Java-HTML-Parser Jsoup beschleunigt

19.02.2011

Der in Java geschriebene HTML-Parser Jsoup kann nun schneller Objekte im Dokumentenbaum finden.

 

In der neuesten Version 1.5.1 des HTML-Parsers Jsoup haben die Entwickler komplexe Abfragen mittels CSS optimiert, sodass sich Elemente im Dokumentenbaum (DOM) nun deutlich schneller finden lassen. Ein Bugfix ermöglicht es nun, Jsoup auch mit der Programmiersprache Scala zu nutzen. Neue Funktionen in der API-Schnittstelle erweiteren die Funktionalität der Bibliothek. 

Jsoup ist dafür ausgelegt, HTML von echten Websites zu verarbeiten und dementsprechend tolerant gegenüber nicht validem Markup. Beim der Namensgebung orientiert es sich an ähnlichen Projekten für die Programmiersprache Python (BeautifulSoup) und Ruby (RubyfulSoup). Jsoup steht als freie Software unter der MIT-Lizenz. 

Ähnliche Artikel

comments powered by Disqus
Mehr zum Thema

XML-Parser Nokogiri wird in Version 1.5.0 reines Ruby-Modul

Der XML-Parser Nokogiri liegt in Version 1.5.0 zum ersten Mal in einer reinen Ruby-Version vor.

Artikel der Woche

Rechneranalyse mit Microsoft-Sysinternals-Tools

Der Rechner verhält sich eigenartig oder Sie haben eine unbekannte Applikation im Task Manager entdeckt und möchten erfahren, worum es sich dabei genau handelt und ob sie möglicherweise gefährlich ist? In so einem Fall helfen die Sysinternals-Tools von Microsoft. Dieser Beitrag stellt die drei Werkzeuge Autoruns, Process Explorer und TCPView vor. (mehr)
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Google+

Ausgabe /2018