Java-HTML-Parser Jsoup beschleunigt

19.02.2011

Der in Java geschriebene HTML-Parser Jsoup kann nun schneller Objekte im Dokumentenbaum finden.

 

In der neuesten Version 1.5.1 des HTML-Parsers Jsoup haben die Entwickler komplexe Abfragen mittels CSS optimiert, sodass sich Elemente im Dokumentenbaum (DOM) nun deutlich schneller finden lassen. Ein Bugfix ermöglicht es nun, Jsoup auch mit der Programmiersprache Scala zu nutzen. Neue Funktionen in der API-Schnittstelle erweiteren die Funktionalität der Bibliothek. 

Jsoup ist dafür ausgelegt, HTML von echten Websites zu verarbeiten und dementsprechend tolerant gegenüber nicht validem Markup. Beim der Namensgebung orientiert es sich an ähnlichen Projekten für die Programmiersprache Python (BeautifulSoup) und Ruby (RubyfulSoup). Jsoup steht als freie Software unter der MIT-Lizenz. 

Ähnliche Artikel

comments powered by Disqus
Mehr zum Thema

XML-Parser Nokogiri wird in Version 1.5.0 reines Ruby-Modul

Der XML-Parser Nokogiri liegt in Version 1.5.0 zum ersten Mal in einer reinen Ruby-Version vor.

Artikel der Woche

Eigene Registry für Docker-Images

Wer selber Docker-Images herstellt, braucht auch eine eigene Registry. Diese gibt es ebenfalls als Docker-Image, aber nur mit eingeschränkter Funktionalität. Mit einem Auth-Server wird daraus ein brauchbares Repository für Images. (mehr)
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Google+

Ausgabe /2019