Apache Hadoop 3.0 ist fertig

Oliver Frommel

19.12.2017

Eine neue Version der Big-Data-Umgebung wurde veröffentlicht.

Ab sofort ist Version 3.0 des Big-Data-Clusters Hadoop verfügbar. Herausragendes Feature ist die Verwendung von Erasure Coding beim Hadoop-Filesystem HDFS. Damit reduziert sich der verwendete Speicherbedarf deutlich. Der YARN Timeline Service v.2 soll die Skalierbarkeit und Verfügbarkeit des Timeline-Diensts verbessern. Derzeit ist es allerdings noch eine Preview. Ein Federation-Feature für YARN und HDFS ermöglicht die bessere Skalierung eins Hadoop-Clusters über zehntausende von Nodes.

Apache Hadoop hat sich als frei verfügbare Lösung für die analytische Verarbeitung großer Datenmengen im Stil von Googles Map/Reduce etabliert. In den letzten Jahren hat es zugunsten von Apache Spark und anderen Frameworks aber an Popularität eingebüßt.