Apache Hadoop 3.0 ist fertig

19.12.2017

Eine neue Version der Big-Data-Umgebung wurde veröffentlicht. 

Ab sofort ist Version 3.0 des Big-Data-Clusters Hadoop verfügbar. Herausragendes Feature ist die Verwendung von Erasure Coding beim Hadoop-Filesystem HDFS. Damit reduziert sich der verwendete Speicherbedarf deutlich. Der YARN Timeline Service v.2 soll die Skalierbarkeit und Verfügbarkeit des Timeline-Diensts verbessern. Derzeit ist es allerdings noch eine Preview. Ein Federation-Feature für YARN und HDFS ermöglicht die bessere Skalierung eins Hadoop-Clusters über zehntausende von Nodes.

Apache Hadoop hat sich als frei verfügbare Lösung für die analytische Verarbeitung großer Datenmengen im Stil von Googles Map/Reduce etabliert. In den letzten Jahren hat es zugunsten von Apache Spark und anderen Frameworks aber an Popularität eingebüßt. 

Ähnliche Artikel

comments powered by Disqus
Mehr zum Thema

Hadoop 1.0.0 veröffentlicht

Nach sechs Jahren Entwicklungszeit erreicht die Cluster-Software Hadoop Version 1.0.0.

Artikel der Woche

Systeme mit Vamigru verwalten

Auch wer nur kleine Flotten von Linux-Servern verwaltet, freut sich über Werkzeuge, die ihm diese Arbeit erleichtern. Vamigru tritt mit diesem Versprechen an. Wir verraten, was es leistet und wie Sie es in der eigenen Umgebung in Betrieb nehmen. (mehr)
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Container

Wie setzen Sie Container ein?

  • Gar nicht
  • Docker standalone
  • Docker mit Kubernetes
  • Docker mit Swarm
  • Docker mit anderem Management
  • LXC/LXD
  • Rocket
  • CRI-O auf Kubernetes
  • Container auf vSphere
  • Andere (siehe Kommentare auf der Ergebnisseite)

Google+

Ausgabe /2018

Microsite