Apache Hadoop 3.0 ist fertig

19.12.2017

Eine neue Version der Big-Data-Umgebung wurde veröffentlicht. 

Ab sofort ist Version 3.0 des Big-Data-Clusters Hadoop verfügbar. Herausragendes Feature ist die Verwendung von Erasure Coding beim Hadoop-Filesystem HDFS. Damit reduziert sich der verwendete Speicherbedarf deutlich. Der YARN Timeline Service v.2 soll die Skalierbarkeit und Verfügbarkeit des Timeline-Diensts verbessern. Derzeit ist es allerdings noch eine Preview. Ein Federation-Feature für YARN und HDFS ermöglicht die bessere Skalierung eins Hadoop-Clusters über zehntausende von Nodes.

Apache Hadoop hat sich als frei verfügbare Lösung für die analytische Verarbeitung großer Datenmengen im Stil von Googles Map/Reduce etabliert. In den letzten Jahren hat es zugunsten von Apache Spark und anderen Frameworks aber an Popularität eingebüßt. 

Ähnliche Artikel

comments powered by Disqus
Mehr zum Thema

Hadoop 1.0.0 veröffentlicht

Nach sechs Jahren Entwicklungszeit erreicht die Cluster-Software Hadoop Version 1.0.0.

Artikel der Woche

Setup eines Kubernetes-Clusters mit Kops

Vor allem für Testinstallationen von Kubernetes gibt es einige Lösungen wie Kubeadm und Minikube. Für das Setup eines Kubernetes-Clusters in Cloud-Umgebungen hat sich Kops als Mittel der Wahl bewährt. Wir beschreiben seine Fähigkeiten und geben eine Anleitung für den praktischen Einsatz. (mehr)
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Container

Wie setzen Sie Container ein?

  • Gar nicht
  • Docker standalone
  • Docker mit Kubernetes
  • Docker mit Swarm
  • Docker mit anderem Management
  • LXC/LXD
  • Rocket
  • CRI-O auf Kubernetes
  • Container auf vSphere
  • Andere (siehe Kommentare auf der Ergebnisseite)

Google+

Ausgabe /2018

Microsite