Mit einer vernünftigen Backup-Strategie wappnen sich Administratoren erfolgreich gegen Datenverluste und längere Systemausfälle. So zeigen wir Ihnen ... (mehr)

Hürden beim Praxis-Einsatz

Wie viel Speicherplatz Sie durch die Deduplikation einsparen, hängt stark von den zu speichernden Daten ab. Zwar versprechen die Entwickler eine Ersparnis von 95 Prozent, dazu muss SDFS allerdings auch 95 Prozent identische Datenblöcke finden. Darüber hinaus steigt die Gefahr von Datenverlust: Ist ein Datenblock defekt, lassen sich alle zugehörigen Dateien nicht wiederherstellen.

Im Gegensatz zu anderen deduplizierenden Dateisystemen bietet SDFS immerhin an, die Datenblöcke im Cluster redundant zu speichern. Diese Spiegelung muss der Administrator jedoch explizit aktivieren. Damit liegen die Daten dann anschließend aber doch wieder mehrfach vor und es ist genau das Gegenteil von dem erreicht, was die Deduplikation eigentlich erreichen soll.

 Des Weiteren muss der Administrator die Meta-Daten der einzelnen Volumes selbst sichern. Die SDFS-Entwickler schlagen vor, dazu DRDB zu verwenden [8]. Die Multicast-Pakete erhöhen nicht nur die Netzwerklast, Administratoren müssen auch entsprechende Löcher in die Firewalls bohren. Zu guter Letzt läuft die Kommunikation zwischen den einzelnen Komponenten in einem Cluster standardmäßig unverschlüsselt ab. Administratoren dürfen immerhin SSL-Verschlüsselung aktivieren.

Die Entwickler haben ihre Werkzeuge zudem recht mangelhaft dokumentiert. Auf der Homepage des Projekts ist neben einer Schnellstartanleitung lediglich eine Beschreibung der Architektur zu finden, die die Entwickler als "Administration Guide" bezeichnen [9]. Eine immerhin äußerst lange Referenz aller Parameter spucken die Tools aus, wenn sie jeweils mit dem Parameter "--help" aufgerufen werden.

Fazit

SDFS ist schnell eingerichtet, die Volumes lassen sich zudem einfach über mehrere Rechnerknoten aufspannen. Zudem gibt es Unterstützung für virtuelle Maschinen. Administratoren sollten jedoch die Risiken eines deduplizierenden Dateisystems im Hinterkopf behalten. Der Einsatz von SDFS ist daher vor allem dann sinnvoll, wenn viele gleiche oder ähnliche Daten anfallen, die zudem weniger wichtig sind – wie etwa temporäre oder Log-Daten. (of)

Link-Codes

[1] Opendedup: http://opendedup.org/

[2] Quellcode auf GitHub: https://github.com/opendedup/sdfs/

[3] Installation unter Windows: http://www.opendedup.org/wqs/

[4] SDFS-Download: http://opendedup.org/download/

[5] Fuse: http://fuse.sourceforge.net/

[6] Jgroups: http://www.jgroups.org/

[7] Anbindung an AWS und Azure: http://opendedup.org/cbdquickstart/

[8] DRDB: http://drbd.linbit.com/

[9] Administration Guide: http://opendedup.org/sdfs-20-administration-guide/

Ähnliche Artikel

comments powered by Disqus
Mehr zum Thema

Deduplizierungs-Software Opendedup beschleunigt

In Version 1.2 der Deduplizierungs-Software Opendedup haben die Entwickler einige Punkte verbessert.

Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Ausgabe /2023