Wie viel Speicherplatz Sie durch die Deduplikation einsparen, hängt stark von den zu speichernden Daten ab. Zwar versprechen die Entwickler eine Ersparnis von 95 Prozent, dazu muss SDFS allerdings auch 95 Prozent identische Datenblöcke finden. Darüber hinaus steigt die Gefahr von Datenverlust: Ist ein Datenblock defekt, lassen sich alle zugehörigen Dateien nicht wiederherstellen.
Im Gegensatz zu anderen deduplizierenden Dateisystemen bietet SDFS immerhin an, die Datenblöcke im Cluster redundant zu speichern. Diese Spiegelung muss der Administrator jedoch explizit aktivieren. Damit liegen die Daten dann anschließend aber doch wieder mehrfach vor und es ist genau das Gegenteil von dem erreicht, was die Deduplikation eigentlich erreichen soll.
Des Weiteren muss der Administrator die Meta-Daten der einzelnen Volumes selbst sichern. Die SDFS-Entwickler schlagen vor, dazu DRDB zu verwenden [8]. Die Multicast-Pakete erhöhen nicht nur die Netzwerklast, Administratoren müssen auch entsprechende Löcher in die Firewalls bohren. Zu guter Letzt läuft die Kommunikation zwischen den einzelnen Komponenten in einem Cluster standardmäßig unverschlüsselt ab. Administratoren dürfen immerhin SSL-Verschlüsselung aktivieren.
Die Entwickler haben ihre Werkzeuge zudem recht mangelhaft dokumentiert. Auf der Homepage des Projekts ist neben einer Schnellstartanleitung lediglich eine Beschreibung der Architektur zu finden, die die Entwickler als "Administration Guide" bezeichnen [9]. Eine immerhin äußerst lange Referenz aller Parameter spucken die Tools aus, wenn sie jeweils mit dem Parameter "--help" aufgerufen werden.
SDFS ist schnell eingerichtet, die Volumes lassen sich zudem einfach über mehrere Rechnerknoten aufspannen. Zudem gibt es Unterstützung für virtuelle Maschinen. Administratoren sollten jedoch die Risiken eines deduplizierenden Dateisystems im Hinterkopf behalten. Der Einsatz von SDFS ist daher vor allem dann sinnvoll, wenn viele gleiche oder ähnliche Daten anfallen, die zudem weniger wichtig sind – wie etwa temporäre oder Log-Daten. (of)
Link-Codes
[1] Opendedup: http://opendedup.org/
[2] Quellcode auf GitHub: https://github.com/opendedup/sdfs/
[3] Installation unter Windows: http://www.opendedup.org/wqs/
[4] SDFS-Download: http://opendedup.org/download/
[5] Fuse: http://fuse.sourceforge.net/
[6] Jgroups: http://www.jgroups.org/
[7] Anbindung an AWS und Azure: http://opendedup.org/cbdquickstart/
[8] DRDB: http://drbd.linbit.com/
[9] Administration Guide: http://opendedup.org/sdfs-20-administration-guide/
In Version 1.2 der Deduplizierungs-Software Opendedup haben die Entwickler einige Punkte verbessert.