RAID-Technologie verspricht höhere Performance und mehr Sicherheit beim permanenten Speichern von Daten. Die ADMIN-Redaktion gibt einen Überblick über ... (mehr)

Aus der Mode: Die Parity Disk

Die hohen Kosten der Spiegelung vermeiden die folgenden RAID-Level dadurch, dass sie die Redundanz etwas vermindern und statt durch Verdopplung der Schreiboperationen durch Berechnung eines Paritätswerts erreichen. Wie das genau funktioniert, wird für die heute gebräuchlichen Verfahren weiter unten demonstriert.

Das RAID-Level 2 spielt heute keine Rolle mehr, es kam überhaupt nur in der Großrechnerwelt zum Einsatz. Es erzeugt die Redundanz durch einen nach seinem Erfinder Hamming benannten linearen fehlerkorrigierenden Blockcode, der ursprünglich entwickelt wurde, um die Lesefehler von Lochkarten zu bereinigen. Dabei werden in einem aufwändigen Verfahren Paritycodes über einem Datenblock fixer Länge berechnet, mit denen sich Einzelbitfehler korrigieren lassen. Eine Besonderheit des Verfahrens ist, dass die Anzahl der Platten ein ganzzahliges Vielfaches der Hamming-Codewortlänge sein muss. Deshalb wurden in der Praxis zumeist RAID-2-Verbünde mit mindestens zehn Platten benutzt.

Auch RAID 3 ist heute weitgehend vom Markt verschwunden: Dahinter verbirgt sich ein Striping (wie bei RAID 0), jedoch mit zusätzlicher Absicherung durch Paritätsinformationen auf einer extra Parity Disk. Auf der Parity Disk wird bitweise vermerkt, ob über alle Datenplatten die Summe aller Datenbits an einer bestimmten Position gerade oder ungerade ist ( Abbildung 1 ). Fällt nun eine Datenplatte aus, ist für jede Bitposition klar, ob die Summe aller verbliebenen Bits an dieser Stelle mit einer » « oder »1« ergänzt werden muss, damit der gemerkte Zustand wieder erreicht wird. Fällt also beispielsweise von den beiden Datenplatten in Abbildung 1 die zweite Platte aus, dann kombiniert der Controller beispielsweise für das letzte Bit der gezeigten Vierergruppe den Wert »1« von der verbliebenen Data Disk 1 mit der »1« der Paritätsplatte, die anzeigt, dass die Bitsumme gerade sein muss. Es ergibt sich »1 + [0 oder 1]? = gerade Zahl« und damit ist unmittelbar klar, dass an der unleserlichen Bitposition eine »1« gestanden haben muss. Das Verfahren ist im Übrigen nur eine andere Formulierung für die unten beschriebene XOR-Verknüpfung.

Abbildung 1: Paritätsberechnung bei RAID 3: Die Paritätsplatte vermerkt, ob die Summe der Datenbits an dieser Position gerade oder ungerade ist.

Der Vorteil von RAID 3 ist, dass für beliebig viele Datenplatten immer nur eine Partitätsplatte nötig ist. Das ist aber zugleich auch der größte Nachteil, denn diese Parity Disk wird für jede Schreiboperation benötigt und so zum Flaschenhals.

RAID 4: Gut mit Cache

Eine leichte Verbesserung gegenüber RAID 3 brachte das heute allerdings auch weitgehend ungebräuchliche RAID 4: Es verwendet ebenfalls eine extra Paritätsdisk mit denselben Nachteilen, beschreibt die Datenplatten aber in größeren Blöcken (Chunks). Der Nachteil der Paritätsplatte lässt sich deutlich abmildern, wenn ein NVRAM-Cache die Schreiboperationen puffert und zusammenfasst. In dieser Konstellation nutzt NetApps eigenes Filesystem WAFL (Write Anywhere File Layout) noch heute einen verwandten Algorithmus von RAID 4 mit einem zweiten Laufwerk für Paritätsdaten: Raid DP. Der Artikel kommt weiter unten darauf zurück.

comments powered by Disqus
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Ausgabe /2023