RAID-Technologie verspricht höhere Performance und mehr Sicherheit beim permanenten Speichern von Daten. Die ADMIN-Redaktion gibt einen Überblick über ... (mehr)

Komplizierte Lesefehler

Noch komplizierter wird die Sache, wenn man nicht nur den Totalausfall einer weiteren Festplatte kalkuliert, sondern auch die Wahrscheinlichkeit einfacher Lesefehler, die ja in dieser Situation ebenfalls einen Totalverlust der Daten zur Folge haben können. Maßgeblich dafür ist die Bitfehlerrate der Festplatte. Hier darf man sich durch große Zahlen nicht blenden lassen. Selbst bei einer Bitfehlerwahrscheinlichkeit von nur 1:1014 bleibt ein Risiko von rund 30 Prozent für einen schadhaften Sektor, wenn die Gesamtkapazität des RAID-Verbundes 5 TByte beträgt. Überhaupt beißt sich die Katze besonders bei den heute üblichen hohen Kapazitäten in den Schwanz: Je größer das RAID, je höher die Fehlerwahrscheinlichkeit, je länger aber auch die Rebuild-Dauer und damit wiederum das Risiko für einen verhängnisvollen doppelten Fehler. Das führt zu der Schlussfolgerung: Sehr große RAID-Sets lassen sich mit den klassischen Verfahren nicht mehr zuverlässig sichern.

Auswege

Einen ersten Ausweg bieten unter Umständen die kombinierten RAID-Level, bei denen generell RAID-Sets aus Elementen gebildet werden, die ihrerseits bereits RAID-Sets sind. Spiegelt man dabei etwa paritätsgesicherte RAID-Sets wie bei RAID 50 (gespiegelte RAID 5-Sets), dann ist die Ausfallsicherheit etwas höher, weil jetzt in jeder Spiegelhälfte eine Platte ausfallen kann, ohne dass es zu Datenverlusten kommt. Das gesamte Konstrukt verträgt also unter günstigen Bedingungen zwei Plattenausfälle. Der Preis dafür ist allerdings eine nochmals geringere Kapazitätsausbeute: Da bei RAID 5 immer die Kapazität einer Platte für die Paritätsdaten verloren geht, verdoppelt sich der Verlust bei zwei RAID 5-Sets (eines in jeder Spiegelhälfte).

Günstiger und zugleich sicherer sind eine Reihe später entwickelter RAID-Level mit doppelter Parität. Diesen Verfahren – zum Beispiel RAID DP oder RAID 5 DP – ist gemeinsam, dass sie eine Prüfsumme wie gehabt durch bitweise XOR-Verknüpfung pro Stripe errechnen und dann zusätzlich eine zweite, davon unabhängige Prüfsumme bilden, ebenfalls durch XOR-Verknüpfung, nun aber von diagonal angeordneten Sektoren ( Abbildung 3 ). RAID DP speichert die Paritätsdaten dabei wie RAID 4 auf zwei extra Paritätsplatten. Ein zumindest theoretischer Vorteil der Paritätsplatte ist in diesem Fall, dass sich ein RAID 4 durch Hinzufügen einer Platte und Neuberechnen der diagonalen Parität zu RAID DP aufbohren ließe. Wie auch immer man dahin gelangt: Jedenfalls dürfen dann zwei Platten pro RAID-Set ausfallen, bevor es zum unwiderruflichen Datenverlust kommt.

Abbildung 3: RAID DP: Eine Prüfsumme (XOR-Verknüpfung) wird wie gehabt horizontal berechnet (Pa, Pb,…) und eine zweite, unabhängige Prüfsumme über die diagonal liegenden Sektoren (hier kenntlich durch die gleiche Farbe.

Die RAID-Level mit doppelter Parität funktionieren jedoch nur bei einer bestimmten Anzahl von Platten. Bei RAID DP muss beispielsweise die Anzahl aller Datenplatten plus der horizontalen Paritätsplatte eine Primzahl sein. Ist das von sich aus nicht der Fall, werden die Platten um leere, virtuelle Platten ergänzt, um diese Bedingung zu erfüllen.

comments powered by Disqus
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Ausgabe /2023