Speicher vom Typ Redundant Array of Independent (ursprünglich Inexpensive) Disks (RAID) hat die Speicherung von Daten in Unternehmen revolutioniert, indem Sicherheit durch Redundanz geschaffen wird (ab RAID 1 aufwärts), sodass sich Ausfallzeiten wegen einzelner ausgefallener Laufwerke stark verringern.

Leider ist aber auch ein RAID-Speicher nicht perfekt und es können auch hier Daten verloren gehen.

Redundant Arry of Independent Disks

Was ist ein RAID-Speichersystem?

Die Definition von RAID finden Sie im Namen des Systems selbst. RAID steht für „Redundant Array of Independent Disks“ und übersetzt für eine redundante Anordnung unabhängiger Laufwerke – ein Cluster bestehend aus mehreren Festplatten, das der Einrichtung einer einzigen logischen Partition dient. Je nach Ziel erhöht RAID die Leistung beim Lesen und Schreiben von Daten, während die Sicherheit der Daten erhöht wird.

RAID ist eine Technologie zur Unterstützung von zwei oder mehr Festplatten in verschiedenen Konfigurationen, die durch Konsolidierung von Laufwerksressourcen und Paritätsberechnungen für mehr Leistung und Zuverlässigkeit sowie größere Volumes sorgen.

Es gibt eine Reihe von Standardkonfigurationen, die als „Level“ bezeichnet werden. Ursprünglich wurden fünf RAID-Level entwickelt, heute gibt es jedoch deutlich mehr Varianten. Dazu gehören vor allem einige hybride Level sowie viele nicht standardmäßige Level (meist proprietärer Art).

Was bedeuten die einzelnen RAID-Level? Die Zahlen beziehen sich einfach auf die jeweilige RAID-Konfiguration. Da alle RAID-Systeme für eine effiziente Speicherung von Daten sorgen, hängt die Auswahl des konkreten Systems von Ihrem persönlichen Bedarf ab. RAID 1 zum Beispiel erfüllt Anforderungen an hohe Leistung und Zuverlässigkeit. RAID 5 hingegen ist eine gute Wahl, wenn Sie sich für hohe Leistung und Fehlertoleranz interessieren.

Geschichte der RAID-Systeme

RAID ist eine Abkürzung für „Redundant Array of Inexpensive Disks“ (Redundant Array of Independent Disks). Das Konzept wurde an der University of California in Berkeley entwickelt, wo David A. Patterson, Garth Gibson und Randy H. Katz zusammen an der Erstellung von betriebsfähigen Prototypen für fünf Level an RAID-Speichersystemen arbeiteten. Das Ergebnis ihrer Forschungen dient als Grundlage für die komplexen RAID-Speichersysteme von heute. Inzwischen ist IBM im Besitz des geistigen Eigentums an RAID 5.

Das Design des RAID-Speichersystems zielte auf hohe Leistung, Wiederherstellbarkeit, Zuverlässigkeit und Skalierbarkeit von Speicher ab. Das Ergebnis war ein einzigartiges Konzept für Redundanz, das Funktionen zur Wiederherstellung von Daten umfasst, sollte ein Laufwerk im System ausfallen. So verfügen RAID-Controllerkarten heute über die Fähigkeit, Daten weiter zu lesen und zu schreiben, selbst wenn ein Laufwerk „offline“ ist.

Überblick über RAID-Systeme

RAID ist ein Begriff, der für Methoden zur Datenspeicherung steht, bei denen Daten auf bzw. zwischen verschiedenen Festplatten verteilt und/oder repliziert werden. Bei der Entwicklung von RAID wurden zwei zentrale Ziele verfolgt: eine höhere Datenzuverlässigkeit sowie eine bessere E/A-Leistung.

In einer RAID-Konfiguration werden physische Festplatten in einer einzigen logischen Einheit zusammengefasst – unter Verwendung spezieller Hardware oder Software. Hardwarebasierte RAID-Lösungen können verschiedene Formen aufweisen, von Integration auf der Hauptplatine über Add-in-Karten bis hin zu großen NAS- oder SAN-Servern der Enterprise-Klasse. Bei diesen Optionen kennt das Betriebssystem die technischen Abläufe des RAID-Systems nicht. Softwarelösungen werden meist im Betriebssystem implementiert.

In RAID-Lösungen gibt es drei Hauptkonzepte:

  • Spiegelung, das Kopieren von Daten auf mehr als ein Laufwerk
  • Striping, das Aufteilen von Daten auf mehr als ein Laufwerk
  • Error Correction, wo redundante Daten gespeichert werden, damit sich Probleme erkennen und ggf. beheben lassen (als Fehlertoleranz bekannt)

Bei den verschiedenen RAID-Level kommen eines oder mehrere dieser Verfahren zum Einsatz, je nach den Systemanforderungen.

RAID wird traditionell auf Server angewendet, kann jedoch auch für Workstations genutzt werden. Die zweite Option eignet sich besonders für speicherintensive Computer, die beispielsweise zur Video- und Audiobearbeitung verwendet werden.

RAID-Konfigurationen

Die logische Systemkonfiguration sorgt dafür, dass die Daten in Bändern auf alle physischen Laufwerke verteilt werden. So lässt sich bei diesen Laufwerken eine ausgewogene Datenrate erzielen; anstatt ein Laufwerk zu nutzen, das das gesamte Schreiben und Lesen von Daten übernimmt, arbeiten hier alle Laufwerke zusammen. Das heißt, dass Daten auf sämtliche physischen Laufwerke verteilt werden.

Redundanter oder fehlertoleranter Betrieb

Redundanz in einer aktuellen RAID 5-Konfiguration ist das Ergebnis der Verwendung einer booleschen mathematischen Funktion namens „Exclusive OR“ (XOR). Diese Funktion wird in der Regel als Parität bezeichnet. Bei der XOR-Funktion handelt es sich um einen logischen Binärprozess. Am besten stellen Sie sich die Parität als eine Kombination der Datenblöcke des anderen Laufwerks vor. Jedes Byte, das in einen Datenblock geschrieben wird, wird mit Bezug auf die anderen Datenblöcke berechnet. Die errechnete Parität wird in den Paritätsblock für das jeweilige Band geschrieben. Diese Berechnung funktioniert immer, auch wenn ein Datenblock fehlt. Sie funktioniert jedoch nicht mehr, wenn zwei Blöcke fehlen (das ist eine der Beschränkungen von RAID 5) – wenn zwei oder mehr Laufwerke ausfallen, ist keine angemessene Redundanz möglich.

Wie bereits erwähnt, sorgt die Controllerkarte für die Verteilung der Daten auf Bänder sowie die Anwendung der XOR-Funktion auf diese Daten. Die Menge der logischen Berechnungen, die der Controller Sekunde für Sekunde ausführt, ist beeindruckend. Moderne RAID-Controller sind ausgeklügelte Hardwaresysteme, die SDRAM-Prozessoren und Arbeitsspeichermodule umfassen, die speziell für hohe Leistung und Redundanz entwickelt wurden.

RAID Konfigurationen

Wiederherstellung von RAID-Daten

Zwar sind RAID-Speichersysteme auf Fehlertoleranz ausgelegt, doch können Hardware- und andere Ausfälle dazu führen, dass sich Daten nicht mehr aufrufen lassen. Sollten in Ihrem System Probleme mit dem RAID-Array auftreten, ist Ontrack Data Recovery ein Experte für Verfahren und Methoden zur Rettung von RAID-Daten.

Unsere Techniker sind sich einig, dass die Wiederherstellung von RAID-Arrays einer der schwierigsten technischen Aspekte bei der Datenrettung ist. Eine RAID-Systemwiederherstellung beinhaltet in Wahrheit eine Kombination aus zwei sehr wichtigen Schritten:

  1. Der erste und langwierigste Schritt ist der Wiederaufbau der Matrix. Wenn Techniker von Ontrack Data Recovery das logische System neu zusammensetzen, untersuchen sie genau, wie die Daten in den verschiedenen Laufwerken organisiert sind. Somit kennen sie die Reihenfolge der Laufwerke sowie die Anordnung von Datenblöcken und Paritätsblöcken. Diese zeitliche Investition dient der Ermittlung der ursprünglichen Konfiguration sowie der Gewährleistung einer hochwertigen Wiederherstellung.
     
  2. Der zweite Schritt besteht aus der Arbeit am logischen Dateisystem. Moderne Logdateisysteme in Unternehmen sind extrem komplex. Wenn ein RAID-Array ausfällt, kommt es im Dateisystem zu Tausenden von Fehlern. Techniker von Ontrack Data Recovery werden überprüfen, ob die Matrix richtig strukturiert ist, bevor sie Daten kopieren. Dieser Zusatzschritt sorgt für eine optimale Datenrettung.
RAID Datenrettung

Häufig verwendete RAID-Begriffe

RAID: RAID ist eine Technologie zur Unterstützung von zwei oder mehr Festplatten in verschiedenen Konfigurationen, die durch Konsolidierung von Laufwerksressourcen und Paritätsberechnungen für mehr Leistung und Zuverlässigkeit sowie größere Volumes sorgen.

Parität: Eine mathematische Berechnung, die es erlaubt, dass Laufwerke in einem RAID-Array ausfallen, ohne dass Daten verloren gehen. Der einfachste Weg zur Veranschaulichung dieser Methode ist folgende Gleichung: A + B = C. Aus dieser Gleichung können Sie einen Buchstaben entfernen und dessen Wert aus den verbleibenden zwei Buchstaben errechnen. Wenn Sie beispielsweise B entfernen (sodass die Gleichung folgendermaßen aussieht: A + ? = C), dann lässt sich der Wert von B berechnen, indem das A bewegt wird (B = C – A). Dies ist natürlich eine vereinfachte Beschreibung; wenn Sie das Verfahren im RAID-Kontext verstehen möchten, müssen Sie auch mit Binärdaten und dem logischen XOR-Ausdruck vertraut sein.

Spiegelung: Die Daten von einem oder mehreren Festplatten werden auf andere physische Laufwerke dupliziert.

Striping: Eine Methode, mit der sich Daten und Parität auf verschiedene Laufwerke schreiben lassen. Im Beispiel unten werden die Daten in sequenzieller Reihenfolge auf die Laufwerke geschrieben – bis zum letzten Laufwerk. Dann springt das Verfahren zurück zum ersten Laufwerk und startet einen zweiten Striping-Vorgang.

Block: Ein Block ist der logische Platz auf einem einzelnen Laufwerk, in den die Daten geschrieben werden. Der verfügbare Platz wird vom RAID-Controller gesteuert und hat meist eine Größe zwischen 16 KB und 256 KB. Der Platz wird mit Daten gefüllt, bis die Grenze erreicht ist, woraufhin das nächste Laufwerk an der Reihe ist. Nach dem letzten Laufwerk erfolgt ein Sprung zum Starten des nächsten Striping-Vorgangs.

Linke / Rechte Symmetrie: Die Symmetrie in einem RAID-System bestimmt darüber, wie Daten und Parität auf die Laufwerke verteilt werden. Es gibt vier zentrale Symmetriearten; welche davon zum Einsatz kommt, hängt vom RAID-Anbieter ab. Manche Unternehmen haben mit Blick auf ihre individuellen geschäftlichen Anforderungen proprietäre Typen entwickelt.

Hot Spare: Es gibt verschiedene Methoden zum Umgang mit Laufwerksausfällen in einem RAID-System. Eine davon besteht aus der Verwendung eines Hot-Spare-Laufwerks. Dabei handelt es sich um ein in Reserve gehaltenes Laufwerk, das anstelle des ausgefallenen Laufwerks verwendet werden kann.

Degradierter Modus: Folgendes geschieht, wenn ein Laufwerk im RAID-System unlesbar wird: Das Laufwerk wird als fehlerhaft eingestuft und aus dem RAID-System entfernt. Neue Daten und Paritätsinformationen werden nun auf die verbleibenden Laufwerke im RAID geschrieben. Sollten Daten vom ausgefallenen Laufwerk angefordert werden, werden diese anhand der Parität auf den anderen Laufwerken berechnet. Dieses Verfahren reduziert die Leistung des RAID-Systems; daher der Name „degradierter Modus“.