Historie der RAID-Technologie

Donnerstag, 4. November 2021 von Ontrack Datenrettung

Raid System
In der IT-Branche kommt es nicht oft vor, dass eine Technologie, die vor vielen Jahrzehnten entwickelt wurde, immer noch als wichtig genug erachtet wird, um von Administratoren und anderen Benutzern verwendet zu werden. Sogar moderne Server und Speichersysteme arbeiten mit RAID-Technologie - vor allem in Unternehmen, aber auch bei NAS-Systemen für Privatanwender hat sie sich durchgesetzt. RAID hat mehr als 30 Jahre überlebt und spielt auch heute noch eine wichtige Rolle bei der Datenspeicherung. Warum ist das so? 

Die Geburt des Raid-Systems

Im Jahr 1987 erfanden David Patterson, Garth A. Gibson und Randy Katz an der University of California in Berkeley den Begriff RAID. Im darauf folgenden Jahr veröffentlichten sie auf der SIGMOD-Konferenz im Juni 1988 ein Papier mit dem Titel "Case for Redundant Arrays of inexpensive Disks". Zu dieser Zeit waren Festplatten noch recht teuer und der Versuch, die Datenspeicherung "schlank" zu halten, war nicht nur üblich, sondern eine Notwendigkeit. Außerdem benutzten die Unternehmen riesige Großrechner, da Desktop-Computer am Arbeitsplatz noch nicht weit verbreitet waren. Dies änderte sich jedoch mit der zunehmenden Akzeptanz und Nutzung von Personal Computern.

Folglich waren die Festplatten für die ersten Nicht-Mainframe-Computer viel billiger als die in Mainframe-Systemen verwendeten; dies war der Grund, warum Garth, Gibson und Katz das Konzept des RAID entwickelten. Sie argumentierten, dass mehrere zusammengeschaltete und weniger teure Festplatten eine einzelne Spitzenfestplatte eines Großrechners in puncto Leistung übertreffen würden. Und obwohl die Verwendung vieler Festplatten eine höhere Ausfallrate bedeutete, war es möglich, sie redundant zu konfigurieren, so dass die Zuverlässigkeit eines solchen Arrays die eines einzelnen großen Mainframe-Laufwerks bei weitem übertreffen konnte.

 

RAID-Speicher erklärt

RAID basiert auf dem Konzept, dass sich die Daten auf mehrere kostengünstige oder unabhängige Laufwerke verteilen bzw. replizieren. Die Laufwerke innerhalb des Systems sind so konfiguriert, dass die Daten auf zwei oder mehr Laufwerke aufgeteilt oder repliziert werden können, um die Last zu verteilen oder die Wiederherstellung der Daten bei Ausfall eines Laufwerks zu unterstützen. Es gibt zwei technische Möglichkeiten, dies zu erreichen: entweder durch eine Hardwarelösung (einen speziellen RAID-Controller) oder eine Softwarelösung, die in der Regel in modernen Betriebssystemen enthalten ist. Hardware-basierte Systeme verwalten das RAID unabhängig vom Host-Computer mit Hilfe eines RAID-Controllers, so dass das Betriebssystem nichts von der technischen Funktionsweise des RAID weiß und das gesamte Speichersystem so sieht, als wäre es ein einziger an den Host-Computer angeschlossener Datenträger.

Neben diesen technischen Implementierungen basiert das RAID-Konzept auf den folgenden drei Grundprinzipien:

Parität - ein Verfahren zur Verteilung von Informationen über ein RAID-System, das die Wiederherstellung von Daten im Falle eines Laufwerksausfalls ermöglicht.
Redundanz - die Duplizierung von kritischen Komponenten in der Systemarchitektur, um die Zuverlässigkeit zu erhöhen und als Ausfallsicherung zu fungieren. Im Wesentlichen ermöglicht sie den Ausfall mehrerer Komponenten, bevor das gesamte System ausfällt, und im Fall von RAID-Systemen sind die Komponenten die Laufwerke.
Mirroring - wenn dieselben Daten von einer Festplatte auf eine andere dupliziert werden. Striping ist eine weitere Methode, bei der Daten über mehrere Festplatten geschrieben werden. Verschiedene RAID-Konfigurationen verwenden eine oder mehrere dieser Techniken, je nach Systemanforderungen.
Auf der Grundlage dieser Prinzipien wurden die folgenden Standard-RAID-Level entwickelt:

RAID 0 verwendet Striping und ist der einfachste RAID-Level. Er bietet keine Redundanz, erhöht aber die Leistung. Die Daten werden auf mindestens zwei Festplatten verteilt, und mit jeder weiteren Festplatte werden die Lese-/Schreibleistung und die Speicherkapazität gegenüber einem einzelnen Laufwerk erhöht. Wenn ein Laufwerk ausfällt, kann der RAID-Controller es nicht wiederherstellen.
RAID 1 verwendet eine Spiegelung, bei der, wie der Name schon sagt, dieselben Daten auf zwei Festplatten gespiegelt werden, und bietet daher die niedrigste Stufe der RAID-Redundanz. RAID 1 kann die Leseleistung im Vergleich zu einem einzelnen Laufwerk verdoppeln, bietet jedoch keine Erhöhung der Schreibgeschwindigkeit. Bei diesem Level kann ein Laufwerk ausfallen.
RAID 5 ist eine gängige Konfiguration und stellt einen guten Kompromiss zwischen Zuverlässigkeit und Leistung dar. Es bietet einen Zuwachs an Lesegeschwindigkeit, aber keine Steigerung der Schreibleistung. RAID 5 führt eine Parität ein, die insgesamt den Platz einer Festplatte beansprucht. Dieser Level kann den Ausfall einer Festplatte verkraften. Wenn Sie ein Hot-Spare-Laufwerk als fünftes Laufwerk konfiguriert haben, kann dieses als Leerlauflauf-Laufwerk im System verbleiben, auf dem keine Daten gespeichert sind. Wenn ein Laufwerk ausfällt, können die Daten auf dem Hot-Spare-Laufwerk wiederhergestellt werden, indem die Daten der Parität auf den anderen Laufwerken verwendet werden. Sobald die Daten wiederhergestellt sind, können Sie das ausgefallene Laufwerk entfernen und durch ein neues ersetzen, das dann zum neuen Hotspare wird.
RAID 6 übernimmt das Konzept von RAID 5 und fügt mit der doppelten Parität weitere Redundanz hinzu. Dadurch können die Daten auch dann wiederhergestellt werden, wenn zwei Festplatten innerhalb des Arrays ausfallen. Die Dual-Parity wird auf alle Festplatten verteilt und nimmt den Platz von zwei Laufwerken ein.
Im Laufe der Jahre wurden viele weitere RAID-Levels entwickelt, hauptsächlich von den Herstellern von RAID-Systemen. Heute gibt es RAID-Levels von RAID 0 bis hin zu RAID 61 und darüber hinaus. Größere Unternehmen erstellen benutzerdefinierte RAID-Levels, um verschiedene Anwendungen und Infrastrukturanforderungen zu unterstützen.

Laufwerksausfälle und die Gefahren von RAID

Wenn in einer RAID 1- oder RAID 5-Konfiguration ein Festplattenausfall auftritt, sollte der Benutzer die ausgefallene Festplatte erst dann ersetzen, wenn er sichergestellt hat, dass alle Daten auf den verbleibenden Festplatten gesichert sind. In vielen Fällen, insbesondere wenn die Lösung Festplatten aus der gleichen Produktion verwendet, ist die Wahrscheinlichkeit, dass eine andere Festplatte ebenfalls bald ausfällt, recht hoch. Und genau hier liegt die Gefahr dieses Konzepts:

Bei all den Vorteilen, die RAID bietet, wie z. B. bessere Leistung und Datensicherheit, vergessen die Benutzer oft, dass RAID kein Backup ist. RAID kann in Kombination mit Backups verwendet werden, wodurch das gesamte Speichersystem wesentlich sicherer wird, aber ein RAID sollte niemals anstelle eines Backups verwendet werden. Im Gegenteil: Wenn ein RAID-System ausfällt, z. B. wegen eines defekten Hardware-RAID-Controllers, ist es viel komplizierter, das RAID wieder zum Laufen zu bringen und verlorene Daten wiederherzustellen.

NAS-Systeme sind für Privatanwender erschwinglicher geworden. Sie nutzen die integrierten RAID-Konfigurationen in Kombination mit anderen fortschrittlichen Speichertechnologien wie Deduplizierung, um so viel Speicherplatz wie möglich aus ihrem System herauszuholen. Dies hat jedoch seinen Preis: In vielen Fällen werden diese Systeme falsch konfiguriert, und wenn ein Fehler auftritt, bricht das gesamte System zusammen.

Unabhängig davon, ob Sie ein Heimanwender oder ein IT-Administrator in einem Unternehmen sind, müssen Sie sorgfältig abwägen, welcher RAID-Level Ihren Anforderungen entspricht oder ob RAID überhaupt notwendig ist. Denken Sie daran, dass Nachlässigkeit am Anfang zu ernsthaften Problemen, hohen Kosten und möglichem Datenverlust führen kann. 

Neue Methoden zur Datenspeicherung werden immer wieder erforscht, erfunden und weiterentwickelt, aber angesichts der Erfolgsbilanz ist es wahrscheinlich, dass RAID nicht so bald verschwinden wird.

Wenn Sie eine RAID-Datenwiederherstellung benötigen, ist Ontrack die erste Adresse. Starten Sie hier Ihre Anfrage,