Go to Top

Alles Gute zum Geburtstag RAID – Warum die Technologie 30 Jahre feiert und immer noch verwendet wird…

Das gibt es nicht oft im IT-Geschäft, dass eine Technologie, die vor vielen Jahrzehnten entwickelt wurde, immer noch weit verbreitet ist und für Administratoren und andere Benutzer wichtig ist. Sogar moderne Server und Speicher laufen mit RAID-Technologie – meist in Unternehmen, aber zunehmend auch in Consumer-NAS-Systemen. Gerade im Bereich der Informationstechnologie sind drei Jahrzehnte eine Ewigkeit und wer kennt noch die vielen Konzepte und Produkte, die entwickelt und auf den Markt gebracht wurden und trotzdem nicht lange Bestand hatten? Nun RAID hat überlebt, feiert in diesem Jahr seinen 30. Geburtstag und spielt immer noch eine große Rolle. Aber warum ist das so? Und was sind Vorteile und Nachteile des Konzepts?

Als David Patterson, Garth A. Gibson und Randy Katz von der University of California in Berkeley 1987 den Begriff RAID erfanden und auf der SIGMOD-Konferenz im Juni 1988 ihre Arbeit über das „Case for Redundant Arrays of Cheap Disks“ veröffentlichten, waren Festplatten immer noch recht teuer und der Versuch, Daten im Speicher „schlank“ zu halten, war nicht nur üblich, sondern schlichtweg eine Notwendigkeit. Und es war immer noch die Zeit, als große Mainframe-Computer in Unternehmen eingesetzt wurden, während Desktop-Computer am Arbeitsplatz noch nicht überall verbreitet waren. Dies begann sich jedoch zu ändern und die Anzahl der Personal Computer stieg sowohl beim Verkauf und bei der Nutzung. Infolgedessen waren Festplattenlaufwerke für diese ersten Nicht-Großrechner bereits viel billiger als diejenigen von den viel größeren Großrechnern, als die Wissenschaftler ihr Konzept vorstellten.

Das ist auch der Grund warum die drei ihr Konzept entwickelten. Sie argumentierten, dass mehrere miteinander verbundene und billigere (PC-) Festplatten in Bezug auf die Leistung eine einzelne hochwertige Mainframe-Festplatte schlagen würden. Zudem argumentierten Sie, dass auch wenn bei vielen Festplatten die Ausfallrate steigt, ist es möglich, sie so auf Redundanz zu konfigurieren, dass die Zuverlässigkeit eines solchen Arrays diejenige eines jeden großen Mainframe-Laufwerks bei weitem übersteigen könnte. RAID ist also somit genau das Gegenteil von der damals üblichen SLED (Single Large Expensive Disk) eines Großrechners.

RAID erklärt

Um es einfach zu halten: RAID basiert auf dem Konzept, dass Daten über mehrere kostengünstige oder unabhängige Laufwerke verteilt oder repliziert werden. Die Laufwerke innerhalb des Systems sind so konfiguriert, dass Daten über zwei oder mehr Laufwerke verteilt oder repliziert werden können, um die Lastverteilung zu ermöglichen oder um Daten wiederherzustellen, wenn ein Laufwerk ausfällt. Hierfür gibt es zwei technische Möglichkeiten: Entweder durch eine Hardwarelösung, einen dedizierten RAID-Controller, oder eine Softwarelösung, die meist bereits in modernen Betriebssystemen enthalten ist. Hardwarebasierte Systeme verwalten das RAID unabhängig vom Host-Computer mithilfe eines RAID-Controllers, sodass das Betriebssystem die technischen Abläufe des RAIDs nicht kennt und das gesamte Speichersystem so sieht, als wäre es ein einzelnes Volume, das mit dem Host-Computer verbunden ist.

Neben diesen technischen Implementierungen basiert das RAID-Konzept auf diesen drei Grundprinzipien:

  1. Parität ist eine Möglichkeit, Informationen über ein RAID-System zu verteilen, das die Wiederherstellung von Daten im Falle eines Festplattenausfalls ermöglicht.
  2. Redundanz ist die Verdoppelung kritischer Komponenten in der Systemarchitektur, um die Zuverlässigkeit zu erhöhen und ausfallsicher zu werden. Im Wesentlichen ermöglicht es, dass mehrere Komponentenausfälle auftreten können, bevor das gesamte System ausfällt, und im Fall von RAID-Systemen sind eben die Komponenten die eingesetzten Laufwerke.
  3. Spiegeln ist, wenn die gleichen Daten von einem Datenträger zu einem anderen kopiert werden. Striping ist eine andere Methode, bei der Daten über mehrere Festplatten geschrieben werden. Verschiedene RAID-Setups verwenden je nach Systemanforderungen eine oder mehrere dieser Techniken.

Basierend auf diesen Prinzipien wurden diese Standard-RAID-Level entwickelt:

  • RAID 0 verwendet „Striping“ und ist der grundlegendste RAID-Level. Es bietet keine Redundanz, erhöht jedoch die Leistung. Daten werden auf mindestens zwei Festplatten verteilt und bei jedem hinzugefügten Laufwerk werden die Lese- / Schreib-Leistung und die Speicherkapazität über ein einzelnes Laufwerk erhöht. Wenn ein Laufwerk ausfällt, kann der RAID-Controller es nicht wiederherstellen.
  • RAID 1 verwendet ‚Mirroring‘, das, wie der Name schon sagt, die gleichen Daten über zwei Festplatten hinweg spiegelt. Daher bietet es die geringste RAID-Redundanz. RAID 1 kann die Leistung über ein einzelnes Laufwerk verdoppeln, aber es gibt keine Erhöhung der Schreibgeschwindigkeit. Mit dieser Stufe kann ein Laufwerk ausfallen.
  • RAID 5 ist eine häufige Konfiguration und bietet einen guten Kompromiss zwischen Zuverlässigkeit und Leistung. Es bietet einen Gewinn an Lesegeschwindigkeiten, aber keine Erhöhung der Schreibleistung. RAID 5 führt ‚Parity‘ ein, die insgesamt den Speicherplatz einer Platte belegt. Dieses Level kann den Ausfall einer Festplatte auffangen. Wenn ein Hot-Spare-Laufwerk als 5. Laufwerk konfiguriert ist, kann dies als Leerlauflaufwerk im System konfiguriert werden, ohne dass Daten darauf gespeichert werden. Wenn eine Festplatte ausfällt, können die Daten auf dem Hot Spare wiederhergestellt werden, indem die Daten in der Parität auf den anderen Laufwerken verwendet werden. Nachdem die Wiederherstellung der Daten abgeschlossen ist, können Sie das fehlerhafte Laufwerk entfernen und durch eine neue Festplatte ersetzen, das dann zur neuen Hotspare-Platte wird.
  • RAID 6 setzt auf dem Konzept von RAID 5 auf und fügt weitere Redundanz mit einer Dual-Parity/Zweifach-Parität hinzu. Dadurch können Daten neu erstellt werden, auch wenn zwei Festplatten innerhalb des Arrays ausfallen. Die Dual-Parity ist auf alle Festplatten verteilt und nimmt den Platz zweier Laufwerke ein.

In den letzten 30 Jahren wurden viele weitere RAID-Level hauptsächlich von Herstellern von RAID-Systemen entwickelt. Heute verfügen wir über RAID-Levels von RAID 0 bis hin zu RAID 61 und darüber hinaus, wobei größere Unternehmen maßgeschneiderte RAID-Levels erstellen, um unterschiedliche Anwendungen und Infrastrukturanforderungen zu unterstützen.

Was, wenn eine Festplatte ausfällt und die Gefahren von RAID

Wenn eine Festplatte in einem RAID 1 oder RAID 5 ausfällt, sollte der Benutzer sie nicht gegen eine neue austauschen, bevor sichergestellt wird, dass alle Daten von den verbleibenden Festplatten gesichert wurden. In vielen Fällen – insbesondere wenn die Lösung Festplatten verwendet, die aus der gleichen Produktionslinie kommen – ist die Chance, dass eine andere Festplatte bald ausfallen wird, ziemlich groß. Und genau hier liegt auch die Gefahr dieses Konzepts:

Selbst bei allen Vorteilen, die RAID bietet, mehr Leistung neben mehr Datensicherheit, was viele – vor allem Privatanwender – vergessen und was jeder im Hinterkopf behalten sollte, ist, dass RAID eben nicht ein „Backup“ ist !!!

RAID kann in Kombination mit Backups verwendet werden und macht das gesamte Speichersystem somit deutlich sicherer, aber man sollte niemals ein RAID anstelle eines Backups verwenden! Im Gegenteil, wenn ein RAID-System ausfällt – zum Beispiel aufgrund eines defekten Hardware-RAID-Controllers oder mehrerer Festplatten, mehr als auf die das ausgewählte RAID-Level abzielt – ist es viel komplizierter, sowohl das RAID wieder zum Laufen zu bringen als auch die verlorenen Daten wiederherzustellen, wenn man von so einem Ereignis getroffen wird.

Besonders da NAS-Systeme für Privatanwender immer erschwinglicher geworden sind, nutzen sie die integrierten RAID-Möglichkeiten in Kombination mit anderen fortschrittlichen Speichertechnologien wie z.B. Deduplizierung, um so viel Performance und Platz wie möglich aus ihrem System herauszuholen. Das hat seinen Preis: In vielen Fällen sind diese Systeme falsch aufgebaut, und wenn ein Fehler auftritt, bricht das ganze System zusammen. Dann müssen Datenrettungsexperten wie die von Kroll Ontrack aus den vielen Technologien, die der Benutzer implementiert hat, mehrere Datenschichten rekonstruieren, bis die ursprünglichen Daten wieder verfügbar sind und wiederhergestellt werden können.

Vor der Einrichtung eines RAID-Arrays sollte der Benutzer – unabhängig davon, ob er ein Privatmann oder ein IT-Administrator eines Unternehmens ist – sorgfältig überlegen, ob RAID der beste Weg ist und welches RAID-Level seinen Anforderungen am besten entspricht. Denken Sie daran: Nachlässigkeit am Anfang kann zu ernsthaften Problemen, hohen Kosten und möglichem Datenverlust führen!

Mit diesen Hinweisen im Hinterkopf besteht eine große Wahrscheinlichkeit, dass RAID noch viele Jahre im Einsatz sein wird, obwohl mehr und mehr Daten gespeichert werden sollen und andere Speicherkonzepte wie z.B. diejenige die  EMC für ihre Isilon-Marke geschaffen hat, mit einem riesigen „Data Lake“ und eingebauten Sicherheitsmaßnahmen gegen Datenverlust, sich durchsetzen werden.  Es wird höchstwahrscheinlich noch viele, viele Jahre dauern, bis RAID endgültig verschwindet.

Bildnachweis: Paul-Georg Meister / pixelio.de