Zo werkt de RAID-opslag

maandag 28 maart 2022 door Ontrack-team

 

Redundant Array of Independent Disks (RAID) is een term die wordt gebruikt voor computergegevensopslagsystemen die gegevens over meerdere schijven verspreiden en/of repliceren. RAID-technologie heeft een revolutie teweeggebracht in de opslag van bedrijfsgegevens en is ontworpen met twee hoofddoelen: de betrouwbaarheid van gegevens verhogen en de I/O-prestaties (invoer/uitvoer) verbeteren.

Helaas is RAID-opslag geen perfecte technologie en als gevolg daarvan kan er nog steeds gegevensverlies optreden bij het gebruik van deze systemen. In dit bericht zullen we onderzoeken hoe RAID-niveaus werken en hoe gegevens kunnen worden opgeslagen (en verlorengaan) met dit type opslag.

 

Hoe werkt RAID?

 

Een RAID combineert fysieke schijven tot een enkele logische eenheid door gebruik te maken van speciale hardware of software. Hardware RAID-oplossingen kunnen in verschillende uitvoeringen worden geleverd, van gemonteerd op het moederbord of toegevoegd in de vorm van kaarten aan NAS- of SAN-servers van grote ondernemingen. Het besturingssysteem (OS) van dit type installatie is niet op de hoogte van de technische werking van de RAID, dus softwareoplossingen worden doorgaans binnen het besturingssysteem geïmplementeerd.

RAID wordt traditioneel gebruikt op servers, maar kan ook op werkstations worden gebruikt. Dit laatste is typisch voor opslagintensieve computers, zoals computers die worden gebruikt voor video- en audiobewerking, waar hoge opslagcapaciteiten en gegevensoverdrachtsnelheden vereist zijn.

 

Veelgebruikte termen voor RAID-opslag

 

Laten we eens kijken naar enkele van de technische termen die vaak worden gebruikt om aspecten van RAID-opslag te beschrijven:

  • RAID - Een technologie die verschillende configuraties van harde schijven ondersteunt om betere prestaties, betrouwbaarheid en grotere volumes te bereiken door het gebruik van consoliderende schijfbronnen en pariteitsberekeningen.

  • Pariteit – Gedistribueerde informatie waarmee gegevens die zijn opgeslagen in een RAID-array kunnen worden gereconstrueerd, zelfs als een schijf defect raakt.

  • Spiegelen – Wanneer gegevens van 1 of meer harde schijven worden gedupliceerd naar andere fysieke schijven.

  • Striping – Een methode waarbij gegevens over meerdere schijven kunnen worden geschreven. In het onderstaande voorbeeld worden gegevens in een sequentiële volgorde over de schijven verdeeld totdat ze de laatste schijf hebben bereikt. Er wordt dan teruggesprongen naar de eerste schijf en er start een tweede streep enz.

  • – Een blok is de logische ruimte op elke schijf waar de gegevens worden geschreven; de hoeveelheid ruimte wordt ingesteld door de RAID-controller.
  • Links/rechts symmetrie – Symmetrie in een RAID bepaalt hoe de gegevens en pariteit over de schijven worden verdeeld. Er zijn vier hoofdstijlen van symmetrie die kunnen worden gebruikt, afhankelijk van de RAID-leverancier. Sommige bedrijven maken ook eigen stijlen, afhankelijk van hun zakelijke behoeften.

  • Hot spare – Er zijn een paar verschillende methoden voor het omgaan met schijfstoringen binnen een RAID. Eén methode is het gebruik van een 'hot spare', een reserveschijf die kan worden gebruikt in plaats van een defecte schijf.

  • Verslechterde modus – Dit gebeurt wanneer een schijf in de RAID onleesbaar wordt. De schijf wordt dan als slecht beschouwd en wordt uit de RAID verwijderd. De nieuwe gegevens en pariteit worden vervolgens naar de resterende schijven in de RAID geschreven. Als er gegevens worden opgevraagd van de defecte schijf, wordt dit uitgewerkt met de pariteit op de andere. Deze afname van het aantal schijven verslechtert de prestaties van de RAID.

Laten we nu eens kijken naar de drie belangrijkste concepten in RAID (spiegelen, stripen en foutcorrectie) en onderzoeken hoe sommige van de traditionele niveauconfiguraties werken.

RAID-opslagniveaus

Zoals eerder vermeld, omvat spiegelen het kopiëren van gegevens naar meer dan één schijf, stripen vindt plaats wanneer gegevens over meer dan één schijf worden verdeeld en foutcorrectie treedt op wanneer overtollige gegevens worden opgeslagen om problemen te detecteren en mogelijk te verhelpen (bekend als fouttolerantie). Een of meer van deze technieken kunnen worden gebruikt binnen verschillende RAID-opstellingen, afhankelijk van de systeemvereisten.

Standaard-RAID-configuraties worden aangeduid als niveaus. Oorspronkelijk zijn er vijf niveaus gemaakt, maar er zijn veel meer variaties ontstaan, waaronder verschillende geneste niveaus en veel niet-standaard (meestal eigen) niveaus. De industrie heeft de niveaus al zien stijgen van RAID 0 naar RAID 51 (en verder). Omdat verschillende niveaus verschillende soorten redundantie hebben, moet er, afhankelijk van de toepassing, meestal een afweging worden gemaakt tussen fouttolerantie en prestaties.

Basis RAID-niveaus zijn onder meer:

  • RAID 0 – Vaak genoemd 'stripen', wordt dit beschouwd als het meest basale RAID-niveau. Het biedt geen redundantie maar uitstekende prestaties. Gegevens worden gestriped over ten minste twee schijven en met elke schijf die wordt toegevoegd, worden de lees-/schrijfprestaties en opslagcapaciteit vergroot over een enkele schijf.

  • RAID 1 – Dit niveau wordt ook wel 'spiegelen' genoemd, dat (zoals de naam al doet vermoeden) dezelfde gegevens op twee schijven spiegelt; biedt het laagste niveau van RAID-redundantie. Dit niveau biedt tot dubbele leesprestaties ten opzichte van een enkele schijf, maar geen verhoging van de schrijfsnelheid. Opgeslagen gegevens zijn altijd toegankelijk als één schijf nog werkt.

  • RAID 5 – Dit is een veelgebruikte configuratie die een behoorlijk compromis biedt tussen beveiliging en prestaties. Het vereist ten minste drie schijven en biedt een winst in leessnelheden, maar geen toename in schrijfprestaties. RAID 5 introduceert 'pariteit' naar de array, die in totaal de ruimte van één schijf in beslag neemt. Dit niveau kan ook één schijffout tolereren.

  • RAID 6 – Dit gaat nog een stap verder met het concept van RAID 5: er zijn minimaal vier schijven vereist en er is duale-pariteit geïntroduceerd, wat betekent dat gegevens opnieuw kunnen worden gemaakt, zelfs als twee schijven binnen de array defect raken.

Moderne RAID-arrays

Er zijn veel manieren om meer uit uw RAID-systeem te halen. Gezien de zeer gecompliceerde en technische aard van moderne arrays (en hoe ze kunnen worden gebruikt met andere complexe systemen voor aanzienlijke efficiëntie- en kostenvoordelen, zoals virtualisatie), is het echter niet ongebruikelijk dat een van deze technologieën defect raakt. Dit kan aanzienlijk gegevensverlies veroorzaken als gevolg van de interconnectiviteit van meerdere systemen en kan bedrijven daardoor miljoenen aan downtime kosten.

Moderne RAID-arrays kunnen ook meerdere bestandssystemen gebruiken, zoals BTRFS of ZFS op hardwareniveau, met NTFS of HFS over de top gelaagd voor applicatieondersteuning via virtualisatie.

RAID-gegevens herstel uitdagingen

RAID-arrays zijn zeer complex. Dit wordt vaak versterkt binnen IT-infrastructuren van ondernemingen, aangezien RAID-systemen meestal worden gebruikt voor bedrijfskritieke toepassingen, waarbij beschikbaarheid en efficiëntie cruciale factoren zijn. Add-ontechnologieën zoals virtualisatie of databasetoepassingen kunnen ook rampzalig zijn voor een bedrijf als het systeem zou falen.

Vanuit het oogpunt van gegevensherstel zou het normaal gesproken nodig zijn om het RAID-bestandssysteem te reconstrueren en fysieke storingen te omzeilen, evenals eventuele bestaande gevirtualiseerde architectuur te beoordelen. Dit proces kan een herstelpoging vaak extreem complex en tijdrovend maken; maar in veel gevallen kan gegevensherstel zeer succesvol zijn.

Voorbereiden op schijfstoring

Helaas kunnen (en zullen) schijven op een bepaald moment in hun leven defect raken. Als er een storing optreedt met afzonderlijke schijven (ervan uitgaande dat het een RAID 1 of hoger is), kan de defecte schijf gewoon worden vervangen door een nieuwe en kan de gegevensopslagkaart opnieuw worden opgebouwd zonder gegevensverlies. Maar als een schijfstoring de redundantiecapaciteit van de RAID overschrijdt, moet er onmiddellijk contact opgenomen worden met een professionele raid data recovery specialist  voor de beste kans op gegevensherstel Het is absoluut noodzakelijk om ervoor te zorgen dat de door u gekozen provider over de tools en expertise beschikt om herstellen van elke configuratie of situatie met gegevensverlies. U moet ook beoordelen of ze directe samenwerkingsverbanden hebben met opslagleveranciers en ontwikkelingsmogelijkheden hebben voor het accommoderen van nieuwe of aangepaste configuraties.

Hebt u onlangs te maken gehad met RAID-gegevensverlies? Neem contact op met de experts van Ontrack voor hulp bij het ophalen van uw bedrijfskritieke gegevens. Ons personeel staat 24/7/365 voor u klaar om u te helpen met uw behoeften, van alledaagse tot once-in-a-lifetime scenario's voor gegevensverlies.

 

 

img_600x600_shirtontrack

Direct hulp nodig? Bel!