Et RAID-array er en samling af diske, der er konfigureret enten af software eller hardware på en bestemt måde for at beskytte data eller forbedre ydeevnen. Udtrykket RAID står for et redundant array af uafhængige diske (Redundant Array of Independent Disks). Der er mange forskellige typer RAID-arrays, der påvirker læse- og skrivehastigheden, såvel som redundans eller fejltolerance.
RAID 5 blev udviklet i begyndelsen af 80'erne og er den mest almindelige RAID-konfiguration. RAID 5 giver et godt kompromis mellem fejltolerance og ydeevne. Et RAID 5-array kræver mindst tre diske og giver øget læsehastighed, men ingen forbedringer i skriveydeevne. Dette RAID-niveau kan tolerere én defekt disk.
Ligesom et RAID 0-array, der striper data på tværs af flere diske for at forbedre ydeevnen, striper RAID 5 også data, men for beskyttelse tilføjer det en ekstra datastripe kendt som paritet. Dataene i paritetsstripen på de fleste RAID 5-konfigurationer er en XOR af dataene fra de andre stripes. Dette gør RAID 5 billigere at implementere end et RAID 10, da kun én diskplads er allokeret til paritet og tillader mere fleksibilitet og større volumenstørrelser end et RAID 10.
I eksemplet ovenfor er pariteten fundet i den første stripe på Disk 4 en XOR af data fra stripes Data 1, Data 2 og Data 3. Pariteten fundet i den anden stripe på Disk 3 er XOR af dataene fra stripes Data 4, Data 5 og Data 6 .
I eksemplet ovenfor ser vi, at en disk har fejlet. Når du mister en disk, vil arrayet gå i forringet tilstand. I degraderet tilstand vil RAID-controlleren efter behov kombinere datastripes med paritet for at præsentere gode data til operativsystemet. I vores eksempel vil controlleren kombinere Data 1, Data 3 og Parity for den første stripe for at erstatte de manglende data i Data 2. I den anden stripe bruges Data 4, Data 6 og Parity til at erstatte Data 5. I den tredje stripe er pariteten ikke nødvendig, da alle datadiske er til stede.
Hvis en hot spare er tilgængelig for systemet, vil controlleren automatisk begynde at gendanne de manglende data fra den fejlbehæftede disk til hot spare disken.
I eksemplet ovenfor har Disk 2 fejlet. Systemet brugte hot spare og gendannede alle de manglende data fra disk 2 til hot spare.
Når en disk fejler, er tid af afgørende betydning for en vellykket genopbygning. Kørsel i forringet tilstand lægger yderligere stress på de resterende diske og kan forårsage yderligere fejl, hvis de ikke rettes hurtigt. At have en eller flere hot spare-diske til rådighed giver hurtigere gendannelsestider.
Datarekonstruktion ved én defekt disk
Hvis én disk i et RAID 5-array fejler, kan paritet bruges til at gendanne de manglende data. I dette tilfælde er Ibas Ontrack normalt i stand til at rekonstruere 100 % af dataene. Ved modtagelse af et ikke-funktionelt array rekonstrueres hver disk bedst muligt i renrumslaboratoriet. Arrayet bliver så stort set genopbygget. Når RAID-arrayet er samlet, scannes filsystemet eller volumen for korruption, repareres og dataene udtrækkes. Den defekte disk er ofte ikke nødvendig, da eventuelle manglende datastripes kan gendannes ved hjælp af paritet.
Datarekonstruktion ved flere defekte diske
Processen for datarekonstruktion ved flere defekte diske er den samme som ved en enkelt defekt disk. Ved modtagelse af et ikke-funktionelt array rekonstrueres hver disk bedst muligt i renrumslaboratoriet. Det er vigtigt at rekonstruere så meget som muligt fra hver af de defekte diske, da dette gør det muligt at rekonstruere flere data.
Arrayet bliver så virtuelt bygget op igen. I eksemplet bruges Data 2, Data 3 og Parity fra den første stripe til at rekonstruere Data 1. Paritet er ikke nødvendig i den anden stripe, da alle datablokkene er til stede. I den tredje stripe er Data 7, Parity og Data 8 kombineret for at erstatte Data 9.
Når RAID-arrayet samles igen, scannes filsystemet eller diskenheden for korruption. Ud over korruption af filsystemet leder ingeniører også efter forældede eller inkonsistente data. Dette sker, når der er forskellige tidspunkter for, hvornår hver enkelt disk fejlede. Datarekonstruktionsingeniører har brug for omfattende erfaring for at genkende denne type skader, så de korrekt kan reparere volumen og udtrække OK-data.