Sviluppato nei primi anni '80, la configurazione RAID 5 è la più comune e fornisce un buon compromesso tra tolleranza agli errori e prestazioni. Un array RAID 5 richiede almeno tre dischi e offre una maggiore velocità di lettura, ma non migliora le prestazioni di scrittura. Questa configurazione RAID può tollerare il guasto di un hard disk.
Analogamente a un array RAID 0, che esegue lo stripping dei dati su più unità per migliorare le prestazioni, un RAID 5 esegue lo stripping dei dati ma aggiunge intervalli di parity bit (parity) per aumentarne la sicurezza in caso di guasto dei supporti. I dati contenuti nella parity, nella maggior parte delle configurazioni RAID 5, sono uno XOR dei dati delle altre strisce (stripes). Questo rende il RAID 5 più economico da implementare rispetto al RAID 10, in quanto solo una porzione delle unità è allocato per la parità, e consente una maggiore flessibilità e dimensioni del volume rispetto al RAID 1.
Nell'esempio precedente, la parità trovata sull'unità 4 per la prima striscia è lo XOR dei dati delle strisce denominate Data 1, Data 2 e Data 3. La parità trovata nella seconda striscia sull'unità 3 è lo XOR delle strisce di dati denominate Data 4, Data 5 e Data 6.
Nell'esempio precedente, vediamo che un'unità è guasta. Quando si verifica il malfunzionamento di un'unità, l'array passa in modalità degradata. In questa modalità, il controller RAID combina le strisce di dati con la parity per presentare dati validi al sistema operativo. Nel nostro esempio, il controller combinerà i data 1, i data 3 e la parity della prima striscia, per sostituire i dati mancanti nel data 2. Nella seconda striscia, i data 4 e i data 6 saranno combinati con la parity per sostituire i data 5. Nella terza striscia non è necessaria la parity, poiché sono presenti tutti i dati delle unità.
In caso di malfunzionamento, se il sistema dispone di un hot spare, il controller inizierà automaticamente a ricostruire i dati mancanti dall'unità guasta sull'hot spare.
Nell'esempio precedente, l'unità 2 si è guastata. Il sistema ha utilizzato l'hot spare e ha ricostruito tutti i dati mancanti dall'unità 2 all'hot spare.
Quando un drive si guasta, il tempo è un fattore importante per il rebuilding. Infatti, l'esecuzione in modalità degradata sottopone a ulteriori sollecitazioni le unità rimanenti e può causare ulteriori guasti se non viene risolta rapidamente. La disponibilità di uno o più hot spare consente tempi di ripristino più rapidi.
Recupero dei dati con un'unità guasta
Se un'unità si guasta in un array, la parità può essere utilizzata per ricostruire i dati mancanti. In questo scenario, Ontrack è solitamente in grado di recuperare il 100% dei dati. Quando ci troviamo di fronte ad un array non funzionante, le unità del sistema vengono sottoposte a imaging in camera bianca. Tali immagini vengono utilizzate nella ricostruzione virtuale dell’array. Una volta ricostruito il RAID, il file system o il volume vengono analizzati al fine di correggere eventuali danni ed estrarne i dati. Spesso non è necessario avere accesso all’unità guasta, poiché i dati mancanti possono essere ricostruiti dalla parity.
Recupero dati da più unità guaste
Quando si hanno più unità guaste, il processo di recupero è simile a quello appena descritto. Quando interveniamo su un array non funzionante, le unità vengono sottoposte a imaging in camera bianca. È importante eseguire il più possibile l'imaging di ciascuna unità guasta, per consentire il recupero di un maggior numero di dati.
Quindi l'array viene ricostruito virtualmente utilizzando queste immagini. Nell'esempio, i data 2, i data 3 e la parity della striscia 1 vengono usati per ricostruire i data 1. La parity non è necessaria nella seconda striscia, poiché tutti i blocchi di dati sono presenti. Nel terzo stripe, i data 7, la parity e i data 8 vengono combinati per sostituire i data 9.
Una volta che l'array RAID è stato virtualmente riassemblato, il file system o il volume vengono analizzati al fine di correggere eventuali danni. Oltre ad ovviare al danneggiamento del file system, i tecnici cercano di individuare anche dati non coerenti o non aggiornati. Questo scenario si verifica quando c’è un gap temporale tra il guasto delle unità ed una di esse è degradata. I tecnici di data recovery devono avere un’opportuna esperienza per riconoscere questo tipo di danno e poter riparare virtualmente il volume ed estrarre dati validi.