Il RAID (Redundant Array of Independent Disk) ha rivoluzionato la tecnologia di archiviazione dei dati aziendali, grazie alla soluzione della ridondanza (dalle configurazioni RAID 1 e successive versioni) che riduce notevolmente i periodi di inattività causati da guasti agli hard disk. 

Sfortunatamente, però, quella RAID non è una tecnologia perfetta e, di conseguenza, si possono sempre verificare casi di perdita dei dati.

Definizione di Sistema di storage RAID

La difnizione di RAID risiede nel nome stesso del sistema. Infatti, RAID sta per "Redundant Array of Independent Disks", che letteralmente significa "insieme ridondante di dischi indipendenti". In pratica si tratta di un cluster di più hard disk collegati in modo da ottenere una singola partizione logica. In base alle esigenze, il RAID permette di incrementare le perfomance di lettura e scrittura dei dati oppure di migliorare la sicurezza delle informazioni.

La tecnologia RAID supporta l'uso di due o più dischi in diverse configurazioni allo scopo di ottenere migliori performance, sicurezza e capacità.

Sono state create numerose configurazioni diverse, che sono indicate come livelli. Originariamente si ricordano cinque livelli RAID, ma che si sono poi evoluti in molte altre variazioni, come numerosi livelli annidati o proprietari.

RAID 0, RAID 1, RAID 5, RAID 10: cosa si indicano i livelli RAID? I numeri si riferiscono semplicemente alle diverse configurazioni RAID. Dato che tutti i sistemi RAID memorizzano i dati efficacemente, la scelta del sistema si baserà sulle specifiche esigenza personali. 

Storia del sistema RAID

RAID è l'acronimo di Redundant Array of Inexpensive Disks (nella prima definizione). L'idea è nata all'Università della California, a Berkeley, dove David A. Patterson, Garth Gibson e Randy H. Katz collaboravano per produrre prototipi operativi di cinque livelli di sistemi di archiviazione RAID. Il risultato della loro ricerca ha costituito la base dei complessi sistemi di archiviazione RAID esistenti oggi. Oggi IBM detiene i diritti di proprietà intellettuale su RAID 5.

L'architettura del sistema di storage RAID era finalizzato a migliorare le prestazioni, il recupero, l'affidabilità e la scalabilità della capacità di storage. Il risultato è stato l'ideazione di un concetto unico di ridondanza, che offre la possibilità di recupero dei dati nel caso in cui un'unità del sistema dovesse guastarsi. Infatti, le schede controller del RAID hanno la capacità di continuare a leggere e scrivere dati anche se un disco è "offline".

Panoramica del sistema RAID

RAID è un termine utilizzato per indicare schemi di archiviazione dei dati che dividono e duplicano i dati tra diverse unità disco. Il RAID è stato progettato con due obiettivi principali: aumentare la sicurezza dei dati e le prestazioni I/O (input/output).

Un RAID aggrega fisicamente gli hard disk in una singola unità logica, utilizzando speciali soluzioni hardware e software. Esistono diverse soluzioni hardware, da quelle integrate sulla scheda madre a quelle che utilizzano schede dedicate, fino a sistema server NAS o SAN. Grazie a questi setup il tipo di hardware e software del RAID è indifferrente per il sistema operativo. 

Ci sono tre concetti chiave nei RAID: 

  • il mirroring, cioè la copia esatta dei dati su più dischi
  • lo striping, la suddivisione dei dati in sezioni distribuite su più di un disco
  • la correzione degli errori, che permette di memorizzare dati ridondati per rilevare eventuali errori e correggerli (nota come fault tolerance).

I diversi livelli di RAID utilizzano uno o più di queste tecnologie, a seconda dei requisiti di sistema.

La tecnologia RAID è solitamente utilizzati per i server, ma può essere implementata per le workstation. Quest'ultimo caso è particolarmente diffuso nei computer che sfruttano intensamente la memoria, come quelli utilizzati per l'editing di video e audio.

Configurazioni RAID

La configurazione logica del sistema divide i dati in sezioni che vengono suddivise equamente su tutti i dischi fisici del sistema. Questo permette di aver una distribuzione bilanciata su tutti i dischi: invece di avere un disco che svolge tutte le operazioni di lettura e scrittura dei dati, tutti i dischi lavorano insieme. 

Operazioni ridondanti o fault-tolerant 

La ridondanza in una configurazione RAID 5 attuale è il risultato dell'uso di una funziona matematica booleana chiamata "Disgiunzione esclusiva" (XOR, dall'inglese eXlusive OR). Il risultato di questa funzione è quello a cui ci riferiamo normalmente con il termine "parity". La funzione XOR è un processo binario logico. È più semplice considerare la parity come una combinazione dei blocchi di dati dei vari dischi. Ogni byte che viene scritto su un blocco di parity è calcolato rispetto agli altri blocchi di dati. Questo calcolo funzionerà sempre, indipendentemente dalla mancanza di un blocco di dati. Tuttavia, il calcolo non funzionerà se dovessero mancare due blocchi. In pratica, solo un disco può guastarsi senza compromettere il funzionamento del sistema. La configurazione RAID 5 non offre una ridondanza adeguata se due o più dischi dovessero rompersi.

Come indicato in precedenza, la scheda di controllo (controller board) divide i dati in sezioni ed esegue anche la funzione XOR su tali dati. La quantità di calcoli logici eseguiti ogni secondo dalla scheda di controllo è impressionante. I controller RAID moderni sono sistemi hardware molto sofisticati, così come i processori SDRAM e i banchi di memoria progettati espressamente per offrire performance e ridondanza.

Recupero dati RAID

Sebbene i sistemi RAID siano progettati per essere fault-tolerant, guasti hardware o di altro tipo possono rendere inaccessibili i tuoi dati. Se il sistema dovesse riscontrare qualsiasi tipo di problema con il suo RAID array, Ontrack Data Recovery possiede l'esperienza, le procedure e le tecniche per recuperare i tuoi dati.

I nostri ingegneri concordano col fatto che il ripristino dei RAID array rappresenta una delle sfide tecniche più difficili del recupero dei dati. La valutazione accurata di un recupero dati da sistema RAID è in realtà la combinazione di due step molto importanti:

  1. Il primo e più lungo passaggio è la ricostruzione della matrice. Quando gli ingegneri Ontrack Data Recovery riassemblano il sistema logico, eseguono una ricerca approfondita su come i dati sono organizzati su tutti i dischi. Definisco così l'ordine dei dischi e la disposizione dei blocchi di dati e dei blocchi di parity. Questo processo è un aspetto fondamentale per determinare la configurazione originale e offrire un recupero dati di qualità.
  2. Il secondo step consiste nell'operare sul file system logico. I log file system aziendali sono estremamente complessi. Se il RAID array non funziona, ci saranno migliaia di errori nel file system. I tecnici di Ontrack Data Recovery verificheranno che la matrice sia strutturata correttamente prima di copiare qualsiasi dato. Questo passaggio aggiuntivo fa la differenza e garantisce un recupero dati di qualità.

RAID: glossario e termini più diffusi

RAID: acronimo di "Redundant Array of Independent Disk". È una tecnologia che supporta l'utilizzo di 2 o più hard disk in varie configurazioni, allo scopo di ottenere maggiori prestazioni, affidabilità e capacità mediante l'utilizzo di risorse disco consolidate e calcoli di parità.

Parity (parità): calcolo matematico che consente alle unità all'interno di un array RAID di guastarsi senza generare la perdita dei dati. Il modo più semplice per spiegarne il funzionamento è l'equazione: A + B = C. Puoi rimuovere una qualunque delle lettere e calcolarne il suo valore dalle due rimanenti. Ad esempio, se la lettera B viene rimossa, l'equazione sarà A +? = C. Il valore di B può essere ricavato spostando la A come segue: B = C - A. Questo è ovviamente un modo semplicistico di descrivere il funzionamento della parity. Per comprenderlo pienamente, è necessaria la conoscenza del codice binario e dell'espressione logica XOR.

Mirroring: duplicazione dei dati di 1 o più hard disk su almeno un altro disco fisico.

Striping: metodo di sezionamento con cui i dati e la parity vengono scritti e distribuiti su più dischi. 

Blocco: spazio logico in cui sono scritti i dati su ogni disco, la quantità di spazio è impostata dal controller RAID e solitamente è compresa tra 16KB e 256KB. I dati riempiono lo spazio disponibile fino al raggiungimento del limite, per passare poi alla successiva unità e così via, fino all'ultima unità. 

Simmetria sinistra/destra: in un RAID la simmetria controlla come i dati e la parità sono suddivisi tra le unità del sistema. Esistono quattro principali tipologie di simmetria e sono i fornitori di RAID a scegliere quale utilizzare. Alcune aziende creano simmetrie proprietarie in base alle proprie specifiche esigenze. 

Hot Spare: disco di riserva che viene utilizzato in caso di guasto di una delle unità del sistema.

Degraded mode: quando un hard disk del sistema RAID diventa illeggibile, l'unità viene considerata danneggiata e viene eliminata dal RAID. I nuovi dati e la parity vengono quindi scritti nelle unità rimanenti all'interno del RAID. Se vengono richiesti dati dall'unità guasta, questi sono elaborati grazie alla parità sulle altre. Ciò “degrada” le prestazioni del RAID, da qui l’espressione modalità degradata.

Inizia ora a recuperare i tuoi dati

Contatta il nostro team di specialisti. Ontrack è in grado di servire qualunque tipologia di cliente, dalle imprese di ogni dimensione agli enti della pubblica amministrazione fino ai singoli professionisti e l’utente privato.

 

Numero Verde 800 44 00 33 Richiedi un preventivo