Storia della Tecnologia RAID

giovedì 4 novembre 2021 di Ontrack

DST_image_970x300_hero-virtualization

Non accade spesso nel settore IT che una tecnologia sviluppata molti decenni fa sia ancora ampiamente utilizzata e considerata importante dagli amministratori IT e altri utenti. Anche i server e i dispositivi di archiviazione moderni sono dotati di tecnologia RAID, principalmente utilizzata nelle aziende, ma sempre di più anche nei sistemi NAS consumer.

Nel campo dell'information technology, oltre tre decadi rappresentano un periodo davvero lungo. La tecnologia RAID invece è ancora in uso e ha un ruolo importante nel settore.

Come mai? Qual è il motivo di tale longevità? Ci fa piacere che tu l'abbia chiesto.

RAID... cominciamo dall'inizio

Quando David Patterson, Garth A. Gibson e Randy Katz dell'Università della California a Berkeley inventarono il termine RAID (Redundant Array of Independent Disks) nel 1987 e pubblicarono il proprio articolo “Case for Redundant Arrays of inexpensive Disks”, presentandolo alla conferenza SIGMOD nel giugno del 1988, gli hard disk erano ancora un prodotto abbastanza costoso e cercare di mantenere i dati su dispositivi di storage “snelli” era più che altro una necessità.

Era, inoltre, il periodo in cui nelle aziende venivano usati enormi computer mainframe, mentre i computer desktop non erano ampiamente diffusi nei luoghi di lavoro. Tuttavia, questa tendenza iniziò a cambiare e le vendite e l'utilizzo dei personal computer cominciarono a crescere.

Di conseguenza, gli hard disk per questi primi pc erano già molto più convenienti rispetto a quelli dei computer mainframe molto più grandi, quando i tre scienziati hanno elaborato la propria teoria.

Questo è il motivo per cui i tre hanno sviluppato la loro soluzione. Secondo loro, diversi hard disk collegati tra loro avrebbero battuto un singolo hard disk mainframe in termini di prestazioni. I tre sostenevano che anche se con l'utilizzo di molti hard disk sarebbe aumentato il tasso di errore, sarebbe stato possibile configurarli per la ridondanza in modo che l'affidabilità di un tale array potesse ampiamente superare quella di qualsiasi singola unità mainframe di grandi dimensioni. Il RAID è pertanto l'esatto contrario dell'allora comune SLED (Single Large Expensive Disk) in un computer mainframe.

RAID storage, come funziona

Per dirla con semplicità: il RAID si basa sul concetto che i dati sono distribuiti o replicati su più unità indipendenti. Le unità all'interno del sistema sono configurate in modo tale che i dati possono essere divisi o replicati su due o più dischi, per la distribuzione del carico o per contribuire al recupero dei dati in caso di guasto del disco.

Esistono due diverse modalità tecniche per ottenere questo risultato: con una soluzione hardware, un controller RAID dedicato; oppure con una soluzione software, che è per lo più già inclusa nei sistemi operativi moderni. I sistemi basati su hardware gestiscono la tecnologia RAID in maniera indipendente dal computer host utilizzando un controller RAID, così il sistema operativo è inconsapevole delle attività tecniche del RAID e vede l'intero sistema di storage come se fosse un singolo volume collegato al computer host.

Leggi il nostro approfondimento sulla storia sistema RAID.

RAID drives

Oltre a queste implementazioni tecniche, il concetto di RAID si basa su questi tre principi fondamentali:

  1. Parità (parity): è un modo di distribuire le informazioni attraverso un sistema RAID che consente ai dati di essere ripristinati in caso di guasto al disco.
  2. Ridondanza: è la duplicazione dei componenti fondamentali nell'architettura del sistema per aumentare l'affidabilità e agire come uno strumento a prova di errore. In sostanza, permette che si verifichino errori ai diversi componenti prima che l’intero sistema si guasti completamente e nel caso dei sistemi RAID, i componenti sono i dischi.
  3. Mirroring: gli stessi dati vengono duplicati da un disco all'altro. Lo striping è un altro metodo per cui i dati sono scritti su più dischi. Le diverse configurazioni RAID usano una o più di queste tecniche, a seconda dei requisiti di sistema.

Sulla base di questi principi sono stati sviluppati questi livelli RAID standard:

  • RAID 0 utilizza lo ‘striping’ ed è il livello RAID più semplice. Non offre ridondanza, ma aumenta le performance. I dati sono distribuiti su almeno due dischi e per ogni disco aggiunto le performance di lettura/scrittura e la capacità storage aumentano per ogni singola unità. In caso di errore di un disco, il controller RAID non può ricostruirlo.
  • RAID 1 utilizza il ‘mirroring’, che come suggerisce il nome stesso, duplica gli stessi dati su due dischi, offrendo il livello più basso di ridondanza RAID. RAID 1 può duplicare le performance di lettura su un singolo disco, ma non modifica la velocità di scrittura. Questo livello permette il guasto di un disco.
  • RAID 5 è una configurazione comune e rappresenta un buon compromesso tra affidabilità e performance. Offre un guadagno in termini di velocità di lettura, ma non aumenta le performance in scrittura. Il RAID 5 introduce la ‘parità’, che occupa, in tutto, lo spazio di un disco. Questo livello può gestire il guasto di un disco. Se si dispone di un disco hot spare configurato come un 5° disco, questo potrebbe rimanere inattivo nel sistema senza che su di esso sia stato salvato alcun dato. In caso di guasto a un disco, i dati possono essere ricostruiti sul disco hot spare utilizzando i dati di parità degli altri dischi. Una volta terminata la ricostruzione dei dati, è possibile rimuovere il disco guasto e sostituirlo con uno nuovo, che diventa il nuovo hot spare.
  • RAID 6 si basa sul concetto del RAID 5 e aggiunge ulteriore ridondanza con doppia parità. Ciò consente di ricreare i dati anche in caso di guasto di due dischi all'interno dell'array. La doppia parità è distribuita su tutti i dischi e occupa lo spazio di due dischi.

Oggi abbiamo svariate configurazioni RAID che vanno dal RAID 0 fino al RAID 61 e oltre, con le società più grandi che creano livelli RAID su misura per supportare requisiti applicativi e di infrastruttura differenti.

Cosa succede in caso di guasto a un disco e i pericoli della tecnologia RAID…

In caso di un guasto di un disco in una configurazione RAID 1 o RAID 5 l'utente non dovrebbe cambiarlo con uno nuovo prima di essere sicuro che sia stato effettuato il backup di ogni dato dei dischi restanti. In molti casi, in particolare quando la soluzione utilizza dischi provenienti dallo stesso lotto di produzione, la possibilità di un imminente guasto a un altro disco è piuttosto elevata. Si tratta del rischio di questa tecnologia.

Anche con tutti i vantaggi offerti dalla tecnologia RAID, maggiori performance in aggiunta a una maggiore sicurezza dei dati, ciò che molti utenti dimenticano è che RAID non è sinonimo di backup!

Il sistema RAID può essere utilizzato in combinazione con i backup, rendendo così l'intero sistema storage molto più sicuro, ma il RAID non deve mai essere utilizzato al posto del backup. Al contrario, in caso di guasto di un sistema RAID, ad esempio a causa di un controller RAID hardware malfunzionante o di un utilizzo di un numero di dischi maggiore rispetto a quello per cui il livello RAID selezionato è stato attrezzato, è molto più complicato ripristinare la piena operatività del RAID oltre che recuperare i dati persi.

In particolare, da quando i sistemi NAS sono diventati sempre più convenienti per gli utenti privati, essi utilizzano le funzionalità RAID integrate in combinazione con altre tecnologie di storage avanzate, come la deduplicazione, per ottenere più spazio possibile dal proprio sistema. Tutto ciò ha un costo: in molti casi questi sistemi sono configurati in maniera errata e quando si verifica un guasto, l'intero sistema collassa. Quindi gli esperti di data recovery, come i professionisti di Ontrack, devono ricostruire parecchi livelli di dati per le numerose tecnologie implementate dall'utente, fino a che non sono di nuovo disponibili per il recupero dei dati originali dal RAID.

Prima di configurare un array RAID l'utente, a prescindere che sia un consumer o un amministratore IT aziendale, dovrebbe considerare attentamente se il RAID è la migliore opzione possibile e quale livello RAID si adatta meglio alle sue esigenze.

Importante: la negligenza iniziale può comportare, in seguito, seri problemi, costi elevati e una possibile perdita dei dati!

Tenendo bene a mente questi consigli, esiste un'elevata possibilità che il RAID resti sulla cresta dell'onda ancora per molti anni, anche se si prevede che sempre più dati saranno archiviati e che prevarranno altre tecnologie di storage. Probabilmente ci vorranno molti, molti anni prima che il RAID scompaia dalle scene.

Se hai bisogno del ripristino dei dati RAID, non esitare a contattare gli esperti di Ontrack.

Servizi di recupero dati

Hai perso i tuoi dati? Contattaci subito per recuperarli.


Cosa pensano i clienti dei nostri servizi: