Comprendre le fonctionnement du système RAID

mercredi 3 novembre 2021 par Ontrack

Système RAID

Redundant Array of Independant (à l’origine Inexpensive) Disk (RAID) est un terme utilisé pour les systèmes de stockage de données informatiques qui diffusent et/ou répliquent des données sur plusieurs disques. La technologie RAID a révolutionné le stockage de données des entreprises et a été conçu avec deux objectifs principaux : augmenter la fiabilité des données et améliorer les performances de l’E/S (Entrée/Sortie ou I/O Input/Output).

Malheureusement, le stockage RAID n’est pas une technologie parfaite et une perte de données peut se produire lors de l’utilisation de ces systèmes. Découvrons le fonctionnement des RAID et comment les données peuvent être stockées (et perdues !) avec ce type de stockage.

Comment fonctionne un système RAID ?

Un système RAID combine des disques physiques en une seule unité logique à l’aide d’un matériel ou d’un logiciel spécial. Les solutions matérielles peuvent prendre différentes formes, de l’intégration à la carte mère ou l’ajout d’une carte, à l’intégration via des serveurs NAS ou SAN. Avec ces configurations, le système d’exploitation (OS) n’a pas connaissance du fonctionnement technique du RAID. Les solutions logicielles, quant à elles, sont généralement intégrées au système d’exploitation.

Les systèmes RAID sont généralement utilisés sur les serveurs, mais ils peuvent également être utilisés sur les postes de travail. Cela est particulièrement vrai pour les ordinateurs utilisés pour le montage audio et vidéo, où des capacités de stockage et des vitesses de transferts élevées sont nécessaires.

Avant d’entrer dans les détails, jetons un œil à quelques-uns des termes techniques couramment utilisés pour décrire les systèmes de stockage RAID :

  • RAID : Une technologie qui prend en charge diverses configurations de disques durs afin d’améliorer les performances, la fiabilité et la capacité de stockage grâce à la consolidation de ressources de disques et des calculs de parité,
  • Parité : Calcul mathématique qui permet la reconstitution de données stockées dans un système RAID, même si un disque tombe en panne,
  • Mirroring : Les données d'un ou plusieurs disques durs sont dupliquées sur un autre disque physique,
  • Stripping : Un procédé dans lequel les données peuvent être écrites sur plusieurs disques. Les données sont écrites sur les disques dans un ordre séquentiel jusqu’au dernier disque, elles reviennent ensuite sur le premier et commencent une seconde bande,
  • Bloc : Un bloc est l’espace logique de chaque disque où les données sont écrites, la capacité de l’espace est définie par le contrôleur RAID,
  • Symétrie Gauche/Droite : La symétrie dans un RAID contrôle la manière dont les données et la parité sont réparties sur les disques. Il y a 4 principaux types de symétrie, chacune d’entre elles est utilisée selon le vendeur du RAID. Certaines entreprises font également des types de propriété en fonction de leurs besoins,
  • Hot Spare : Il existe différentes méthodes pour faire un dépannage RAID, l’une d’entre elles est l’utilisation d’un disque de secours. C’est un disque de rechange qui peut être utilisé à la place de celui altéré,
  • Mode dégradé : Cela arrive lorsqu’un disque du RAID devient illisible, le disque est alors considéré comme mauvais et est retiré du RAID. Les nouvelles données et la parité sont ensuite écrites sur les disques restants du RAID. Si une de ces données est sollicitée depuis le disque défaillant, alors elle est transférée grâce à la parité sur les autres. Cela dégrade les performances du RAID.

Examinons maintenant les concepts clés du RAID et explorons le fonctionnement des configurations les plus fréquentes.

Les niveaux de RAID

Tout d’abord, nous allons aborder les trois concepts clés du RAID : le mirroring, la copie de données sur plus d’un disque ; le striping, la division des données sur plus d’un disque ; et la correction d’erreur, le stockage des données redondantes afin de détecter et résoudre les problèmes (connu sous le nom de tolérance aux pannes). Différentes configurations RAID utilisent une ou plusieurs de ces techniques en fonction des exigences du système.

Les configurations RAID standard sont appelées niveaux. A l’origine, il y avait cinq niveaux, mais beaucoup de variations sont apparues, notamment celles avec plusieurs niveaux imbriqués et des niveaux non standards (la plupart du temps propriétaire). Ainsi, nous avons vu des niveaux de RAID allant de RAID 0 à RAID 51 (et au-delà). Les différents niveaux ont différents types de redondance, et un compromis doit être généralement fait entre la tolérance aux pannes et la performance, en fonction de l’utilisation. Par exemple, certains niveaux de base comprennent :

  • RAID 0 : Souvent appelé « striping », c’est le niveau de RAID le plus basique. Il n’offre pas de redondance mais une excellente performance. Les données sont réparties sur au moins deux disques et, avec chaque disque ajouté, les performances de lecture/écriture et la capacité de stockage sont améliorées sur un seul disque,
  • RAID 1 : Ce niveau est aussi appelé « mirroring », qui, comme son nom l’indique, reflète les mêmes données sur deux disques, fournissant ainsi le niveau le plus bas de redondance RAID. Ce niveau peut jusqu’à doubler les performances de lecture sur un seul disque, mais ne modifie pas la vitesse d’écriture. Les données stockées sont toujours accessibles tant qu’un disque continue de fonctionner,
  • RAID 5 : C’est une configuration basique qui offre un bon compromis entre la sécurité et la performance. Il faut au moins trois disques. Il fournit un gain de vitesse de lecture mais n’améliore pas les performances d’écriture. Le RAID 5 introduit la « parité » dans la matrice, qui occupe la place d’un disque. Ce niveau peut tolérer la panne d’un disque,
  • RAID 6 : Il reprend le concept du RAID 5 en l’emmenant plus loin – un minimum de 4 disques sont nécessaires et il introduit la double parité. Cela signifie que des données peuvent être créées même si deux disques subissent une panne dans la matrice.

Les matrices RAID modernes

Aujourd’hui, il existe de nombreuses façons d’obtenir plus de votre système RAID. Toutefois, étant donné la nature très complexe et technique des matrices modernes (et comment elles peuvent être utilisées avec d’autres systèmes complexes pour améliorer l’efficacité et augmenter les bénéfices, tels que la virtualisation), il n’est pas rare que l’une de ces technologies souffre d’un défaut. Lorsque cela se produit, en raison de l’inter-connectivité des systèmes multiples, cela peut potentiellement causer une importante perte de données, ce qui peut coûter des millions aux entreprises qui devront cesser leur activité.

Les matrices RAID modernes peuvent également utiliser plusieurs systèmes de fichiers, comme le BTRFS ou ZFS au niveau du matériel, avec des surcouches NTFS ou HFS pour le support des applications via la virtualisation.

Défis pour la récupération de données

Comme vous avez pu le voir, les matrices RAID sont très complexes. Ceci est souvent intensifié dans les infrastructures informatiques des entreprises car les systèmes RAID sont utilisés principalement pour des tâches essentielles de l’entreprise ; où la disponibilité et l’efficacité sont des facteurs cruciaux. De plus, de nouvelles technologies comme la virtualisation ou des applications de base de données peuvent être synonymes de catastrophe pour une entreprise si le système tombe en panne.

Du point de vue de la récupération de données, il serait habituellement nécessaire de reconstruire non seulement le système de fichiers RAID, et de contourner les défaillances physiques, mais également d’évaluer toute architecture virtualisée qui peut exister. Cela peut souvent rendre une tentative de récupération extrêmement complexe et prendre du temps ; cependant, dans de nombreux cas, les récupérations de données sont couronnées de succès.

Préparez-vous pour la perte de données

Malheureusement, les disques peuvent (et vont) tomber en panne à un moment ou un autre. Lorsque cela se produit, si les disques individuels tombent en panne, alors (en supposant qu’il soit RAID 1 ou supérieur) le disque défectueux peut simplement être remplacé par un nouveau et la carte de stockage des données reconstruite sans perte de données. Si une panne du disque dépasse la capacité de redondance du RAID, vous devriez consulter un spécialiste de la récupération de données pour augmenter vos chances de récupération. Il est impératif de vous assurer que le fournisseur que vous avez choisi possède les outils et l’expertise pour effectuer une récupération dans toutes les configurations ou perte de données. Vous devez également déterminer s'il a ou non des partenariats directs avec les fournisseurs de stockage et des capacités de développement pour recevoir des configurations sur mesure.