What does a RAID 6 configuration look like?

RAID 6 is similar to RAID 5 in that both arrays use parity and data striping. The difference is where RAID 5 has one instance of parity, RAID 6 has two parity stripes. This allows a RAID 6 array to withstand two drive failures rather than just one. The data contained in the first parity stripe in most RAID 6 configurations is an XOR of the data from the other stripes, the second parity stripe is typically a proprietary algorithm.

What does parity do in a RAID 6 array?

Parity is a mathematical feature that provides additional protection because it allows for the reconstruction of lost data. Having a block of parity as part of every data stripe allows the system to rebuild in the event one or more of the drives fails or goes offline. The RAID controller or RAID software can virtually rebuild any missing data segment by using parity.

How does a Hot Spare work in a RAID 6 array?

A hot spare is one or more additional drives that can be added to a RAID 6 array to allow for fast recovery in the event of a failed drive. In the above example, we see a healthy RAID 6 array with a single hot spare added. Note that the hot spare does not contain any data until a failure occurs and the drive is needed.

What causes failures in RAID 6 arrays?

There are several reasons why a RAID 6 array might fail. Here are several of the leading causes we see at Ontrack. - Multiple disk failures - Power issues (power spike or low voltage) - RAID controller or RAID software failure - RAID corruption (including logical corruption) - Flood/Water or Fire Damage - Failed or Partial Rebuilds

Is data recovery from RAID 6 possible?

Data recovery is possible from a RAID 6 array. While data recovery can be complex and more challenging with a RAID 6 array, it generally ends successfully. The biggest challenge is often the proprietary algorithm used to create the second parity block as each manufacturer implements this differently, and custom development is often needed to research and develop tools to support this.

RAID 6 : allier tolérance aux pannes et performance

Retour à l'accueil

Une matrice RAID est un ensemble de disques configurés de manière logicielle ou matérielle pour protéger les données, améliorer les performances, ou les deux. Le terme RAID signifie "réseau redondant de disques indépendants". Il existe de nombreux types de matrices RAID qui influent sur les vitesses de lecture et d'écriture, ainsi que sur la redondance ou la tolérance aux pannes.

Le RAID 6, comme le RAID 5, a également été développé dans les années 1980. Une matrice RAID 6 construite avec un contrôleur matériel est souvent utilisée comme un bon compromis entre la redondance et la vitesse. Une matrice RAID 6 nécessite au moins quatre disques et offre des vitesses de lecture accrues avec un impact minimal sur les performances d'écriture. Ce niveau RAID peut tolérer deux défaillances de disque.

À quoi ressemble une configuration RAID 6 ?

Le RAID 6 est similaire au RAID 5 dans la mesure où les deux matrices utilisent la parité et les bandes (striping) des données. La différence est que le RAID 5 a une instance de parité, alors que le RAID 6 a deux bandes de parité. Cela permet à une matrice RAID 6 de résister à deux pannes de disque au lieu d'une seule. Dans la plupart des configurations RAID 6, les données contenues dans la première bande de parité sont un XOR des données des autres bandes, la deuxième bande de parité étant généralement un algorithme propriétaire.

Les matrices RAID 6 devront consacrer deux disques de données à la parité. Cela signifie qu'une matrice RAID 6 est toujours moins chère à mettre en œuvre qu'une matrice RAID 10 de même taille, car seuls deux disques sont alloués à la parité. Le RAID 6 permet également une plus grande flexibilité et des volumes plus importants que le RAID 1.

Matrice RAID 6

Dans l'exemple ci-dessus, nous avons une matrice RAID 6 à cinq disques, comme celle que l'on trouve dans un serveur Dell PowerEdge. Le premier bloc de parité (Parité 1) situé sur le disque 4 pour la première bande est le XOR des données des blocs nommés Données 1 (Disque 1), Données 2 (Disque 2) et Données 3 (Disque 3).

Le deuxième bloc de parité (Parité 2), situé sur le Données 5 pour la première bande, est une combinaison des données des blocs Données 1, Données 2, Données 3 et peut inclure la Parité 1 en fonction du fabricant et du contrôleur. Ces calculs de parité sont répétés sur toutes les bandes de données en utilisant différentes combinaisons de lecteurs.

Quel est le rôle de la parité dans une matrice RAID 6 ?

La parité est une fonction mathématique qui offre une protection supplémentaire car elle permet de reconstruire les données perdues. La présence d'un bloc de parité dans chaque bande de données permet au système de se reconstruire en cas de défaillance ou de mise hors ligne d'un ou de plusieurs disques. Le contrôleur RAID ou le logiciel RAID peut virtuellement reconstruire tout segment de données manquant en utilisant la parité.

Dans l'exemple ci-dessous, nous voyons que le disque 2 est tombé en panne :

Matrice RAID 6- 1 disque défaillant

En cas de perte d'un disque, la matrice passe en mode dégradé. En mode dégradé, le contrôleur RAID combine les bandes de données avec la parité si nécessaire pour présenter des données correctes au système d'exploitation. Dans notre exemple, le contrôleur combinera les Données 1, les Données 3 et la Parité 1 pour la première bande afin de remplacer les données manquantes des Données 2. Dans la deuxième bande, les Données 4, 6 et la Parité 1 sont utilisées pour remplacer les Données 5. Dans les troisième et quatrième bandes, aucune parité n'est nécessaire puisque tous les disques de données sont présents.

Avec deux blocs de parité par bande, le RAID 6 permet à deux disques de tomber en panne. Dans l'exemple ci-dessous, nous voyons que les Disques 2 et 4 sont tombés en panne :

Matrice RAID 6- 2 disques défaillants

En cas de perte de deux disques, le contrôleur utilise les bandes de données combinées aux blocs de Parité 1 et 2 pour recréer les données manquantes. Dans notre exemple, le contrôleur combinera les Données 1, les Données 3 et la Parité 2 pour la première bande afin de remplacer les données manquantes dans les Données 2. Dans la deuxième bande, les Données 4, 6 et la Parité 1 sont utilisées pour remplacer les Données 5. Dans la troisième bande, les Données 7, les Données 9 et la Parité 2 sont utilisées pour remplacer les Données 8.

Comment fonctionne un disque de secours (Hot spare) dans une matrice RAID 6 ?

Matrice RAID 6- fonctionnelle avec Hot spare

Un disque de secours (Hot Spare, en anglais) est un ou plusieurs disques supplémentaires qui peuvent être ajoutés à une matrice RAID 6 pour permettre une récupération rapide en cas de défaillance d'un disque. Dans l'exemple ci-dessus, nous voyons une matrice RAID 6 saine à laquelle a été ajouté un seul disque de secours. Notez que le disque de secours ne contient aucune donnée jusqu'à ce qu'une panne survienne et que le disque soit nécessaire.

Si le système dispose d'un disque de secours, en cas de panne, le contrôleur commencera automatiquement à reconstruire les données manquantes du disque défaillant sur le disque de secours.

Matrice RAID 6- 1 disque défaillant avec Hot spare

L’exemple ci-dessus illustre la panne du Disque 2. Le système a alors utilisé le disque de secours pour reconstruire l’ensemble des données manquantes du disque défectueux. Une fois cette opération terminée, le Disque 2 peut être retiré et remplacé par un nouveau disque, soit en tant que disque de secours, soit en tant que Disque 2, sur lequel les données seront restaurées.

Pourquoi prévoir des disques de secours ?
Lorsqu’un disque tombe en panne, la reconstruction doit être effectuée rapidement. Le fonctionnement en mode dégradé sollicite davantage les disques restants, ce qui augmente le risque de nouvelles défaillances si la situation perdure. De plus, les disques issus d’un même lot peuvent présenter des défauts similaires, ce qui accroît la probabilité d’autres pannes. Disposer d’un ou plusieurs disques de secours permet d’accélérer la récupération et de réduire ces risques.

Quelles sont les causes de défaillance des matrices RAID 6 ?

Plusieurs raisons peuvent expliquer la défaillance d'une matrice RAID 6. Voici quelques-unes des principales causes que nous voyons chez Ontrack :

Défaillances de plusieurs disques
Problèmes d'alimentation (pic de puissance ou basse tension)
Défaillance du contrôleur RAID ou du logiciel RAID
Corruption du RAID (y compris corruption logique)
Inondations, dégâts des eaux ou incendies
Reconstructions échouées ou partielles

Est-il possible de récupérer les données d'un RAID 6 ?

La récupération des données à partir d’une matrice RAID 6 est possible. Bien qu’elle puisse s’avérer complexe et plus exigeante qu’avec d’autres configurations, elle aboutit généralement à un résultat positif. La principale difficulté réside souvent dans l’algorithme propriétaire utilisé pour générer le second bloc de parité : chaque fabricant l’implémente différemment, ce qui nécessite souvent un développement spécifique pour concevoir et ajuster les outils adaptés.

Les causes de perte de données sont multiples, et l’effort de récupération varie selon chacune d’elles. Voici quelques exemples :

Récupération de données avec un seul disque défaillant

Matrice RAID 6- 1 disque défaillant

Comme pour une matrice RAID 5, si un disque tombe en panne dans une matrice, la parité peut être utilisée pour reconstruire les données manquantes. Dans ce scénario, Ontrack est généralement en mesure de récupérer 100 % des données. Dès réception d'une matrice non fonctionnelle, tous les disques de la matrice sont imagés dans la salle blanche (y compris le disque défectueux si possible). La matrice est ensuite virtuellement reconstruite à l'aide de ces images. Une fois le RAID assemblé, le système de fichiers ou le volume est analysé à la recherche de corruption, réparé virtuellement et les données sont extraites. Le disque défaillant n'est souvent pas nécessaire car les bandes de données manquantes peuvent être reconstruites à partir de la parité.

Récupération de données à partir de deux disques défectueux

Matrice RAID 6- 2 disques défaillants

Contrairement à une matrice RAID 5, qui tolère la panne d’un seul disque, la matrice RAID 6 est conçue pour supporter la défaillance de deux disques simultanément sans perte de données. Le processus de récupération, même en cas de plusieurs disques défectueux, reste similaire à celui d’une panne unique.

Dès réception d’une matrice hors service, tous les disques — y compris ceux endommagés — sont clonés en salle blanche. Si les données présentes sur les disques sont intactes, il est parfois possible de restaurer la matrice sans utiliser les disques défectueux. La reconstruction s’effectue ensuite virtuellement à partir de ces images.

Dans l'exemple ci-dessus, les Données 1, 3 et la Parité 2 de la bande 1 sont utilisées pour reconstruire les Données 2. Les Données 4, la Parité 1 et les Données 6 sont utilisées pour reconstruire les Données 5 de la deuxième bande. Les Données 7, la Parité 2 et les Données 9 sont utilisées pour reconstruire les Données 8 de la troisième bande.

Une fois que la matrice RAID est virtuellement réassemblée, le système de fichiers ou le volume est analysé à la recherche d'une corruption. Outre la corruption du système de fichiers, les ingénieurs recherchent également des données incohérentes ou périmées. Cela se produit lorsqu'il y a un intervalle de temps entre les pannes de disque et que l'un des disques est dégradé. Les ingénieurs en récupération de données doivent avoir l'expérience nécessaire pour reconnaître ce type de dommage afin de pouvoir réparer virtuellement le volume et extraire les bonnes données de fichier.

Récupération de données à partir de plusieurs disques défectueux

Il est possible d'obtenir une récupération complète à partir d'une matrice RAID 6 même s'il y a plus de deux disques défectueux.

Matrice RAID 6- Plusieurs disques défaillants

Dans l'exemple ci-dessus, nous avons une matrice RAID 6 dont les cinq disques sont endommagés à certains endroits. S'il n'y a pas plus de deux blocs défectueux par bande, il est possible de reconstruire les données manquantes. Ontrack va imager la plus grande partie possible de chaque disque.

La matrice est ensuite virtuellement reconstruite à l'aide de ces images. Dans l'exemple ci-dessus, les Données 1, 3 et la Parité 2 de la bande 1 sont utilisées pour reconstruire les Données 2. Aucune parité n'est nécessaire pour la bande 2 car les Données 4, 5 et 6 sont toutes intactes. Les Données 7, la Parité 2 et les Données 8 sont utilisées pour reconstruire les Données 9 de la troisième bande.

Une fois la matrice RAID virtuellement réassemblée, le système de fichiers ou le volume est analysé pour détecter toute corruption. Les données récupérables sont extraites de la matrice virtuellement reconstruite sur de nouveaux supports pour être remises en production.

Share Print Page

Supports de stockage

Solutions informatiques

Secteurs d'activité

Récupération de données

Bandes magnétiques

Service d'effacement de données

Autres services

Ontrack EasyRecovery

Ontrack PowerControls

Solutions logicielles d'effacement

Solutions matérielles d'effacement

Ontrack Partenaire

Partenaires Technologiques

Partenaires Technologiques