À l'instar d'une matrice RAID 0 qui répartit les données sur plusieurs disques pour améliorer les performances, le RAID 5 répartit les données, mais ajoute une bande supplémentaire de données, appelée parité. Les données contenues dans la bande de parité, dans la plupart des configurations RAID 5, sont un XOR ("ou" exclusif) des données des autres bandes (striping). Cela rend le RAID 5 moins cher à mettre en œuvre qu'un RAID 10, car un seul espace de disque est alloué à la parité et permet une plus grande flexibilité, et des tailles de volume plus importantes qu'un RAID 1.
Dans l'exemple ci-dessus, la parité trouvée sur le lecteur 4 pour la première bande est le XOR des données des bandes nommées Data1, Data 2 et Data 3. La parité trouvée dans la deuxième bande sur le lecteur 3 est le XOR exclusif des bandes de données nommées Data 4, Data 5 et Data 6.
Le contrôleur RAID ou le logiciel RAID peut pratiquement reconstruire tout segment de données manquant en utilisant la parité.
Dans l'exemple ci-dessus, nous voyons qu'un disque est en panne. Lors de la perte d'un disque, la matrice passe en mode dégradé. En mode dégradé, le contrôleur RAID combinera les bandes de données avec la parité nécessaire pour présenter de bonnes données au système d'exploitation. Dans notre exemple, le contrôleur combinera les données 1, les données 3 et la parité pour la première bande pour remplacer les données manquantes dans les données 2. Dans la deuxième bande, les données 4, les données 6 et la parité sont utilisées pour remplacer les données 5. Dans la troisième bande, aucune parité n'est nécessaire, car tous les lecteurs de données sont présents.
Dans l'exemple ci-dessus, nous voyons une matrice RAID 5 saine avec le Hot Spare ajouté. Notez que l'espace actif ne contient aucune donnée jusqu'à ce qu'une panne se produise et que le lecteur soit nécessaire.
Si un Hot Spare est disponible sur le système, le contrôleur commencera automatiquement à reconstruire les données manquantes du disque défaillant en cas de panne.
Dans l'exemple ci-dessus, le lecteur 2 est tombé en panne. Le système a utilisé le Hot Spare et y a reconstruit toutes les données manquantes du disque 2.
Lorsqu'un disque tombe en panne, le temps presse pour le reconstruire. Le fonctionnement en mode dégradé exerce une pression supplémentaire sur les disques restants et peut entraîner des pannes supplémentaires si elles ne sont pas corrigées rapidement. Avoir un ou plusieurs disques de secours disponibles permet des temps de récupération plus rapides.
Il existe plusieurs raisons à la perte de données et l'effort de récupération pour chacune d'entre elles est différent. En voici quelques exemples :
Si un disque tombe en panne dans une matrice RAID 5, la parité peut être utilisée pour reconstruire les données manquantes. Dans ce scénario, Ontrack est généralement capable de récupérer 100 % des données. Dès réception d'une matrice non fonctionnelle, les disques de la matrice sont imagés en salle blanche. L'ensemble est ensuite virtuellement reconstruit à l'aide de ces images. Une fois le RAID assemblé, le système de fichiers ou le volume est analysé à la recherche de corruption, virtuellement réparé et les données sont extraites. Le disque défaillant n'est souvent pas nécessaire, car toute bande de données manquante peut être reconstruite grâce à la parité.
Le processus est similaire à une panne de disque unique. Dès réception d'une matrice non fonctionnelle, les disques de la matrice sont imagés dans la salle blanche. Il est important d'obtenir autant d'images que possible de chacun des disques défaillants, car cela permet la récupération de plus de données.
La matrice est ensuite virtuellement reconstruite à l'aide de ces images. Dans l'exemple ci-dessus, les données 2, les données 3 et la parité de la première bande sont utilisées pour reconstruire les données 1. La parité n'est pas nécessaire dans la deuxième bande, car tous les blocs de données sont présents. Dans la troisième bande, les données 7, la parité et les données 8 sont combinées pour remplacer les données 9.
Une fois la matrice RAID virtuellement réassemblée, le système de fichiers ou le volume est analysé à la recherche de corruption. Outre la corruption du système de fichiers, les ingénieurs recherchent également des données non cohérentes ou obsolètes. Cela se produit lorsqu'il y a un intervalle de temps entre les pannes de disque et que l'un des disques est dégradé. Les ingénieurs en récupération de données doivent être expérimentés pour reconnaître ce type de dommage afin de pouvoir réparer virtuellement le volume et extraire de bonnes données de fichiers.