Virtualisation : Quelles sont les causes de perte de données sur un système virtuel ?

jeudi 16 avril 2020 by Michael Nuncic

adobestock_176352355_smaller

La virtualisation a connu une croissance exponentielle au cours de la dernière décennie. Cela peut être bénéfique pour les entrreprises, mais la perte de données virtuelles reste toujours très fréquente. Pourquoi ?

La virtualisation domine le paysage de l’entreprise. D’après Gartner, la plupart des firmes déclarent avoir recours à la virtualisation à 75 % ou plus. Le perfectionnement des hyperviseurs a contribué à rendre moins complexe la configuration et l’entretien des serveurs physiques, à améliorer grandement l’utilisation des serveurs et à accroître la flexibilité et la réactivité informatiques pour les besoins de l’entreprise. Il n’est pas étonnant qu’une part importante des systèmes informatiques modernes soient virtualisée. Mais que vous utilisiez VMware, Hyper-V, Citrix, Oracle ou tout autre hyperviseur, la virtualisation présente un inconvénient.

L’inconvénient de la virtualisation

Afin de transformer un serveur physique en machines virtuelles, une couche logicielle supplémentaire est ajoutée. Tandis qu’elle simplifie l’expérience utilisateur, la virtualisation augmente la complexité globale de l’environnement informatique car le matériel sous-jacent est détourné, compliquant ainsi la tâche aux administrateurs pour savoir sur quel système physique leurs machines virtuelles fonctionnent ou quel système de stockage est utilisé pour une machine en particulier en cas de perte de données. Avec moins de personnes pour entretenir et contrôler un plus grand nombre de machines virtuelles (en comparaison avec les serveurs physiques), les chances que des problèmes et des pertes de données se produisent sont plus grandes.

Les raisons d’une perte de données dans les environnements virtuels

Les données réunies dans le monde entier par Ontrack Data Recovery révèlent que les pertes de données dans les environnements virtualisés peuvent avoir plusieurs causes. Les principales raisons d’une perte de données dans une machine virtuelle sont les erreurs des utilisateurs, les ransomware, les pannes matérielles et la corruption RAID. L’objet de cet article est d’exposer les éléments menant à une perte de données virtuelles et d’expliquer comment les fournisseurs en récupération des données dans le monde sont en mesure de résoudre un pourcentage élevé des cas de perte de données dans les environnements virtualisés, même les plus compliqués.

Causes of data loss

Problèmes de matériel ou dans le système RAID

Pour permettre de prévenir les pertes de données, les systèmes modernes utilisent souvent une sorte de réplication des données sur plusieurs lecteurs physiques (HDD ou SSD) qui sont consolidés en une unité logique unique. Cette protection des données peut être une solution matérielle ou logicielle. Un système RAID combine plusieurs disques durs ou bandes de données pour améliorer la redondance, accroître la fiabilité des données et booster la performance I/O (entrée/sortie). Le système RAID fragmente les données sur plusieurs disques et les réassemble à la demande de l’utilisateur ou lorsque le système en a besoin. Un système RAID robuste est nécessaire pour garder une trace de tout et gérer les données.

Les problèmes matériels auxquels les systèmes virtuels font face sont essentiellement les mêmes que dans les systèmes physiques, tels que les pannes de lecteurs, de contrôleurs, de composants serveurs et de courant. Mais la corruption du système RAID présente un défi encore plus important avec les machines virtuelles à cause de la nature de la virtualisation. Malheureusement, les pertes de données ne sont pas rares dans les appareils de stockage RAID. La complexité des matériels et logiciels RAID modernes est décuplée par la présence de la déduplication et de la compression. Ajoutez à cela une couche de virtualisation supplémentaire et vous augmentez les risques de panne. Les contrôleurs RAID sont responsables de la cartographie où toutes les informations se trouvent sur les nombreux disques à leur disposition. Mais si une configuration RAID est corrompue, les fichiers ne peuvent pas être reconstruits. Lorsque c’est la cas, l’interconnectivité de plusieurs systèmes peut entraîner une perte de données importante ainsi que des temps d’arrêt.

Formatage/problèmes logiciels

Le reformatage d’un disque, d’un disque virtuel, d’une matrice, d’un LUN, d’un vDisk, d’un volume ou d’un autre support de stockage et la réinstallation de logiciels peuvent entraîner une perte de données supplémentaire dans les environnements virtualisés. De manière spécifique aux machines virtuelles, par exemple, il peut y avoir un reformatage au niveau Guest ou Host. Une corruption peut également survenir à cause de correctifs ou de mises à jour défectueux sans une sauvegarde hors ligne, de la mise en œuvre mal planifiée d’un nouveau logiciel, de problèmes d’intégration ou d’une corruption de la base de données. Ces problèmes peuvent également entraîner une corruption des fichiers hôtes et une détérioration des systèmes de fichiers invités. Une perte de données due à l’allocation granulaire doit également être envisagée. Plutôt que d’allouer toutes les données dont la machine virtuelle aura besoin et de positionner les structures des systèmes de fichiers sur leurs offsets physiques spécifiés, l’allocation granulaire provisionne uniquement la quantité d’espace nécessaire immédiatement et ajoute d’autres blocs au disque virtuel à mesure qu’il grandit.

Ceci peut avoir pour conséquence un environnement virtuel sur le disque plus complexe et plus fragmenté. Si les pointeurs des métadonnées vers les données sont manquants ou endommagés, il devient difficile de trouver les différents fragments et de reconstruire le disque virtuel. D’autre part, la couche de modélisation à l’intérieur du disque virtuel peut être endommagée ou écrasée, ce qui rend le ré-assemblage très difficile.

Corruption des métadonnées du système de fichiers virtuel

Une autre source de perte de données est la corruption des métadonnées. Les métadonnées sont encore plus importantes dans les environnements virtualisés à cause du nombre de couches et de machines virtuelles qui existent. Un petit problème avec les métadonnées VMFS peut avoir de graves répercussions sur la disponibilité des données.

Virtualisation graph diagram

Erreurs des utilisateurs

Un grand nombre de ces sources de pertes de données peuvent être classifiées comme erreurs d’utilisateur de la part des administrateurs. Les privilèges d’accès font que les administrateurs peuvent supprimer des machines virtuelles par erreur. Et même lorsque les droits d’accès sont gérés correctement, les erreurs demeurent très courantes. Une quantité de pannes étonnamment importante est due à l’effacement par erreur de disques virtuels, à l’écrasement de machines virtuelles ou à la réattribution de leur espace. Une corruption des chaînes snapshot, c.-à-d. une série entière de snapshots corrompue, supprimée ou inaccessible pour une quelconque raison. Ceci peut détériorer les sauvegardes et compliquer la récupération des données.

De manière ironique, la facilité d’utilisation des hyperviseurs modernes incite les organisations à moins investir dans la formation. Un personnel inexpérimenté se voit confier la responsabilité de gérer des environnements virtualisés de grande taille et en constante croissance. Les fournisseurs de services infogérés de petite et moyenne taille peuvent ne pas avoir assez de personnel expérimenté pour contrôler les environnements virtuels suffisamment souvent afin de détecter les problèmes à mesure qu’ils se développent. Dans certains cas, il arrive que les administrateurs informatiques ne lancent pas les mesures de sécurité adéquates sur une base de données ou omettent de documenter les modifications. Si le chiffrement est activé et qu’un volume est supprimé, par exemple, cela complique la tâche de récupération des données. Les roulements entre différents employés est une autre source de problèmes. Le nouvel arrivant n’est pas en mesure de comprendre les complexités des architectures virtualisées et il arrive qu’il supprime des machines virtuelles par inadvertance ou effectue des modifications entraînant une perte de données.

Dans certains autres cas, il est possible que le fichier plat d’origine soit stocké mais que personne ne soit en mesure de le trouver lorsqu’une perte de données se produit. La négligence vis-à-vis des sauvegardes est une autre raison courante pouvant causer une perte de données virtuelles. Et que dire des différents systèmes de stockage, des hyperviseurs et des équipes Guest travaillant en silos ? Une équipe peut créer un volume, une autre connecter l’hyperviseur et un administrateur Guest configurer la machine virtuelle. Ce type de structure organisationnelle est une fenêtre ouverte aux lacunes et erreurs. Le reformatage, l’écrasement et les suppressions peuvent survenir plus facilement. Ainsi, que peuvent faire les entreprises lorsqu’elles font face à une perte de données dans un environnement virtualisé ? Il n ‘y a pas de touche retour ou annuler. Une machine virtuelle supprimée est définitivement perdue. Les sauvegardes ? Elles sont souvent incomplètes ou corrompues.

Heureusement, la récupération des données est souvent possible grâce aux fournisseurs mondiaux en récupération des données.

Vous pouvez en apprendre davantage concernant la récupération de données à partir d’environnements virtualisés dans notre dernier livre blanc, en anglais.