Stockage hyperconvergé : bénédiction ou malédiction ?

jeudi 28 mai 2015 par Ontrack France

Pour comprendre le stockage hyperconvergé ou les systèmes hyperconvergés, nous devons d'abord prendre en compte la situation initiale : dans de nombreux centres de données d’entreprises - et pas seulement en France mais dans le monde entier - différents systèmes informatiques fonctionnent côte à côte, coexistent tranquillement et sont maintenus en état de marche par la personne responsable au prix de nombreux efforts. Dans les PME, différents serveurs, systèmes de stockage ou ordinateurs individuels fonctionnent souvent sur des systèmes d'exploitation, des protocoles de réseau et des solutions de stockage différents. La connexion et les communications entre les différents systèmes deviennent de plus en plus difficiles avec le temps.

Pour aider les entreprises dans leur lutte constante avec la grande diversité de solutions, le concept d'infrastructure convergée a été développé. Les fondements de ces solutions sont des produits prêts à l'emploi qui établissent une base commune pour tous les serveurs, les systèmes de stockage et les réseaux. Sous ce concept, le client n'utilise que les progiciels préconfigurés issus d'un seul fabricant et de ses partenaires. La plupart sont des solutions préconfigurées offertes par des fournisseurs de renom comme EMC, Cisco et VMware, qui contrôlent et gèrent toute l'informatique du centre de données, y compris les capacités de stockage. Étant donné que de nombreux clients ont déjà acheté des produits conçus par les fabricants respectifs, une partie importante des solutions existent déjà dans l'entreprise et peuvent à présent continuer à opérer sur la nouvelle plate-forme. Cependant, l'intégration d'infrastructures existantes d'autres fournisseurs au sein d'une infrastructure convergée est souvent très difficile, si ce n'est impossible. C'est pourquoi il est parfois nécessaire de l’abandonner complètement : c'est le prix à payer en tant que client pour maîtriser l'expansion informatique dans l'entreprise.

La gestion de données virtualisées sur une interface logicielle commune

Les systèmes hyper-convergés sont néanmoins exclusivement basés sur des logiciels et s'appuient également constamment sur la virtualisation. La gestion et le contrôle de toute l'informatique fonctionnent ici exclusivement sur une interface logicielle commune. Cette solution logicielle peut ainsi être utilisée pour contrôler à la fois le serveur et le réseau ainsi que les systèmes de stockage joints – qu'on appelle systèmes de stockage hyper-convergés.

L'interdigitation des composants utilisés ici est encore plus prononcée que dans une infrastructure convergée. En outre, les systèmes et les stockages hyper-convergés ont encore plus d’avantages : ils offrent une optimisation de la vitesse du WAN (Wide Area Network), une compression des données à transporter à travers le réseau et la dé-duplication des données, ce qui limite à la fois le flux de données et peut constituer un avantage pour les sauvegardes informatiques situées à distance et la récupération de données.

Cependant, précisément parce que les systèmes hyper-convergés ne sont pas seulement basés sur les logiciels, mais s'appuient sur les avantages de la virtualisation, presque tous les logiciels se reposent sur la technologie du leader du marché, VMware. C’est encore plus évident avec les solutions logicielles de stockage hyper-convergé : l'un des fournisseurs les plus connus de stockage hyper-convergé est Nutanix. Comme pour les concurrents Pivot3 et SimpliVity, la solution utilise des interfaces et des modèles qui offrent VMware pour virtualiser. Pour l'instant, un seul fournisseur utilise son propre modèle de virtualisation dans son logiciel, il s’agit de Scale Computing avec une solution open-source basée sur Linux.

Lire aussi : Disque dur : historique, structure & fonctionnement

Comme avec l'infrastructure convergée, un système hyper-convergé est complètement propre à un fabricant. Il est néanmoins intéressant de noter que de nombreux fournisseurs de matériel associent leurs propres produits au logiciel d'un partenaire. Par exemple, les systèmes matériels d'EMC, Cisco et VMware sont proposés en tant qu’offres groupées prêtes à l'emploi avec le logiciel SimpliVity par des partenaires spécialisés.

Alors qu’elle était annoncée et attendue depuis longtemps, le leader de la technologie de virtualisation VMware a enfin lancé, l'année dernière, sa propre solution de stockage hyper-convergée sur le marché. VMware développe avec VSAN sa solution de virtualisation pour serveurs, vSphere ESXI, permettant d'organiser et de gérer les stockages. Dans un système VSAN, les applications et les fichiers, qui sont stockés sur des appareils virtuels, sont stockés sur un magasin de données commun. Un système VSAN peut accueillir jusqu'à 32 hôtes connectés en même temps, chacun composé de sept lecteurs de disques durs et mémoires SSD, utilisés pour mettre en cache les flux de données.

Que signifie l'hyper-convergence pour la récupération de données ?

L'avantage clé du concept, c’est-à-dire la gestion simple du stockage sur une interface commune, est aussi le plus grand obstacle à la réussite d'une récupération de données. Comme vous avez pu le voir avec la panne d'un système vSan presque entièrement neuf de VMware aux Pays-Bas l'année dernière, un stockage hyper-convergé n'est pas archivé avant les problèmes.

Dans ce cas spécifique, les cas de récupération de données Virtual SAN chez Ontrack comprenaient un total de trois hôtes, chacun composé de 5 lecteurs de disques durs et trois SSD. La défaillance d'une seule mémoire SSD a entraîné la défaillance complète du système et la perte de quatre grands appareils virtuels. Ce n'est que grâce à des outils logiciels récemment développés qu'il a été possible d'à la fois lire et assigner la structure et les dépendances au sein des magasins de données VSAN.

Pour les ingénieurs en récupération de données professionnels, un stockage hyper-convergé ou un système hyper-convergé « offre » en supplément de la récupération « classique » des structures intégrées au progiciel dans les données de l'appareil virtuel, le problème d'une nouvelle couche « parent » du stockage hyper-convergé.

Restaurer la structure de données supplémentaire, pour avoir accès à l'appareil virtuel et aux données, requiert beaucoup de connaissances sur la structure interne du système utilisé. Étant donné qu’encore plus de fabricants entreront sur le marché ces prochaines années et que chaque produit sera probablement accompagné de ses propres modèles de structure de données brevetés, les ingénieurs en récupération de données devront faire en sorte de maintenir leurs connaissances dans ce secteur à jour et devront creuser en profondeur dans les nouvelles solutions à venir.

En savoir plus

Vous avez perdu des données ? Demandez une évaluation gratuite de votre support de stockage :
0 800 10 12 13 Evaluation gratuite