Vitualisierung: Gründe für virtuellen Datenverlust?

Donnerstag, 16. April 2020 von Tilly Holland

Die Virtualisierungstechnologie dominiert die Unternehmenslandschaft. Laut Gartner berichten die meisten Firmen von einer Virtualisierung von 75 % oder mehr. Verbesserungen bei Hypervisoren haben die Komplexität der Einrichtung und Wartung physischer Server reduziert, die Serverauslastung erheblich verbessert und die Flexibilität der IT sowie die Reaktionsfähigkeit auf die Anforderungen des Unternehmens erhöht. Es ist kein Wunder, dass der Großteil der modernen IT-Systeme virtualisiert ist. Aber egal, ob Sie VMware, Hyper-V, Citrix, Oracle oder einen der anderen Hypervisoren verwenden, es gibt eine potenzielle Kehrseite der Virtualisierung.

Der Nachteil der Virtualisierung

Um einen physischen Server in viele virtuelle Maschinen (VMs) zu verwandeln, wird eine zusätzliche Software-Schicht hinzugefügt. Die Virtualisierung vereinfacht zwar die Arbeit der Administratoren, erhöht aber die Gesamtkomplexität der IT-Umgebung, da die zugrundeliegende Hardware verschleiert wird, wodurch es für Administratoren schwieriger wird, zu wissen, auf welchem physischen System ihre VMs laufen oder welcher Speicher für eine bestimmte Maschine im Falle eines Datenverlustes verwendet wird. Da eine größere Anzahl virtueller Maschinen (im Vergleich zu physischen Servern) von weniger Mitarbeitern gewartet und überwacht werden muss, ist die Wahrscheinlichkeit für Probleme und Datenverluste größer.

Die Hauptgründe für Datenverluste in virtuellen Umgebungen

Die von Ontrack Data Recovery weltweit gesammelten Daten zeigen, dass es mehrere Ursachen für Datenverluste in virtualisierten Umgebungen gibt. Die Hauptgründe für Datenverluste bei virtuellen Maschinen sind Benutzerfehler, Ransomware, Hardwareausfälle und RAID-Korruption. In diesem Beitrag wird dargestellt, was zu virtuellen Datenverlusten führt, und erläutert, wie globale Datenrettungsanbieter einen hohen Prozentsatz selbst der schwierigsten Datenverlustsituationen in virtualisierten Umgebungen beheben können.

Hardware/RAID-Probleme

Um Datenverlusten vorzubeugen, verwenden moderne Systeme oft eine Form der Replikation von Daten über mehrere physische Laufwerke (HDD oder SSD), die zu einer einzigen logischen Einheit konsolidiert werden. Diese Datensicherung kann eine hardware- oder softwarebasierte Lösung sein. RAID kombiniert mehrere Festplatten oder Datenstripes, um die Redundanz zu verbessern, die Datenzuverlässigkeit zu erhöhen und die E/A-Leistung (Eingabe/Ausgabe) zu steigern. RAID fragmentiert Daten effektiv über viele Festplatten und setzt sie wieder zusammen, wenn sie vom Benutzer angefordert oder vom System benötigt werden.

Es braucht ein robustes RAID-System, um den Überblick zu behalten und die Daten zu verwalten. Die Hardware-Probleme, mit denen virtuelle Systeme konfrontiert werden, sind im Grunde die gleichen wie bei physischen Systemen, wie z. B. ausfallende Laufwerke, ausfallende Controller, ausfallende Serverkomponenten und Stromversorgungsprobleme. Aber RAID-Korruption ist aufgrund der Natur der Virtualisierung eine weitaus größere Herausforderung bei VMs. Leider sind Datenverluste bei RAID-Speichern keine Seltenheit. Die Komplexität von modernem Hardware- und Software-RAID wird durch das Vorhandensein von Deduplizierung und Komprimierung noch erhöht. Wenn nun noch eine zusätzliche Virtualisierungsschicht hinzukommt, steigt die Wahrscheinlichkeit eines Fehlers. RAID-Controller sind dafür verantwortlich, zuzuordnen, wo sich alle Informationen auf den vielen ihnen zur Verfügung stehenden Festplatten befinden. Wenn jedoch eine RAID-Konfiguration beschädigt wird, können die Dateien nicht wiederhergestellt werden. Wenn das passiert, kann die Zusammenschaltung mehrerer Systeme potenziell zu erheblichen Datenverlusten und Ausfallzeiten führen.

Formatierung / Software-Probleme

Das Neuformatieren eines Datenträgers, virtuellen Datenträgers, Arrays, LUNs, vDisks, Volumes usw. (oder anderer Speichermedien) und die Neuinstallation von Software sind weitere Ursachen für Datenverluste in virtualisierten Umgebungen. Speziell bei VMs kann es z. B. zu einer Neuformatierung auf der Guest- oder Host-Ebene kommen. Korruption kann auch durch fehlerhafte Patches und Updates ohne Offline-Backup, schlecht geplante Implementierung neuer Software, Integrationsprobleme und Datenbankbeschädigungen entstehen.

Diese Probleme können auch zur Beschädigung von Host-Dateien und des Gast-Dateisystems führen. Auch der Datenverlust beim Thin Provisioning sollte berücksichtigt werden. Anstatt alle Daten, die die VM benötigen wird, zuzuweisen und die Dateisystemstrukturen an den angegebenen physischen Offsets zu positionieren, wird beim Thin Provisioning nur der unmittelbar benötigte Speicherplatz bereitgestellt und zusätzliche Blöcke zur virtuellen Festplatte hinzugefügt, wenn diese wächst. Dies kann zu einer komplexeren und fragmentierten virtuellen Umgebung auf der Festplatte führen. Wenn die Metadatenzeiger auf die Daten fehlen oder beschädigt sind, ist es eine Herausforderung, die verschiedenen Fragmente zu lokalisieren und die virtuelle Festplatte wiederherzustellen. Alternativ kann auch die Zuordnungsschicht innerhalb der virtuellen Festplatte beschädigt oder überschrieben werden, was den Wiederaufbau extrem erschwert.

Beschädigung der Metadaten des virtuellen Dateisystems

Eine weitere Quelle für Datenverluste ist die Beschädigung von Metadaten. Metadaten sind in virtualisierten Umgebungen aufgrund der vielen Ebenen und VMs, die es gibt, noch wichtiger. Ein kleines Problem mit VMFS-Metadaten kann ernsthafte Auswirkungen auf die Datenverfügbarkeit haben.

Anwenderfehler

Viele dieser Quellen für Datenverluste können als Benutzerfehler von Administratoren kategorisiert werden. Zugriffsrechte ermöglichen es Admins, VMs versehentlich zu löschen. Aber selbst wenn die Zugriffsrechte korrekt verwaltet werden, sind Fehler an der Tagesordnung.

Eine überraschend große Anzahl von Ausfällen ist darauf zurückzuführen, dass virtuelle Festplatten versehentlich gelöscht, VMs überschrieben oder ihr Speicherplatz neu zugewiesen wurde. Es kann auch zu einer Beschädigung der Snapshot-Kette kommen, d. h. einer aus einer Reihe von Snapshots ist entweder beschädigt, wird gelöscht oder ist aus einem anderen Grund nicht mehr verfügbar. Dies kann Backups durcheinander bringen und die Wiederherstellung von Daten erschweren.

Ironischerweise führt die Benutzerfreundlichkeit moderner Hypervisoren dazu, dass Unternehmen weniger in Schulungen investieren. Unerfahrenen Mitarbeitern wird die Verantwortung für die Verwaltung großer und immer größer werdender virtualisierter Umgebungen übertragen. Kleine und mittelgroße Managed Service Provider (MSPs) verfügen möglicherweise nicht über eine ausreichende Anzahl erfahrener Mitarbeiter, um virtuelle Umgebungen häufig genug zu überwachen, um Probleme zu erkennen, sobald sie entstehen. In einigen Fällen leiten IT-Administratoren möglicherweise keine angemessenen Sicherheitsmaßnahmen für eine Datenbank ein oder versäumen die Dokumentation von Änderungen. Wenn zum Beispiel die Verschlüsselung aktiviert ist und ein Volume gelöscht wird, lassen sich die Daten nur schwer wiederherstellen. Mitarbeiterwechsel sind eine weitere Quelle für Probleme. Der neue Mitarbeiter kommt mit den Feinheiten der virtualisierten Architekturen nicht zurecht; er löscht versehentlich VMs oder führt Änderungen ein, die zu Datenverlust führen.

Andere Fälle

In anderen Fällen kann es vorkommen, dass die ursprüngliche Flat-File gespeichert ist, aber niemand sie findet, wenn ein Datenverlust auftritt. Auch die Vernachlässigung von Backups ist ein häufiger Grund für virtuelle Datenverluste. Und wie sieht es mit verschiedenen Storage-, Hypervisor- und Gast-Teams aus, die in Silos arbeiten? Ein Team erstellt vielleicht ein Volume, ein anderes schließt den Hypervisor an und ein Gast-Admin richtet dann die virtuelle Maschine ein. Diese Art der Organisationsstruktur bietet die Möglichkeit für Lücken und Fehler. Neuformatierungen, Überschreibungen und Löschungen können leichter vorkommen. Was können Unternehmen also tun, wenn sie einen Datenverlust in einer virtualisierten Umgebung feststellen? Es gibt keinen Zurück- oder Rückgängig-Button. Eine gelöschte VM ist weg. Backups? Sie sind oft unvollständig oder beschädigt.

Glücklicherweise ist eine Datenrettung in den meisten Fällen möglich.

Ontrack Datenrettungsblog

Das sagen unsere Kunden: