Wirtualizacja: Przyczyny utraty danych w systemach wirtualnych

środa, 17 czerwca 2020 przez Kathrin Brekle

DST_image_970x300_hero-virtualization

Technologia wirtualizacji zdominowała krajobraz przedsiębiorstw: według Gartnera, większość firm deklaruje poziom wirtualizacji na poziomie co najmniej 75%. Udoskonalone hiperwizory zmniejszyły złożoność konfiguracji i utrzymania serwerów fizycznych, umożliwiły znacznie lepsze wykorzystanie serwerów, a także zwiększyły elastyczność i zdolność reagowania działu IT na potrzeby biznesowe. Nic więc dziwnego, że większość współczesnych systemów IT została zwirtualizowana. Niezależnie od tego, czy korzystasz z VMwaredatarescue, Hyper-V, Citrix, Oracle, czy jednego z innych hypervisorów, wirtualizacja ma również pewne wady.

Wady wirtualizacji

Aby przekształcić serwer fizyczny w wiele maszyn wirtualnych (VM), dodawana jest dodatkowa warstwa oprogramowania. Chociaż wirtualizacja upraszcza pracę administratora, zwiększa ogólną złożoność środowiska IT, ponieważ sprzęt, na którym opiera się wirtualizacja, pozostaje ukryty. Utrudnia to administratorom śledzenie, na jakim systemie fizycznym działają ich maszyny wirtualne lub jaka pamięć masowa jest używana dla danego komputera w przypadku naruszenia danych. Przy mniejszej liczbie osób do utrzymania i monitorowania większej liczby maszyn wirtualnych (w porównaniu do serwerów fizycznych), istnieje większe prawdopodobieństwo wystąpienia problemów i utraty danych.

Główne przyczyny utraty danych w środowiskach wirtualnych

Dane zebrane przez Ontrack Data Recovery na całym świecie pokazują, że utrata danych w środowiskach zwirtualizowanych może mieć wiele przyczyn. Główne przyczyny utraty danych na maszynach wirtualnych to błąd użytkownika, ransomware, awaria sprzętu i uszkodzenie macierzy RAID. W niniejszym artykule wyjaśniono, co powoduje wirtualną utratę danych i jak globalni dostawcy usług odzyskiwania danych mogą odzyskać wysoki procent nawet najtrudniejszych przypadków utraty danych w środowiskach wirtualnych.

Problemy sprzętowe / RAID

Aby zapobiec utracie danych, nowoczesne systemy często wykorzystują pewną formę replikacji danych na wielu dyskach fizycznych (HDD lub SSD) połączonych w jedną jednostkę logiczną. Ta ochrona danych może być rozwiązaniem sprzętowym lub programowym. RAID łączy wiele dysków twardych lub pasków danych w celu poprawy redundancji, zwiększenia niezawodności danych i poprawy wydajności I/O (wejścia/wyjścia). RAID efektywnie rozdziela dane na wiele dysków i składa je ponownie, gdy wymaga tego użytkownik lub gdy wymaga tego system. Do śledzenia tego wszystkiego i zarządzania danymi potrzebny jest solidny system RAID. Problemy sprzętowe z systemami wirtualnymi są zasadniczo takie same jak z systemami fizycznymi, takie jak uszkodzone dyski, kontrolery i komponenty serwera lub problemy z zasilaniem. Jednak ze względu na naturę wirtualizacji, uszkodzenie RAID jest znacznie większym wyzwaniem w przypadku maszyn wirtualnych. Niestety, utrata danych nie jest rzadkością w przypadku pamięci masowej RAID. Złożoność nowoczesnego sprzętowego i programowego RAID jest dodatkowo potęgowana przez deduplikację i kompresję. Następnie dodaj dodatkową warstwę wirtualizacji, a prawdopodobieństwo niepowodzenia kilkukrotnie wzrasta. Kontrolery RAID są odpowiedzialne za mapowanie, gdzie na wielu dostępnych dyskach znajdują się wszystkie informacje. Jeżeli jednak konfiguracja RAID ulegnie uszkodzeniu, plików nie można odtworzyć. Wówczas wzajemne powiązanie wielu systemów może prowadzić do znacznej utraty danych i przestojów.

Problemy z formatowaniem / Oprogramowaniem

Inne przyczyny utraty danych w środowiskach wirtualnych to przeformatowanie dysku, dysku wirtualnego, macierzy, jednostki LUN, vDysku, woluminu (lub innego nośnika) oraz ponowna instalacja oprogramowania. Na przykład w odniesieniu do maszyn wirtualnych może dojść do ponownego formatowania na poziomie gościa lub hosta. Szkody mogą być również spowodowane przez nieprawidłowe łatki i aktualizacje bez kopii zapasowych offline, źle zaplanowane wdrożenie nowego oprogramowania, problemy z integracją oraz uszkodzenie bazy danych. Ponadto, problemy te mogą prowadzić do uszkodzenia plików hosta i systemu plików gościa. Należy również rozważyć utratę danych w przypadku thin provisioning. Zamiast alokować wszystkie dane potrzebne maszynie wirtualnej i pozycjonować struktury systemu plików na określonych fizycznych offsetach, thin provisioning alokuje tylko przestrzeń, która jest natychmiast potrzebna i dodaje dodatkowe bloki do wirtualnego dysku w miarę wzrostu wolumenu danych. Może to skutkować bardziej złożonym i pofragmentowanym środowiskiem wirtualnym na dysku. Jeśli brakuje metadanych wskazujących na dane lub są one uszkodzone, trudno jest odnaleźć poszczególne fragmenty i odbudować dysk wirtualny. Ponadto warstwa alokacji w obrębie dysku wirtualnego mogła zostać uszkodzona lub nadpisana, co sprawia, że ponowne złożenie jest niezwykle trudne.

Uszkodzone metadane wirtualnego systemu plików

Inną przyczyną utraty danych jest uszkodzenie metadanych. Metadane są jeszcze ważniejsze niż zwykłe w środowiskach zwirtualizowanych ze względu na liczbę warstw i maszyn wirtualnych. Niewielki problem z metadanymi VMFS może mieć poważny wpływ na ogólną dostępność danych.

Błąd użytkownika

Wiele z tych naruszeń danych można zakwalifikować jako błąd administratora. Dzieje się tak dlatego, że ich uprawnienia dostępu stawiają administratorów w sytuacji przypadkowego usunięcia maszyn wirtualnych. I nawet jeśli uprawnienia dostępu są zarządzane prawidłowo, błędy są nadal powszechne. Zaskakująco duża liczba błędów spowodowana jest przypadkowym usunięciem wirtualnych dysków, nadpisaniem maszyn wirtualnych lub realokacją ich przestrzeni. Może również wystąpić uszkodzenie łańcucha migawek, co oznacza, że jedna migawka w serii migawek jest uszkodzona, usunięta lub niedostępna z innego powodu. A to może prowadzić do uszkodzenia kopii zapasowych i utrudnić przywracanie danych.

Jak na ironię, łatwość użycia nowoczesnych hypervisorów oznacza, że firmy inwestują mniej w szkolenia.

Niedoświadczonym pracownikom powierza się więc odpowiedzialność za zarządzanie dużymi i stale rosnącymi środowiskami wirtualnymi. Mali i średni dostawcy usług zarządzanych (MSP) mogą nie mieć wystarczająco doświadczonego personelu do monitorowania środowisk wirtualnych na tyle często, aby wychwycić pojawiające się problemy. W niektórych przypadkach administratorzy IT nie wprowadzają odpowiednich środków bezpieczeństwa dla bazy danych lub nie dokumentują wprowadzanych zmian. Na przykład, jeśli dysk zostanie wyczyszczony przy włączonym szyfrowaniu, odzyskanie danych może być trudne. Problemem jest również rotacja pracowników. Na przykład, nowy administrator może nie być w stanie zorientować się w złożoności zwirtualizowanych architektur, przypadkowo usuwając maszyny wirtualne lub wprowadzając zmiany powodujące utratę danych.

Lub oryginalny plik może być zapisany, ale nie można go znaleźć. Zaniedbywanie kopii zapasowych jest również częstą przyczyną utraty danych wirtualnych. Nie wspominając już o różnych zespołach zajmujących się pamięcią masową, hypervisorem i systemami, które pracują w izolacji od siebie. Na przykład, jeden zespół może utworzyć dysk, inny może dołączyć hypervisor, a następnie administrator gościa może skonfigurować maszynę wirtualną. Tego typu struktura organizacyjna pozwala na wkradanie się podatności i błędów. Ułatwia to ponowne formatowanie, nadpisywanie i usuwanie danych.

Co mogą zrobić firmy, które doświadczyły utraty danych w środowisku wirtualnym?

Nie ma przycisku wstecz ani cofnij. Usunięta maszyna wirtualna przestaje istnieć. Kopie zapasowe? Często są niekompletne lub uszkodzone. Na szczęście odzyskiwanie danych jest często dostępne za pośrednictwem globalnych firm zajmujących się odzyskiwaniem danych.