Virtualizzazione: quali sono le cause della perdita di dati del sistema virtuale?

giovedì 16 aprile 2020 di Tilly Holland

La virtualizzazione domina il panorama aziendale. Secondo Gartner, la maggior parte delle aziende riporta una virtualizzazione del 75% o superiore. I miglioramenti negli hypervisor hanno ridotto la complessità dell'installazione e della manutenzione di server fisici, hanno migliorato notevolmente l'utilizzo dei server e offerto una maggiore flessibilità e reattività IT alle esigenze dell'azienda. Non sorprende che la maggior parte dei moderni sistemi IT sia virtualizzata. Tuttavia, sia che si utilizzi VMware, Hyper-V, Citrix, Oracle o uno qualsiasi degli altri hypervisor, nella virtualizzazione è ancora presente un potenziale aspetto negativo.

L'aspetto negativo della virtualizzazione

Per trasformare un server fisico in più macchine virtuali (VM), viene aggiunto un livello software ulteriore. Se da un lato semplifica l'esperienza dell'utente amministratore, la virtualizzazione aumenta la complessità generale dell'ambiente IT a mano a mano che l'hardware sottostante viene offuscato, rendendo più difficile per gli amministratori sapere su quale sistema fisico sono in esecuzione le rispettive macchine virtuali o quale memoria viene utilizzata per un determinato computer in caso di perdita di dati. Con un numero inferiore di persone addette alla manutenzione e al monitoraggio di un numero maggiore di macchine virtuali (rispetto ai server fisici), le possibilità che si verifichino di problemi e perdita di dati aumentano.

I motivi principali della perdita di dati negli ambienti virtuali

I dati raccolti in tutto il mondo da Ontrack Data Recovery rivelano la presenza di varie cause per la perdita di dati negli ambienti virtualizzati. Le principali cause della perdita di dati per le macchine virtuali sono errori dell'utente, ransomware, guasti hardware e corruzione del RAID.

Questo documento intende descrivere le cause della perdita di dati virtuali e spiegare come i fornitori globali di recupero dati siano in grado di risolvere un'elevata percentuale di problematiche anche nelle situazioni di perdita di dati più complesse in ambienti virtualizzati.

Problemi hardware/RAID

Per aiutare a prevenire la perdita di dati, i sistemi moderni spesso utilizzano una forma di replicazione dei dati su più unità fisiche (HDD o SSD) che viene consolidata in una singola unità logica.

Questa protezione dei dati può essere una soluzione basata su hardware o software. Il RAID combina più dischi rigidi o strisce di dati per migliorare la ridondanza, aumentare l'affidabilità dei dati e le prestazioni di I/O (input/output). Il RAID frammenta efficacemente i dati su molti dischi e li riassembla quando richiesto dall'utente o dal sistema. Serve un sistema RAID solido per tenere traccia di tutto e gestire i dati. I problemi hardware che devono affrontare i sistemi virtuali sono sostanzialmente gli stessi dei sistemi fisici, come unità guaste, controller danneggiati, componenti server in errore e problemi di alimentazione. Tuttavia, la corruzione del RAID è una sfida molto più ampia con le macchine virtuali a causa della natura della virtualizzazione. Sfortunatamente, la perdita di dati non è rara con l'archiviazione RAID. La complessità del RAID hardware e software moderno è accresciuta dalla presenza di deduplicazione e compressione. Rappresenta un ulteriore livello di virtualizzazione e aumenta la probabilità di guasto.

I controller RAID sono responsabili della mappatura delle posizioni in cui risiedono tutte le informazioni nei numerosi dischi a loro disposizione. Ma se la configurazione di un RAID viene danneggiata, i file non possono essere ricostruiti. Quando ciò accade, l'interconnettività di più sistemi può potenzialmente causare una significativa perdita di dati e tempi di inattività.

Problemi di formattazione/software

La riformattazione di un disco, disco virtuale, array, LUN, vDisk, volume, ecc. (o altri supporti di archiviazione) e la reinstallazione del software rappresentano ulteriori cause di perdita di dati in ambienti virtualizzati. Per le macchine virtuali, ad esempio, la causa potrebbe essere una riformattazione a livello guest o host.

La corruzione può verificarsi anche a causa di patch e aggiornamenti difettosi senza un backup offline, implementazione mal programmata di un nuovo software, problemi di integrazione e corruzione del database.

Questi problemi possono anche causare la corruzione del file host e danni al file system guest. Anche la perdita di dati di thin provisioning dovrebbe essere presa in considerazione. Invece di allocare tutti i dati necessari alla macchina virtuale e posizionare le strutture del file system negli offset fisici specificati, il thin provisioning fornisce solo la quantità di spazio immediatamente necessario e aggiunge ulteriori blocchi al disco virtuale a mano a mano che cresce. Ciò può comportare un ambiente virtuale più complesso e frammentato sul disco.

Se i puntatori dei metadati ai dati sono mancanti o danneggiati, è difficile individuare i vari frammenti e ricostruire il disco virtuale. In alternativa, il layer di mappatura all'interno del disco virtuale può essere danneggiato o sovrascritto, rendendo estremamente difficile il riassemblaggio.

Corruzione dei metadati del file system virtuale

Un'altra causa di perdita di dati è la corruzione dei metadati. I metadati sono ancora più importanti negli ambienti virtualizzati a causa del numero di layer e delle macchine virtuali esistenti. Un piccolo problema con i metadati VMFS può avere gravi ripercussioni sulla disponibilità dei dati.

Errore dell'utente

Molte di queste cause di perdita di dati possono essere classificate dagli amministratori come errori dell'utente. I privilegi di accesso fanno sì che gli amministratori possano eliminare le macchine virtuali per errore. Tuttavia, anche se i diritti di accesso vengono gestiti correttamente, gli errori rimangono all'ordine del giorno.

Una quantità sorprendentemente elevata di guasti è dovuta all'eliminazione erronea dei dischi virtuali, alla sovrascrittura delle macchine virtuali o alla riassegnazione del loro spazio. Un altro tipo di problema potrebbe essere dovuto al danneggiamento, all'eliminazione o alla non disponibilità per altri motivi di una delle snapshot. Ciò può compromettere i backup e rendere difficile il recupero dei dati.

Ironia della sorte, la facilità d'uso dei moderni hypervisor sta spingendo le organizzazioni a investire meno nella formazione; in questo modo personale inesperto si sta assumendo la responsabilità della gestione di ambienti virtualizzati di grandi dimensioni e in continua crescita. I fornitori di servizi gestiti di piccole e medie dimensioni (MSP) potrebbero non disporre di un numero sufficiente di personale esperto per monitorare gli ambienti virtuali abbastanza frequentemente per rilevare i problemi durante lo sviluppo. In alcuni casi, gli amministratori IT potrebbero non avviare adeguate misure di sicurezza su un database od omettere la documentazione delle modifiche.

Se la crittografia è abilitata e un volume viene eliminato, ad esempio, i dati diventano difficili da recuperare. Un'altra causa di problemi è data dall'avvicendamento dei dipendenti. Un soggetto subentrante non è in grado di comprendere la complessità delle architetture virtualizzate e, inavvertitamente, potrebbe eliminare le macchine virtuali o introdurre modifiche che potrebbero causare la perdita di dati.

In altri casi, il file flat originale può essere memorizzato, tuttavia nessuno è in grado di trovarlo in caso di perdita di dati. Anche trascurare i backup è un motivo comune per la perdita di dati virtuali. E cosa dire dei diversi team di archiviazione, hypervisor e guest che lavorano in base a una strutturazione in "silos organizzativi"? Un team potrebbe creare un volume, un altro potrebbe collegare l'hypervisor e un amministratore guest configurare la macchina virtuale. Questo tipo di struttura organizzativa potrebbe esporre a lacune ed errori; riformattazione, sovrascrittura ed eliminazioni potrebbero verificarsi più facilmente.

Cosa possono fare le aziende, quindi, in caso di perdita di dati da un ambiente virtualizzato? Non è possibile premere il tasto "Indietro" o "Annulla". Quando una macchina virtuale viene eliminata, è persa. I backup? Sono spesso incompleti o corrotti.

Fortunatamente, però, tramite fornitori di servizi di recupero dati globali è spesso possibile recuperare i dati.

Maggiori informazioni sul ripristino da ambienti virtualizzati sono disponibili nel nostro ultimo white paper.