De meest voorkomende situaties van gegevensverlies in virtuele systemen

dinsdag 16 juli 2019 door Jaap-Jan Visser

Verwijderde virtuele schijven als gevolg van menselijke fouten zijn een klassieker. Dit is wat je moet doen als het noodlot toeslaat.

Een Ontrack-onderzoek toonde aan dat overwerkte IT-afdelingen kunnen leiden tot verstoringen en dataverlies.

  • 84% van de bedrijven meldt dat ze gegevens verloren hebben door vermijdbare fouten.
  • Elke tweede IT-medewerker heeft geen tijd om regelmatig procedures en processen te documenteren. Dit gedrag kan op de lange termijn fatale fouten veroorzaken.
  • 77% beschrijft zichzelf als overbelast.

4 veelgemaakte fouten

  • Verwijderde of ontbrekende virtuele machine / VMDK: als je vermoedt dat gegevens verloren zijn geraakt, moet je eerst alle informatie over de ontbrekende of verwijderde virtuele schijf opnemen. Denk hierbij aan de virtuele schijfgrootte, het thick or thin volume, de naam van de virtuele machine, het gast bestandssysteem en het soort gegevens dat aanwezig is. Verlaag vervolgens de lees- en schrijfbewerkingen naar de getroffen datastore. Als de datastore actieve, thin-provisioned virtuele machines bevat, schakel je deze zo snel mogelijk uit. Wat je ook doet, migreer geen actieve virtuele machine naar of van de getroffen datastore zonder eerst met een professional te hebben gesproken. Je kunt ongewild de complexiteit van het VMware recovery verhogen en de kans verkleinen dat gegevens worden hersteld. Als er sprake is van een VM met ontbrekende of verwijderde snapshots, schakel deze dan niet in. En als de virtuele machine momenteel draait, schakel deze dan zo snel mogelijk uit.
  • Corrupte VMFS-metadata of ontoegankelijke datastore: Probeer nooit de datastore opnieuw te maken en als je het LUN zelf onderzoekt, zorg er dan voor dat de alleen-lezen toegang wordt gebruikt.
  • Mechanische storingen en RAID / Storage-problemen: vervang nooit een defecte schijf door een schijf die deel uitmaakte van een eerder RAID-systeem; wis altijd de vervangende schijf voordat je deze gebruikt. Als de drive ongewone mechanische geluiden maakt, moet je deze onmiddellijk uitschakelen en hulp zoeken. Net als in de fysieke serveromgeving verhoogt het inschakelen van een mechanisch defecte schijf de kans op verdere schade en vermindert het de kans op volledig herstel. Label de schijven met hun positie in een RAID-array voordat je ze uit het systeem verwijdert. Als een RAID-systeem tijdens een rebuild-proces faalt, voer dan geen verdere rebuild-pogingen uit. Migreer nooit VM's naar of van een verdachte RAID. Als je daarnaast de RAID-hardware moet afsluiten of uitzetten, zorg er dan eerst voor dat alle virtuele machines en VMware-hosts worden uitgeschakeld.
  • Corruptie binnen Guest OS: voer geen programma's voor het herstellen van volumes (zoals CHKDSK) of defragmentatieprogramma’s uit op vermoedelijk corrupte virtuele schijven, omdat dit problemen kan verergeren. Als je merkt dat meer dan één virtuele machine tekenen van corruptie vertoont, is er mogelijk een probleem op opslagniveau. Schakel de apparaten uit en raadpleeg zo snel mogelijk een professional.

Wat je nodig hebt

  • Plannen en procedures voor het herstellen van systemen na het verlies van gegevens;
  • Zichtbare informatie op de IT-afdeling over wat te doen als er ongelukken gebeuren;
  • Bijgewerkte back-ups die regelmatig worden gecontroleerd;
  • Directe toegang tot contactgegevens van recovery-experts;
  • Frequente controles van systemen, opslag, hardware en status op archief / back-up;
  • Trainingen en oefeningen over wat te doen als het noodlot toeslaat;
  • De kennis en het zelfvertrouwen om te weten wanneer iemand moet stoppen. Mislukte pogingen brengen de situatie vaak van kwaad tot erger.
img_600x600_shirtontrack

Direct hulp nodig? Bel!