Een nacht bij Ontrack: emergency raid recovery

dinsdag 7 juli 2015 door Jaap-Jan Visser

Klaar voor haar nachtdienst bij Ontrack wordt Gine om 19.10 uur gebeld. Een groot bedrijf heeft te maken met een RAID-systeem waarvan de gegevens verdwenen zijn. Het systeem heeft honderden gebruikers en de data moeten zo snel mogelijk teruggehaald worden. Het systeem is momenteel in gebruik en de downtime moet zo kort mogelijk blijven.

Wat voor taak staat ons te wachten?

RAID-systemen zijn in feite ontworpen om met fouten om te kunnen gaan. Hardwareproblemen kunnen er echter voor zorgen dat een RAID crasht, maar er kunnen ook andere oorzaken zijn van dataverlies.

Gine en een technicus van de klant bespreken de belangrijke eerste maatregelen. Het gaat om vier schijven in een RAID 5 met NTFS-bestandssysteem, geen virtuele omgevingen, en er zijn enkele mappen en bestanden verdwenen. De klant weet niet wat er is gebeurd en waarom. Het systeem is ten tijde van het telefoongesprek in gebruik, en Gine geeft de instructies het systeem meteen af te sluiten om te voorkomen dat belangrijke gegevens worden overschreven of beschadigd raken. Tijdens het gesprek wordt het systeem afgesloten.

RAID recovery

Onze technieken voor RAID recovery hebben zich veelvuldig bewezen en onze ingenieurs zijn het erover eens dat RAID-systemen tot de meest uitdagende technieken van het vak behoren. Welbeschouwd zetten wij bij het herstellen van RAID de datablokken handmatig weer samen. Dit gebeurt na een diepgaande analyse van hoe de gegevens over de schijven verdeeld zijn, de volgorde van de disks, en de indeling van de data- en pariteitsblokken.

Gine en de inmiddels wanhopige technicus bespreken het mogelijke dataverlies en waar de fout kan liggen. Het gaat om gewone gebruikersbestanden die verdwenen zijn, zoals documenten, en Gine krijgt informatie over welke mappen en bestanden weg zijn.

Wat gebeurde er voor de technicus Ontrack belde?

Ontrack moet te weten komen welke maatregelen genomen zijn voordat er contact is opgenomen. De technicus heeft geprobeerd een back-up op het systeem te restoren, en dit maakt de zaak meteen een stuk gecompliceerder omdat belangrijke gegevens kunnen zijn overschreven. Er wordt geconcludeerd dat een Remote Data Recovery niet mogelijk is, omdat Ontrack het systeem dan langer in beslag zou moeten nemen dan de tijd dat het zou duren om het naar het laboratorium op te sturen. Normaliter is Remote Data Recovery van Ontrack de snelste oplossing voor data recovery. Deze optie wordt vaak gekozen wanneer tijd cruciaal is en er sprake is van een softwarematig defect waarbij de hardware wel gewoon werkt.

Om 19.25 uur concluderen Gine en de technicus dat de RAID verpakt moet worden en moet worden verzonden naar ons laboratorium.

Om 19.30 is de ophaaldienst onderweg naar onze klant.

Om 21.00 uur gaan twee van onze ingenieurs op weg naar hun werk en staan klaar wanneer de chauffeur om 21.15 uur met het RAID-systeem bij het laboratorium is aangekomen. Er volgt een lange nacht waarin intensief gewerkt wordt aan het veiligstellen van de ruwe data van vier schijven.

Wat gebeurt er tijdens een RAID recovery?

Een RAID recovery bestaat uit twee zeer belangrijke stappen. Eerst moet het RAID-systeem worden opgebouwd, wat de meeste tijd kost. Het is uiterst belangrijk de oorspronkelijke configuratie te achterhalen om de kwaliteit van de data recovery te kunnen waarborgen. Er wordt ook gekeken of de RAID met offline disks in gebruik is geweest. Onze ingenieurs controleren en bevestigen dat het systeem correct is opgebouwd voordat er gegevens naar onze externe schijven gekopieerd worden, waarna de inhoudsanalyse kan beginnen. Deze extra stap verzekert een goede kwaliteit van de te herstellen data.

Om 6.00 uur komt een derde ingenieur aan om met het logische bestandssysteem te werken en de datastructuren en inhoud te analyseren. Dit proces zal enkele uren in beslag nemen en het resultaat hiervan laat zien hoeveel verloren gegevens hersteld kunnen worden.

Om 6.45 uur worden de originele disks terug naar de klant in Oslo vervoerd. Zij moeten het systeem zo snel mogelijk in gebruik nemen met de data die niet verloren is geweest.

Om 8.00 uur komen nog onwetende Ontrack-werknemers op hun werk aan, om al snel te horen te krijgen dat een paar dappere zielen de hele nacht hebben doorgewerkt om een bedrijf in nood te redden.

Om 9:00 uur vindt de derde ingenieur de oplossing voor het herstellen van belangrijke bestanden van het bestandssysteem. Samen met een collega werkt hij nog eens 2-3 uur aan het analyseren van de steekproeven; die worden gedaan om een optimaal resultaat van de volledige reconstructie te garanderen. Uiteindelijk vinden ze pointers voor meer dan 90 % van de belangrijke bestanden van de klant. Tot slot komen ze tot de conclusie dat vrijwel alle herstelbare bestanden met een uitstekende kwaliteit gereconstrueerd kunnen worden.

Dit was een verslag van een nacht bij Ontrack. Data recovery is onze passie, en wij proberen onze klanten daar zoveel mogelijk bij te betrekken.

Lees meer over RAID recovery.

img_600x600_shirtontrack

Direct hulp nodig? Bel!