Uit ons laboratorium: SAN recovery

vrijdag 10 juni 2016 door Jaap-Jan Visser

Een tijdje geleden kon je lezen over een normale werkdag in ons lab. Deze keer is het een heel ander verhaal.

Het begon goed toen we twee harde schijven konden redden die in de wasmachine verstopt waren voor inbrekers. Het wassen van de harde schijven bleek een groter gevaar voor de data. In de nacht deed zich een nog groter probleem voor, toen een multidisk SAN RAID systeem met hostingdata crashte. Een virtueel systeem voor het opslaan van  gegevens, dat nooit zou falen.

Wij beginnen altijd met een analyse. De eerste stap is te bepalen of het mogelijk is de harde schijven die wij toegestuurd krijgen te lezen. Vinden onze ingenieurs mechanische defecten moeten deze gerepareerd worden voordat we de data kunnen lezen. Bij traditionele harde schijven komt een head crash vaak voor, waarbij de lees-/schrijfkop op de platter is gevallen. Bij SSD’s is er vaak sprake van een defecte controller of geheugenchip.

Onze werkruimtes worden niet voor niets laboratoria genoemd. Wij werken met speciaal gereedschap en speciale apparatuur en de werkbanken in onze cleanrooms zijn perfect voor ons vak.  Wij bezitten zelfs nog reserveonderdelen van harde schijven uit de jaren 80, een unicum in onze branche.

De cleanroom is de plek waar de meeste klussen geklaard worden. Als de schade gerepareerd is en niet aan de datastructuur gewerkt hoeft te worden, kunnen de gegevens worden gelezen en naar een nieuwe harde schijf gekopieerd worden. Zo ging het ook met de wasmachineschijven.

Een SAN is andere koek. Hierbij moet het kaf van het koren gescheiden worden. De professionals maken het verschil.

Gecompliceerde opslagsystemen moeten nadat de fysieke defecten hersteld zijn een grondige logische analyse ondergaan. Een defect bij een of meer schijven in een RAID-, NAS- of virtueel systeem kan grote schade aanbrengen aan de logische datastructuur en aan de onderliggende systemen. Onze experts zijn wereldtoppers op dit gebied en zoeken als bloedhonden naar toegankelijke data om de systemen laag voor laag te reconstrueren. Dit gebeurt nooit bij de oorspronkelijke opslagmedia; er wordt altijd aan een kopie gewerkt die op onze servers is opgeslagen.

Deze week zijn onze super specialisten de hele dag door op zoek geweest naar snapshots in een VMware-/HP SAN-systeem. Een virtuele machine met 900 GB aan data moest naar nieuwe hardware verplaatst worden. De vMotion-software  maakte geen melding van problemen, maar het bleek al snel dat maar 50 GB was overgeplaatst. De oorspronkelijke virtuele machine met alle snapshots was verdwenen. De ingenieurs moesten het hele systeem, het betrokken LUN en de nieuwe hardware doorzoeken naar fragmenten. Dat is echt puzzelwerk. Deze keer kon speciaal ontwikkelde software worden gebruikt; onze ontwikkelingsteams ontwikkelen deze software indien nodig. Zonder zulke tools en deskundige ingenieurs kunnen dit soort problemen niet worden opgelost.

Onze klanten horen van fabrikanten vaak dat het redden van data bij dit soort systemen ondoenlijk is. Het gebeurt ook dat systeemtechnici fout advies geven of het probleem juist verergeren door het zelf proberen op te lossen.

De juiste eerste hulp, correcte routines, goed gereedschap, speciale tools en deskundig personeel zijn essentieel als alles in duigen valt.

Lees meer over onze cleanroom en server recovery.

img_600x600_shirtontrack

Direct hulp nodig? Bel!