Complexe storage systemen, voorkom data verlies

donderdag 23 mei 2019 door Jerrel Arkes

Hoe goed uw bedrijf ook probeert om gegevens verlies te voorkomen. De kans is aanwezig dat het toch fout gaat. Wat te doen?

Hoe kan het verlies van gegevens nog steeds gebeuren, en wat kan ik eraan doen?

Zomaar een voorbeeld uit de praktijk: In een poging om de capaciteit van een file server met honderden gebruikers uit te breiden, verbond de IT-manager van een ziekenhuis een extern disk enclosure met 14 disken met de RAID controller die reeds wordt gebruikt als onderdeel van een groter storage systeem. Daarbij ging helaas de oorspronkelijke RAID-configuratie verloren - meer dan 400.000 bestanden (ongeveer 250 GB) aan gegevens leken verloren te zijn gegaan. IT-team probeerde een rebuild, maar toen het systeem na een nacht draaien nog niet was hersteld, ontdekten ze al snel dat al het oude systeem verdwenen leek te zijn. Gelukkig kon Ontrack via remote data recovery meer dan 99% van de 400.000+ bestanden herstellen van de opnieuw geconfigureerde, rebuild en gedeeltelijk overschreven RAID-set.

Dit illustreert een centrale paradox: de complexiteit en verfijning van nieuwe storage-systemen neemt toe, maar ook het foutpercentage van de hardware, software, en niet op de laatste plaats van menselijke fouten.

Elk jaar worden vele nieuwe storage producten en technologieën geïntroduceerd bedoeld om de processen sneller en eenvoudiger beheer te maken. Zo veel opties om te overwegen en vaak achter simpele GUI’s weggestopte complexiteit creëert verwarring. De vraag die de meeste IT-professionals, die duizenden euros hebben geïnvesteerd in state-of-the-art storage technologie, zich stellen is: Hoe kan het verlies van gegevens nog steeds gebeuren, en wat kan ik eraan doen?

Back-up mislukt? Waarom?

In een perfecte wereld zou een bedrijf hun storage-infrastructuur vanaf de grond opbouwen met behulp van enkele van de nieuwste storage-oplossingen en standaardiseren op specifieke leveranciers. Als alles ongewijzigd bleef zouden verbazingwekkende resultaten worden bereikt.

Maar in de echte wereld is gegevensopslag complex. Niets blijft constant – de hoeveelheid nieuw gecreëerde gegevens groeit in een razend tempo en nieuwe regelgeving, zoals Sarbanes-Oxley en de nieuwe EU-regelgeving voor het verwijderen van gegevens, zorgen voor veranderingen in hoe lang de gegevens moeten worden opgeslagen. Weinig bedrijven kunnen het bouwen van nieuwe storage vanaf de grond rechtvaardigen, de meeste hebben de neiging om opslag toe te voegen in verschillende stadia - de introductie van nieuwe elementen van verschillende leveranciers op verschillende tijdstippen – en dat verhoogt de complexiteit van data-opslag.

Al deze complexiteit kan leiden tot een verscheidenheid aan onverwachte back-up fouten. Bedrijven zijn vaak niet voldoende voorbereid om te gaan met de gevolgen van dit soort verlies van gegevensverlies situaties. Slechte back-up media is een veel voorkomende oorzaak van de storing. Vaak komen de back-up tapes na jaren uit de kast en blijken de tapes beschadigd of de tapes onleesbaar te zijn. Dit is een veel voorkomend scenario als de backup tapes niet goed zijn opgeslagen. Een andere reden waarom backup restores falen is dat de software die werd gebruikt voor de back-up niet meer beschikbaar is. Het is ook gebruikelijk dat er fouten in het back-up proces of de back-up procedures zijn ontoereikend. Het niet testen van de routines voordat u werkelijk in nood bent, zorgt ervoor dat veel bedrijven voor grote verrassingen komen te staan op de dag dat deze kritische back-up onvolledig blijkt te zijn.

Wat te doen als back-up mislukt?

Hoe goed uw bedrijf ook probeert om gegevens verlies te voorkomen. De kans is aanwezig dat het toch fout gaat. De resulterende downtime zijn een bedreiging voor de business continuity en daarom moet data recovery worden meegenomen in het disaster recovery plan.

Het gaat om de juiste eerste hulp. Wie doet wat en welke maatregelen en middelen moeten worden geïnitieerd. Vaak krijg je maar één poging om het goed te doen het is van essentieel dat IT managers begrijpen wanneer te kiezen voor rebuild, repair, restore of data recovery.

Repair

Dit kan zo simpel zijn als het draaien bestand reparatie tool (zoals fsck of CHKDSK - bestand reparatie tool die probeert om gebroken links in het bestandssysteem te repareren). Maar vergeet niet om eerst de alleen-lezen-modus selecteren. Bij het uitvoeren van reparaties op een systeem met veel fouten bestaat het risico van het overschrijven van gegevens en dat het probleem erger wordt. Afhankelijk van de resultaten van de read-only diagnose, kan de beheerder kiezen te repareren of te restoren. Als men een beperkte hoeveelheid fouten vindt, is het waarschijnlijk goed om ze op te lossen met behulp van de reparatie tool. Houdt u er rekening mee dat de vreemde geluiden in uw harde schijf betekent dat u beter onmiddellijk de data recovery optie kiest.

Restore

De eerste vraag voor een admin: van wanneer is de laatste backup en is deze volledig? Het terugdraaien van de backup zal normaal gesproken ervoor zorgen dat alles weer snel up and running is. Er is echter vaak een significant verschil tussen de gegevens van de laatste reservekopie en data op het moment van de problemen. Is er helemaal geen back-up meer dan rest slechts data recovery. Een andere belangrijke vraag is hoe lang het zal duren om een volledige restore uit te voeren - als dit te lang duurt moet u kijken naar andere opties. Een laatste overweging is hoeveel data moet er hersteld worden. Het restoren van meerdere terabytes aan gegevens van tapes, zal een lange tijd in beslag nemen.

Data recovery

Het besluit om voor data recovery te kiezen hangt af van hoeveel kritische data er verloren lijkt te zijn en hoeveel downtime u kunt verwachten en zich kan veroorloven. Als er niet genoeg tijd is om na te gaan wat er allemaal nog beschikbaar is en het maken voor het plannen van een ad hoc disaster recovery plan teveel tijd kost kan gekozen worden voor data recovery. Data recovery is ook de beste methode als de back-up te oud is of die back-up media defect blijken te zijn. Als de gegevens van cruciaal belang zijn en uw bedrijf niet zonder deze gegevens kan doen neem dan geen enkel risico.

Praktijkvoorbeeld geen toegang tot NAS.

Door middel van een reeks van samenhangende systeemupgrades en onderhoudsprocessen, verloor een advocatenkantoor toegang tot de gegevens die waren opgeslagen op het bedrijf NAS-systeem. Na een support gesprek met de fabrikant van de NAS, werd vastgesteld dat het verlies van gegevens situatie veel complexer dan aanvankelijk werd verwacht, en een heleboel meer gegevens in gevaar waren dan er beschikbaar waren in de meest recente back-up. Ontrack herstelde binnen 100% van de opgeslagen gegevens.

Conclusie – het maakt niet uit hoeveel tijd en geld een bedrijf besteedt aan de planning, het ontwerpen, implementeren en onderhouden van hun storage-omgeving, met de complexiteit van de technologie, en met het niveau van de kennis die nodig is om te werken, blijft de dreiging van het verlies van gegevens constant aanwezig.

Bel altijd Ontrack voor voordat u besluit wat te doen als het fout gaat. U heeft vaak maar één poging om de juiste keuze te maken.

Ontrack is de grootste, meest ervaren en technologisch geavanceerde aanbieder van data recovery-producten en diensten wereldwijd. Wij zijn in staat om verloren of beschadigde gegevens te herstellen van alle besturingssystemen en typen opslagapparaten. Met onze doe-het-zelf software, remote of clean room services en het gebruik van de honderden gepatenteerde eigen tools en technieken.

Ontrack Server Recovery

img_600x600_shirtontrack

Direct hulp nodig? Bel!