Disaster Recovery Plan - jak zachować spokój podczas katastrofy

piątek, 29 maja 2015 przez Linda Kass

RAID

Bez względu na to, jaki system ochrony danych zastosujemy w firmie, nigdy nie mamy 100% pewności, że nie zostaną one utracone. Przyczyn utraty danych są setki, jedną z najczęstszych jest jednak człowiek - bez względu więc na to, jak bardzo ufasz sobie i współpracownikom, pamiętaj, że jesteśmy tylko ludźmi. Warto więc przygotować się na wypadek niespodziewanej sytuacji kryzysowej. Dzięki temu, kiedy wokół będzie się waliło i paliło, Ty zostaniesz bohaterem przez zaledwie kilka kliknięć myszą. Oto instrukcja, która pozwoli Ci stworzyć plan na wypadek totalnej katastrofy i utraty danych, który zadziała zawsze wtedy, kiedy będzie to konieczne. Disaster Recovery Plan powinien był podstawowym dokumentem gwarantującym bezpieczeństwo i ciągłość działania przedsiębiorstwa.

Kalkulacja ryzyka

Cała idea Disaster Recovery Plan opiera się na przeprowadzeniu chłodnej kalkulacji ryzyka związanego z utratą danych zanim jeszcze do niej dojdzie. Podstawą jest założenie, że w każdej chwili może dojść do nieoczekiwanej i niemożliwej do przewidzenia awarii, o trudnym do oszacowania zasięgu, która może sparaliżować działanie infrastruktury IT i - w konsekwencji - działanie całości lub części przedsiębiorstwa. Taki plan w momencie awarii systemu, pozwoli nam uniknąć gorączkowej i chaotycznej akcji ratunkowej, która nieraz może przynieść więcej strat niż pożytku. W tym celu musimy wziąć pod uwagę dwa najważniejsze wskaźniki:

  1. RPO (Recovery Point Objective) - wskaźnik ten jest wartością czasu, w jakim firma może sobie poradzić bez dostępu do swoich danych i infrastruktury. Na przykład w przypadku sklepu internetowego istotne jest rozważenie sytuacji, w której przestaje działać cała infrastruktura IT, lub jakaś jej konkretna część - np. klient nie będzie miał dostępu do strony sklepu, pracownicy nie będą mogli realizować zamówień, transakcje nie będą rejestrowane i realizowane. Na jak długą przerwę w działaniu systemu firma może sobie pozwolić? Jakie będą straty i jaki będzie koszt tych strat?
  2. RTO (Recovery Time Objective) - to maksymalny czas, w którym konieczne jest odzyskanie danych i pełne wznowienie działania systemu. W celu oszacowania tego czasu należy wziąć pod uwagę pierwszy wskaźnik, ale także możliwości infrastruktury, pracowników, a także okoliczności, które mogą wystąpić. Należy przy tym pamiętać, że zgodnie z wynikami badań 93% przedsiębiorstw, które zmagały się z problemem utraty kluczowych danych dłużej niż dziesięć dni, upadło w ciągu roku od awarii - w tym aż 50% zbankrutowało od razu!

W szacowaniu obu wskaźników bardzo ważne jest prawidłowe ustalenie potencjalnych kosztów dla przedsiębiorstwa. Ważna jest odpowiedź na pytanie - kiedy koszty związane z przerwą w świadczeniu usług i/lub z utratą danych staną się dla firmy śmiertelne. Oczywiście należy w tym wypadku wziąć pod uwagę wiele czynników - rozbudowywanie infrastruktury zabezpieczającej dane, minimalizuje ryzyko ich utraty, ale zwiększa koszty obsługi samego systemu. Ponadto istotne jest również zastanowienie się nad tym, jakie rozwiązania będą odpowiednie dla danego sektora naszej infrastruktury. Czasem dobrze jest zainwestować w szybsze i bezpieczniejsze systemy backupowe, chroniące krytyczne z punktu widzenia działalności firmy procesy, a w innych przypadkach w ogóle zrezygnować z przywracania kopii zapasowej. Zamiast tego, zdecydować się na zlecenie procesu odzyskiwania danych zewnętrznej firmie, która przeprowadzi cały proces szybko i sprawnie.

Sztuka wyboru

Kalkulacja w naszym planie musi opierać się przede wszystkim na uświadomieniu sobie kosztów nieoczekiwanej awarii systemu. Mogą to być między innymi:

  • koszty finansowe związane z utratą klientów, którzy nie mogli skorzystać z naszych usług w trakcie awarii;
  • koszty związane z opóźnieniami w realizacji zamówień;
  • koszty opóźnień związanych z przestojem, wynikające z braku możliwości wykonywania zadań przez pracowników;
  • koszty związane z roszczeniami klientów;
  • straty wizerunkowe i biznesowe;

Z drugiej strony należy oszacować koszty działań, które mają służyć przeciwdziałaniu potencjalnym awariom lub reagowania kryzysowego, a mogą to być między innymi:

  • koszty utrzymywania pracownika lub całego działu zajmującego się ciągłością działania infrastruktury, albo kosztów związanych ze zleceniem tych usług firmie zewnętrznej;
  • koszty infrastruktury technicznej, w tym backupowej;
  • koszty ewentualnego odzyskiwania danych w przypadku ich utraty.

Wypadkowa tych czynników powinna pomóc w określeniu priorytetów naszego planu - powinniśmy podjąć decyzję ile środków i wysiłku chcemy przeznaczyć na ochronę przed zagrożeniami, a więc na szeroko pojętą profilaktykę. Istotny jest także wybór krytycznych z punktu widzenia działania naszej firmy elementów, które będą przez nas chronione i ratowane w pierwszej kolejności.

Jak stworzyć plan?

Dotychczasowe wskazówki powinny dać nam podstawę do stworzenia strategii na wypadek niespodziewanej awarii. Tworzymy więc listę kluczowych elementów infrastruktury, ich priorytet i dla każdego opracowujemy model postępowania na wypadek awarii. Dokumenty Disaster Recovery Plan powinny zawierać następujące elementy:

  • Podział ról i obowiązków - każdy pracownik musi znać pole swojego działania i wiedzieć, co zrobić w przypadku jeśli zaobserwuje symptomy awarii. Jest to o tyle ważne, że szybka reakcja pozwoli szybciej opanować sytuację i zmniejszyć szkody.
  • Sposób reagowania na kryzys - należy stworzyć procedurę postępowania w przypadku awarii. Awaria musi zostać jak najszybciej wykryta, zdiagnozowana i zgłoszona przełożonemu.
  • Plan naprawczy - scenariuszy awarii może być sporo, ale można wypracować pewne ogólne plany naprawcze, które mogą zostać zastosowane, jeśli będzie to konieczne. Odpowiedni plan powinien zostać jak najszybciej wdrożony.
  • Procedury - każdy z pracowników powinien wiedzieć, co ma robić w przypadku awarii. Ważne jest ścisłe stosowanie się do procedur  - pozwoli to uniknąć działań chaotycznych i nieprzemyślanych.
  • Dokumentacja - szczegóły awarii, a także wszystkie działania podjęte w celu jej usunięcia, muszą zostać szczegółowo opisane. Jest to o tyle ważne, że w przypadku, jeśli awaria okaże się poważniejsza niż przypuszczano i niezbędne będzie skorzystanie z usług firmy odzyskującej dane, opis sytuacji może znacznie skrócić proces odzyskiwania.
  • Szczegóły systemu - każdy plan naprawczy musi zostać uzupełniony o szczegóły infrastruktury, której dotyczy, a więc pełny spis inwentaryzacyjny wykorzystywanego sprzętu, szczegóły dotyczące konfiguracji systemu, dane dotyczące posiadanych kopii zapasowych (kiedy były aktualizowane, gdzie konkretnie się znajdują, na jakich nośnikach), etc.

Należy pamiętać, że każdy plan naprawczy musi być regularnie testowany, aktualizowany i dostosowywany do zmieniającej się infrastruktury i warunków funkcjonowania firmy. W przeciwnym wypadku stanie się tylko nic nie znaczącym dokumentem, który w przypadku poważnej awarii, zamiast pomóc, spowoduje jeszcze więcej zamętu i dezorganizacji.

img_600x600_shirtontrack

Poproś o bezpłatną wycenę:
32 630 48 65Darmowa konsultacja