Entwicklung eines Server Data Recovery Business Continuity Plan

Montag, 21. Oktober 2019 von Ontrack Datenrettung

DST_image_970x300_hero-natural-disaster

Die Planung der Wiederherstellung im Katastrophenfall ist ein anspruchsvoller Prozess. Während der Planungsphasen konzentriert man sich natürlich auf materielle Katastrophen wie Feuer, Einbruch und Naturkatastrophen. Aber auch Datenkatastrophen sollten in Ihrem Disaster-Recovery-Plan berücksichtigt werden.


Proaktive Vorschläge für Ihren Notfallplan

Dokumentation Eine vierteljährliche Überprüfung der Notfallprozeduren ist ein proaktiver Ansatz für die Notfallwiederherstellung. Das Schlüsselpersonal sollte über alle technischen Artikel, die sich auf die primären Geschäftssysteme oder Messaging-Systeme beziehen, auf dem Laufenden sein. Im Bereich des Serverraums sollte eine detaillierte Dokumentation zur Verfügung stehen, die die einzelnen Maschinenkonfigurationen und Softwareeinstellungen beschreibt. Die administrative Dokumentation sollte bei jedem Rechner vollständig sein.


Redundanz von Microsoft Exchange Server


Ist beispielsweise in einem Unternehmen, das Microsoft Exchange Message Server einsetzt, ein sekundärer Wiederherstellungsserver vorhanden, der die Wiederherstellung des Informationsspeichers des Servers während eines Ausfalls übernimmt? Alle aktuellen Versionen von Exchange Server verwenden Protokolldateien, um Nachrichtentransaktionen aufzuzeichnen, bevor sie in die Informationsspeicherdatenbank übertragen werden. Während "Circular Logging" dabei helfen kann, Speicherplatz zu sparen, ist ein vollständiger Satz von Protokolldateien bei einem Datenausfall von entscheidender Bedeutung, um einen wiederhergestellten Informationsspeicher auf den neuesten Stand zu bringen und Ihre Benutzer wieder auf ihre Daten zugreifen zu lassen.


Archivierte Daten auf Bandmedien


Die Disaster-Recovery-Planung sollte Pläne für die externe Lagerung von Sicherungsbändern und anderen Medien enthalten. Band-Backups bringen zusätzliche Validierungstestschritte in den Plan ein. Es ist eine gute Praxis, die Backups regelmäßig zu testen. Die Rotation der Bänder sollte regelmäßig und konsistent erfolgen und die Überwachung der Lebensdauer der Bänder ist ein wichtiger Prozess, um Medienausfälle zu reduzieren.


RAID-Systeme


Bei Katastrophen mit RAID-Speichersystemen, SAN-Systemen, JBOD-Systemen und NAS-Systemen nimmt die Katastrophenplanung eine andere Perspektive ein. Diese Speichersysteme haben eine Redundanzarchitektur, um Ausfälle und Katastrophen zu verhindern. Dies kann jedoch ein falsches Gefühl der Sicherheit vermitteln.


Zum Beispiel hatte ein Kunde im letzten Jahr 40 TB Speicherplatz, verteilt auf 20 Server. Diese Systeme hatten Hardware-RAID 1+0-Konfigurationen. Auf einem Server begannen Probleme aufzutreten, wenn ein Laufwerk für einen Moment offline ging. Die Controller-Karte schaltete als Teil des Redundanzprozesses auf die Spiegelkopie um. Irgendwann ging das erste Laufwerk wieder online. Die Controllerkarte würde wieder auf das ursprüngliche Laufwerk umschalten und es gäbe inkonsistente Daten aus der Perspektive des Volumes und des Dateisystems. Nach einem Herunterfahren und Neustart des Systems würde die Hardware des Speichersystems zurückgesetzt. Das automatische Volume-Reparaturprogramm des Betriebssystems wurde gestartet und begann mit den Reparaturen. Dadurch kam es zu weiteren Problemen mit der Integrität des Dateisystems und die kritischen Daten waren nicht mehr verfügbar. Die Daten mussten sofort verfügbar sein und Remote Data Recovery war die Option für diesen Kunden.


Dieses  Fallbeispiel ist wegen der Kaskade von Ausfällen, die in schneller Folge auftraten, interessant. Dieser Kunde verarbeitete große Datenmengen aus drei Schichten pro Tag. Eine Archivierung dieser Menge an sich jede Nacht ändernden Daten war nicht möglich. Der Kunde hatte sich darauf verlassen, dass die Speicherkonfiguration aufgrund der Spiegelung "kugelsicher" war.


Diese Konfigurationen können gegen mehrere Laufwerksausfälle erfolgreich sein. In diesem Fall fiel das Laufwerk jedoch nie aus, es ging nur offline. Als das Laufwerk wieder online ging, gab es Inkonsistenzen im Dateisystem. Infolgedessen waren die Daten nicht mehr verfügbar, als das automatische Volume-Reparatur-Tool mit den Reparaturen begann. Die Techniker arbeiteten die ganze Nacht hindurch, um die Daten wieder verfügbar zu machen. Am Ende war die Wiederherstellung ein 100-prozentiger Erfolg.


Wenn Ihr Server ausgefallen ist oder Daten fehlen, wenden Sie sich an die Server-Datenrettung von Ontrack.