Go to Top

Backup für die Ewigkeit (4)

Welches Speichermedium eignet sich am besten für die Langzeitarchivierung? Diese Woche: Die Cloud und das Ergebnis unseres Vergleichs!

In den letzten zwei Wochen haben wir eine Reihe von Artikeln über die hauptsächlich genutzten Speichermedien veröffentlicht, die derzeit noch für die Datenspeicherung verwendet werden, und dabei auch ihre jeweilige vermutete Lebensspanne betrachtet. Heute möchte ich in diesem letzten Teil unserer Serie die Vor- und Nachteile der Cloud diskutieren und versuchen, eine Schlussfolgerung zu ziehen, welche Medien am besten für die Langzeitarchivierung geeignet sind. Das lesen Sie heute:

  • Die Cloud kann eine gute Alternative für die Speicherung kleinerer Backups sein, aber für umfangreiche Archive hat sie viele Nachteile: Abhängig von der Internetgeschwindigkeit kann es im Falle einer Klage oder anderer regulatorischer Angelegenheiten viel Zeit kosten, um auf benötigte Dateien zuzugreifen. Manchmal zu viel Zeit … Daher eignet sich die Cloud nicht für eine Langzeitarchivierung.
  • Nach dem Vergleich der Hauptspeichermedien, die heute noch verwendet werden, ist Band die beste Möglichkeit, Daten für einen längeren Zeitraum zu speichern. Wenn Sie Daten für mehr als ein Jahrzehnt speichern möchten und manchmal mehr als 30 Jahre lang Daten speichern möchten, können nur Bänder das tun. Es ist jedoch ratsam, Bänder nach 5 oder mehr Jahren zu überprüfen und zu migrieren, damit ein Datenverlust ausgeschlossen wird.

Die Cloud als Datenspeicher

Die Cloud ist seit einiger Zeit überall in den Nachrichten. Aber was ist damit wirklich gemeint? Die Cloud ist ein Synonym für das Cloud Computing, das einfach ausgedrückt bedeutet, dass Sie das Internet als Zugang zu einem Service Provider nutzen, der verschiedene IT-Produkte und Services als Dienstleistung anbietet. Seit mehr als einem Jahrzehnt verkauft der Softwarehersteller Adobe beispielsweise seine Grafiksoftwareprogramme in einer DVD-Box oder als Download, den Sie als Nutzer kaufen und auf Ihrem Desktop- oder Unternehmensrechner installieren mussten. Seit einigen Jahren hat Adobe allerdings seine Art, seine Softwaretools zu verkaufen, geändert: Jetzt verwenden und installieren Sie nur eine “kleine” Client-Software auf Ihrem PC, während die reale Anwendung gehostet wird und in einem Rechenzentrum von Adobe läuft (oder besser gesagt eines, das sie selbst auch gemietet haben). Microsoft hat diesen Ansatz mit seiner Office-Software-Suite ebenfalls vor einigen Jahren in der Cloud – mit Office 365 – kopiert. Dieses Konzept der Bereitstellung von Diensten über das Internet wird Software-as-a-Service (SaaS) genannt. Eines der ersten Unternehmen, das dieses Cloud-Konzept nutzte, war salesforce.com, das 1999 seine vollständig internetbasierte CRM-Software erstmals angeboten hat.

Es ist nicht verwunderlich, dass viele der cloudbasierten Serviceangebote Mitte der 2000er erstmals auf dem Markt erschienen. In den USA wurden die Netzwerk- und Internetgeschwindigkeiten wesentlich schneller und ohne dabei eine teure Kabel-Internetverbindung nutzen zu müssen. Mit viel schnelleren und zuverlässigeren Internetanschlüssen wurden viele Angebote Realität: Infrastructure as a Service, Computing-as-a-Service, Data-Center-as-a-Service und viele weitere Angebote … Kurz gesagt: Heutzutage wird fast jeder IT-Service, den man benötigt über das Internet vertrieben und angeboten.

Das gilt auch für das Datenspeichern. Mit Cloud-Speicher können Verbraucher und Unternehmen alle ihre Daten in der Cloud speichern. “Die Cloud” bedeutet hier: Speicherplatz auf bestimmten Speichersystemen in einem Rechenzentrum eines Cloud-Speicherdienstanbieters (oder der von einem der großen Anbieter auf dem Markt wie Amazon, Microsoft, Google usw. geleast wird). Die Daten werden gepflegt, verwaltet, remote gesichert und den Nutzern über das Internet zur Verfügung gestellt. Normalerweise berechnen Cloud-Speicher-Service-Provider ihren Kunden den „Verbrauch“ pro Monat. Obwohl die Kosten pro Gigabyte in den letzten Jahren drastisch gesunken sind, verlangen viele Serviceprovider zusätzliche Kosten im Zusammenhang mit den Betriebskosten, was zu einer hohen monatlichen Rechnung führen kann.

Während die Nutzung der Cloud zur Datenspeicherung für Unternehmen und Verbraucher von Vorteil sein kann, die nur eine überschaubare Menge an Daten bei einem Cloud-Speicheranbieter speichern wollen, ist die Verwendung dieser Speichermethode für eine große Datenmenge oder ein ganzes Archiv keine gute Idee.

Die Probleme bei der Verwendung von Cloud-Speicher für die Langzeitarchivierung

Das Hauptproblem besteht darin, alle Daten über das Internet hin und her zu übertragen. In den meisten Fällen ist die Nutzung des Internets zur Übertragung der Daten immer noch zu langsam, so dass eine Übertragung wahrscheinlich Tage, wenn nicht sogar Monate oder sogar Jahre dauern würde, um zum Rechenzentrum des Cloud-Speicheranbieters zu gelangen. Deshalb bietet der größere Dienstleister eine andere Lösung an, um die Daten in das Rechenzentrum zu “übertragen”: Sie verwenden riesige mobile Speicherserver, schnelle Netzwerk-Switches und Kabel, um die Daten vor Ort – also im Unternehmen – auf ihre Server zu kopieren. Nachdem die Daten kopiert wurden, fahren sie dann zurück zum Rechenzentrum und kopieren die Daten erneut auf die dortigen Speichersysteme. Diese Möglichkeit wird jedoch oft nur gewährt, um die Daten in das Rechenzentrum zu bekommen, nicht aber um die Daten zurück zu erhalten. Das Entfernen der archivierten Daten wird daher in einigen Jahren eine kostspielige und zeitraubende Aufgabe sein.

Eine weitere Herausforderung bei der Verwendung von Cloud-Speicher können Datenlecks sein. Obwohl die Anbieter für die Sicherheit ihrer Daten verlässlich sind, werden die Rechenzentren von Menschen betrieben und Menschen machen Fehler. Selbst wenn die Serviceprovider Geschäftsvereinbarungen anbieten, die die Sicherheit garantieren sollen, so gibt es immer eine Ausnahme der Regel. Gleiches gilt für die Erreichbarkeit des Dienstes. Viele der Dienste bieten eine Erreichbarkeitsrate von 99,8%. Dies bedeutet jedoch nicht, dass Sie wirklich jederzeit auf Ihre Daten zugreifen können. Wie in jedem Rechenzentrum können Server ausfallen, entweder durch einen menschlichen Fehler oder einen Software- oder Hardwarefehler. Dann können Sie Ihre Daten lange nicht mehr erreichen – wie 2015, als Google-Kunden von einem 70-minütigen Problem mit der Cloud-Engine betroffen waren. Was, wenn jede Minute zählt, wenn Sie aufgrund einer Klage gesetzlich dazu verpflichtet sind, eine archivierte Datei zu suchen? Wenn Sie Stunden warten müssen, um diese Datei herunterzuladen, können Sie Probleme bekommen. Ganz zu schweigen von Datenlecks! In den letzten Jahren sind in Rechenzentren viele Datenlecks aufgetreten. Datenzentren sind nicht immun gegen Hackerangriffe und wenn ein solches Ereignis stattgefunden hat, besteht immer die Möglichkeit, dass sensible Daten von Ihrem Unternehmen in die Öffentlichkeit gelangen.

Und es gibt noch ein anderes Problem mit „der Wolke“. Im Falle eines Datenverlusts, der durch Sie verursacht wurde, zum Beispiel, wenn Sie versehentlich die falschen Tasten gedrückt haben, kann die Wiederherstellung Ihrer Daten eine echte Herausforderung werden. In diesem Fall – und wenn nur noch die Dateien übrig sind – benötigen Sie den guten Willen Ihres Dienstanbieters. Wenn er diese Daten nicht wiederherstellen kann, können Sie sich an einen Datenwiederherstellungsspezialisten wie Ontrack Data Recovery wenden, aber der Dienstanbieter muss Zugriff auf das spezifische Speichersystem gewähren. In den meisten Fällen speichert dieses System jedoch nicht nur Ihre Daten, sondern auch die von vielen anderen Kunden. In diesem Fall lassen viele Speicheranbieter Datenwiederherstellungs-Provider nicht arbeiten, weil sie den anderen Kunden eben auch die volle Sicherheit für ihre Daten versprachen, was dann dadurch auch geschieht, indem sie eine Fremdfirma nicht an die Systeme lassen. Das Ergebnis ist, dass Sie Ihre Dateien deswegen nicht zurückerhalten, obwohl es technisch möglich ist, Ihre Daten wiederherzustellen.

Schließlich gibt es ein weiteres Risiko: Cloud-Speicher ist eine ziemlich neue Methode zum Speichern von Daten. Deshalb kann nicht garantiert werden, dass Ihr Cloud-Speicheranbieter auch noch nach 10, 20 oder mehr Jahren im Geschäft ist bzw. seine Server im Betrieb sind. Aber das ist gerade der kritische Punkt hier: Es gab bereits Fälle, in denen Kunden von Cloud-Diensten aufgrund von Änderungen in den Richtlinien der Anbieter gezwungen waren, ihre Daten in sehr kurzer Zeit zu entfernen. Und das kann die ganze Zeit passieren. Und was, wenn der Speicheranbieter Bankrott geht? Es gibt immer noch viele Szenarien, die nicht unwahrscheinlich sind und damit ein Risiko darstellen, Archivdaten in der Cloud zu speichern.

Die Schlussfolgerung – Welche Speichermedien eignen sich am besten für die Langzeitarchivierung?

Was wir in diesem Artikel und den vorherigen gesehen haben, ist, dass jedes Speichermedium seine Vor- und Nachteile hat. Einige Speicher sind billiger als andere, aber haben keine sehr lange Lebensdauer, andere haben jedoch eine lange Lebensdauer, sind aber teurer.

Aber aus dem, was wir in den letzten Artikeln gesehen haben: Das beste Speichermedium für die Langzeitarchivierung ist das digitale Magnetband! Dies liegt an der Tatsache, dass es die längste Lebensdauer aller hier beschriebenen Medien hat und somit für mindestens 30 Jahre geeignet ist. Alle anderen Medien halten nur 5 bis 10 Jahre oder noch weniger und sind daher für diesen Zweck nicht zuverlässig genug. Zusätzlich sind Bandgeräte viel schneller geworden, obwohl sie die Daten immer noch linear speichern und ihre Kapazität auch über die Jahre gewachsen ist. Vergleicht man HDDs mit Tape, dann zeigt sich deutlich, dass Tape im Vergleich zu ihrer Kapazität noch günstiger als HDDs sind und länger halten.

Mit der Einführung des Linear Tape File System (LTFS) für LTO 5 und neuer können Bänder nun wie eine externe Festplatte genutzt werden und machen das Speichern und den Zugriff auf Dateien noch einfacher. Und wenn sie gemäß den Herstellerrichtlinien trocken und innerhalb eines bestimmten Temperaturbereichs gelagert werden, sollten Probleme mit den Medien zukünftig nicht auftreten.

Es ist jedoch ratsam, vorausschauend zu planen, wann Bänder zur Archivierung verwendet werden sollen. Bänder und die Bandhardware sollten häufig auf ihre Funktion überprüft werden. Außerdem sollten die Bandlaufwerke häufig gereinigt werden, damit ein mechanischer Verschleiß der Bänder verhindert wird. Und obwohl Bänder Daten lange speichern können, sollten Sie nach etwa 5 bis 6 Jahren in Betracht ziehen, die Daten auf eine neuere LTO-Version zu migrieren. Auf diese Weise können Sie sicher sein, dass die Daten auch nach 20 Jahren noch zugänglich sind, wenn Sie möglicherweise eine bestimmte Datei finden müssen.

Bildnachweis: Ontrack Datenrettung