Go to Top

Die Weiterentwicklung des Speichers: Dateispeicher vs. Blockspeicher vs. Objektspeicher – Teil 1

Immer mehr Daten werden weltweit übertragen und generiert als jemals zuvor. Die Marktforscher von IDC erwarten, dass bis 2025 die globale Datensphäre auf 163 Zettabytes anwachsen wird. Das ist ein Anstieg um mehr als 1000% gegenüber den 16,1 ZB der Daten von 2016. Die Gründe für diese enorme Zunahme der Daten sind vielfältig:

Die Anzahl der Quellen und Geräte, die Daten erzeugen, steigt weiterhin rasant. Embedded Systems und Internet of Things-Geräte sammeln Daten und übertragen diese in Big-Data-Anwendungen und -Lösungen, um eine Echtzeitanalyse durchzuführen. Der anhaltende Trend, mobile Geräte und Social-Media-Plattformen sowie Online-Shopping und alle Arten von Anwendungen zu nutzen, egal wann und wo auch immer, produziert jeden Tag viele, viele Daten. Auch Unternehmen verändern sich stetig beim Datenmanagement, um die steigende Nachfrage nach Nachrichten und Echtzeitdaten ihrer Kunden zu befriedigen.

Laut einer neuen Gartner-Prognose wird mehr als die Hälfte der Unternehmen bei den wichtigsten Geschäftsprozessen und -systemen mindestens ein Element des IoT (Internet der Dinge) bis zum Jahr 2020 in ihre Organisation integrieren. Und damit wird die Menge an Daten, die von Big-Data-Anwendungen generiert, übertragen und analysiert werden (und die entweder vor Ort oder außerhalb des Unternehmens gespeichert werden), enorm wachsen.

Aus diesem Grund ist die Nachfrage – durch das Management und die Vertreter der IT-Abteilungen – nach Speicherlösungen, die in der Lage sind, noch mehr digitale Inhalte für lange Zeit zu verwalten und zu archivieren, drastisch gestiegen.

Es ist jedoch nicht nur die größere Menge an Speichergeräten, die jetzt aus einer Hardware-Perspektive benötigt wird – wie zum Beispiel Festplatten, SSDs oder SSHDs. Auch der Bedarf an geeigneten Dateisystemen, die das Wachstum der Big Data bewältigen kann ist gestiegen. Denn selbst wenn nicht alle Daten auf Speichergeräten gespeichert werden, so müssen doch die wichtigsten Daten sowie die Analyseergebnisse auf jedem Fall gespeichert werden. Dies führt zu mehr Nachfrage nach Speicherplatz. Ein großer Teil dieses gewachsenen Speicherbedarfs wird sowohl intern als auch in der Cloud mit Diensten wie Amazon S3 oder Microsoft Azure von Unternehmen abgewickelt.

Die alten Konzepte der Speicherung mit Dateispeicher und Blockspeicher werden für dieses Datenwachstum sowohl für Unternehmen als auch für die Cloud-Anbieter in Zukunft nicht mehr funktionieren. Die Lösung für die Speicherung dieser riesigen Datenmengen ist der Objektspeicher (engl. Object storage), der auch als objektbasierter Speicher bezeichnet wird. Aber was sind die Unterschiede und was macht den Objektspeicher geeignet für die Datenexplosion als die früheren Konzepte?

Um die Vorteile zu verstehen, die Objektspeicher bieten, muss man sich zuerst die älteren Konzepte – Dateispeicher (File storage) und Blockspeicher (Block storage) – ansehen, da sie sich stark unterscheiden.

Die Unterschiede zwischen Datei-, Block- und Objektspeicher (File, Block and Object storage)

Datei- und Blockspeicher sind Methoden zum Speichern von Daten auf NAS- und SAN-Speichersystemen.

Auf einem NAS-System wird der Speicher als Netzwerkdateisystem verfügbar gemacht. Wenn Geräte an ein NAS-System (Network Attached Storage) angeschlossen werden, wird ein gemountetes Dateisystem angezeigt und Benutzer können mit ihren Zugriffsrechten auf ihre Dateien zugreifen. Aus diesem Grund muss ein NAS-System Benutzerrechte, Dateisperren und andere Sicherheitsmaßnahmen verwalten, damit mehrere Benutzer auf Dateien zugreifen können. Der Zugriff auf das NAS erfolgt über NFS- und SMB / CIFS-Protokolle. Wie bei jedem Server oder jeder Speicherlösung ist ein Dateisystem für die Positionierung der Dateien im NAS zuständig. Das funktioniert sehr gut für Hunderttausende oder sogar Millionen von Dateien, aber nicht für Milliarden.

Der Blockspeicher funktioniert ähnlich, aber im Gegensatz zum Dateispeicher, bei dem die Daten auf Dateiebene verwaltet werden, werden Daten in Datenblöcken gespeichert. Mehrere Blöcke (zum Beispiel in einem SAN-System) ergeben eine Datei. Ein Block besteht aus einer Adresse und die SAN-Anwendung bekommt den Block, wenn sie eine SCSI-Anfrage an diese Adresse sendet. Die Speicheranwendung entscheidet dann, ob die Datenblöcke innerhalb des Systems gespeichert werden und auf welchem spezifischen Datenträger oder Speichermedium. Wie die Blöcke am Ende kombiniert werden und wie auf sie zugegriffen wird, entscheidet die Speicherverwaltungsanwendung der Storagelösung. Blöcke in einem SAN haben keine Metadaten, die sich dezidiert auf das Speichersystem oder die Storageanwendung beziehen. Mit anderen Worten: Blöcke sind Datensegmente ohne Beschreibung, Zuordnung und ohne einen Besitzer für die Speicherverwaltungsapplikation. Alles wird von der SAN-Software gehandhabt und gesteuert. Aus diesem Grund werden SAN- und Block-Speicher häufig für leistungshungrige Anwendungen wie Datenbanken oder für Transaktionen verwendet, da hier die Daten abgerufen, geändert und gespeichert werden können.

Beide Methoden zum Speichern von Daten funktionierten jahrelang einwandfrei. Warum braucht man dann ein anderes Konzept? Das liegt daran, dass Lösungen für beide Konzepte und Funktionen für Benutzerzugriffsrechte implementiert werden müssen, damit sie Änderungen an den Daten vornehmen können.

Was wir jetzt sehen, ist, dass viele der Daten, die jetzt produziert werden, “eingekerkerte” oder unstrukturierte Daten sind. Inhalte oder Material, das nie wieder geändert wird. Und hier kommt der Objektspeicher ins Spiel:

Objekte im Objektspeicher sind “gebündelte Daten” (aka eine Datei) mit entsprechenden Metadaten. Dieses Objekt erhält eine eindeutige ID (Identifizierungsbezeichnung), die aus dem Dateiinhalt und den Metadaten berechnet wird. Anwendungen identifizieren das Objekt dann über diese ID. Die vielen Objekte innerhalb eines Objektspeichersystems sind über die gesamten gegebenen Speicherplatten hinweg gespeichert. In seiner reinen Form kann ein Objektspeicher “nur” eine Version einer Datei (Objekt) speichern. Wenn ein Benutzer eine Änderung vornimmt, wird eine andere Version derselben Datei als neues Objekt gespeichert. Aus diesem Grund ist ein Objektspeicher die perfekte Lösung für eine Backup- oder Archivierungslösung. Oder auch für Speicher, die große Mengen an Videos oder Filmen enthalten, die nur angeschaut, aber nicht verändert werden, wie zum Beispiel Online-Videostreaming-Seiten oder Videos auf youtube.com.

Der Hauptunterschied zwischen den anderen Konzepten besteht darin, dass die Objekte über die Anwendung selbst verwaltet werden, die den Objektspeicher unterstützt. Das bedeutet, dass hier kein echtes Dateisystem benötigt wird. Diese Ebene ist hier obsolet. Eine Anwendung, die den Objektspeicher verwendet, sendet eine Speicheranfrage direkt an die Lösung, in der das Objekt gespeichert werden soll. Das Objekt erhält dann eine Adresse innerhalb des großen Speicherplatzes und wird dann dort von der Anwendung selbst gespeichert.

Aufgrund der sehr einfachen Verwaltung von Daten – ohne echtes Dateisystem – können Objektspeicherlösungen viel einfacher skaliert werden als Dateispeicher oder blockspeicherbasierte Systeme. Sie fügen nur einige Festplatten in die Lösung ein und es ist keine große Verwaltung mehr erforderlich, um mehr Speicherplatz zu bekommen. Das ist gerade in Zeiten exponentiellen Datenwachstums ein immenser Vorteil.

Object Storage ist also eine perfekte Lösung für große Datenmengen und wird daher von großen Cloud-Service-Providern wie Amazon, Google und anderen genutzt. Aber wie verhält es sich mit der Data Protection und der Datenwiederherstellung? Die Antworten auf diese Fragen geben wir im zweiten Teil dieses Artikels …

Bildnachweis: Gabi Schoenemann / pixelio.de

https://www.pixelio.de/media/245932