Enterprise- und Client-SSDs im Vergleich

Donnerstag, 24. Februar 2022 von Der Datenrettung Blog

Eine wachsende Zahl von Unternehmensrechenzentren, die mit hohem Datendurchsatz und niedrigen Latenzzeiten bei Transaktionen arbeiten, hat sich bislang auf Hard Disk Laufwerke (HDD) in ihren Servern verlassen und steht nun Leistungsengpässen gegenüber. Sie fassen heute Solid-State Laufwerke (SSD) als gangbare Speicherlösung ins Auge, mit denen sie die Leistung, Effizienz und Zuverlässigkeit ihrer Rechenzentren steigern und gleichzeitig die Betriebskosten (OpEx) senken können.

Zur Verdeutlichung der Unterschiede zwischen den einzelnen SSD-Klassen müssen wir zunächst zwischen den beiden Schlüsselkomponenten eines SSD, dem Flash Storage Controller und dem zum Speichern von Daten verwendeten nicht-volatilen NAND-Flashspeicher, unterscheiden.

Auf dem heutigen Markt wird der SSD- und NAND-Flashspeicherkonsum in drei Hauptgruppen unterteilt:

  • Endkundengeräte (Tablets, Kameras, Mobiltelefone)
  • Client-Systeme (Netbook, Notebook, Ultrabook, AIO, Desktop-PCs), eingebettet/gewerblich (Gaming Kiosk, speziell gebaute Systeme, Digital Signage)
  • Enterprise-Computing-Plattformen (HPC, Rechenzentrum-Server)

Die Auswahl des richtigen SSD-Speichergeräts für das Rechenzentrum eines Unternehmens kann ein langwieriger und mühsamer Lernprozess sein, in dem eine Vielzahl unterschiedlicher SSD-Anbieter und Produktarten hinsichtlich der Eignung überprüft werden müssen, da nicht alle SSDs und NAND-Flashspeicher in derselben Art hergestellt wurden.

SSDs werden für den einfach zu installierenden Ersatz oder zur Ergänzung von auf magnetischen Platten basierenden Festplatten (HDD) hergestellt und sind in vielen verschiedenen Formfaktoren, einschl. 2,5 Zoll, und mit Kommunikationsprotokollen/Schnittstellen, einschließlich Serial ATA (SATA), Serial Attached SCSI (SAS) und in jüngerer Zeit PCIe erhältlich, um Daten auf die Zentraleinheit (CPU) eines Servers oder von dieser zu übertragen.

SSDs können zwar leicht installiert werden, was aber nicht garantiert, dass sich alle langfristig für die Anwendungen eignen, für die sie das Unternehmen ausgewählt hat. Wenn SSDs vorzeitig verschleißen, weil sie übermäßig beschrieben wurden, die anhaltende Schreibleistung während ihrer zu erwartenden Lebensdauer wesentlich niedriger ist, oder sie im Speicher-Array zusätzliche Latenzzeit verursachen und deshalb frühzeitig ersetzt werden müssen, können die Kosten für eine falsch ausgewählte SSD oft alle ursprünglichen Kosteneinsparungen und Leistungsvorteile zunichtemachen.

Als Entscheidungshilfe für Ihren nächsten Kauf von Ersatzspeicher oder zusätzlichem Speicher für ein Unternehmensrechenzentrum befassen wir uns in dieser Studie mit den drei Hauptmerkmalen, die eine SSD der Enterprise-Klasse von einer SSD der Client-Klasse unterscheiden: Leistung, Zuverlässigkeit und Ausdauer.

Leistung

Durch den Einsatz von Multi-Channel-Architektur und Parallelzugriff vom SSD Controller auf die NAND-Flash-Chips können SSDs unglaublich hohe Lese- und Schreibgeschwindigkeiten, sowohl bei sequenziellen als auch bei zufälligen Datenabfragen der CPU, erreichen.

Das typische Szenario eines Rechenzentrums besteht aus der Verarbeitung von Millionen Bytes zufälliger Firmendaten, einschließlich technischer CAD-Zeichnungen und seismischer Analysedaten (z.B. Big Data), oder dem weltweiten Zugang von Kunden für Banking-Transaktionen (z.B. OLTP). Der Zugang zu den Speichergeräten muss mit niedrigsten Latenzzeiten erfolgen, und es kann auch erforderlich sein, dass viele Kunden gleichzeitig Zugang zu den selben Daten haben, ohne dass die Reaktionszeiten dadurch abfallen. Anwendererfahrung basiert auf niedrigen Latenzzeiten, was die Produktivität der Anwender steigern.

Eine Client-Anwendung betrifft nur einen Benutzer oder eine Anwendung, und die Toleranzgrenze zwischen dem Minimum und dem Maximum der Reaktionszeit (oder Latenzzeit) bei Anwender- oder Systemaktivitäten liegt höher.

Falsch angepasste Leistung kann komplexe SSD-Speicher-Arrays (z. B. Network Attached Storage, Direct Attached Storage oder Storage Area Network) nachteilig beeinflussen und sich verheerend auf die Latenzzeiten des Speicher-Arrays, auf die dauerhafte Leistung und letztendlich auf die Servicequalität, die von Anwendern wahrgenommen wird, auswirken.

Im Gegensatz zu Client-SSDs sind SSDs der Enterprise-Klasse nicht nur für Spitzenleistung in den ersten Sekunden nach dem Zugriff optimiert, sondern bieten durch Nutzung eines größeren, überdimensionierten Bereichs (OP) eine höhere stabile Leistung über längere Zeiträume. Weitere Informationen zu den einzelnen Laufwerken finden Sie auf der Kingston Website unter Enterprise SSDs.

Dies garantiert, dass die Leistung des Speicher-Arrays auch bei Spitzenbelastungen ständig der von der Organisation erwarteten Servicequalität (QoS) entspricht.

Zuverlässigkeit

Mit NAND-Flashspeichern sind verschiedene Probleme verbunden, wobei zu den beiden wichtigsten die begrenzte Lebenserwartung gehört, da NAND-Flashzellen während des wiederholten Schreibens verschleißen, sowie eine normal anfallende Fehlerhäufigkeit.

Jeder NAND-Flash-Die wird während des Herstellungsprozesses eines NAND-Flashspeichers von Silizium-Wafers getestet und mit einer Bit-Rohfehlerrate (BER oder RBER) gekennzeichnet.

Die BER definiert die Rate, mit der normal auftretende Bitfehler im NAND-Flash ohne Ausgleich durch den Error Correction Code (ECC) vorkommen, und die der SSD Controller mit spontanem Advanced ECC (in der Regel BCH ECC-, Strong ECC- or LDPC-Fehlerkorrektur durch unterschiedliche SSD-Controller-Hersteller genannt) korrigiert, ohne den Anwender- oder Systemzugriff zu unterbrechen.

Die Fähigkeit des SSD Controllers, diese Bitfehler zu korrigieren, kann durch die Uncorrectable Bit Error Ratio (UBER), "eine Metrik für die Datenkorruptionsrate, die der Anzahl der Datenfehler pro Bit entspricht, die nach der Anwendung bestimmter Fehlerkorrekturverfahren gelesen wird", interpretiert werden. [1]

Wie durch die Industry Standards Association JEDEC im Jahre 2010 mit Dokumenten JESD218A: Solid State Drive (SSD) Requirements and Endurance Test Method und JESD219: Solid State Drive (SSD) Endurance Workloads definiert und vereinheitlicht, unterscheidet sich die Enterprise-Klasse in einer Reihe von Möglichkeiten von SSDs der Client-Klasse, einschließlich, aber nicht beschränkt auf ihre Fähigkeit zur Unterstützung höherer Schreibauslastungen, extremerer Umgebungsbedingungen und Wiederherstellung einer höheren BER als ein Client-SSD. [2] [3]

Anwendungs klasseWorkload (siehe JESD219)Aktive Nutzung (eingeschaltet)Datenerhaltung (ausgeschaltet)UBER-Anforderungen
ClientClient40° C 8 Stunden/Tag30° C 1 Jahr≤10 bis 15
EnterpriseEnterprise55° C 24 Stunden/Tag40° C 3 Monate≤10 bis 16

Tabelle 1 - JESD218A: Solid-State-Drive (SSD) Requirements and Endurance Test Method Copyright JEDEC. Nachdruck mit freundlicher Genehmigung von JEDEC.

Mit den von JEDEC vorgeschlagenen UBER-Vorgaben für SSDs der Enterprise-Klasse geht man bei einem Vergleich zwischen Enterprise-SSDs und Client-SSDs davon aus, dass bei einem Verhältnis von 1 Bitfehler je 10 Billiarden Bits (~ 1,11 Petabytes) nur 1 nicht behebbarer Bitfehler auftritt, im Gegensatz zu Client-SSDs, bei denen 1 Bitfehler je 1 Billiarde Bits (~ 0,11 Petabytes) verarbeitet wird.

Kingston Enterprise-SSDs haben auch zusätzliche Technologien, mit denen die Wiederherstellung von beschädigten Datenblöcken mit Paritätsdaten, die in anderen NAND-Dies, gespeichert sind, möglich ist (ähnlich RAIDing-Laufwerken, was die Wiederherstellung von bestimmten Blöcken ermöglicht, die mit den Paritätsdaten, die in anderen Blöcken gespeichert sind, wiederaufgebaut werden können).

Um die redundanten Datenblock-Wiederherstellungstechnologien in Kingston Enterprise-SSDs zu ergänzen, werden auch periodische Checkpoint-Erstellung, Cyclic Redundancy Check (CRC) und ECC-Fehlerkorrektur in einem End-to-End-internen Sicherungssystem implementiert, um die Integrität der Daten vom Host über den Flash und zurück zum Host zu gewährleisten. End-to-End-Datenschutz bedeutet, dass Daten, die vom Host empfangen werden, während ihrer Speicherung im internen Cache des SSD und wenn sie von den NAND-Speicherbereichen geschrieben oder wiedergegeben werden auf deren Integrität überprüft werden.

Ähnlich wie ein verbesserter ECC-Schutz gegen Bitfehler bei SSDs der Enterprise-Klasse, enthalten SSDs auch technische Schaltungen zum Erkennen von Stromverlust, welche die Stromspeicherkondensatoren auf den SSDs verwalten. Powerfail-Support in Hardware überwacht den an die SSD eingehenden Strom und gewährt während eines überraschenden Stromverlustes vorübergehend die Stromversorgung der SSD-Schaltungen mit Tantal-Kondensatoren, um intern oder extern ausgegebene, ausstehende Schreibvorgänge abzuschließen, bevor die SSDs ausgeschaltet werden. Powerfail-Schutzschaltungen sind in der Regel für Anwendungen erforderlich, wenn Datenverlust nicht mehr rückgängig gemacht werden kann.

Powerfail-Schutz kann auch in der SSD-Firmware durch häufiges Entleeren von Daten in den SSD Controller-Cache-Bereichen (z. B. ihre FTranslation-Layer-Tabelle) an den NAND-Speicher implementiert werden. Dies gewährleistet zwar nicht, dass während eines Stromausfalls keine Daten verloren gehen, versucht aber, die Auswirkungen von unsicheren Stromabschaltungen zu minimieren. Firmware-Powerfail-Schutz gewährleistet auch, dass es unwahrscheinlich ist, dass die SSD nach einer unsicheren Abschaltung nicht mehr betriebsfähig ist.

In vielen Situationen kann die Verwendung von Software Defined Storage oder Server-Clustering die Notwendigkeit für auf Hardware basierten Powerfail-Support reduzieren, da alle Daten auf ein separates und unabhängiges Speichergerät auf einem anderen Server oder auf mehreren anderen Servern repliziert werden. Web-Scale-Rechenzentren verzichten oft auf Powerfail-Support und verwenden Software Defined Storage an RAID-Servern, um faktisch redundante Kopien der gleichen Daten zu speichern.

[1] Kingston Technology
[2] Nicht korrigierbare Bitfehlerrate (UBER) JEDEC dictionary,
[3] JEDEC Committee JESD218A:  JESD218A: Solid State Drive (SSD) Requirements and Endurance Test Method

Artikel Copyright: Kingston Technology

Load more comments


Neuer Code



Ontrack Datenrettungsblog

Das sagen unsere Kunden: