Intels Optane SSD DC P4800X-Serie war bereits im März 2017 gestartet mit dem Versprechen, ein neues SCM-Medium (Storage Class Memory) namens 3D XPoint (Intel unter der Marke Optane) auf den Markt zu bringen. Das P4800X wurde sowohl als herkömmliches 2.5-Zoll-NVMe-Laufwerk (U.2) als auch als PCIe-Zusatzkarte eingeführt. Die anfänglichen Kapazitäten lagen zunächst bei 375 GB, bis Ende 1.5 sollen 2017 TB erreicht werden. Dieses Kapazitätsziel wurde nicht verwirklicht, aber Intel brachte es auf den Markt 750-GB-Optane-Modelle im November. Unabhängig von der Kapazität hat das P4800X eine Aufgabe: die Bereitstellung von möglichst schnellem Speicher für latenzempfindliche Anwendungen im Rechenzentrum.
Intels Optane SSD DC P4800X-Serie war bereits im März 2017 gestartet mit dem Versprechen, ein neues SCM-Medium (Storage Class Memory) namens 3D XPoint (Intel unter der Marke Optane) auf den Markt zu bringen. Das P4800X wurde sowohl als herkömmliches 2.5-Zoll-NVMe-Laufwerk (U.2) als auch als PCIe-Zusatzkarte eingeführt. Die anfänglichen Kapazitäten lagen zunächst bei 375 GB, bis Ende 1.5 sollen 2017 TB erreicht werden. Dieses Kapazitätsziel wurde nicht verwirklicht, aber Intel brachte es auf den Markt 750-GB-Optane-Modelle im November. Unabhängig von der Kapazität hat das P4800X eine Aufgabe: die Bereitstellung von möglichst schnellem Speicher für latenzempfindliche Anwendungen im Rechenzentrum.
Aufgrund der geringeren Kapazität der Laufwerke ist es weniger wahrscheinlich, dass das Unternehmen JBODs mit P4800X-SSDs zur Verwendung als Primärspeicher auffüllt. Als Punktlösung für Anwendungen, die von einer schnelleren Speicherung profitieren können, wie z. B. kleine Analysedatensätze und BI-Anwendungsfälle, ist dies jedoch durchaus möglich. Auch die Anbieter von Enterprise-Arrays haben es nicht eilig, Optane in großen Mengen in ihre Systemdesigns zu integrieren, wiederum hauptsächlich wegen der Kapazitätsbeschränkungen. HPE hat jedoch die Verwendung von Optane als Cache für 3PAR-Systeme untersucht, und andere möchten diese Speicherklasse sicherlich in ihre Systeme integrieren, wenn die Technologie ausgereift ist. Es gibt jedoch sofort eine Reihe hervorragender Anwendungsfälle für Optane-basierte SSDs in der Welt des softwaredefinierten Speichers, in denen Designs mehr Flexibilität bieten, um dieser neuen Speicherklasse Rechnung zu tragen.
VMware vSAN ist in diesem Bereich möglicherweise das sichtbarste Angebot Day-0-Support für das P4800X und haben eine herausragende Führungsrolle im HCI-Bereich. Da vSAN in einer zweistufigen Architektur betrieben wird, ist vSAN außerdem besonders gut positioniert, um die Vorteile dieser kleineren Laufwerke zu nutzen. vSAN-Speicher ist in Festplattengruppen koordiniert, mit einer Ebene für alle eingehenden Schreibaktivitäten sowie einer kapazitätsorientierten Leseebene. Derzeit nutzt vSAN nur bis zu 600 GB pro Laufwerk in der Schreibschicht, sodass die kleineren Kapazitäten des P4800X keine wirkliche Einschränkung darstellen. Für vSAN-Benutzer bedeutet dies, dass bei Bereitstellungen, bei denen der P4800X als Cache-Laufwerk fungiert, Schreibvorgänge in vSAN-Cluster mit der schnellstmöglichen Geschwindigkeit erfolgen.
Dieser Testbericht bezieht sich auf das P4800X im U.375-Formfaktor mit 2 GB. Während ich größtenteils als Teil einer Festplattengruppe für unsere arbeite bevorstehende vSAN-Überprüfungkonnten wir einen Teil unserer normalen Enterprise-SSD-Tests durchführen, um ein umfassenderes Bild vom Leistungsprofil des P4800X zu erhalten.
Technische Daten der Intel Optane SSD DC P4800X
Formfaktor | AIC HHHL, U.2 |
Kapazität | 375GB, 750GB |
Schnittstelle | PCIe 3x4, NVMe |
Latency | <10 μs |
QoS | |
4 KB zufällig, Warteschlangentiefe 1, Lesen/Schreiben | <60/100μs |
4 KB zufällig, Warteschlangentiefe 16, R/W | <150/200μs |
Durchsatz | |
4 KB zufällig, Warteschlangentiefe 16, R/W | bis zu 550/500 IOPS |
4 KB zufällig, Warteschlangentiefe 16, gemischt 70/30 R/W | bis zu 500 IOPS |
Ausdauer | |
DWPD | 30 |
Petabyte geschrieben | |
375GB | 20.5 PBW |
750GB | 41 PBW |
Kennzahlen
Testbed
Unsere Enterprise-SSD-Testberichte nutzen ein Lenovo ThinkSystem SR850 für Anwendungstests und a Dell PowerEdge R740xd für synthetische Benchmarks. Das ThinkSystem SR850 ist eine gut ausgestattete Quad-CPU-Plattform, die eine CPU-Leistung bietet, die weit über das hinausgeht, was zur Belastung des leistungsstarken lokalen Speichers erforderlich ist. Synthetische Tests, die nicht viele CPU-Ressourcen erfordern, verwenden den traditionelleren Dual-Prozessor-Server. In beiden Fällen besteht die Absicht darin, den lokalen Speicher im bestmöglichen Licht zu präsentieren, das mit den maximalen Laufwerksspezifikationen des Speicheranbieters übereinstimmt.
Lenovo Think System SR850
- 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 Kerne)
- 16 x 32 GB DDR4-2666 MHz ECC-DRAM
- 2 x RAID 930-8i 12 Gbit/s RAID-Karten
- 8 NVMe-Schächte
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x Intel Gold 6130 CPU (2.1 GHz x 16 Kerne)
- 16 x 16 GB DDR4-2666 MHz ECC-DRAM
- 1x PERC 730 2GB 12Gb/s RAID-Karte
- Add-in-NVMe-Adapter
- Ubuntu-16.04.3-desktop-amd64
Hintergrund und Vergleiche testen
Die StorageReview Enterprise Test Lab bietet eine flexible Architektur für die Durchführung von Benchmarks für Unternehmensspeichergeräte in einer Umgebung, die mit der Umgebung vergleichbar ist, die Administratoren in realen Bereitstellungen vorfinden. Das Enterprise Test Lab umfasst eine Vielzahl von Servern, Netzwerken, Stromkonditionierungs- und anderen Netzwerkinfrastrukturen, die es unseren Mitarbeitern ermöglichen, reale Bedingungen zu schaffen, um die Leistung während unserer Überprüfungen genau zu messen.
Wir integrieren diese Details zur Laborumgebung und zu den Protokollen in Überprüfungen, damit IT-Experten und diejenigen, die für die Speicherbeschaffung verantwortlich sind, die Bedingungen verstehen können, unter denen wir die folgenden Ergebnisse erzielt haben. Keine unserer Bewertungen wird vom Hersteller der von uns getesteten Geräte bezahlt oder überwacht. Weitere Details zum StorageReview Enterprise Test Lab und einen Überblick über seine Netzwerkfähigkeiten finden Sie auf den jeweiligen Seiten.
Vergleichswerte für diesen Testbericht:
- Memblaze PBlaze5 3.2 TB
- Intel P4510 2 TB
- Samsung PM1725a 1.6 TB
- Huawei ES3000 V5 3.2 TB
- Toshiba PX04 1.6 TB
Houdini von SideFX
Der Houdini-Test wurde speziell zur Bewertung der Speicherleistung im Zusammenhang mit der CGI-Wiedergabe entwickelt. Der Prüfstand für diese Anwendung ist eine Variante des Kerns Dell PowerEdge R740xd Servertyp, den wir im Labor verwenden, mit zwei Intel 6130-CPUs und 64 GB DRAM. In diesem Fall haben wir Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) mit Bare-Metal installiert. Die Ausgabe des Benchmarks wird in Sekunden bis zum Abschluss gemessen, wobei weniger besser ist.
Die Maelstrom-Demo stellt einen Abschnitt der Rendering-Pipeline dar, der die Leistungsfähigkeiten des Speichers hervorhebt, indem er seine Fähigkeit demonstriert, die Auslagerungsdatei effektiv als eine Form von Erweiterungsspeicher zu nutzen. Der Test schreibt die Ergebnisdaten nicht aus und verarbeitet die Punkte nicht, um den Wandzeiteffekt der Latenzauswirkungen auf die zugrunde liegende Speicherkomponente zu isolieren. Der Test selbst besteht aus fünf Phasen, von denen wir drei im Rahmen des Benchmarks durchführen:
- Lädt gepackte Punkte von der Festplatte. Dies ist die Zeit zum Lesen von der Festplatte. Hierbei handelt es sich um Single-Threaded, was den Gesamtdurchsatz einschränken kann.
- Entpackt die Punkte in ein einzelnes flaches Array, damit sie verarbeitet werden können. Wenn die Punkte nicht von anderen Punkten abhängig sind, kann der Arbeitssatz so angepasst werden, dass er im Kern bleibt. Dieser Schritt ist multithreaded.
- (Nicht ausführen) Verarbeitet die Punkte.
- Packt sie in Bucket-Blöcke um, die für die Speicherung auf der Festplatte geeignet sind. Dieser Schritt ist multithreaded.
- (Nicht ausgeführt) Schreibt die zusammengefassten Blöcke zurück auf die Festplatte.
Die Intel Optane SSD DC P4800X belegte im Houdini-Test mit 1,520.4 Sekunden den Spitzenplatz. Das P4800X hatte die beste Leistung aller Optane-Laufwerke und insgesamt die beste Leistung.
VDBench-Workload-Analyse
Wenn es um das Benchmarking von Speichergeräten geht, sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten sind, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, Konkurrenzlösungen direkt miteinander zu vergleichen. Diese Workloads bieten eine Reihe verschiedener Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten. Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, bei denen 100 % des Antriebs genutzt und in einen stabilen Zustand versetzt werden. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.
Profile:
- 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
- 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
- 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
- 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
- Synthetische Datenbank: SQL und Oracle
- VDI-Vollklon- und Linked-Clone-Traces
Für die 4K-Spitzenzufallsleistung startete die Intel Optane SSD DC P4800X (im Folgenden als P4800X bezeichnet) mit einer viel geringeren Latenz als die anderen Laufwerke, bevor sie kurz nach 500 IOPS anstieg und mit 585,754 IOPS mit einer Latenz von 213 μs den letzten Platz belegte .
Bei der 4K-Spitzenschreibleistung schnitt das P4800X besser ab und landete mit einer Spitzenleistung von etwa 554 IOPS und einer Latenz von nur 155 μs auf dem zweiten Platz.
Bei der Umstellung auf sequentielle Arbeitslasten sahen wir bei unserem 64-KByte-Read ein ähnliches Muster wie beim 4-KB-Read. Das P4800X begann mit einer viel geringeren Latenz als die anderen Laufwerke, bevor es auf etwa 35 IOPS anstieg und bei einer Latenz von 40,558 μs einen Spitzenwert von 2.53 IOPS oder 394 GB/s erreichte. Damit belegte die Fahrt den vierten Gesamtrang.
Beim 64K-Schreiben belegte das P4800X mit einer Spitzenleistung von etwa 34,700 IOPS oder 2.17 GB/s bei einer Latenz von 380 μs den zweiten Platz, bevor es leicht abfiel.
Bei unserem SQL-Workload sehen wir, dass der P4800X mit einem Spitzenwert von 286,548 IOPS und einer Latenz von nur 111 μs mit großem Vorsprung an die Spitze springt.
In unserem SQL90-10 setzte sich der P4800X mit einem Spitzenwert von 276,530 IOPS und einer Latenz von 114 μs weiterhin durch.
Der P80X blieb im SQL 20-4800 an erster Stelle und erreichte einen Spitzenwert von etwa 266 IOPS mit einer Latenz von etwa 111 μs, bevor es zu einem kleinen Rückgang kam.
Bei unseren Oracle-Workloads belegte der P4800X mit einem Spitzenwert von fast 248 IOPS und einer Latenz von 127 μs den zweiten Platz.
Im Oracle 90-10 hat das P4800X die anderen Laufwerke mit einer Spitzenleistung von 276,703 IOPS bei einer Latenz von nur 79 μs umgehauen.
Auch beim Oracle 80-20 sahen wir den P4800X mit 265,769 IOPS und einer Latenz von nur 82 μs weit vorne.
Als nächstes wechselten wir zu unserem VDI-Klontest, Full Clone (FC) und Linked Clone (LC). Beim VDI FC Boot startete der P4800X extrem stark, sprang dann nach oben und belegte mit einer Spitzenleistung von 167,856 IOPS und einer Latenz von 199μs den dritten Platz.
Beim VDI FC Initial Login belegte der P4800X mit 108,159 IOPS und einer Latenz von 274μs erneut den dritten Platz.
Beim VDI FC Monday Login sprang der P4800X mit einer Spitzenleistung von 97,198 IOPS und einer Latenz von 163 μs auf den zweiten Platz.
Beim VDI LC Boot konnte sich der P4800X mit einem Wert von 93,095 IOPS und einer Latenz von 171 μs den Spitzenplatz sichern.
VDI LC Initial Login belegte mit einem Wert von 4800 IOPS und einer Latenz von 66,463 μs einen weiteren Spitzenplatz für den P118X.
Bei unserem VDI LC Monday Login-Test belegte das P4800X schließlich den zweiten Platz mit 67,085 IOPS und einer Latenz von 235 μs.
Schlussfolgerung
Die Intel Optane SSD DC P4800X ist ein weiteres Laufwerk mit Intels 3D-XPoint-Technologie. Wie der Name schon sagt, wurde das Laufwerk speziell für das Rechenzentrum entwickelt und ist in den gängigen Formfaktoren U.2 und AIC HHHL erhältlich. Einer der Nachteile, der sofort auffällt, ist, dass das Laufwerk nur in den Kapazitäten 375 GB und 750 GB angeboten wird. Dies schränkt einerseits die Anwendungsfälle ein, andererseits sind die Anwendungsfälle jedoch vorwiegend auf Workloads und Anwendungen ausgerichtet, bei denen eine niedrige Latenz im Vergleich zur Kapazität von größter Bedeutung ist. In dieser Hinsicht hat sich die Optane-Technologie sowohl bei Unternehmens- als auch bei Endbenutzer-Workloads als Branchenführer erwiesen.
Aufgrund der geringen Kapazität des P4800X haben wir eine kleine Lücke in unserem normalen Benchmark-Spektrum. Die Laufwerkskapazität war nicht groß genug, um SQL oder Sysbench auszuführen, daher fehlen sie in diesem Einzellaufwerkstest. Beim ersten Anwendungsanalyse-Workload, den wir ausführen konnten, Houdini by SideFX, war der P4800X mit 1,520.4 Sekunden insgesamt der Spitzenreiter. In unserem VDBench dominierte das P4800X bei geringen Warteschlangentiefen auf ganzer Linie. Die Spitzenleistung war beim P4800X uneinheitlicher, wo einige traditionelle NVMe-Produkte ihn in der Leistung übertrafen. Allerdings hat es andere in Bereichen wie SQL und Oracle mit 90-10 und 80-20 umgehauen. Zu den Highlights des P4800X gehören über eine halbe Million IOPS in beiden 4K-Tests, 2.53 GB/s beim 64K-Lesen und 2.17 GB/s beim 64K-Schreiben. In allen drei SQL-Tests erreichte der P4800X über eine Viertelmillion IOPS und in unseren Oracle-Tests mindestens 250 IOPS. Aber abgesehen von der Spitzenleistung hatte der Intel Optane P4800X extrem niedrige Latenzen. In jedem Test war die Latenz zu Beginn sehr niedrig, typischerweise viel niedriger als bei allen anderen Laufwerken. Und in einigen Fällen erzielte der P4800X eine Spitzenleistung mit einer Latenz von nur 79 μs in Oracle 90-10 und 82 μs in Oracle 80-20.
Für Workloads mit geringer Latenz gibt es derzeit nichts, was der Intel Optane SSD DC P4800X nahe kommt. Zwar gibt es Bereiche, in denen herkömmliche NVMe-Produkte es in Bezug auf Gesamtbandbreite und IOPS übertreffen können, doch im Allgemeinen würde das P4800X aufgrund seiner Preis-/Kapazitätskennzahlen nicht für diese Anwendungsfälle geeignet sein. Es ist jedoch spannend, über die Möglichkeiten der Intel Optane-Technologie nachzudenken, sobald die Enterprise-Laufwerke die höheren Kapazitätspunkte erreichen; vor allem etwas in der 2-TB-Klasse, das bei Array-Anbietern immer noch beliebt ist, obwohl 30-TB-SAS-SSDs allgemein erhältlich sind. In unserem speziellen Anwendungsfall rund um vSAN liefert der P4800X die schnellstmögliche Leistung für die Schreib-Cache-Schicht. Für alle, die vSAN optimal nutzen möchten, ist der P4800X der De-facto-Standard.
Besprechen Sie diese Rezension
Melden Sie sich für den StorageReview-Newsletter an