Startseite Unternehmen Memblaze PBlaze5 910 U.2 NVMe SSD Testbericht

Memblaze PBlaze5 910 U.2 NVMe SSD Testbericht

by Adam Armstrong

Während ihrer Step Ahead-Veranstaltung in Peking stellte Memblaze eine neue Serie von 500 NVME-Laufwerken sowie eine Erweiterung seiner 900er-Reihe auf 910 und 916 vor. In diesem Test werden wir uns die 910er-Serie ansehen. Die neuen 910-Laufwerke werden in zwei Formfaktoren angeboten und nutzen 64-Layer-3D-NAND, wodurch die Laufwerke mit Kapazitäten von bis zu 16 TB erhältlich sind. Diese höhere Dichte kann zu dichteren Racks oder einer Rack-Konsolidierung im Rechenzentrum führen.


Während ihrer Step Ahead-Veranstaltung in Peking stellte Memblaze eine neue Serie von 500 NVME-Laufwerken sowie eine Erweiterung seiner 900er-Reihe auf 910 und 916 vor. In diesem Test werden wir uns die 910er-Serie ansehen. Die neuen 910-Laufwerke werden in zwei Formfaktoren angeboten und nutzen 64-Layer-3D-NAND, wodurch die Laufwerke mit Kapazitäten von bis zu 16 TB erhältlich sind. Diese höhere Dichte kann zu dichteren Racks oder einer Rack-Konsolidierung im Rechenzentrum führen.

Abgesehen von der Nutzung von 64-Layern zur Erzielung höherer Kapazitäten behauptet der Memblaze PBlaze5 910 eine höhere Leistung als die Vorgängermodelle. Das Unternehmen gibt an, dass das Laufwerk sequenzielle Lesegeschwindigkeiten von bis zu 3.5 GB/s und einen Durchsatz von bis zu 835 IOPS erreichen kann, und das bei einer Latenz von weniger als einer Millisekunde. Das Laufwerk verfügt außerdem über eine integrierte Hochverfügbarkeit, da es über zwei Ports verfügt, sodass ein einziger Fehlerpfad entfällt. Der 910 hat eine Ausdauer von 1 DWPD und eine MTBF von zwei Millionen Stunden. Zu den idealen Anwendungsfällen gehören: Datenbank, Suche, Indizierung, CDN, Cloud und Hyperscale, SDS, Deep Learning und Big-Data-Analyse, ERP, SAP HANA, BOSS, Bankwesen, Steuern, Hochfrequenzhandel und Online-Zahlung.

Für diesen Test schauen wir uns die 3.84 TB, U.2 des PBlaze5 910 an.

Memblaze PBlaze5 910 NVMe SSD-Spezifikationen

Formfaktor U.2
Kapazität 3.84TB 7.68TB 15.36TB
NAND- 3D eTLC
Schnittstelle PCIe 3.0 x 4
Protokoll NVMe 1.2a
Kennzahlen
Sequentielles Lesen (128 KB) 3.5GB / s 3.5GB / s 3.3GB / s
Sequentielles Schreiben (128 KB) 3.1GB / s 3.5GB / s 3.3GB / s
Dauerhaftes zufälliges Lesen (4 KB) 835K IOPS 830K IOPS 826K IOPS
Anhaltendes zufälliges Schreiben (4 KB) 99K IOPS 135K IOPS 150K IOPS
Latenz R/W 87 / 12μs
DWPD 1
UBER <10^-17
MTBF 2 Millionen Stunden
Leistungsaufnahme  7 ~ 25W

Kennzahlen

Testbed

Unsere Enterprise-SSD-Testberichte nutzen ein Lenovo ThinkSystem SR850 für Anwendungstests und a Dell PowerEdge R740xd für synthetische Benchmarks. Das ThinkSystem SR850 ist eine gut ausgestattete Quad-CPU-Plattform, die eine CPU-Leistung bietet, die weit über das hinausgeht, was zur Belastung des leistungsstarken lokalen Speichers erforderlich ist. Synthetische Tests, die nicht viele CPU-Ressourcen erfordern, verwenden den traditionelleren Dual-Prozessor-Server. In beiden Fällen besteht die Absicht darin, den lokalen Speicher im bestmöglichen Licht zu präsentieren, das mit den maximalen Laufwerksspezifikationen des Speicheranbieters übereinstimmt.

Lenovo Think System SR850

  • 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 Kerne)
  • 16 x 32 GB DDR4-2666 MHz ECC-DRAM
  • 2 x RAID 930-8i 12 Gbit/s RAID-Karten
  • 8 NVMe-Schächte
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x Intel Gold 6130 CPU (2.1 GHz x 16 Kerne)
  • 16 x 16 GB DDR4-2666 MHz ECC-DRAM
  • 1x PERC 730 2GB 12Gb/s RAID-Karte
  • Add-in-NVMe-Adapter
  • Ubuntu-16.04.3-desktop-amd64

Hintergrund und Vergleiche testen

Die StorageReview Enterprise Test Lab bietet eine flexible Architektur für die Durchführung von Benchmarks für Unternehmensspeichergeräte in einer Umgebung, die mit der Umgebung vergleichbar ist, die Administratoren in realen Bereitstellungen vorfinden. Das Enterprise Test Lab umfasst eine Vielzahl von Servern, Netzwerken, Stromkonditionierungs- und anderen Netzwerkinfrastrukturen, die es unseren Mitarbeitern ermöglichen, reale Bedingungen zu schaffen, um die Leistung während unserer Überprüfungen genau zu messen.

Wir integrieren diese Details zur Laborumgebung und zu den Protokollen in Überprüfungen, damit IT-Experten und diejenigen, die für die Speicherbeschaffung verantwortlich sind, die Bedingungen verstehen können, unter denen wir die folgenden Ergebnisse erzielt haben. Keine unserer Bewertungen wird vom Hersteller der von uns getesteten Geräte bezahlt oder überwacht. Weitere Details zum StorageReview Enterprise Test Lab und einen Überblick über seine Netzwerkfähigkeiten finden Sie auf den jeweiligen Seiten.

Vergleichswerte für diesen Testbericht:

Analyse der Anwendungsauslastung

Um die Leistungsmerkmale von Unternehmensspeichergeräten zu verstehen, ist es wichtig, die Infrastruktur und die Anwendungs-Workloads in Live-Produktionsumgebungen zu modellieren. Unsere Benchmarks für den Memblaze PBlaze5 910 sind daher die MySQL OLTP-Leistung über SysBench und Microsoft SQL Server OLTP-Leistung mit einer simulierten TCP-C-Arbeitslast. Für unsere Anwendungs-Workloads werden auf jedem Laufwerk zwei bis vier identisch konfigurierte VMs ausgeführt.

SQL Server-Leistung

Jede SQL Server-VM ist mit zwei vDisks konfiguriert: einem 100-GB-Volume für den Start und einem 500-GB-Volume für die Datenbank und Protokolldateien. Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 64 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt. Während unsere zuvor getesteten Sysbench-Workloads die Plattform sowohl in Bezug auf Speicher-I/O als auch in Bezug auf die Kapazität ausgelastet haben, wird beim SQL-Test nach der Latenzleistung gesucht.

Dieser Test verwendet SQL Server 2014, das auf Windows Server 2012 R2-Gast-VMs ausgeführt wird, und wird durch Quests Benchmark Factory für Datenbanken belastet. StorageReviews Microsoft SQL Server OLTP-Testprotokoll verwendet den aktuellen Entwurf des Benchmark C (TPC-C) des Transaction Processing Performance Council, einen Online-Transaktionsverarbeitungs-Benchmark, der die Aktivitäten in komplexen Anwendungsumgebungen simuliert. Der TPC-C-Benchmark kommt der Messung der Leistungsstärken und Engpässe der Speicherinfrastruktur in Datenbankumgebungen näher als synthetische Leistungsbenchmarks. Jede Instanz unserer SQL Server-VM für diese Überprüfung verwendet eine SQL Server-Datenbank mit 333 GB (Maßstab 1,500) und misst die Transaktionsleistung und Latenz unter einer Last von 15,000 virtuellen Benutzern.

SQL Server-Testkonfiguration (pro VM)

  • Windows Server 2012 R2
  • Speicherbedarf: 600 GB zugewiesen, 500 GB genutzt
  • SQL Server 2014
    • Datenbankgröße: Maßstab 1,500
    • Virtuelle Client-Auslastung: 15,000
    • RAM-Puffer: 48 GB
  • Testdauer: 3 Stunden
    • 2.5 Stunden Vorkonditionierung
    • 30-minütiger Probezeitraum

Bei unserem SQL Server-Transaktions-Benchmark landete das Memblaze PBlaze5 910 U.2 mit 12,546.5 TPS am Schlusslicht, weniger als drei andere PBlaze-Laufwerke. 

Überraschenderweise hatte der 910 mit 38.8 ms auch die höchste Latenz. 

Sysbench-Leistung

Der nächste Anwendungsbenchmark besteht aus a Percona MySQL OLTP-Datenbank gemessen über SysBench. Dieser Test misst die durchschnittliche TPS (Transaktionen pro Sekunde), die durchschnittliche Latenz und auch die durchschnittliche 99. Perzentil-Latenz.

Systembankben Die VM ist mit drei vDisks konfiguriert: eine für den Start (~92 GB), eine mit der vorgefertigten Datenbank (~447 GB) und die dritte für die zu testende Datenbank (270 GB). Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 60 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt.

Sysbench-Testkonfiguration (pro VM)

  • CentOS 6.3 64-Bit
  • Percona XtraDB 5.5.30-rel30.1
    • Datenbanktabellen: 100
    • Datenbankgröße: 10,000,000
    • Datenbankthreads: 32
    • RAM-Puffer: 24 GB
  • Testdauer: 3 Stunden
    • 2 Stunden Vorkonditionierung von 32 Threads
    • 1 Stunde 32 Threads

Beim Sysbench-Transaktions-Benchmark schnitt der U.2 910 mit 6,664.6 TPS besser ab und lag damit etwa im Mittelfeld der getesteten Leistung. 

Mit der durchschnittlichen Sysbench-Latenz lag das U.2 910 mit einer Latenz von 19.2 ms erneut im Mittelfeld. 

Bei unserem Worst-Case-Latenz-Benchmark-Szenario landete der U.2 910 mit 37.8 ms wieder in der Mitte.

Houdini von SideFX

Der Houdini-Test wurde speziell zur Bewertung der Speicherleistung im Zusammenhang mit der CGI-Wiedergabe entwickelt. Der Prüfstand für diese Anwendung ist eine Variante des Kerns Dell PowerEdge R740xd Servertyp, den wir im Labor verwenden, mit zwei Intel 6130-CPUs und 64 GB DRAM. In diesem Fall haben wir Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) mit Bare-Metal installiert. Die Ausgabe des Benchmarks wird in Sekunden bis zum Abschluss gemessen, wobei weniger besser ist.

Die Maelstrom-Demo stellt einen Abschnitt der Rendering-Pipeline dar, der die Leistungsfähigkeiten des Speichers hervorhebt, indem er seine Fähigkeit demonstriert, die Auslagerungsdatei effektiv als eine Form von Erweiterungsspeicher zu nutzen. Der Test schreibt die Ergebnisdaten nicht aus und verarbeitet die Punkte nicht, um den Wandzeiteffekt der Latenzauswirkungen auf die zugrunde liegende Speicherkomponente zu isolieren. Der Test selbst besteht aus fünf Phasen, von denen wir drei im Rahmen des Benchmarks durchführen:

  1. Lädt gepackte Punkte von der Festplatte. Dies ist die Zeit zum Lesen von der Festplatte. Hierbei handelt es sich um Single-Threaded, was den Gesamtdurchsatz einschränken kann.
  2. Entpackt die Punkte in ein einzelnes flaches Array, damit sie verarbeitet werden können. Wenn die Punkte nicht von anderen Punkten abhängig sind, kann der Arbeitssatz so angepasst werden, dass er im Kern bleibt. Dieser Schritt ist multithreaded.
  3. (Nicht ausführen) Verarbeiten Sie die Punkte.
  4. Packt sie in Bucket-Blöcke um, die für die Speicherung auf der Festplatte geeignet sind. Dieser Schritt ist multithreaded.
  5. (Nicht ausgeführt) Schreiben Sie die in Buckets unterteilten Blöcke zurück auf die Festplatte.

Beim Houdini-Test platzierte sich der 910 U.2 im mittleren bis unteren Bereich, lag aber mit einer Punktzahl von 3,093.8 Sekunden genau auf einer Linie mit anderen Memblaze-Produkten.

VDBench-Workload-Analyse

Beim Benchmarking von Speichergeräten sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, Konkurrenzlösungen direkt miteinander zu vergleichen. Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten. Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, bei denen 100 % des Antriebs genutzt und in einen stabilen Zustand versetzt werden. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.

Profile:

  • 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
  • 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
  • 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
  • 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
  • Synthetische Datenbank: SQL und Oracle
  • VDI-Vollklon- und Linked-Clone-Traces

In unserer ersten VDBench-Workload-Analyse, Random 4K Read, konnte das Memblaze PBlaze5 910 U.2 durchgehend unter 1 ms bleiben, mit einem Spitzenwert von 665,679 IOPS und einer Latenz von 191.3 μs, womit das Laufwerk ungefähr in der Mitte lag. 

Auch beim zufälligen 4K-Schreiben kam es durchgehend zu einer Latenz von unter einer Millisekunde. Der 910 U.2 belegte mit einer Spitzenleistung von 296,639 IOPS und einer Latenz von 429.6 μs den vorletzten Platz.

Bei der Umstellung auf sequentielle Workloads belegte der 910 U.2 erneut den vorletzten Platz bei sequenziellen 64K-Lesevorgängen mit einem Spitzenwert von 38,472 IOPS oder 2.4 GB/s bei einer Latenz von 415.3 μs.

Auf dem vorletzten Platz blieb der 910 U.2 mit etwa 18 IOPS oder 1.1 GB/s bei einer Latenz von etwa 870 μs beim 64-KB-sequenziellen Schreiben. 

Was die SQL-Workloads betrifft, erreichte das 910 U.2 einen Spitzenwert von 243,228 IOPS mit einer Latenz von nur 130.4 μs und belegte damit den vierten Platz in der Gesamtwertung.

Bei SQL 90-10 behielt der 910 mit einem Spitzenwert von 232,061 IOPS und einer Latenz von 136.5 μs den vierten Platz.

Der 910 U.2 lag immer noch auf dem vierten Platz und erreichte im SQL 220,195-144.6-Benchmark einen Spitzenwert von 80 IOPS mit einer Latenz von 20 μs.

Bei unserem Oracle-Workload blieb der 910 U.2 mit einem Spitzenwert von 212,052 IOPS und einer Latenz von 168.5 μs weiterhin auf dem vierten Platz.

Bei Oracle 90-10 rückte der 910 U.2 mit einem Spitzenwert von 180,723 IOPS und einer Latenz von 121.1μs auf den dritten Platz vor.

In Oracle 80-20 belegte der 910 mit einer Spitzenleistung von 900 IOPS und einer Latenz von 177,143 μs fast den dritten Platz mit dem 123.5.

Als nächstes fahren wir mit unserem VDI-Klontest „Vollständig und verknüpft“ fort. Beim VDI Full Clone Boot landete der 910 U.2 mit einer Spitzenleistung von 176,239 IOPS und einer Latenz von 197.9 μs auf dem vierten Platz.

VDI FC Initial Login sah den 910 U.2 immer noch auf dem vierten Platz, aber weiter hinter den drei besten Laufwerken mit einer Spitzenleistung von 66,925 IOPS und einer Latenz von 445.1 μs.

Beim VDI FC Monday Login landete der 910 U.2 mit 67,309 IOPS und einer Latenz von 235.7μs auf dem vierten Platz.

Beim Umstieg auf Linked Clone (LC) schauen wir uns zunächst den Boottest an. Hier belegte der 910 U.2 mit 83,210 IOPS und einer Latenz von 191.2μs den vierten Platz.

VDI LC Initial Login hielt den 910 U.2 mit 40,035 IOPS und einer Latenz von 197.4 μs auf dem vierten Platz.

Schließlich erreichte der VDI LC Monday Login mit der 910 U.2-Spitze bei 45,349 IOPS und einer Latenz von 349μs erneut den vierten Platz.

Schlussfolgerung

Das Memblaze PBlaze5 910 ist das neue NVMe-Rechenzentrumslaufwerk des Unternehmens, das 64-Layer-3D-NAND nutzt. Das Laufwerk ist in zwei Formfaktoren (U.2 für diesen Test) und mit Kapazitäten von 3.84 TB, 7.68 TB und 15.36 TB erhältlich. Memblaze gibt eine Leistung von bis zu 3.5 GB/s beim Lesen, 3.5 GB/s beim Schreiben und einen Durchsatz von bis zu 835 IOPS beim Lesen und 150 IOPS beim Schreiben an. Das Laufwerk erfüllt die Kriterien für eine Vielzahl von Anwendungsfällen und verfügt über Sicherheitsoptionen wie AES 256-Datenverschlüsselung und unterstützt die TRIM-Funktion mit bis zu 8 TB/s. 

Betrachtet man die Leistung der Anwendungs-Workload-Analyse, belegte der 910 U.2 in unseren SQL Server-Benchmarks mit 12,546.5 TPS und einer durchschnittlichen Latenz von 38.8 ms den letzten Platz. Im Sysbench schnitt das Laufwerk etwas besser ab und landete mit 6,664.6 TPS und einer durchschnittlichen Latenz von 19.2 ms im Mittelfeld. Im schlimmsten Fall lag die Latenz bei 37.8 ms. In unserem Houdini by SideFX-Benchmark erzielte der 910 U.2 eine Punktzahl von 3,093.8 Sekunden und lag damit am unteren Ende des Feldes, lag aber auf einer Linie mit anderen Memblaze-Produkten. 

Bei VDBench hatte der Memblaze PBlaze5 910 U.2 in allen Tests eine Latenz von unter einer Millisekunde. In allen Tests lag das Laufwerk tendenziell im mittleren bis mittleren Schlussfeld. Zu den wichtigsten Ergebnissen zählen 666 IOPS beim 4K-Lesen, 297 IOPs beim 4K-Schreiben, 2.4 GB/s beim 64K-Lesen und 1.1 GB/s beim 64K-Schreiben. Die SQL-Ergebnisse lagen bei rund einer Viertelmillion IOPS, wobei die Oracle-Tests zwischen 177 und 212 IOPS liefen. 

Insgesamt lieferte es eine gute Leistung, im Vergleich zum PBlaze5 900 der vorherigen Generation begann die Leistung jedoch einzubrechen.

Memblaze PBlaze5 910

Besprechen Sie diese Rezension

Melden Sie sich für den StorageReview-Newsletter an