Startseite Unternehmen Memblaze PBlaze5 916 Series U.2 SSD Testbericht

Memblaze PBlaze5 916 Series U.2 SSD Testbericht

by Lyle Smith

Die PBlaze5 916-Serie ist eine 64-Layer-3D-NAND-Hochleistungsreihe von NVMe-SSDs, die sich auf Energieeffizienz für Rechenzentren konzentrieren. Es verfügt über die üblichen Verdächtigen für Unternehmensfunktionen, darunter AES 256-Datenverschlüsselung, vollständigen Datenpfadschutz und erweiterten Stromausfallschutz, und trägt so zum Schutz kritischer Unternehmensanwendungen bei. Die 916-Serie ist sowohl im 2.5-Zoll-U.2- als auch im HHHL-AIC-Formfaktor erhältlich, wobei wir uns in diesem Test mit dem ersteren befassen.


Die PBlaze5 916-Serie ist eine 64-Layer-3D-NAND-Hochleistungsreihe von NVMe-SSDs, die sich auf Energieeffizienz für Rechenzentren konzentrieren. Es verfügt über die üblichen Verdächtigen für Unternehmensfunktionen, darunter AES 256-Datenverschlüsselung, vollständigen Datenpfadschutz und erweiterten Stromausfallschutz, und trägt so zum Schutz kritischer Unternehmensanwendungen bei. Die 916-Serie ist sowohl im 2.5-Zoll-U.2- als auch im HHHL-AIC-Formfaktor erhältlich, wobei wir uns in diesem Test mit dem ersteren befassen.

Der PBlaze5 916 verfügt über 16 Leistungsmoduseinstellungen (die von 10 W bis 25 W reichen) und einen Leistungsmodusschalter, der es Benutzern ermöglicht, innerhalb einer Millisekunde schnell zwischen verschiedenen Stufen zu wechseln. Darüber hinaus unterstützt die neue Memblaze SSD-Reihe die TRIM-Funktion der Enterprise-Klasse, die sicherstellt, dass gekürzte alte Daten für neue Benutzer nicht zugänglich sind. Es verbessert auch die Leistung und Ausdauer.

Was die Leistung angeht, wird angegeben, dass das U.5-Modell der PBlaze916 2-Serie beim 3.5-GB-Modell bis zu 6.4 GB/s sowohl beim Lesen als auch beim Schreiben erreicht, während bei zufälligen Lese- und Schreibvorgängen 830,000 IOPS und 303,000 IOPS erwartet werden. bzw. Was die Ausdauer betrifft, unterstützt er bis zu 3 DWPD, während der PBlaze5 910 nur 1 DWPD unterstützt.

Beide Formfaktoren der PBlaze5 916-Serie sind in zwei Kapazitäten erhältlich: 3.2 TB und 6.4 TB. Wir werden uns für diesen Test das 3.2-TB-Modell ansehen.

Memblaze PBlaze5 916 Serie U.2 Spezifikationen

Benutzerkapazität (TB) 3.2, 6.4
Formfaktor 2.5-Zoll-U.2  
Schnittstelle: PCIe 3.0 x 4
Sequentielles Lesen (128 KB) (GB/s) 3.5, 3.5
Sequentielles Schreiben (128 KB) (GB/s) 3.1, 3.5
Dauerhaftes zufälliges Lesen (4 KB) IOPS 835K, 830K
Dauerhaftes zufälliges Schreiben (4 KB) IOPS (Steady State) 210K, 303K
Latenz beim Lesen/Schreiben 87 / 11 μs
Lebenslange Ausdauer 3 DWPD
UBER <10-17 
MTBF 2 Millionen Stunden
Protokoll NVMe 1.2a
NAND-Flash-Speicher 3D eTLC NAND 
Operation System RHEL, SLES, CentOS, Ubuntu, Windows-Server, VMware ESXi 
Energieverbrauch 7 ~ 25 W.
Grundlegende Funktionsunterstützung Stromausfallschutz, Hot-Plug-fähig, vollständiger Datenpfadschutz, SMART: TRIM, Multi-Namespace, AES 256-Datenverschlüsselung, schneller Neustart, Kryptolöschung, 
Erweiterte Funktionsunterstützung TRIM, Multi-Namespace, AES 256-Datenverschlüsselung, schneller Neustart, Crypto Erase, Dual Port
Softwareunterstützung Open-Source-Verwaltungstool, CLI-Debug-Tool, im Lieferumfang enthaltener Betriebssystemtreiber
(Einfache Systemintegration)

Kennzahlen

Testbed

Unsere Enterprise-SSD-Testberichte nutzen ein Lenovo ThinkSystem SR850 für Anwendungstests und a Dell PowerEdge R740xd für synthetische Benchmarks. Das ThinkSystem SR850 ist eine gut ausgestattete Quad-CPU-Plattform, die eine CPU-Leistung bietet, die weit über das hinausgeht, was zur Belastung des leistungsstarken lokalen Speichers erforderlich ist. Synthetische Tests, die nicht viele CPU-Ressourcen erfordern, verwenden den traditionelleren Dual-Prozessor-Server. In beiden Fällen besteht die Absicht darin, den lokalen Speicher im bestmöglichen Licht zu präsentieren, das mit den maximalen Laufwerksspezifikationen des Speicheranbieters übereinstimmt.

Lenovo Think System SR850

  • 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 Kerne)
  • 16 x 32 GB DDR4-2666 MHz ECC-DRAM
  • 2 x RAID 930-8i 12 Gbit/s RAID-Karten
  • 8 NVMe-Schächte
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x Intel Gold 6130 CPU (2.1 GHz x 16 Kerne)
  • 4 x 16 GB DDR4-2666 MHz ECC-DRAM
  • 1x PERC 730 2GB 12Gb/s RAID-Karte
  • Add-in-NVMe-Adapter
  • Ubuntu-16.04.3-desktop-amd64

Hintergrund und Vergleiche testen

Das StorageReview Enterprise Test Lab bietet eine flexible Architektur für die Durchführung von Benchmarks für Unternehmensspeichergeräte in einer Umgebung, die mit der Umgebung vergleichbar ist, die Administratoren in realen Bereitstellungen vorfinden. Das Enterprise Test Lab umfasst eine Vielzahl von Servern, Netzwerken, Stromkonditionierungs- und anderen Netzwerkinfrastrukturen, die es unseren Mitarbeitern ermöglichen, reale Bedingungen zu schaffen, um die Leistung während unserer Überprüfungen genau zu messen.

Wir integrieren diese Details zur Laborumgebung und zu den Protokollen in Überprüfungen, damit IT-Experten und diejenigen, die für die Speicherbeschaffung verantwortlich sind, die Bedingungen verstehen können, unter denen wir die folgenden Ergebnisse erzielt haben. Keine unserer Bewertungen wird vom Hersteller der von uns getesteten Geräte bezahlt oder überwacht. Weitere Details zum StorageReview Enterprise Test Lab und einen Überblick über seine Netzwerkfähigkeiten finden Sie auf den jeweiligen Seiten.

Vergleichswerte für diesen Testbericht:

Analyse der Anwendungsauslastung

Um die Leistungsmerkmale von Unternehmensspeichergeräten zu verstehen, ist es wichtig, die Infrastruktur und die Anwendungs-Workloads in Live-Produktionsumgebungen zu modellieren. Unsere Benchmarks für den Memblaze PBlaze5 916 sind daher die MySQL OLTP-Leistung über SysBench und Microsoft SQL Server OLTP-Leistung mit einer simulierten TCP-C-Arbeitslast. Für unsere Anwendungs-Workloads werden auf jedem Laufwerk zwei bis vier identisch konfigurierte VMs ausgeführt.

SQL Server-Leistung

Jede SQL Server-VM ist mit zwei vDisks konfiguriert: einem 100-GB-Volume für den Start und einem 500-GB-Volume für die Datenbank und Protokolldateien. Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 64 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt. Während unsere zuvor getesteten Sysbench-Workloads die Plattform sowohl in Bezug auf Speicher-I/O als auch in Bezug auf die Kapazität ausgelastet haben, wird beim SQL-Test nach der Latenzleistung gesucht.

Dieser Test verwendet SQL Server 2014, das auf Windows Server 2012 R2-Gast-VMs ausgeführt wird, und wird durch Quests Benchmark Factory für Datenbanken belastet. StorageReviews Microsoft SQL Server OLTP-Testprotokoll verwendet den aktuellen Entwurf des Benchmark C (TPC-C) des Transaction Processing Performance Council, einen Online-Transaktionsverarbeitungs-Benchmark, der die Aktivitäten in komplexen Anwendungsumgebungen simuliert. Der TPC-C-Benchmark kommt der Messung der Leistungsstärken und Engpässe der Speicherinfrastruktur in Datenbankumgebungen näher als synthetische Leistungsbenchmarks. Jede Instanz unserer SQL Server-VM für diese Überprüfung verwendet eine SQL Server-Datenbank mit 333 GB (Maßstab 1,500) und misst die Transaktionsleistung und Latenz unter einer Last von 15,000 virtuellen Benutzern.

SQL Server-Testkonfiguration (pro VM)

  • Windows Server 2012 R2
  • Speicherbedarf: 600 GB zugewiesen, 500 GB genutzt
  • SQL Server 2014
    • Datenbankgröße: Maßstab 1,500
    • Virtuelle Client-Auslastung: 15,000
    • RAM-Puffer: 48 GB
  • Testdauer: 3 Stunden
    • 2.5 Stunden Vorkonditionierung
    • 30-minütiger Probezeitraum

Für unseren SQL Server-Transaktions-Benchmark verzeichnete der Memblaze PBlaze5 916 12,644 TPS und lag damit leicht hinter dem 910 AIC, der 12,645.1 TPS verzeichnete.

Der 916 zeigte mit nur 2.0 ms gute Latenzwerte; Es blieb jedoch immer noch hinter dem 910 AIC zurück, der 1.0 ms hatte.

Sysbench-Leistung

Der nächste Anwendungsbenchmark besteht aus a Percona MySQL OLTP-Datenbank gemessen über SysBench. Dieser Test misst die durchschnittliche TPS (Transaktionen pro Sekunde), die durchschnittliche Latenz und auch die durchschnittliche 99. Perzentil-Latenz.

Systembankben Die VM ist mit drei vDisks konfiguriert: eine für den Start (~92 GB), eine mit der vorgefertigten Datenbank (~447 GB) und die dritte für die zu testende Datenbank (270 GB). Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 60 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt.

Sysbench-Testkonfiguration (pro VM)

  • CentOS 6.3 64-Bit
  • Percona XtraDB 5.5.30-rel30.1
    • Datenbanktabellen: 100
    • Datenbankgröße: 10,000,000
    • Datenbankthreads: 32
    • RAM-Puffer: 24 GB
  • Testdauer: 3 Stunden
    • 2 Stunden Vorkonditionierung von 32 Threads
    • 1 Stunde 32 Threads

Beim Sysbench-Transaktions-Benchmark setzte der 916 seine solide Leistung mit 8,532.2 TPS fort und platzierte sich damit im mittleren bis oberen Teil der Bestenliste.

Mit der durchschnittlichen Latenz von Sysbench belegte das 916 mit 15 ms den vierten Platz unter den Vergleichsgeräten.

In unserem Worst-Case-Latenz-Benchmark belegte der 916 mit 27.7 ms erneut den vierten Platz, lag aber wie bei den anderen nicht weit hinter den Spitzenreitern.

Houdini von SideFX

Der Houdini-Test wurde speziell zur Bewertung der Speicherleistung im Zusammenhang mit der CGI-Wiedergabe entwickelt. Der Prüfstand für diese Anwendung ist eine Variante des Kerns Dell PowerEdge R740xd Servertyp, den wir im Labor verwenden, mit zwei Intel 6130-CPUs und 64 GB DRAM. In diesem Fall haben wir Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) mit Bare-Metal installiert. Die Ausgabe des Benchmarks wird in Sekunden bis zum Abschluss gemessen, wobei weniger besser ist.

Die Maelstrom-Demo stellt einen Abschnitt der Rendering-Pipeline dar, der die Leistungsfähigkeiten des Speichers hervorhebt, indem er seine Fähigkeit demonstriert, die Auslagerungsdatei effektiv als eine Form von Erweiterungsspeicher zu nutzen. Der Test schreibt die Ergebnisdaten nicht aus und verarbeitet die Punkte nicht, um den Wandzeiteffekt der Latenzauswirkungen auf die zugrunde liegende Speicherkomponente zu isolieren. Der Test selbst besteht aus fünf Phasen, von denen wir drei im Rahmen des Benchmarks durchführen:

  1. Lädt gepackte Punkte von der Festplatte. Dies ist die Zeit zum Lesen von der Festplatte. Hierbei handelt es sich um Single-Threaded, was den Gesamtdurchsatz einschränken kann.
  2. Entpackt die Punkte in ein einzelnes flaches Array, damit sie verarbeitet werden können. Wenn die Punkte nicht von anderen Punkten abhängig sind, kann der Arbeitssatz so angepasst werden, dass er im Kern bleibt. Dieser Schritt ist multithreaded.
  3. (Nicht ausführen) Verarbeitet die Punkte.
  4. Packt sie in Bucket-Blöcke um, die für die Speicherung auf der Festplatte geeignet sind. Dieser Schritt ist multithreaded.
  5. (Nicht ausgeführt) Schreibt die zusammengefassten Blöcke zurück auf die Festplatte.

Beim Houdini-Test platzierte sich der 916 mit 2,839.7 Sekunden im mittleren bis oberen Bereich, was gleichzeitig die beste Leistung unter allen getesteten Memblaze-Produkten darstellte.

VDBench-Workload-Analyse

Wenn es um das Benchmarking von Speichergeräten geht, sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, Konkurrenzlösungen direkt miteinander zu vergleichen. Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten. Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, bei denen 100 % des Antriebs genutzt und in einen stabilen Zustand versetzt werden. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.

Profile:

  • 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
  • 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
  • 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
  • 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
  • Synthetische Datenbank: SQL und Oracle
  • VDI-Vollklon- und Linked-Clone-Traces

In unserer ersten VDBench-Workload-Analyse, Random 4K Read, konnte das Memblaze PBlaze5 916 während des gesamten Tests mit einem Spitzenwert von 1 IOPS und einer Latenz von 664,910 μs unter 191.4 ms bleiben und belegte damit den dritten Platz (wenn auch weit hinter den beiden führenden Laufwerken).

Die 4K-Zufallsschreibleistung zeigte während des gesamten Tests erneut eine Latenz von unter einer Millisekunde. Hier zeigte der 916 eine Spitzenleistung von 489,619 IOPS und eine Latenz von 258.7μs. Dies reichte für den Spitzenplatz unter den Vergleichswerten.

Bei der Umstellung auf sequentielle Workloads platzierte sich der 916 bei sequenziellen 64K-Lesevorgängen mit einem Spitzenwert von 38,275 IOPS oder 2.4 GB/s bei einer Latenz von 418 μs ganz unten im Feld.

Der 916 erreichte einen Spitzenwert von 33,715 IOPS oder 2.11 GB/s mit einer Latenz von 368 μs beim sequentiellen 64K-Schreibvorgang und lag damit mit großem Abstand an erster Stelle.

Was die SQL-Workloads angeht, erreichte der 916 einen Spitzenwert von 250,053 IOPS mit einer Latenz von nur 127.6 μs, was ihn an die Spitze der Bestenliste brachte.

Bei SQL 90-10 lag der 916 gleichauf mit dem Huawei ES3000 und erreichte einen Spitzenwert von 248,229 IOPS und einer Latenz von 128.4 μs.

Der 916 erreichte im SQL 246,510-129.1-Benchmark einen Spitzenwert von 80 IOPS mit einer Latenz von 20 μs und lag damit wieder an der Spitze der Bestenliste neben dem Huawei.

In unserem Oracle-Workload schnitt das 916 mit einem Spitzenwert von 243,041 IOPS und einer Latenz von 146.8 μs weiterhin gut ab und lag damit knapp hinter dem Huawei-Laufwerk.

Für Oracle 90-10 zeigte der 916 einen Spitzenwert von 189,276 IOPS und eine Latenz von 115.7 μs und belegte damit den Spitzenplatz.

In unserem letzten Oracle-Test (916-80) schnitt der 20 mit einer beeindruckenden Spitzenleistung von 192,998 IOPS und einer Latenz von 113.4μs erneut gut ab.

Als nächstes gingen wir zu unserem VDI-Klon-Benchmark „Full and Linked“ über, bei dem der PBlaze5 916 durchgehend und direkt hinter dem Huawei-Laufwerk eine hervorragende Leistung zeigte. Beim VDI Full Clone Boot erreichte der 916 eine Spitzenleistung von 182,646 IOPS und eine Latenz von 191.4 μs.

Bei der ersten Anmeldung bei VDI FC erzielte der 916 eine Spitzenleistung von 107,565 IOPS und eine Latenz von 276 μs.

Beim VDI FC Monday Login landete das 916 mit 2 IOPS und einer Latenz von 84,663μs auf dem 187.1. Platz hinter dem Huawei-Laufwerk.

Beim Umstieg auf Linked Clone (LC) haben wir uns zunächst den Boottest angesehen. Hier belegte der 916 mit 86,488 IOPS und einer Latenz von 184.4μs den zweiten Platz.

VDI LC Initial Login zeigte 48,524 IOPS und eine Latenz von 162.5 μs für den 916, womit er erneut den zweiten Platz belegte.

Im VDI LC Monday Login-Test verzeichnete der 916 einen Spitzenwert von 65,837 IOPS und eine Latenz von 240.5μs.

Schlussfolgerung

Der PBlaze2 5 ist sowohl im U.916- als auch im AIC-Formfaktor erhältlich und Teil der Memblaze-Reihe von Rechenzentrumslaufwerken, die 3 DWPD unterstützen, ein Angebot mit höherer Lebensdauer im Vergleich zum PBlaze5 910, der nur 1 DWPD unterstützt. Es verfügt über 64-Layer-3D-NAND-Technologie und unterstützt AES 256-Datenverschlüsselung, vollständigen Datenpfadschutz und erweiterten Stromausfallschutz, die üblichen Funktionen der Unternehmensklasse. Für diesen Test haben wir uns das U.2-Modell angesehen, das mit Kapazitäten von 3.2 TB und 6.4 TB erhältlich ist, und maximale Geschwindigkeiten von 3.5 GB/s für Lese- und Schreibvorgänge angegeben. Memblaze gibt außerdem bis zu 835,000 IOPS bei anhaltenden zufälligen Lesevorgängen für das Modell mit der größten Kapazität an.

Insgesamt zeigte die Leistung des 916-3.2-TB-Modells trotz der Bandbreitenbeschränkungen seiner U.2-Schnittstelle (x4 Kanäle gegenüber x8 eines AIC) solide Ergebnisse. In unseren SQL Server-Benchmarks erreichte der Durchsatz 12,644 TPS, während die durchschnittliche Latenz beeindruckende 2.0 ms erreichte. Im Sysbench schnitt das Memblaze-Laufwerk mit 8,532.2 TPS, einer durchschnittlichen Latenz von 15 ms und einer Latenz im schlimmsten Fall von 27.7 ms gut ab. In unserem Houdini by SideFX-Benchmark platzierte sich der 916 mit 2,839.7 Sekunden im mittleren bis oberen Teil der Bestenliste und war damit auch das leistungsstärkste Memblaze-Produkt, das wir für diesen Benchmark getestet haben.

In unseren VDBench-Benchmarks behielt der 916 U.2 in allen unseren Tests eine Latenzzeit von unter einer Millisekunde bei, wobei er in vielen unserer Kategorien an oder nahe der Spitze lag. Zu den Highlights zählen 665 IOPS beim 4K-Lesen, 490 IOPS beim 4K-Schreiben, 2.4 GB/s beim 64K-Lesen und 2.11 GB/s beim 64K-Schreiben. Bei unseren SQL-Tests erreichte der 916 U.2 in allen drei Tests rund eine Viertelmillion IOPS. Oracle erzielte starke Ergebnisse mit 243 IOPS, 189 IOPS in den Jahren 90–10 und 193 IOPS in den Jahren 80–20. 

Die PBlaze5 916 U.2 SSD ist ein weiterer starker Leistungsträger von Memblaze. Die 916 SSD erfüllt den Bedarf nach höherer Leistung und Ausdauer und belegt im Vergleich zu anderen U.2-Laufwerken in fast allen unseren Tests den ersten Platz. Da Rechenzentren zunehmend sowohl Kapazität als auch Geschwindigkeit benötigen, ist der Memblaze PBlaze5 916 U.2 eine sehr attraktive Option. 

Memblaze PBlaze5 916 U.2

Besprechen Sie diese Rezension

Melden Sie sich für den StorageReview-Newsletter an