Die Memblaze PBlaze5 910 ist eine leistungsstarke NVMe-SSD, die entwickelt wurde, um die Anwendungsleistung deutlich zu steigern. Ausgestattet mit 64-Layer-3D-NAND verfügt der PBlaze5 über eine enorme Einzelfestplattenkapazität von bis zu 15.36 TB, was 40 % mehr als bei den Vorgängermodellen ist. Memblaze gibt an, dass die neue SSD dadurch die Rackdichte in Speicherserveranwendungen erhöhen, Platz sparen und die Energiekosten senken kann. Die 910-Serie steigert Berichten zufolge die Energieeffizienz von Rechenzentren um 38 % pro Watt und unterstützt 16 Energiemoduseinstellungen von 10 W bis 25 W.
Die Memblaze PBlaze5 910 ist eine leistungsstarke NVMe-SSD, die entwickelt wurde, um die Anwendungsleistung deutlich zu steigern. Ausgestattet mit 64-Layer-3D-NAND verfügt der PBlaze5 über eine enorme Einzelfestplattenkapazität von bis zu 15.36 TB, was 40 % mehr als bei den Vorgängermodellen ist. Memblaze gibt an, dass die neue SSD dadurch die Rackdichte in Speicherserveranwendungen erhöhen, Platz sparen und die Energiekosten senken kann. Die 910-Serie steigert Berichten zufolge die Energieeffizienz von Rechenzentren um 38 % pro Watt und unterstützt 16 Energiemoduseinstellungen von 10 W bis 25 W.
Was die Leistung betrifft, gibt Memblaze die 910-Serie mit bis zu 6 GB/s bzw. 3.8 GB/s für Lese- und Schreibvorgänge sowie 1 Million IOPS beim Lesen und 135,000 IOPS beim Schreiben bei anhaltendem Zufallsdurchsatz an.
Die PBlaze5 910-Serie unterstützt AES 256-Datenverschlüsselung, vollständigen Datenpfadschutz und erweiterten Stromausfallschutz, um die Integrität der Unternehmensanwendungsdaten sicherzustellen. Es verfügt außerdem über eine Dual-Port-Funktion, wodurch das Problem des Single-Path-Ausfalls im Wesentlichen beseitigt wird, da auf beide Ports gleichzeitig zugegriffen werden kann.
Memblaze PBlaze5 910 NVMe SSD-Spezifikationen
Formfaktor | HHHL AIC | ||
Kapazität | 3.84TB | 7.68TB | |
NAND- | 3D eTLC | ||
Schnittstelle | PCIe 3.0 x 8 | ||
Protokoll | NVMe 1.2a | ||
Kennzahlen | |||
Sequentielles Lesen (128 KB) | 5.5GB / s | 6.0GB / s | |
Sequentielles Schreiben (128 KB) | 3.1GB / s | 3.8GB / s | |
Dauerhaftes zufälliges Lesen (4 KB) | 850K IOPS | 1 Millionen IOPS | |
Anhaltendes zufälliges Schreiben (4 KB) | 99K IOPS | 135K IOPS | |
Latenz R/W | 87 / 12μs | ||
DWPD | 1 | ||
UBER | <10^-17 | ||
MTBF | 2 Millionen Stunden | ||
Leistungsaufnahme | 7 ~ 25W |
Kennzahlen
Testbed
Unsere Enterprise-SSD-Testberichte nutzen ein Lenovo ThinkSystem SR850 für Anwendungstests und a Dell PowerEdge R740xd für synthetische Benchmarks. Das ThinkSystem SR850 ist eine gut ausgestattete Quad-CPU-Plattform, die eine CPU-Leistung bietet, die weit über das hinausgeht, was zur Belastung des leistungsstarken lokalen Speichers erforderlich ist. Synthetische Tests, die nicht viele CPU-Ressourcen erfordern, verwenden den traditionelleren Dual-Prozessor-Server. In beiden Fällen besteht die Absicht darin, den lokalen Speicher im bestmöglichen Licht zu präsentieren, das mit den maximalen Laufwerksspezifikationen des Speicheranbieters übereinstimmt.
Lenovo Think System SR850
- 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 Kerne)
- 16 x 32 GB DDR4-2666 MHz ECC-DRAM
- 2 x RAID 930-8i 12 Gbit/s RAID-Karten
- 8 NVMe-Schächte
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x Intel Gold 6130 CPU (2.1 GHz x 16 Kerne)
- 16 x 16 GB DDR4-2666 MHz ECC-DRAM
- 1x PERC 730 2GB 12Gb/s RAID-Karte
- Add-in-NVMe-Adapter
- Ubuntu-16.04.3-desktop-amd64
Hintergrund und Vergleiche testen
Die StorageReview Enterprise Test Lab bietet eine flexible Architektur für die Durchführung von Benchmarks für Unternehmensspeichergeräte in einer Umgebung, die mit der Umgebung vergleichbar ist, die Administratoren in realen Bereitstellungen vorfinden. Das Enterprise Test Lab umfasst eine Vielzahl von Servern, Netzwerken, Stromkonditionierungs- und anderen Netzwerkinfrastrukturen, die es unseren Mitarbeitern ermöglichen, reale Bedingungen zu schaffen, um die Leistung während unserer Überprüfungen genau zu messen.
Wir integrieren diese Details zur Laborumgebung und zu den Protokollen in Überprüfungen, damit IT-Experten und diejenigen, die für die Speicherbeschaffung verantwortlich sind, die Bedingungen verstehen können, unter denen wir die folgenden Ergebnisse erzielt haben. Keine unserer Bewertungen wird vom Hersteller der von uns getesteten Geräte bezahlt oder überwacht. Weitere Details zum StorageReview Enterprise Test Lab und einen Überblick über seine Netzwerkfähigkeiten finden Sie auf den jeweiligen Seiten.
Vergleichswerte für diesen Testbericht:
- Memblaze PBlaze5 3.2 TB
- Memblaze PBlaze4 3.2 TB
- Intel P3700 2 TB
- Intel P4500 2 TB
- HGST SN100 3.2 TB
- Toshiba PX04 1.6 TB
Analyse der Anwendungsauslastung
Um die Leistungsmerkmale von Unternehmensspeichergeräten zu verstehen, ist es wichtig, die Infrastruktur und die Anwendungs-Workloads in Live-Produktionsumgebungen zu modellieren. Unsere Benchmarks für den Memblaze PBlaze5 910 sind daher die MySQL OLTP-Leistung über SysBench und Microsoft SQL Server OLTP-Leistung mit einer simulierten TCP-C-Arbeitslast. Für unsere Anwendungs-Workloads werden auf jedem Laufwerk zwei bis vier identisch konfigurierte VMs ausgeführt.
SQL Server-Leistung
Jede SQL Server-VM ist mit zwei vDisks konfiguriert: einem 100-GB-Volume für den Start und einem 500-GB-Volume für die Datenbank und Protokolldateien. Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 64 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt. Während unsere zuvor getesteten Sysbench-Workloads die Plattform sowohl in Bezug auf Speicher-I/O als auch in Bezug auf die Kapazität ausgelastet haben, wird beim SQL-Test nach der Latenzleistung gesucht.
Dieser Test verwendet SQL Server 2014, das auf Windows Server 2012 R2-Gast-VMs ausgeführt wird, und wird durch Quests Benchmark Factory für Datenbanken belastet. StorageReviews Microsoft SQL Server OLTP-Testprotokoll verwendet den aktuellen Entwurf des Benchmark C (TPC-C) des Transaction Processing Performance Council, einen Online-Transaktionsverarbeitungs-Benchmark, der die Aktivitäten in komplexen Anwendungsumgebungen simuliert. Der TPC-C-Benchmark kommt der Messung der Leistungsstärken und Engpässe der Speicherinfrastruktur in Datenbankumgebungen näher als synthetische Leistungsbenchmarks. Jede Instanz unserer SQL Server-VM für diese Überprüfung verwendet eine SQL Server-Datenbank mit 333 GB (Maßstab 1,500) und misst die Transaktionsleistung und Latenz unter einer Last von 15,000 virtuellen Benutzern.
SQL Server-Testkonfiguration (pro VM)
- Windows Server 2012 R2
- Speicherbedarf: 600 GB zugewiesen, 500 GB genutzt
- SQL Server 2014
- Datenbankgröße: Maßstab 1,500
- Virtuelle Client-Auslastung: 15,000
- RAM-Puffer: 48 GB
- Testdauer: 3 Stunden
- 2.5 Stunden Vorkonditionierung
- 30-minütiger Probezeitraum
Für unseren SQL Server-Transaktions-Benchmark erzielte der Memblaze PBlaze5 910 AIC mit 12,645.1 TPS die Spitzenleistung.
Das 910 AIC-Modell hatte mit nur 1.5 ms auch die niedrigste Latenz, was der Hälfte der Latenz des zweitplatzierten Huawei ED3000 entsprach.
Sysbench-Leistung
Der nächste Anwendungsbenchmark besteht aus a Percona MySQL OLTP-Datenbank gemessen über SysBench. Dieser Test misst die durchschnittliche TPS (Transaktionen pro Sekunde), die durchschnittliche Latenz und auch die durchschnittliche 99. Perzentil-Latenz.
. Systembankben Die VM ist mit drei vDisks konfiguriert: eine für den Start (~92 GB), eine mit der vorgefertigten Datenbank (~447 GB) und die dritte für die zu testende Datenbank (270 GB). Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 60 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt.
Sysbench-Testkonfiguration (pro VM)
- CentOS 6.3 64-Bit
- Percona XtraDB 5.5.30-rel30.1
- Datenbanktabellen: 100
- Datenbankgröße: 10,000,000
- Datenbankthreads: 32
- RAM-Puffer: 24 GB
- Testdauer: 3 Stunden
- 2 Stunden Vorkonditionierung von 32 Threads
- 1 Stunde 32 Threads
Beim Sysbench-Transaktions-Benchmark setzte der AIC 910 seine beeindruckende Leistung mit 9,190.7 TPS fort und platzierte sich damit an der Spitze der Bestenliste.
Bei der durchschnittlichen Sysbench-Latenz war der AIC 910 mit 13.9 ms erneut der Spitzenreiter.
In unserem Worst-Case-Latenz-Benchmark lag der AIC 910 mit nur 25.9 ms an der Spitze.
Houdini von SideFX
Der Houdini-Test wurde speziell zur Bewertung der Speicherleistung im Zusammenhang mit der CGI-Wiedergabe entwickelt. Der Prüfstand für diese Anwendung ist eine Variante des Kerns Dell PowerEdge R740xd Servertyp, den wir im Labor verwenden, mit zwei Intel 6130-CPUs und 64 GB DRAM. In diesem Fall haben wir Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) mit Bare-Metal installiert. Die Ausgabe des Benchmarks wird in Sekunden bis zum Abschluss gemessen, wobei weniger besser ist.
Die Maelstrom-Demo stellt einen Abschnitt der Rendering-Pipeline dar, der die Leistungsfähigkeiten des Speichers hervorhebt, indem er seine Fähigkeit demonstriert, die Auslagerungsdatei effektiv als eine Form von Erweiterungsspeicher zu nutzen. Der Test schreibt die Ergebnisdaten nicht aus und verarbeitet die Punkte nicht, um den Wandzeiteffekt der Latenzauswirkungen auf die zugrunde liegende Speicherkomponente zu isolieren. Der Test selbst besteht aus fünf Phasen, von denen wir drei im Rahmen des Benchmarks durchführen:
- Lädt gepackte Punkte von der Festplatte. Dies ist die Zeit zum Lesen von der Festplatte. Hierbei handelt es sich um Single-Threaded, was den Gesamtdurchsatz einschränken kann.
- Entpackt die Punkte in ein einzelnes flaches Array, damit sie verarbeitet werden können. Wenn die Punkte nicht von anderen Punkten abhängig sind, kann der Arbeitssatz so angepasst werden, dass er im Kern bleibt. Dieser Schritt ist multithreaded.
- (Nicht ausführen) Verarbeitet die Punkte.
- Packt sie in Bucket-Blöcke um, die für die Speicherung auf der Festplatte geeignet sind. Dieser Schritt ist multithreaded.
- (Nicht ausgeführt) Schreibt die zusammengefassten Blöcke zurück auf die Festplatte.
Beim Houdini-Test platzierte sich der 910 AIC mit 3,077.7 Sekunden im mittleren bis unteren Bereich und lag damit direkt über dem U.2-Modell und unter den Memblaze-Produkten.
VDBench-Workload-Analyse
Wenn es um das Benchmarking von Speichergeräten geht, sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, Konkurrenzlösungen direkt miteinander zu vergleichen. Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten. Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, bei denen 100 % des Antriebs genutzt und in einen stabilen Zustand versetzt werden. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.
Profile:
- 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
- 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
- 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
- 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
- Synthetische Datenbank: SQL und Oracle
- VDI-Vollklon- und Linked-Clone-Traces
In unserer ersten VDBench-Workload-Analyse, Random 4K Read, konnte der Memblaze PBlaze5 910 AIC während des gesamten Tests mit einem Spitzenwert von 1 IOPS und einer Latenz von 814,640 μs unter 155.9 ms bleiben und belegte damit den klaren ersten Platz.
Auch hier zeigte die 4K-Zufallsschreibleistung durchgehend eine Latenz von unter einer Millisekunde. Der 910 AIC belegte bei den Testfahrten den zweiten Platz (der PBlaze 900 belegte den ersten Platz) mit einer Spitzenleistung von 550,864 IOPS und einer Latenz von 229.3 μs.
Bei der Umstellung auf sequentielle Workloads lag der 910 AIC mit einem Spitzenwert von 64 IOPS oder 50,372 GB/s bei einer Latenz von 3.14 μs an der Spitze bei 317 sequentiellen Lesevorgängen.
Der 900 AIC tauschte mit dem PBlaze 910 die Plätze und erreichte beim sequentiellen 42,563K-Schreibvorgang einen Spitzenwert von 2.66 IOPS oder 370 GB/s mit einer Latenz von 64 μs.
Was die SQL-Workloads betrifft, erreichte der 910 AIC einen Spitzenwert von 270,432 IOPS mit einer Latenz von nur 117.8 μs, womit er erneut an die Spitze der Bestenliste kam.
Bei SQL 90-10 behielt der 910 mit einem Spitzenwert von 273,321 IOPS und einer Latenz von 116.6 μs mit großem Abstand den Spitzenplatz.
Der 910 AIC erreichte im SQL 277,815-114-Benchmark einen Spitzenwert von 80 IOPS mit einer Latenz von 20 μs und lag damit an der Spitze der Bestenliste.
In unserem Oracle-Workload setzte der 910 AIC seine Dominanz mit einem Spitzenwert von 282,326 IOPS und einer Latenz von 126.2 μs fort.
Für Oracle 90-10 erreichte der 910 AIC mit einem Spitzenwert von 202,695 IOPS und einer Latenz von 108 μs den Spitzenplatz.
Im Jahr 80-20 beendete der 910 seine Oracle-Tests mit einer beeindruckenden Spitzenleistung von 210,228 IOPS und einer Latenz von 104 μs.
Als nächstes gingen wir zu unserem VDI-Klon-Benchmark „Full and Linked“ über, bei dem der 910 AIC in den meisten Tests Spitzenleistung zeigte. Beim VDI Full Clone Boot erreichte der 910 AIC eine Spitzenleistung von 219,337 IOPS und eine Latenz von 158.2 μs.
Beim ersten Login von VDI FC belegte der 910 AIC mit einer Spitzenleistung von 150,121 IOPS und einer Latenz von 197 μs den Spitzenplatz.
Mit VDI FC Monday Login endete der 910 AIC auf Platz 2nd Platz knapp hinter dem Huawei mit 101,128 IOPS und einer Latenz von 156.3μs.
Beim Umstieg auf Linked Clone (LC) haben wir uns zunächst den Boottest angesehen. In diesem Szenario belegte der 910 AIC mit 98,284 IOPS und einer Latenz von 161.3 μs den ersten Platz.
VDI LC Initial Login zeigte mit 910 IOPS und einer Latenz von 55,061 μs eine praktisch identische Leistung zwischen dem 143.4 AIC und dem Huawei.
Im VDI LC Monday Login-Test zeigten Huawei und 910 AIC mit einem Spitzenwert von 77,721 IOPS und einer Latenz von 203.8 μs erneut eine gleichwertige Leistung und belegten erneut den vierten Platz.
Schlussfolgerung
Das PBlaze2 5 von Memblaze besteht aus Modellen mit U.910- und AIC-Formfaktor und ist das neueste NVMe-Laufwerk für Rechenzentren, das 64-Layer-3D-NAND verwendet. Wir haben uns für diesen Test das AIC-Modell angesehen, das mit Kapazitäten von 3.84 TB und 7.68 TB erhältlich ist und eine Leistung von 6.0 GB/s beim Lesen und 3.8 GB/s beim Schreiben sowie einen Durchsatz von bis zu 1 Million IOPS beim Lesen angibt. Der 910 AIC verfügt über die nötige Leistung, um in praktisch jeder Anwendung, für die er verwendet wird, hervorragende Leistungen zu erbringen, gepaart mit einer Reihe von Schutzfunktionen, einschließlich AES 256-Datenverschlüsselung und TRIM-Funktionsunterstützung bis zu 8 TB/s.
Wenn man sich die Leistungsdetails genauer ansieht, zeigt sich, dass der 910 AIC bei vielen unserer getesteten Arbeitslasten an der Spitze der Bestenliste steht. In unseren SQL Server-Benchmarks belegte es mit 12,645.1 TPS und einer durchschnittlichen Latenz von nur 1.5 ms den ersten Platz. Im Sysbench lag das Laufwerk erneut an der Spitze der Bestenliste mit 9,190.7 TPS, einer durchschnittlichen Latenz von 13.3 ms und einer Latenz im schlimmsten Fall von 25.9 ms. In unserem Houdini by SideFX-Benchmark verzeichnete der 910 AIC 3,077.7 Sekunden, was etwas besser war als das U.2-Modell und unter den anderen Memblaze-Produkten. In unserem VDBench-Benchmark behielt der 910 AIC in allen unseren Tests eine Latenzzeit von unter einer Millisekunde bei und war in den meisten Kategorien der Spitzenreiter. Beim zufälligen 4K-Lesen und Schreiben erreichte der Memblaze PBlaze5 910 AIC 814,640 IOPS bzw. 550,864 IOPS, während sequentielle Arbeitslasten 3.14 GB/s bzw. 2.66 GB/s verzeichneten. Die SQL-Ergebnisse lagen bei rund einer Viertelmillion IOPS, wobei die Oracle-Tests zwischen 277,000 und 270,000 IOPS liefen.
Durch den Wechsel von einer x4- zu einer x8-Schnittstelle bietet der Memblaze PBlaze5 910 eine enorme Leistungssteigerung im Vergleich zur U.2-Formfaktorversion der SME-Familie. Auf ganzer Linie zeigte der AIC 910 seine Stärken gegenüber U.2-Modellen mit eingeschränkter Schnittstelle und zeigt Kunden, was möglich ist, wenn die jeweilige Anwendung den größeren Formfaktor nutzen kann.
Besprechen Sie diese Rezension
Melden Sie sich für den StorageReview-Newsletter an