Memblaze hat eine Reihe von 64-Layer-3D-NAND-NVMe-SSDs der PBlaze5-910-916-Serie herausgebracht. Die Laufwerke wurden sowohl im U.2- als auch im AIC-Formfaktor veröffentlicht, wobei die 910 sogar eine Kapazität von bis zu 15.36 TB bietet. Die langlebigere Version des Laufwerks ist das 916. Wir haben es bereits getestet 916 U.2 SSD und konzentrieren sich nun auf die leistungsstärkere HHHL AIC-Version.
Memblaze hat eine Reihe von 64-Layer-3D-NAND-NVMe-SSDs der PBlaze5-910-916-Serie herausgebracht. Die Laufwerke wurden sowohl im U.2- als auch im AIC-Formfaktor veröffentlicht, wobei die 910 sogar eine Kapazität von bis zu 15.36 TB bietet. Die langlebigere Version des Laufwerks ist das 916. Wir haben es bereits getestet 916 U.2 SSD und konzentrieren sich nun auf die leistungsstärkere HHHL AIC-Version.
Die Memblaze PBlaze5 916 AIC SSD bietet alle Vorteile der U.2-Version, einschließlich AES 256-Datenverschlüsselung, vollständigen Datenpfadschutz und erweiterten Stromausfallschutz. Die 916-Versionen verfügen außerdem über eine höhere Lebensdauer und unterstützen 3 DWPD im Vergleich zur 910, die nur 1 DWPD unterstützt. Der 916 AIC nutzt die vier zusätzlichen Lanes, um mit angegebenen Geschwindigkeiten von bis zu 5.9 GB/s beim Lesen und 2.8 GB/s beim Schreiben mit einem Durchsatz von bis zu 1 Million IOPS beim Lesen und 303 IOPS beim Schreiben noch mehr Leistung zu erzielen.
Die Memblaze PBlaze5 916 AIC SSD gibt es sowohl mit 3.2 TB als auch mit 6.4 TB, für diesen Test schauen wir uns die 6.4 TB-Version an.
AIC-Spezifikationen der Memblaze PBlaze5 916-Serie
Benutzerkapazität (TB) | 3.2, 6.4 |
Formfaktor | HHHL AIC |
Schnittstelle: | PCIe 3.0 x 8 |
Sequentielles Lesen (128 KB) (GB/s) | 5.5, 5.9 |
Sequentielles Schreiben (128 KB) (GB/s) | 3.1, 3.8 |
Dauerhaftes zufälliges Lesen (4 KB) IOPS | 850K, 1,000K |
Dauerhaftes zufälliges Schreiben (4 KB) IOPS (Steady State) | 210K, 303K |
Latenz beim Lesen/Schreiben | 87 / 11 μs |
Lebenslange Ausdauer | 3 DWPD |
UBER | <10-17 |
MTBF | 2 Millionen Stunden |
Protokoll | NVMe 1.2a |
NAND-Flash-Speicher | 3D eTLC NAND |
Operation System | RHEL, SLES, CentOS, Ubuntu, Windows-Server, VMware ESXi |
Energieverbrauch | 7 ~ 25 W. |
Grundlegende Funktionsunterstützung | Stromausfallschutz, Hot-Plug-fähig, vollständiger Datenpfadschutz, SMART: TRIM, Multi-Namespace, AES 256-Datenverschlüsselung, schneller Neustart, Kryptolöschung, |
Erweiterte Funktionsunterstützung | TRIM, Multi-Namespace, AES 256-Datenverschlüsselung, schneller Neustart, Crypto Erase, Dual Port |
Softwareunterstützung | Open-Source-Verwaltungstool, CLI-Debug-Tool, im Lieferumfang enthaltener Betriebssystemtreiber (Einfache Systemintegration) |
Kennzahlen
Testbed
Unsere Enterprise-SSD-Testberichte nutzen ein Lenovo ThinkSystem SR850 für Anwendungstests und a Dell PowerEdge R740xd für synthetische Benchmarks. Das ThinkSystem SR850 ist eine gut ausgestattete Quad-CPU-Plattform, die eine CPU-Leistung bietet, die weit über das hinausgeht, was zur Belastung des leistungsstarken lokalen Speichers erforderlich ist. Synthetische Tests, die nicht viele CPU-Ressourcen erfordern, verwenden den traditionelleren Dual-Prozessor-Server. In beiden Fällen besteht die Absicht darin, den lokalen Speicher im bestmöglichen Licht zu präsentieren, das mit den maximalen Laufwerksspezifikationen des Speicheranbieters übereinstimmt.
Lenovo Think System SR850
- 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 Kerne)
- 16 x 32 GB DDR4-2666 MHz ECC-DRAM
- 2 x RAID 930-8i 12 Gbit/s RAID-Karten
- 8 NVMe-Schächte
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x Intel Gold 6130 CPU (2.1 GHz x 16 Kerne)
- 4 x 16 GB DDR4-2666 MHz ECC-DRAM
- 1x PERC 730 2GB 12Gb/s RAID-Karte
- Add-in-NVMe-Adapter
- Ubuntu-16.04.3-desktop-amd64
Hintergrund und Vergleiche testen
Die StorageReview Enterprise Test Lab bietet eine flexible Architektur für die Durchführung von Benchmarks für Unternehmensspeichergeräte in einer Umgebung, die mit der Umgebung vergleichbar ist, die Administratoren in realen Bereitstellungen vorfinden. Das Enterprise Test Lab umfasst eine Vielzahl von Servern, Netzwerken, Stromkonditionierungs- und anderen Netzwerkinfrastrukturen, die es unseren Mitarbeitern ermöglichen, reale Bedingungen zu schaffen, um die Leistung während unserer Überprüfungen genau zu messen.
Wir integrieren diese Details zur Laborumgebung und zu den Protokollen in Überprüfungen, damit IT-Experten und diejenigen, die für die Speicherbeschaffung verantwortlich sind, die Bedingungen verstehen können, unter denen wir die folgenden Ergebnisse erzielt haben. Keine unserer Bewertungen wird vom Hersteller der von uns getesteten Geräte bezahlt oder überwacht. Weitere Details zum StorageReview Enterprise Test Lab und einen Überblick über seine Netzwerkfähigkeiten finden Sie auf den jeweiligen Seiten.
Vergleichswerte für diesen Testbericht:
- Memblaze PBlaze5 3.2 TB
- Flüssiges Element AIC 7.68 TB
- Intel SSD DC P4610 1.6 TB
- Huawei ES3000 V5 3.2 TB
- Intel SSD DC P4510 2 TB, 8 TB
- Memblaze PBlaze5 910 AIC 7.68 TB
Analyse der Anwendungsauslastung
Um die Leistungsmerkmale von Unternehmensspeichergeräten zu verstehen, ist es wichtig, die Infrastruktur und die Anwendungs-Workloads in Live-Produktionsumgebungen zu modellieren. Unsere Benchmarks für den Memblaze PBlaze5 916 sind daher die MySQL OLTP-Leistung über SysBench und Microsoft SQL Server OLTP-Leistung mit einer simulierten TCP-C-Arbeitslast. Für unsere Anwendungs-Workloads werden auf jedem Laufwerk zwei bis vier identisch konfigurierte VMs ausgeführt.
SQL Server-Leistung
Jede SQL Server-VM ist mit zwei vDisks konfiguriert: einem 100-GB-Volume für den Start und einem 500-GB-Volume für die Datenbank und Protokolldateien. Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 64 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt. Während unsere zuvor getesteten Sysbench-Workloads die Plattform sowohl in Bezug auf Speicher-I/O als auch in Bezug auf die Kapazität ausgelastet haben, wird beim SQL-Test nach der Latenzleistung gesucht.
Dieser Test verwendet SQL Server 2014, das auf Windows Server 2012 R2-Gast-VMs ausgeführt wird, und wird durch Quests Benchmark Factory für Datenbanken belastet. StorageReviews Microsoft SQL Server OLTP-Testprotokoll verwendet den aktuellen Entwurf des Benchmark C (TPC-C) des Transaction Processing Performance Council, einen Online-Transaktionsverarbeitungs-Benchmark, der die Aktivitäten in komplexen Anwendungsumgebungen simuliert. Der TPC-C-Benchmark kommt der Messung der Leistungsstärken und Engpässe der Speicherinfrastruktur in Datenbankumgebungen näher als synthetische Leistungsbenchmarks. Jede Instanz unserer SQL Server-VM für diese Überprüfung verwendet eine SQL Server-Datenbank mit 333 GB (Maßstab 1,500) und misst die Transaktionsleistung und Latenz unter einer Last von 15,000 virtuellen Benutzern.
SQL Server-Testkonfiguration (pro VM)
- Windows Server 2012 R2
- Speicherbedarf: 600 GB zugewiesen, 500 GB genutzt
- SQL Server 2014
- Datenbankgröße: Maßstab 1,500
- Virtuelle Client-Auslastung: 15,000
- RAM-Puffer: 48 GB
- Testdauer: 3 Stunden
- 2.5 Stunden Vorkonditionierung
- 30-minütiger Probezeitraum
Bei unserem SQL Server-Transaktions-Benchmark landete der Memblaze PBlaze5 916 AIC mit 12,645.0 TPS auf dem dritten Platz, obwohl er nur 1.1 TPS vom Spitzenplatz entfernt war.
Um ein besseres Verständnis der Leistung zu erhalten, muss auch die Latenz betrachtet werden. Hier belegte der 916 AIC mit nur 1.3 ms den zweiten Platz und schlug den Rest der 910/916-Serie.
Sysbench-Leistung
Der nächste Anwendungsbenchmark besteht aus a Percona MySQL OLTP-Datenbank gemessen über SysBench. Dieser Test misst die durchschnittliche TPS (Transaktionen pro Sekunde), die durchschnittliche Latenz und auch die durchschnittliche 99. Perzentil-Latenz.
. Systembankben Die VM ist mit drei vDisks konfiguriert: eine für den Start (~92 GB), eine mit der vorgefertigten Datenbank (~447 GB) und die dritte für die zu testende Datenbank (270 GB). Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 60 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt.
Sysbench-Testkonfiguration (pro VM)
- CentOS 6.3 64-Bit
- Percona XtraDB 5.5.30-rel30.1
- Datenbanktabellen: 100
- Datenbankgröße: 10,000,000
- Datenbankthreads: 32
- RAM-Puffer: 24 GB
- Testdauer: 3 Stunden
- 2 Stunden Vorkonditionierung von 32 Threads
- 1 Stunde 32 Threads
Beim Sysbench-Transaktions-Benchmark landete der 916 AIC mit 9,298 TPS auf dem zweiten Platz.
Bei der durchschnittlichen Sysbench-Latenz blieb der 916 AIC mit 13.8 ms auf dem zweiten Platz.
Bei der Latenz unseres Worst-Case-Szenarios (99. Perzentil) belegte der 916 AIC mit nur 25.2 ms Latenz den Spitzenplatz.
Houdini von SideFX
Der Houdini-Test wurde speziell zur Bewertung der Speicherleistung im Zusammenhang mit der CGI-Wiedergabe entwickelt. Der Prüfstand für diese Anwendung ist eine Variante des Kerns Dell PowerEdge R740xd Servertyp, den wir im Labor verwenden, mit zwei Intel 6130-CPUs und 64 GB DRAM. In diesem Fall haben wir Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) mit Bare-Metal installiert. Die Ausgabe des Benchmarks wird in Sekunden bis zum Abschluss gemessen, wobei weniger besser ist.
Die Maelstrom-Demo stellt einen Abschnitt der Rendering-Pipeline dar, der die Leistungsfähigkeiten des Speichers hervorhebt, indem er seine Fähigkeit demonstriert, die Auslagerungsdatei effektiv als eine Form von Erweiterungsspeicher zu nutzen. Der Test schreibt die Ergebnisdaten nicht aus und verarbeitet die Punkte nicht, um den Wandzeiteffekt der Latenzauswirkungen auf die zugrunde liegende Speicherkomponente zu isolieren. Der Test selbst besteht aus fünf Phasen, von denen wir drei im Rahmen des Benchmarks durchführen:
- Lädt gepackte Punkte von der Festplatte. Dies ist die Zeit zum Lesen von der Festplatte. Hierbei handelt es sich um Single-Threaded, was den Gesamtdurchsatz einschränken kann.
- Entpackt die Punkte in ein einzelnes flaches Array, damit sie verarbeitet werden können. Wenn die Punkte nicht von anderen Punkten abhängig sind, kann der Arbeitssatz so angepasst werden, dass er im Kern bleibt. Dieser Schritt ist multithreaded.
- (Nicht ausführen) Verarbeitet die Punkte.
- Packt sie in Bucket-Blöcke um, die für die Speicherung auf der Festplatte geeignet sind. Dieser Schritt ist multithreaded.
- (Nicht ausgeführt) Schreibt die zusammengefassten Blöcke zurück auf die Festplatte.
Beim Houdini-Test erzielte der 916 AIC eine Punktzahl von 3,070.7 Sekunden und landete damit etwa im Totpunkt der Nicht-Optane-Antriebe und direkt auf Augenhöhe mit dem 910 AIC.
VDBench-Workload-Analyse
Wenn es um das Benchmarking von Speichergeräten geht, sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, Konkurrenzlösungen direkt miteinander zu vergleichen. Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten. Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, bei denen 100 % des Antriebs genutzt und in einen stabilen Zustand versetzt werden. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.
Profile:
- 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
- 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
- 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
- 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
- Synthetische Datenbank: SQL und Oracle
- VDI-Vollklon- und Linked-Clone-Traces
In unserer ersten VDBench-Workload-Analyse, Random 4K Read, wurde das Memblaze PBlaze5 916 AIC mit zwei anderen AIC-Laufwerken verglichen: dem Memblaze PBlaze5 910 und dem Liqid Element. Hier lag der 916 knapp hinter dem 910, wobei der Liqid deutlich an der Spitze lag. Der 916 startete bei 81,010 IOPS mit 99 μs und erreichte seinen Höhepunkt bei 809,069 IOPS mit einer Latenz von 157 μs.
Zufälliges 4K-Schreiben zeigte zuletzt die gleiche Platzierung für den 916. Hier startete der 916 bei 64,157 IOPS mit nur 17.7μs. Das Laufwerk konnte unter 100 μs, eigentlich 25 μs, bleiben, bis es etwa 578 IOPS erreichte, wo es seinen Höhepunkt erreichte, bevor es abfiel.
Beim Übergang zu sequentiellen Workloads betrachten wir zunächst 64 sequentielle Lesevorgänge. Hier landete der 916 erneut ganz unten in unserem Feld, knapp hinter dem 910. Der 916 erreichte einen Spitzenwert von 50,011 IOPS oder 3.13 GB/s mit einer Latenz von 319 μs.
Bei 64K-Schreibvorgängen rutschte der 916 knapp hinter dem 910 auf den zweiten Platz ab. Hier startete der 916 mit 4,308 IOPS oder 256 MB/s und durchlief die 50μs-Latenzgrenze bis zu 30 IOPS oder 1.85 GB/s, bevor er mit 42,319 IOPS oder 2.65 seinen Höhepunkt erreichte GB/s bei 370 μs Latenz.
Als nächstes kommen unsere SQL-Workloads. Auch hier lag der 916 ganz unten, aber nur haarscharf hinter dem 916. Der 916 startete bei 27,120 IOPS bei einer Latenz von 100.9 μs und erreichte seinen Höhepunkt bei 269,845 IOPS mit einer Latenz von 118.1 μs. Lediglich ein Latenzunterschied von 18 μs vom Anfang bis zum Ende.
Bei SQL 90-10 lag der 916 mit 27,381 IOPS und einer Latenz von 97.7 μs auf dem dritten Platz. Der 916 schaffte über 100 μs bei etwa 82 IOPS und erreichte anschließend einen Spitzenwert von 273,081 IOPS mit einer Latenz von 116.3 μs.
Mit SQL 80-20 war die Platzierung des 916 gleich, beginnend bei 28,023 IOPS und 88.9 μs Latenz und erreichte ihren Höhepunkt bei 277,572 IOPS mit einer Latenz von 114.6 μs.
Bei unserem Oracle-Workload übertraf der 916 den 910 nur knapp. Hier startete das Laufwerk bei 30,716 IOPS mit einer Latenz von 91.2 μs und erreichte seinen Höhepunkt bei 282,888 IOPS mit einer Latenz von 126.2 μs.
Bei Oracle 90-10 fiel der 916 knapp auf den letzten Platz zurück. Hier startete das Laufwerk bei 40,494 IOPS mit einer Latenz von 98.2 μs und erreichte seinen Höhepunkt bei 202,512 IOPS mit einer Latenz von 107.9 μs.
Bei Oracle 80-20 sehen wir, dass der 916 erneut kaum den zweiten Platz vor dem 910 einnimmt. Das Laufwerk startete bei 42,276 IOPS mit einer Latenz von 87.6 μs und blieb unter 100 μs, bis etwa 169 IOPS erreicht wurden und seinen Höhepunkt bei 210,628 IOPS mit einer Latenz von 103.8 μs erreichte .
Als nächstes fahren wir mit unserem VDI-Klontest „Vollständig und verknüpft“ fort. Beim VDI Full Clone Boot belegte der 916 mit 22,788 IOPS und einer Latenz von 107.9 μs den dritten Platz und erreichte mit 218,323 IOPS und einer Latenz von 158.9 μs seinen Höhepunkt.
Beim VDI FC Initial Login belegte der 916 mit 910 IOPS bei einer Latenz von 15,487 μs den zweiten Platz hinter dem 69.7 und blieb bis zu etwa 100 IOPS unter 65 μs. Das Laufwerk erreichte einen Spitzenwert von 147,777 IOPS und einer Latenz von 199.4 μs.
Bei VDI FC Monday Login startete der 916 als Erster mit 10,213 IOPS und einer Latenz von 89.4 μs. Das Laufwerk blieb bis zu etwa 100 IOPS unter 35 μs und erreichte anschließend einen Spitzenwert von 101,673 IOPS mit einer Latenz von 155.5 μs.
Für den VDI Linked Clone (LC) beginnen wir noch einmal mit dem Boottest. Hier belegte der 916 mit 9,598 IOPS bei 127 μs Latenz den dritten Platz und erreichte mit 98,621 IOPS bei einer Latenz von 161.6 μs seinen Höhepunkt.
Beim VDI LC Initial Login verdrängte der 916 den 910 und belegte den zweiten Platz. Hier startete das Laufwerk bei 5,599 IOPS mit einer Latenz von 94.2 μs und erreichte über 100 μs bei etwa 20 IOPS. Der 916 erreichte einen Spitzenwert von 55,416 IOPS mit einer Latenz von 142.1 μs.
Beim VDI LC Monday Login schließlich belegte der 916 mit einer Spitzenleistung von 78,483 IOPS und einer Latenz von 201.3 μs den ersten Platz.
Schlussfolgerung
Die Memblaze PBlaze5 916 ist eine der 64-Layer-3D-NAND-NVMe-SSDs des Unternehmens. Für diesen speziellen Test haben wir uns den AIC-Formfaktor angesehen. Der AIC-Formfaktor bietet alle Vorteile der 916-Reihe, AES 256-Datenverschlüsselung, vollständigen Datenpfadschutz, verbesserten Schutz vor Stromausfällen und höhere Lebensdauer und bietet gleichzeitig eine noch höhere Leistung als sein U.2-Gegenstück. Der 916 AIC hat Geschwindigkeiten von bis zu 5.9 GB/s beim Lesen und 2.8 GB/s beim Schreiben mit einem Durchsatz von bis zu 1 Million IOPS beim Lesen und 303 IOPS beim Schreiben sowie 3DWPD angegeben.
Für unsere Anwendungs-Workload-Analyse zeigte der Memblaze PBlaze5 916 AIC sowohl in SQL Server als auch in Sysbench eine starke Leistung. In der SQL Server-Ausgabe belegte das Laufwerk mit 12,645 TPS und einer durchschnittlichen Latenz von 1.3 ms den dritten Platz und belegte damit den zweiten Platz. Für Sysbench hatte der 916 AIC 9,298 TPS, eine durchschnittliche Latenz von 13.8 ms und belegte mit 25.2 ms den Spitzenplatz in unserem Worst-Case-Szenario. Houdini zeigte mit 3070.7 Sekunden eine weniger starke Leistung.
Für unseren VDBench haben wir den 916 AIC im Vergleich zu zwei anderen AIC-Modellen getestet, dem Memblaze PBlaze5 910 AIC und dem Liqid Element AIC. Hier war die Leistung gut, aber die Platzierung ließ einen gemischten Eindruck entstehen. Der 916 belegte im Vergleich zu den beiden anderen Fahrzeugen häufig den letzten Platz, war aber jedes Mal in Reichweite des 910. Zu den Highlights gehören ein zufälliger 4K-Lesewert von 809 IOPS, ein zufälliger 4K-Schreibwert von 578 IOPS, ein sequenzieller 64K-Wert von 3.13 GB/s und ein sequenzieller Schreibwert von 2.65 GB/s. Interessanter war hier die Latenz. Selbst in der Spitze waren 370 μs der höchste Wert, wobei das Laufwerk während eines Großteils der zufälligen 25K-Schreibvorgänge unter 4 μs lief. SQL zeigte Spitzenwerte von über einer Viertelmillion IOPS in jedem Test und die Latenz lag zwischen 88.9 μs und nur 118.1 μs, was sehr niedrig und in allen Tests konsistent war. Die Spitzenwerte von Oracle waren nicht so hoch wie die von SQL (obwohl der erste 283 IOPS betrug), aber es zeigte erneut eine niedrige konsistente Latenz, die von 87.6 μs bis 126.2 μs bei der höchsten Spitze reichte.
Der Memblaze PBlaze5 916 AIC ist eine ideale Wahl für Anwendungen, die eine konsistente, niedrige Latenz erfordern. Aufgrund der Add-in-Card-Eigenschaft muss zwar auf die Hot-Swap-Fähigkeit verzichtet werden (wodurch der Wartungsaufwand potenziell höher ist, obwohl die Karte auch eine hohe Lebensdauer aufweist), dies wird jedoch durch die Leistung, insbesondere die Latenzleistung, mehr als wettgemacht.
Besprechen Sie diese Rezension
Melden Sie sich für den StorageReview-Newsletter an