Startseite Unternehmen DapuStor H3201 E1.S SSD-Test

DapuStor H3201 E1.S SSD-Test

by Lyle Smith

Die Dapustor Haishen3 H3200 ist eine energieeffiziente NVMe-SSD für eine Reihe unterschiedlicher Anwendungen. Heute werfen wir einen Blick auf die Lineal-Iteration (E1.S) der H3200-Reihe (speziell als H3201 bezeichnet), die in zwei Kapazitäten mit 112-Layer-KIOXIA 3D-Enterprise-NAND und einem Marvell-Controller erhältlich ist. Wir haben das zuvor überprüft DapuStor H3200– das U.2-Formfaktormodell. Während der U.2-Formfaktor eher für den intensiven Einsatz wie in Rechenzentren, Videoüberwachung und Edge-Computing gedacht ist, ist die E1.S-Version hauptsächlich dafür konzipiert, Hyperscalern eine gewisse Flexibilität hinsichtlich Leistung und Dichte zu bieten, und das alles in einem winzigen (d. h. (nur etwas größer als ein M.2-Laufwerk).

Die Dapustor Haishen3 H3200 ist eine energieeffiziente NVMe-SSD für eine Reihe unterschiedlicher Anwendungen. Heute werfen wir einen Blick auf die Lineal-Iteration (E1.S) der H3200-Reihe (speziell als H3201 bezeichnet), die in zwei Kapazitäten mit 112-Layer-KIOXIA 3D-Enterprise-NAND und einem Marvell-Controller erhältlich ist. Wir haben das zuvor überprüft DapuStor H3200– das U.2-Formfaktormodell. Während der U.2-Formfaktor eher für den intensiven Einsatz wie in Rechenzentren, Videoüberwachung und Edge-Computing gedacht ist, ist die E1.S-Version hauptsächlich dafür konzipiert, Hyperscalern eine gewisse Flexibilität hinsichtlich Leistung und Dichte zu bieten, und das alles in einem winzigen (d. h , nur etwas größer als ein M.2-Laufwerk) Formfaktor.

DapuStor H3201

DapuStor H3201

Was den physischen Platzbedarf angeht, sind die Vorteile von E1.S erheblich. Mit der U.2-Version des H3200 können Sie tatsächlich nur 10–12 davon in ein 1U-Servergehäuse unterbringen (ohne Mittelplatinen oder andere zeitaufwändige Methoden verwenden zu müssen). Mit dem H3200 E1.S können Sie 24 an der Vorderseite montierte Laufwerke in dasselbe 1-HE-System einbauen, die alle im laufenden Betrieb austauschbar sind und über Funktionen der Enterprise-Klasse verfügen. Dies ist sowohl für OEM als auch für Hyperscale von enormer Bedeutung. Dadurch können Unternehmen mit dem E1.S-Modell einen deutlich dichteren 1U-Server erstellen.

DapuStor H3201-Controller

Der DapuStor H3201 zeichnet sich durch Sicherheitsfunktionen aus, wie z. B. End-to-End-Datenschutz sowohl auf Firmware- als auch auf Hardware-Pfad, einschließlich DDR ECC, LDPC und Stromausfallschutz. In Bezug auf die Leistung soll der 3.84 TB große DapuStor H3201 sequentielle Geschwindigkeiten von bis zu 3,400 MB/s beim Lesen und 2,500 MB/s beim Schreiben erreichen, während die zufällige 4K-Leistung voraussichtlich bis zu 720,000 IOPS beim Lesen und 105,000 IOPS beim Schreiben erreichen wird.

Aus Gründen der Zuverlässigkeit verfügt der H3201 über eine Lebensdauerbewertung von 1 DWPD. DapuStor bietet ein weiteres E1.S-Modell mit einer Kapazität von 3.2 TB an, das als „H3101“ bezeichnet wird. Bei dieser Version handelt es sich um das Modell mit höherer Ausdauer, das eine bessere zufällige Schreibleistung (220 IOPS) und eine viel längere Lebensdauer bei 3 Laufwerksschreibvorgängen pro Tag bietet.

Für alle Modelle der DapuStor H3200-Reihe gilt eine 5-Jahres-Garantie.

DapuStor H3201 E1.S Spezifikationen

Modell Nr. DapuStore H3201
Kapazität (TB1) 3.84TB
Skizzieren E1.S
Schnittstellenprotokoll PCle3.0×4 NVMe 1.3, Dual-Port
Flash-Typ KIOXIA 3D NAND, 112 Schichten, 2 Ebenen Enterprise TLC
Lesebandbreite (128 KB) MB/s 3,400MB / s
Schreibbandbreite (128 KB) MB/s 2,500MB / s
Zufälliges Lesen (4 KB) KIOPS 720,000 IOPS
Zufälliges Schreiben (4 KB) KIOPS 105,000 IOPS
Energieverbrauch 8.0 W typisch / 10.5 W maximal
4K zufällige Latenz (typisch) R/R < 85μs
Sequentielle 4K-Latenz (typisch) R/W μs < 15μs
Lebensdauer 1 DWPD
Nicht korrigierbare Bitfehlerrate (UBER) 1 Sektor pro 10^17 gelesene Bits
Mittlere Zeit zwischen Ausfällen (MTBF) 2 Millionen Stunden
Garantie 5 Jahre

DapuStor H3201 E1.S Leistung

Testbed

Unsere PCIe Gen4 Enterprise SSD-Testberichte nutzen a Lenovo Think System SR635 für Anwendungstests und synthetische Benchmarks. Das ThinkSystem SR635 ist eine gut ausgestattete Single-CPU-AMD-Plattform, die eine CPU-Leistung bietet, die weit über das hinausgeht, was zur Belastung von leistungsstarkem lokalem Speicher erforderlich ist. Es ist auch die einzige Plattform in unserem Labor (und derzeit eine der wenigen auf dem Markt) mit PCIe Gen4 U.2-Schächten. Synthetische Tests erfordern nicht viele CPU-Ressourcen, nutzen aber dennoch dieselbe Lenovo-Plattform. In beiden Fällen besteht die Absicht darin, den lokalen Speicher im bestmöglichen Licht zu präsentieren, das mit den maximalen Laufwerksspezifikationen des Speicheranbieters übereinstimmt.

PCIe Gen4 Synthese- und Anwendungsplattform (Lenovo ThinkSystem SR635)

  • 1 x AMD 7742 (2.25 GHz x 64 Kerne)
  • 8 x 64 GB DDR4-3200 MHz ECC DRAM (1 x 64 GB für Houdini)
  • CentOS 7.7 1908
  • Ubuntu 20.10-Desktop
  • ESXi 6.7u3

Hintergrund und Vergleiche testen

Das StorageReview Enterprise Test Lab bietet eine flexible Architektur für die Durchführung von Benchmarks für Unternehmensspeichergeräte in einer Umgebung, die mit der Umgebung vergleichbar ist, die Administratoren in realen Bereitstellungen vorfinden. Das Enterprise Test Lab umfasst eine Vielzahl von Servern, Netzwerken, Stromkonditionierungs- und anderen Netzwerkinfrastrukturen, die es unseren Mitarbeitern ermöglichen, reale Bedingungen zu schaffen, um die Leistung während unserer Überprüfungen genau zu messen.

Wir integrieren diese Details zur Laborumgebung und zu den Protokollen in Überprüfungen, damit IT-Experten und diejenigen, die für die Speicherbeschaffung verantwortlich sind, die Bedingungen verstehen können, unter denen wir die folgenden Ergebnisse erzielt haben. Keine unserer Bewertungen wird vom Hersteller der von uns getesteten Geräte bezahlt oder überwacht. Weitere Details zum StorageReview Enterprise Test Lab und einen Überblick über seine Netzwerkfähigkeiten finden Sie auf den jeweiligen Seiten.

Analyse der Anwendungsauslastung

Um die Leistungsmerkmale von Unternehmensspeichergeräten zu verstehen, ist es wichtig, die Infrastruktur und die Anwendungs-Workloads in Live-Produktionsumgebungen zu modellieren. Unsere Benchmarks für den DapuStor H3200 sind daher die MySQL OLTP-Leistung über SysBench und Microsoft SQL Server OLTP-Leistung mit einer simulierten TCP-C-Arbeitslast. Für unsere Anwendungs-Workloads werden auf jedem Laufwerk zwei bis vier identisch konfigurierte VMs ausgeführt.

SQL Server-Leistung

Jede SQL Server-VM ist mit zwei vDisks konfiguriert: einem 100-GB-Volume für den Start und einem 500-GB-Volume für die Datenbank und Protokolldateien. Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 64 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt. Während unsere zuvor getesteten Sysbench-Workloads die Plattform sowohl in Bezug auf Speicher-I/O als auch in Bezug auf die Kapazität ausgelastet haben, wird beim SQL-Test nach der Latenzleistung gesucht.

Dieser Test verwendet SQL Server 2014, das auf Windows Server 2012 R2-Gast-VMs ausgeführt wird, und wird durch Quests Benchmark Factory für Datenbanken belastet. StorageReviews Microsoft SQL Server OLTP-Testprotokoll verwendet den aktuellen Entwurf des Benchmark C (TPC-C) des Transaction Processing Performance Council, einen Online-Transaktionsverarbeitungs-Benchmark, der die Aktivitäten in komplexen Anwendungsumgebungen simuliert. Der TPC-C-Benchmark kommt der Messung der Leistungsstärken und Engpässe der Speicherinfrastruktur in Datenbankumgebungen näher als synthetische Leistungsbenchmarks. Jede Instanz unserer SQL Server-VM für diese Überprüfung verwendet eine SQL Server-Datenbank mit 333 GB (Maßstab 1,500) und misst die Transaktionsleistung und Latenz unter einer Last von 15,000 virtuellen Benutzern.

SQL Server-Testkonfiguration (pro VM)

  • Windows Server 2012 R2
  • Speicherbedarf: 600 GB zugewiesen, 500 GB genutzt
  • SQL Server 2014
    • Datenbankgröße: Maßstab 1,500
    • Virtuelle Client-Auslastung: 15,000
    • RAM-Puffer: 48 GB
  • Testdauer: 3 Stunden
    • 2.5 Stunden Vorkonditionierung
    • 30-minütiger Probezeitraum

Für unseren SQL Server-Transaktions-Benchmark erzielte der DapuStor H3201 E1.S einen durchschnittlichen Wert von 12,650 TPS bei 4 VMs, was ein solider Wert war. Die U.2-Version hatte einen Durchschnitt von 12,646 TPS.

Bei der durchschnittlichen Latenz zeigte der DapuStor H3200 mit 2.5 ms ein weiteres solides Ergebnis, während die U.2-Version einen deutlich höheren Durchschnitt von 126.5 ms aufwies.

Sysbench-Leistung

Der nächste Anwendungsbenchmark besteht aus a Percona MySQL OLTP-Datenbank gemessen über SysBench. Dieser Test misst die durchschnittliche TPS (Transaktionen pro Sekunde), die durchschnittliche Latenz und auch die durchschnittliche 99. Perzentil-Latenz.

Systembankben Die VM ist mit drei vDisks konfiguriert: eine für den Start (~92 GB), eine mit der vorgefertigten Datenbank (~447 GB) und die dritte für die zu testende Datenbank (270 GB). Aus Sicht der Systemressourcen haben wir jede VM mit 16 vCPUs und 60 GB DRAM konfiguriert und den LSI Logic SAS SCSI-Controller genutzt.

Sysbench-Testkonfiguration (pro VM)

  • CentOS 6.3 64-Bit
  • Percona XtraDB 5.5.30-rel30.1
    • Datenbanktabellen: 100
    • Datenbankgröße: 10,000,000
    • Datenbankthreads: 32
    • RAM-Puffer: 24 GB
  • Testdauer: 3 Stunden
    • 2 Stunden Vorkonditionierung von 32 Threads
    • 1 Stunde 32 Threads

Bei unserem Sysbench-Transaktions-Benchmark erzielte der DapuStor H3200 E1.S einen soliden Gesamtwert von 8,646, was viel besser war als der durchschnittliche TPS des H3200 U.2-Modells von 7,879.

Der E1.S H3200 setzte seine gute Leistung mit einer durchschnittlichen Sysbench-Latenz von 14.8 ms fort. Das H3200 U.2-Modell blieb mit durchschnittlich 23.3 ms erneut zurück.

Für die Latenz unseres Worst-Case-Szenarios (99. Perzentil) hatte der H3200 eine beeindruckende Latenz von 27.61 ms, während die H3200 U.2-Version 31.18 ms aufwies.

VDBench-Workload-Analyse

Wenn es um das Benchmarking von Speichergeräten geht, sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, Konkurrenzlösungen direkt miteinander zu vergleichen. Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten. Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, bei denen 100 % des Antriebs genutzt und in einen stabilen Zustand versetzt werden. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.

Profile:

  • 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
  • 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
  • 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
  • 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
  • Synthetische Datenbank: SQL und Oracle
  • VDI-Vollklon- und Linked-Clone-Traces

Vergleichbares:

Unsere erste VDBench-Workload-Analyse ist ein zufälliger 4K-Lesevorgang. Hier erzielte der H3201 E1.S einen Spitzenwert von 719,236 gelesenen IOPS bei 709.2 µs. Im Vergleich dazu erreichte die H3200 U.2-Version einen Spitzenwert von 788,774 IOPS mit einer viel geringeren Latenz von 161 µs.

Beim 4K-Zufallsschreibvorgang erreichte der H3201 E1.S 312,913 IOPS bei 1,623.4 µs, während das H3200 U.2-Modell 274,362 IOPS bei einer Latenz von 463 µs erreichte.

Bei der Umstellung auf sequenzielle 64-Workloads zeigte der H3201 hervorragende Ergebnisse mit einer Spitzenleistung von 50,344 IOPS (oder 3.15 GB/s) bei einer Latenz von 1,269.6 µs, während das H3200 U.2-Modell einen Spitzenwert von 52,860 IOPS (oder 3.3 GB/s) erreichte ) mit einer Latenz von 301.8µs.

Bei 64K-Schreibvorgängen erreichte das Modell DapuStor H3201 ES.1 einen Spitzenwert von 20,251 IOPS (oder 1.27 GB/s); Allerdings erlitt die Latenz am Ende des Tests einen erheblichen Einbruch und lag bei 3,147.5 µs. Die H3200 U.2-Version erreichte 22,654 IOPS (oder 1.42 GB/s) und 699.3 ms.

Unsere nächste Testreihe sind unsere SQL-Workloads: SQL, SQL 90-10 und SQL 80-20. Beginnend mit SQL zeigte das DapuStor H3200 U.2-Modell erwartungsgemäß deutlich bessere Ergebnisse, wo es einen Spitzenwert von 281,512 IOPS bei einer Latenz von nur 113.2 µs erreichte. Das H3201 E1.S-Modell erreichte einen Spitzenwert von 219,870 IOPS mit einer Latenz von 144.1 µs.

In SQL 90-10 zeigte der H3201 E1.S einen Spitzenwert von 200,283 IOPS bei 158.3 µs, während das Modell H3200 U.2 259,351 IOPS und 118.3 µs erreichte.

Mit dem SQL 80-20 erreichte der H3201 E1.S einen Spitzenwert von 182,944 bei 173.2 µs, während das H3200 U.2-Modell 247,053 IOPS mit einer Latenz von 129 µs zeigte.

Als nächstes folgen unsere Oracle-Workloads: Oracle, Oracle 90-10 und Oracle 80-20. Beginnend mit Oracle erreichte der DapuStor H3201 E1.S einen Spitzenwert von 174,220 IOPS mit einer Latenz von 204.1 µs. Das H3200 U.2-Modell erreichte 263,217 IOPS bei einer Latenz von 132.8 µs.

Betrachtet man Oracle 90-10, erreichte das Modell DapuStor H3201 E1.S einen Spitzenwert von 164,870 IOPS mit einer Latenz von 131 µs, während das Modell H3200 U.2 218,213 IOPS bei 100.4 µs erreichte.

Mit Oracle 80-20 erreichte der H3201 E1.S einen Spitzenwert von 155,614 bei 139.7 µs, während das H3200 U.2-Modell einen Spitzenwert von 212,157 IOPS mit einer Latenz von 103.1 µs erreichte.

Als nächstes wechselten wir zu unserem VDI-Klontest „Full and Linked“. Beim VDI Full Clone (FC) Boot erreichte der DapuStor H3201 E1.S einen Spitzenwert von 135,628 IOPS bei 255 µs, während das H3200 U.2-Modell 191,069 IOPS bei einer Latenz von 179.1 µs erreichte.

Bei der ersten VDI FC-Anmeldung erreichte der DapuStor H3201 E1.S einen Spitzenwert von 68,248 IOPS bei 439.1 µs, während das H3200 U.2-Modell 115,354 IOPS bei einer Latenz von 259.2 µs erreichte.

Beim VDI FC Monday Login erreichte der H3201 einen Spitzenwert von 53,529 IOPS bei 293.9 µs, während das H3200 U.2-Modell 87,136 IOPS bei einer Latenz von 182.6 µs erreichte.

Beim VDI Linked Clone (LC) Boot erreichte das H3201 E1.S einen Spitzenwert von 69,288 IOPS bei 229.7 µs, während das H3200 U.2-Laufwerk 95,726 IOPS bei einer Latenz von 166.5 µs erreichen konnte.

VDI LC Initial Login zeigte einen Spitzenwert von 17,926 IOPS bei 443.1 µs, während das H3200 U.2-Modell einen Spitzenwert von 50,750 IOPS mit einer Latenz von 154.9 µs erreichte.

Schließlich zeigte DapuStor H3201 E1.S beim VDI LC Monday Login eine sehr instabile Leistung, als es sich 20 IOPS näherte, mit Spitzen, die bei einem Maximum von knapp 40 und nahe der 400-µs-Marke endeten. Das Modell H3200 U.2 zeigte eine sehr stabile Leistung und erreichte einen Spitzenwert von 66,846 IOPS bei 236.9 µs.

Schlussfolgerung

Der DapuStor H3201 ist eine Gen3 NVMe SSD-Lösung, die über 112-Layer 3D NAND von KIOXIA und einen Marvell-Controller verfügt. Es ist nur im E1.S-Formfaktor mit einer Kapazität (3.84 TB) erhältlich und eignet sich derzeit hauptsächlich für Hyperscale-Umgebungen. Wer eine höhere Ausdauer wünscht, hat die Wahl zum Modell H3201, das sich durch eine verbesserte Schreibleistung und eine höhere DWPD-Bewertung auszeichnet.

DapuStor H3201 zurück

Während unserer Tests verglichen wir das Laufwerk mit dem H3200, der U.2-Version der DapuStor Haishen3-Reihe. Für die Anwendungs-Workload-Analyse lieferte uns der DapuStor H3201 ziemlich solide Ergebnisse: Er erreichte 12,646 TPS bei 4 VMs und 2.5 ms durchschnittliche Latenz. Laut Sysbench erreichte das Laufwerk 8,646 TPS, 14.8 ms durchschnittliche Latenz und 27.61 ms im Worst-Case-Szenario, allesamt eine Leistung der oberen Preisklasse.

Während unseres VDbench-Tests verlangsamte sich die Leistung im Vergleich zum U.2-Modell. Zu den Highlights gehörten: 719,236 IOPS beim 4K-Lesen, 312,913 IOPS beim 4K-Schreiben, 3.15 GB/s beim 64K-Lesen und 1.27 GB/s beim 64K-Schreiben. Bei SQL-Workloads wurden 219,870 IOPS erreicht, während 200,283 IOPS für SQL 90–10 und 182,944 IOPS für SQL 80–20 erreicht wurden. Für unsere Oracle-Workloads erreichte der Spitzenwert 174,220 IOPS, 164,870 IOPS in Oracle 90-10 und 155,614 IOPS in Oracle 80-20. In unseren VDI-Full-Clone-Tests erreichte der H3200 135,628 (Boot), 68,248 IOPS (erste Anmeldung) und 53,529 IOPS (Montags-Login), während Linked Clone 69,288 IOPS (Boot), 17,926 IOPS (erste Anmeldung) und einen sehr instabilen Spitzenwert verzeichnete von ~40 IOPS (Montag-Anmeldung).

Obwohl die Anwendungsfälle für das Lineal derzeit recht begrenzt sind (z. B. Hyperscale), insbesondere für diese schlanken Laufwerke ohne Wärmesynchronisierung, E1.S-Server stehen kurz davor, Mainstream zu werden. Dies wird die Anzahl der verfügbaren Laufwerkssteckplätze für Unternehmensserver erheblich erhöhen und wiederum zu neuen, IOPS-gesteuerten Servern und Speichersystemen mit hoher Dichte führen, bei denen die Wartungsfreundlichkeit im Vordergrund steht. Der DapuStor H3201 verwendet eine ältere Gen3-Schnittstelle, aber die Leistung ist vielversprechend und dies sollte eine gute Plattform für DapuStor für die Weiterentwicklung von Gen4- und Gen5-E1.S-SSDs sein.

DapuStor

Beteiligen Sie sich an StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed