ScaleFlux konzentriert sich ausschließlich auf rechnergestützte Speicherung im großen Maßstab. Sein neues Computational Storage Device (CSD) 3000 ist eine Gen4-SSD mit integrierten Datenkomprimierungs- und Dekomprimierungs-Engines, die nach Angaben des Unternehmens die Kapazität vervierfachen und die Leistung verdoppeln kann. Wir werden diese Behauptungen auf die Probe stellen.
ScaleFlux konzentriert sich ausschließlich auf rechnergestützte Speicherung im großen Maßstab. Sein neues Computational Storage Device (CSD) 3000 ist eine Gen4-SSD mit integrierten Datenkomprimierungs- und Dekomprimierungs-Engines, die nach Angaben des Unternehmens die Kapazität vervierfachen und die Leistung verdoppeln kann. Wir werden diese Behauptungen auf die Probe stellen.
Technische Daten des ScaleFlux CSD 3000
Hintergrundinformationen zur Computerspeicherung finden Sie in unserem ScaleFlux CSD 2000-Rezension (die hier besprochene Vorgängerversion des CSD 3000) ist eine lohnenswerte Lektüre. Kurz gesagt, Computational Storage integriert Rechenressourcen in den Speicher selbst, anstatt sich auf die Rechenressourcen des Hostsystems zu verlassen.
Die Rechenleistung des CSD 3000 stammt vom SFX 3000-Speicherprozessor, einem maßgeschneiderten SoC-ARM-Chip mit dedizierter Hardwarebeschleunigung. Dieses Laufwerk ist im 2.5-Zoll-U.2-Formfaktor mit Kapazitäten von 3.2 TB, 3.84 TB, 6.4 GB und 7.68 TB erhältlich. Es verwendet eine PCIe Gen4 x4-Schnittstelle, eine Verbesserung gegenüber der Gen2000-Schnittstelle des CSD 3.
ScaleFlux bietet ein ähnliches Laufwerk an, das NSD 3000. Es verfügt über eine integrierte Komprimierung, verfügt jedoch nicht über den Kapazitätsmultiplikator des CSD 3000.
Die wichtigsten Spezifikationen des CSD 3000 finden Sie in der folgenden Tabelle.
Formfaktor | 2.5″ U.2 (15 mm) |
Standardkapazitäten | 3.2 TB, 3.84 TB, 6.4 TB, 7.68 TB |
Host-Schnittstelle | PCIe-Gen4 x4 |
Virtualisierung | SR-IOV mit 15 virtuellen Funktionen |
Sicherheit
|
TCG Opal 2.0 mit HW-Sicherheitsbeschleunigung
|
management | NVMe-MI 1.1 über SMBus
|
Power | <20 W typisch, <5 W im Leerlauf
|
Zuverlässigkeit | End-to-End-Datenpfadschutz, Stromausfall
Schutz, LDPC-Fehlerkorrektur, NAND-Die-RAID |
Sequenzielles Lesen | 7.2 GB / s |
Sequenzielles Schreiben | 4.8 GB/s* |
Zufälliges Lesen (4kB) | 1450 kIOPS |
Zufälliges Schreiben (4kB) | 380 kIOPS* |
Nachhaltig 70/30 Zufällig 4kB Lesen/Schreiben mit 2:1 komprimierbar Daten-Management | 1020 kIOPS |
ScaleFlux CSD 3000-Testhintergrund und Vergleiche
Das StorageReview Enterprise Test Lab bietet eine flexible Architektur für die Durchführung von Benchmarks für Unternehmensspeichergeräte in einer Umgebung, die mit der Umgebung vergleichbar ist, die Administratoren in realen Bereitstellungen vorfinden. Das Enterprise Test Lab umfasst eine Vielzahl von Servern, Netzwerken, Stromkonditionierungs- und anderen Netzwerkinfrastrukturen, die es unseren Mitarbeitern ermöglichen, reale Bedingungen zu schaffen, um die Leistung während unserer Überprüfungen genau zu messen.
Wir integrieren diese Details zur Laborumgebung und zu den Protokollen in Überprüfungen, damit IT-Experten und diejenigen, die für die Speicherbeschaffung verantwortlich sind, die Bedingungen verstehen können, unter denen wir die folgenden Ergebnisse erzielt haben.
ScaleFlux CSD 3000-Testumgebung
Für den Test des CSD 3000 haben wir ein anderes System als unseren regulären Teststand verwendet. Da das Laufwerk so einzigartig ist und die unterschiedliche Testplattform genutzt wird, werden wir es nicht direkt mit herkömmlichen Gen4-NVMe-SSDs vergleichen. Dieser Test nutzt unseren Intel OEM Scalable Gen3 Server, der gut mit zwei Intel 8380-Prozessoren ausgestattet ist und eine CPU-Leistung bietet, die weit über dem liegt, was zur Belastung des leistungsstarken lokalen Speichers erforderlich ist. Zu den allgemeinen Spezifikationen gehören:
- 2 x Intel Scalable Gen3 8380
- 32 x 32 GB DDR4 3200 MHz
- Ubuntu 20.04.2 Live Server (Synthetische Workloads)
- VMware ESXi 7.0u2 (Anwendungs-Workloads)
- 8 x PCI Gen4 U.2 NVMe-Schächte
Um die Leistung des ScaleFlux CSD 3000 zu messen, nutzen wir VDbench, mit dem der Grad der Komprimierung vor jeder Arbeitslast angepasst werden kann. Normalerweise wird diese Einstellung standardmäßig auf 0 % gehalten, aber wir haben sie beim Testen dieser SSD auf 50 % erhöht, um einen Komprimierungsfaktor von 2:1 zu erreichen. Diese beiden Läufe spiegeln sich in den folgenden Diagrammen wider.
ScaleFlux CSD 3000 Leistung
Note: Nachdem wir den ScaleFlux CSD 3000 getestet haben, haben wir zwei neuere Modelle mit Produktions-Firmware erhalten. Wir haben den Testbericht mit den neuesten Ergebnissen dieser beiden Kapazitätspunkte aktualisiert.
VDBench-Workload-Analyse
Beim Benchmarking von Speichergeräten sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der den Vergleich konkurrierender Lösungen erleichtert.
Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests und allgemeinen Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten.
Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, die 100 % des Antriebs nutzen und ihn in einen stabilen Zustand versetzen. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.
Profile:
- 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
- 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
- 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
- 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
- Synthetische Datenbank: SQL und Oracle
- VDI-Vollklon- und Linked-Clone-Traces
Die Einzigartigkeit dieses Laufwerks bedeutet, dass wir es nur mit sich selbst vergleichen. Zum Vergleich schauen wir uns den ScaleFlux CSD 3000 an, wobei VDBench inkompressible Daten und 2:1 komprimierbare Daten sendet.
In unserem ersten Benchmark, 4K Random Read, stieg die komprimierte Leistung des CSD 3000 stetig auf 909 IOPS mit einer Latenz von 139 µs für das 7.68-TB-Modell (das 3.85-TB-Modell lag etwas zurück als die anderen). Ohne Komprimierung und gleicher Kapazität war das Laufwerk etwas langsamer und erreichte 886 IOPS bei 142.4 µs.
Der unkomprimierte CSD 3000 zeigte in unserem nächsten Test, 4K Random Write, eine achterbahnartige Kurve, wobei das 7.68-TB-Modell die besten Ergebnisse von beiden zeigte: Spitzenwert bei 454 IOPS mit 275.7 µs Latenz. Das komprimierte Laufwerk zeigte viel bessere Ergebnisse, beide endeten bei etwa 735 IOPS und 168.2 µs.
Wenn wir zu sequentiellen 64K-Tests übergehen, beginnen wir mit der Leseleistung, die ein ähnliches Bild zeigt (die komprimierten Laufwerke haben wiederum beeindruckende Zahlen). Beide Kapazitäten hatten nahezu identische Leistung, wobei das 3.84-TB-Modell die höhere Kapazität mit 113 IOPS (oder 7.06 GB/s) bei 282 µs leicht übertrifft. Das oberste unkomprimierte Laufwerk (7.68 TB) erreichte 98 IOPS bei 326.8 µs.
Beim sequentiellen Schreiben mit 64 KB fielen die Ergebnisse bei den komprimierten Versionen sogar noch besser aus. Beide Kapazitäten hatten erneut die gleiche Leistung (obwohl, wie Sie sehen können, die 3.84 TB die größere Kapazität mit 96 IOPS bei 154 µs Latenz nur geringfügig übertrafen und deutlich unter 100 µs blieben, bis sie sich 90 IOPS näherten. Im Gegenteil, das unkomprimierte Laufwerk Es gab starke Spitzen, die bei 29 IOPS bei 534 µs für die 7,68-TB-Kapazität und 25 IOPS bei 616.6 µs für die 3.85-TB-Kapazität endeten.
Unsere nächste Testreihe sind unsere SQL-Workloads: SQL, SQL 90-10 und SQL 80-20. Zuerst erfolgt der SQL-Workload-Test; Der CSD 3000 zeigt im komprimierten und unkomprimierten Zustand eine ähnliche Kurve wie die Modelle mit hoher Kapazität, wobei die komprimierte Version mit 310 IOPS bei einer Latenz von 101.9 µs etwas besser war.
Mit SQL 90-10 war das mit 7.68 TB komprimierte CSD 3000 erneut das leistungsstärkste Laufwerk und schloss den Test mit 311 IOPS und einer Latenz von 101.3 µs ab. Im Vergleich dazu erreichte das beste unkomprimierte Laufwerk (ebenfalls 7.68 TB) 285 IOPS und eine Latenz von 110.8 µs.
In SQL 80-20 sehen wir, dass beide Kapazitäten des komprimierten CSD 3000 die Spitzenplätze einnehmen, wobei das 7.68-TB-Modell bei 319 IOPS bei einer Latenz von 98.3 µs endet. Die unkomprimierte Version mit 7.68 TB lag mit 277 IOPS bei 113.5 µs deutlich zurück (wenn auch sehr nah am Modell mit geringer Kapazität).
Als nächstes folgen unsere Oracle-Workloads: Oracle, Oracle 90-10 und Oracle 80-20. Hier setzten die komprimierten CSD 3000-Laufwerke ihre insgesamt überlegene Leistung fort. Beginnend mit dem Oracle-Workload-Test war das beste Ergebnis ein 7.68-TB-Komprimierungslaufwerk mit 336 IOPS und einer Latenz von 103.9 µs. Das komprimierte 7.68-TB-Laufwerk lag deutlich zurück und erreichte einen Spitzenwert von 279 IOPS mit einer Latenz von 126 µs.
In Oracle 90-10; Das komprimierte 7.86-TB-Laufwerk erreichte 229 IOPS bei einer Latenz von 94.7 µs. Die Laufwerke mit 3.84 TB (komprimiert) und 7.68 TB (unkomprimiert) zeigten eine identische Leistung mit 214 IOPS bei 101.4 µs Latenz.
Der Übergang zu Oracle 80-20 erzählte noch einmal eine ähnliche Geschichte. Das unkomprimierte 7.68-TB-Laufwerk erreichte 237 IOPS mit einer Latenz von 91 µs, während das komprimierte 7.68-TB-Laufwerk mit 213 IOPS bei einer Latenz von nur 101.9 µs hinterherhinkte.
Als nächstes wechselten wir zu unseren VDI-Klontests, Full Clone (FC) und Linked Clone (LC). Alle Laufwerke zeigten beim VDI FC Boot eine geringfügige Tail-End-Instabilität. Komprimiert lag der 7.68 TB große CSD 3000 erneut an der Spitze mit 270 IOPS und einer Latenz von 126.9 µs; komprimiert, die Spitzenleistung des 7.68-TB-Laufwerks (das tatsächlich das komprimierte 3.84-TB-Laufwerk übertraf) mit 242 IOPS bei einer Latenz von 141.9 µs.
VDI FC Initial Login erzählt eine andere Geschichte, da die komprimierten Laufwerke weitaus besser waren, während die unkomprimierten Laufwerke überall zu finden waren. Das komprimierte 7.68-TB-Laufwerk erreichte einen Spitzenwert von 244 IOPS mit einer Latenz von 117.2 µs, während das 3.84-TB-Modell einen Spitzenwert von 210 IOPS mit einer Latenz von 137.2 µs erreichte. Die unkomprimierten Laufwerke erreichten 127 IOPS mit einer Latenz von 231.1 µs (7.68 TB) und 94 IOPS mit einer Latenz von 312.4 µs (3.84 TB).
Der komprimierte CSD 3000 beeindruckte weiterhin in unserem letzten FC-Test, Monday Login, wo sein bester Wert 144 IOPS bei einer Latenz von 106.9 µs (7.68 TB) betrug. Das unkomprimierte 7.68-TB-Laufwerk zeigte 100 IOPS mit einer Latenz von 154.6 µs.
Wir wechseln nun zu den LC-Tests, bei denen alle Laufwerke im Boot-Test stabile Linien zeigten. Die komprimierten Laufwerke dominierten weiterhin (insbesondere das 7.68-TB-Laufwerk mit 131 IOPS und einer Latenz von 120.1 µs). Das oberste unkomprimierte Laufwerk (7.68 TB) konnte 110 IOPS bei 144.4 µs erreichen.
Wir sehen ein instabiles Verhalten der unkomprimierten Laufwerke bei der LC-Erstanmeldung, wenn sie sich 20,000 IOPS nähert; die endgültige Zahl betrug 49 IOPS/157.1 µs (3.84 TB) und 56 IOPS/138 µs (7.68 TB). Wie immer zeigten die komprimierten Laufwerke eine bessere Leistung und Stabilität und schlossen den Test mit 73 IOPS/103.1 µs (3.84 TB) und 80 IOPS/94.4 µs (7.68 TB) ab.
In unserem allerletzten Test waren die unkomprimierten Laufwerke im Vergleich zu den komprimierten Versionen immer noch leistungsschwach. Beim LC Monday Login, das erneut einige merkwürdige Latenzspitzen für die komprimierten Laufwerke zeigte, erreichten die 3.84 TB und 7.68 TB 62 IOPS/250.1 µs bzw. 75 IOPS/207.5 µs. Die endgültigen Werte des komprimierten Laufwerks waren mit 109 IOPS/140.9 µs (3.84 TB) und 124 IOPS/123.5 µs (7.68 TB) viel besser.
Schlussfolgerung
ScaleFlux konzentriert sich weiterhin auf Computational Storage. Das CSD 3000-Laufwerk, das wir uns in diesem Test angesehen haben, ist gegenüber dem früheren CSD 2000 vor allem dadurch verbessert, dass es eine PCIe-Gen4-Schnittstelle bietet, was ihm ein deutlich höheres Leistungspotenzial verleiht.
Wir haben den CSD 3000 unter Linux in unserem skalierbaren Intel OEM Gen3-Server im unkomprimierten Zustand und erneut im 2:1-komprimierten Zustand getestet, um die Vorteile der integrierten Komprimierungs-Engines des Laufwerks zu nutzen. Das Laufwerk zeigte in allen Tests mit komprimierbaren Daten eine überlegene Leistung und geringere Latenz, oft mit zweistelligen Leistungsunterschieden.
Zu den Leistungshighlights (Top-Ergebnisse/Kapazität) mit komprimierten Daten gehören 909 IOPS beim 4K-Zufallslesen für die 7.68 TB (im Vergleich zu 886 IOPS unkomprimiert), 735 IOPS beim 4K-Zufallsschreiben für die 7.68 TB (454 IOPS unkomprimiert) und 7.06 GB/s im 64 KB sequentielles Lesen für 3.85 TB (6.12 GB/s unkomprimiert) und 6 GB/s beim 64 KB sequentiellen Schreiben (1.82 GB/s unkomprimiert).
Der CSD 3000 zeigte in unseren SQL- und Oracle-Tests ähnliche komprimierte und unkomprimierte Werte, obwohl das komprimierte Laufwerk konsistenter war. In einem Beispiel, SQL 80-20, erreichte das komprimierte Laufwerk 319 IOPS bei einer Latenz von 98.3 µs (7.68-TB-Modell), während das unkomprimierte Modell mit 277 IOPS bei 113.5 µs deutlich zurückblieb
Schließlich konnten wir bei unseren VDI-Voll- und Linked-Klontests die auffälligsten Unterschiede zwischen dem CSD 3000, auf dem komprimierte und unkomprimierte Daten ausgeführt wurden, feststellen – das heißt, die komprimierten Daten schnitten viel besser und konsistenter ab. Um ein Beispiel zu nennen: VDI LC Initial Login zeigte, dass die unkomprimierten Laufwerke eine Spitzenleistung von 49 IOPS/157.1 µs (3.84 TB) und 56 IOPS/138 µs (7.68 TB) erreichten, während die komprimierten Laufwerke den Test mit 73 IOPS/103.1 µs abschlossen ( 3.84 TB) und 80 IOPS/94.4 µs (7.68 TB).
Bitte beachten Sie, dass wir bei der Ausführung unkomprimierter Daten einige unerklärliche Latenzspitzen und eine verringerte Leistung festgestellt haben. Dies trat bei unseren 4K/64K-, SQL/Oracle- und VDI FC/LC-Tests auf, sodass es nicht nur auf ein Szenario beschränkt war.
Die Stärken des CSD3000 kommen am besten zur Geltung, wenn er mit einigen komprimierbaren Daten arbeiten kann, da er hier insgesamt die größten Vorteile gegenüber herkömmlichen SSDs aufweist. ScaleFlux hat mit dieser Version auch VMWare-Unterstützung hinzugefügt, die es bei unserem Test des früheren CSD 2000 nicht gab. Das ist ein großes Plus, aber es fehlt immer noch die Unterstützung für Windows-Virtualisierung. Nichtsdestotrotz ist der CSD 3000 von ScaleFlux eine Überlegung wert, wenn Sie Ihre Arbeitslasten mit der Plattformunterstützung und den erheblichen Komprimierungsstärken des Laufwerks in Einklang bringen können.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed