Graid Technology setzt mit SupremeRAID neue Maßstäbe in Sachen Datenschutz und Leistung, insbesondere für KI- und HPC-Workloads.
SupremeRAID von Graid Technology definiert die Speicherlandschaft immer wieder neu, indem es neue Standards für Datenschutz und Leistung setzt, insbesondere für moderne Workloads wie KI und High-Performance Computing (HPC). Herkömmliche RAID-Konfigurationen haben oft Schwierigkeiten, die Anforderungen dieser datenintensiven Umgebungen zu erfüllen, insbesondere wenn sie auf Hardware-RAID-Karten angewiesen sind, die durch die Einschränkungen des PCIe-Busses eingeschränkt sind. Durch die Nutzung der GPU-Beschleunigung durchbricht Graid diese Barrieren und bietet außergewöhnliche Leistung bei minimaler Auswirkung auf die CPU-Ressourcen, während gleichzeitig ein robuster RAID-Schutz gewährleistet wird.
Bei anspruchsvollen Workloads wie KI und HPC werden auch häufig alternative Konfigurationen wie JBOD (Just a Bunch of Disks) und Software-RAID (mdadm) eingesetzt. JBOD ist zwar praktisch, wenn es mit Checkpointing zur Vermeidung von Datenverlusten gekoppelt wird, führt jedoch zu mehr Ausfallpunkten und belastet IT-Administratoren mit anspruchsvollen Wiederherstellungsprozessen. Software-RAID bietet Datenausfallsicherheit, verbraucht jedoch wertvolle CPU-Ressourcen zur Verwaltung von RAID-Paritätsdaten und bietet in vielen Bereichen eine unterdurchschnittliche Leistung. Im Gegensatz dazu bietet SupremeRAID von Graid eine optimierte, leistungsstarke Lösung, die die Datenverwaltung vereinfacht, ohne Geschwindigkeit oder Zuverlässigkeit zu beeinträchtigen.
In diesem Dokument wird ein Leistungsvergleich zwischen Graids SupremeRAID, JBOD und Software-RAID durchgeführt, um zu verdeutlichen, warum Graid die bessere Wahl für IT-Umgebungen ist, in denen Leistung und Datenschutz an erster Stelle stehen.
Leistungsprüfstand
Wir nutzten die Gigabyte S183-SH0-AAV1 Dual Intel 5th Gen Scalable 1U Server für diesen Teststand. Wir wollten einen kompakten Server mit viel Rechenleistung finden, und so kam es, dass der Server 32 E1.S SSDs unterstützt, das Maximum dessen, was mit einem einzelnen Graid SupremeRAID SR-1010 unterstützt wird. Der Gigabyte-Server hat 32 DIMM-Steckplätze, mit 96 GB RDIMM- und 256 GB 3DS RDIMM-Unterstützung. Diese Plattform bietet drei FHHL PCIe Gen5-Steckplätze auf der Rückseite und bietet damit zahlreiche Optionen für Hochgeschwindigkeitsnetzwerkverbindungen. Darüber hinaus bietet das Motherboard duales 1GbE Onboard-Netzwerk und einen 1GbE-Verwaltungsport.
Der Server unterstützt 32 DIMM-Steckplätze, aber in diesem Fall haben wir 16 Kingston DIMMs verwendet, 1 DIMM pro Kanal (1DPC) für maximale DRAM-Geschwindigkeit. Sollte die Arbeitslast einen größeren Platzbedarf erfordern, ist ein Wechsel zu DIMMs mit höherer Dichte oder einer 2DPC-Konfiguration möglich, aber letztere verringert die DRAM-Geschwindigkeit auf 4400 MT/s. Das Kingston 96 GB DDR5-5600 ECC RDIMMs in diesem Server bieten ein hervorragendes Verhältnis von Leistung zu Geld und sind damit eine attraktive Option für Workloads, die Hochgeschwindigkeits-DRAM und einen angemessenen DRAM-Footprint benötigen, ohne den Preisaufschlag von 128-GB-DIMMs. Diese Module bieten das Beste aus beiden Welten für intensive HPC- und KI-Workloads.
Die 32 E1.S SSD-Schächte sind mit KIOXIA 7.68 TB XD7P SSDs bestückt. Die Laufwerke verwenden eine PCIe Gen4 x2-Schnittstelle und liefern eine maximale Bandbreite von 7.2 GB/s Lesen und 4.8 GB/s Schreiben. KIOXIA hat diese Laufwerke speziell für intensive Hyperscale- und HPC-Workloads entwickelt, bei denen die Dichtevorteile der E1.S SSDs von Vorteil sind. Wichtig ist, dass KIOXIA sichergestellt hat, dass das thermische Design des XD7P auch bei hoher Belastung mit diesem dichten Serverdesign Schritt halten kann.
Spezifikationen des Testsystems
- Gigabyte S183-SH0-AAV1 Server
- 2 x Intel Xeon Platinum 8592+ CPUs (64 Kerne, 1.9 GHz)
- 16 x 96 GB Kingston DDR5-5600
- 32 x KIOXIA XD7P 7.68 TB E1.S SSDs
- Graid SupremeRAID SR-1010
- Ubuntu 22.04.4 Server
Ergebnisse der Leistungstests
HPC-Workloads können Tage, Wochen oder Monate am Stück ausgeführt werden, und ohne ausfallsicheren Backend-Speicher kann ein einziger Laufwerksausfall diese Jobs wieder auf Anfang zurückwerfen. Um die Auswirkungen von Graid auf die Ausfallsicherheit und Leistung für HPC- und KI-Workloads zu bewerten, untersuchen wir die Leistung des internen Speicherbenchmarks von y-cruncher. Ziel ist es, verschiedene Speicherkonfigurationen, JBOD, Software-RAID und Graid SupremeRAID, zu vergleichen, um ihre Auswirkungen auf CPU-intensive Workloads zu verstehen.
RAID-Konfiguration
Wir wissen, dass mdadm-Software-RAID bei Paritätsdaten erhebliche Schreibzugriffe verzeichnet. RAID10 würde zwar eine höhere Leistung erzielen, aber auch die nutzbare Kapazität erheblich reduzieren. Um die Leistung von Software-RAID5 optimal zu optimieren, haben wir zwei RAID5-Pools konfiguriert, die auf die SSDs 0-15 und 16-31 aufgeteilt sind. Dadurch wurden sie auf beide CPUs verteilt.
Der Graid-Vergleich wurde außerdem so optimiert, dass er zwei RAID5-Pools verwendet, wobei die Hälfte der SSDs gleichmäßig auf CPU0 und die andere Hälfte auf CPU1 für den NUMA-Ausgleich aufgeteilt wird. Wir haben mit einem einzelnen Volume auf jedem RAID5-Pool sowie mit zwei Volumes pro RAID5-Pool getestet.
Jedes Laufwerk wird in der JBOD-Konfiguration einzeln zugeordnet, wodurch ein gleichmäßiger NUMA-Ausgleich gewährleistet wird.
Wir konnten Hardware-RAID nicht in diesen Bericht aufnehmen, da die Art und Weise, wie die Laufwerke in diesem Server verkabelt sind, dazu führt, dass herkömmliche Hardware-RIAD-Karten nicht unterstützt werden. Es ist jedoch erwähnenswert, dass selbst wenn wir dies könnten, im besten Fall das Bandbreitenlimit eines PCIe Gen4 x16-Steckplatzes für eine einzelne Karte (ca. 28 GB/s) erreicht wäre.
Software-Konfiguration
Für diese verschiedenen Speicherszenarien verwendeten wir Y-Cruncherinternes Leistungstesttool von . Die Testergebnisse sind unterteilt in sequentielle Lese- und Schreibleistung, Rechen-E/A-Geschwindigkeit, Festplatten-E/A-Geschwindigkeit und das Verhältnis von Festplatten-E/A-Geschwindigkeit zu Rechengeschwindigkeit. Wir haben dieses Tool ausgewählt, weil es gleichzeitig CPU, Speicher und Laufwerk-E/A belastet. Obwohl es keine einzelne spezifische Arbeitslast darstellt, haben wir festgestellt, dass die von ihm generierten Daten eng mit der Gesamtsystemleistung bei E/A-intensiven Anwendungen korrelieren. Insbesondere umfasst der E/A-Test die tatsächliche Datenverarbeitung, anstatt nur Bits so schnell wie möglich durch eine Schnittstelle zu schieben, wodurch er eine genauere Widerspiegelung der Systemleistung unter realer Belastung darstellt.
Die sequentielle Lese- und Schreibleistung gibt die Rohgeschwindigkeit des Festplattenarrays an. Die Rechengeschwindigkeit ist die Geschwindigkeit, mit der die CPU Daten verarbeitet, während die Festplatten-E/A-Geschwindigkeit angibt, wie schnell Daten bei der Rechenarbeit zur CPU gestreamt werden können. Um nicht verlangsamt zu werden, müssen Arbeitslasten auf der Festplatte eine höhere Festplatten-E/A-Geschwindigkeit aufweisen als die Rechengeschwindigkeit. Wenn dieses Verhältnis unter 1.0 liegt, ist die Festplatte ein Engpass, während bei über 1.0 die CPU ein Engpass ist. y-cruncher für große Arbeitslasten arbeitet am besten, wenn das Verhältnis 2.0 oder höher ist.
Speicherkonfiguration | Sequentielles Lesen in GB/s | Sequentielles Schreiben in GB/s | Berechnung GB/s | Festplatten-E/A GB/s | Ratio |
---|---|---|---|---|---|
Direktes JBOD | 102 | 102 | 18.4 | 81.5 | 4.42 |
Grad RAID5 x 2 2VD | 64.3 | 43.8 | 23.1 | 70.4 | 3.05 |
Grad RAID5 x 2 4VD | 85.2 | 73.7 | 22.1 | 69.4 | 3.14 |
SW RAID5 x 2 | 122 | 3.6 | 25.7 | 10.9 | 0.42 |
Mit direktem JBOD auf 32 einzelne E1.S SSDs erreichte y-cruncher mit seinem internen Striping-Prozess eine Leistung von 102 GB/s beim Lesen und 102 GB/s beim Schreiben. Dies ist im Allgemeinen die höchste Leistung, die y-cruncher für diese Plattform erreichen wird, obwohl der Kompromiss darin besteht, dass keine Datenparität besteht. Als die Konfiguration mit mdadm auf Software-RAID5-Volumes (verteilt auf beide CPUs) umgestellt wurde, sank die sequentielle Leistung auf nur 3.6 GB/s beim Schreiben und 122 GB/s beim Lesen. Graid mit zwei RAID5-Pools und zwei Volumes maß 64.3 GB/s beim Lesen bei einer Schreibleistung von 43.8 GB/s. Durch die Aufteilung auf zwei RAID5-Pools, aber mit vier Volumes konnte Graid eine Bandbreitensteigerung auf 85.2 GB/s beim Lesen und 73.7 GB/s beim Schreiben verzeichnen.
Nachdem wir die Bandbreitenzahlen angesprochen und das Spektrum der Speicherkonfigurationsoptionen verstanden haben, untersuchen wir die Auswirkungen dieser Entscheidung auf die Anwendung. Das Verhältnis von Rechenleistung zu Festplatten-E/A-Bandbreite war mit 4.43 bei der JBOD-Konfiguration am höchsten. Software-RAID5 lag bei mageren 0.42, während Graid-RAID5 3.05 mit 2 VDC und 3.14 mit 4 VDC erreichte.
In diesem Y-Cruncher-Beispiel, das alle Leistungsfunktionen des Servers umfasst, ist für optimale Leistung ein Verhältnis von 2.0 oder höher erforderlich. Während die JBOD-Konfiguration die besten Gesamtergebnisse erzielt, geschieht dies auf Kosten der Paritätsdaten, was bedeutet, dass ein Ausfall eines Laufwerks, selbst für einen Moment, Datenverlust bedeutet. Andererseits kann Software-RAID Datenverfügbarkeit und eine höhere Lesegeschwindigkeit als JBOD bieten, aber die Schreibvorgänge leiden so stark darunter, dass die Festplatten-E/A nicht mit der CPU Schritt halten kann, was zu dem schrecklichen Ergebnis von 42 führt.
Diese beiden Datenpunkte sind entscheidend, um den Nutzen zu verstehen, den Graid SupremeRAID diesen Workloads bietet. Für diesen Anwendungsfall liegen die Gesamtleistungszahlen zwischen JBOD und Software-RAID, aber die Roh-E/A ist nicht die ganze Geschichte. Dieses Beispiel zeigt, dass Graid mehr als die erforderliche Anwendungsleistung liefern und gleichzeitig Datenverfügbarkeit bieten kann. Diese Kombination bedeutet, dass Organisationen, die Graid verwenden, RAID-Schutz, Speicher und Anwendungsleistung mit einer nicht blockierenden Architektur erwarten können, die weit über das hinausgeht, was eine herkömmliche RAID-Karte bieten könnte.
Schlussfolgerung
SupremeRAID von Graid Technology erweitert kontinuierlich die Grenzen von Datenschutz und Leistung und setzt einen neuen Branchenstandard. Durch Nutzung der Leistung der GPU-Beschleunigung bietet Graid unübertroffene Geschwindigkeit und Effizienz in RAID-Konfigurationen, reduziert die CPU-Belastung erheblich und maximiert gleichzeitig den Durchsatz.
Die Daten, die wir für diesen Bericht gesammelt haben, zeigen, dass Graid einen robusten Datenschutz gewährleistet und gleichzeitig die hohen Anforderungen moderner KI- und HPC-Workloads erfüllt – Bereiche, in denen herkömmliche RAID- und Software-RAID-Lösungen oft versagen. Diese Effizienz ermöglicht es kritischen Systemressourcen wie CPU, DRAM und Speicher, voll zur Leistung der Anwendungen beizutragen, die sie unterstützen sollen, wodurch der Gesamtwert und die Effektivität des Systems verbessert werden.
Dieser Bericht wird von Graid Technology gesponsert. Alle in diesem Bericht geäußerten Ansichten und Meinungen basieren auf unserer unvoreingenommenen Sicht auf die betreffenden Produkte.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed