Erst letzte Woche hat Intel ihre veröffentlicht Xeon-CPUs der 3. Generation, das auf seinem Ökosystem-Spiel aufbaut, das Optane SSD-Speicher in das einschließt P5800X und natürlich das Neueste Persistente Speichermodule der Serie 200 (PMem). Nach Abschluss unserer ersten Intel-Speichertests haben wir beschlossen, die Intel-Server- und Speichertechnologie, die wir im Labor haben, einem neuen Zweck zuzuführen. Wir haben Windows Server 2019 installiert, um Optane PMem 200, Optane P5800X SSD und TLC NAND zu testen P5510 SSDs Kopf an Kopf. Der Zweck dieser Überprüfung besteht darin, die Intel-Speicherleistung in Windows Server zu bewerten, damit wir besser verstehen können, wo die Stärken jeder dieser Technologien in einem Bare-Metal-Szenario liegen.
Erst letzte Woche hat Intel ihre veröffentlicht Xeon-CPUs der 3. Generation, das auf seinem Ökosystem-Spiel aufbaut, das Optane SSD-Speicher in das einschließt P5800X und natürlich das Neueste Persistente Speichermodule der Serie 200 (PMem). Nach Abschluss unserer ersten Intel-Speichertests haben wir beschlossen, die Intel-Server- und Speichertechnologie, die wir im Labor haben, einem neuen Zweck zuzuführen. Wir haben Windows Server 2019 installiert, um Optane PMem 200, Optane P5800X SSD und TLC NAND zu testen P5510 SSDs Kopf an Kopf. Der Zweck dieser Überprüfung besteht darin, die Intel-Speicherleistung in Windows Server zu bewerten, damit wir besser verstehen können, wo die Stärken jeder dieser Technologien in einem Bare-Metal-Szenario liegen.
Optane PMem vs. Optane SSD vs. NAND SSD
Trotz der seit langem bevorzugten Speicherpyramide von Intel gibt es immer noch eine Reihe von Fragen dazu, welche Speichertechnologie für eine bestimmte Anwendung oder einen bestimmten Anwendungsfall die richtige ist. Sicher, DRAM ist das schnellste, aber leider ist es auch teuer. Optane PMem kann wie DRAM verwendet werden und bietet dauerhaften Speicher, der beim Neustart nicht rehydriert werden muss. PMem nutzt auch herkömmliche DIMM-Steckplätze, so dass es einfach einzubauen ist. PMem verfügt auch im Vergleich zu herkömmlichen SSDs über ein beeindruckendes Leistungsprofil.
Dann haben Sie natürlich Optane-SSDs, die für die Aufnahme von Schreibvorgängen optimiert wurden, eine Aufgabe, mit der herkömmliche SSDs zu kämpfen haben. Aus diesem Grund werden sie typischerweise als Teil einer mehrschichtigen Speicherarchitektur als Cache oder Tiering-Pool verwendet. Optane-SSDs sind jedoch teurer als TLC-NAND-SSDs und haben einen enormen Kapazitätsnachteil, die P5800X erreicht beispielsweise 1.6 TB.
Im weiteren Verlauf haben wir TLC-SSDs wie die Intel P5510, was dem optimalen Preis-Leistungs-Verhältnis entspricht. Schließlich haben wir im Flash-Bereich QLC-SSDs. Diese bieten die größte Kapazität und den höchsten Wert pro Terabyte, bevorzugen jedoch eher eine leseintensive Umgebung, noch besser, wenn sie sich hinter einem Cache oder Tier befinden, der Schreibvorgänge aggregiert und sie auf sanfte und liebevolle Weise an die QLC-SSDs weiterleitet. Von da an verwandelt sich die Speicherpyramide in einen Sumpf aus Festplatten, Bandlaufwerken und Permutationen von Cloud-Speicher.
Intel Storage-Leistung in Windows Server
Um die Leistung dieser neuesten Intel-Speichertechnologien zu bewerten, wollten wir eine Situation mit möglichst geringem Overhead und dennoch eine gute Unterstützung speziell für PMem und unsere bestehende Testmethodik. Der erste Kandidat ist Microsoft Windows Server 2019. Wir testen auf einem Intel OEM-Server, der die neuesten Plattformtechnologien wie Xeon der 3. Generation, PMem 200 und die Unterstützung für PCIe Gen4-Speicher präsentieren soll.
Spezifikationen für Intel OEM-Server
- 2 x Intel Xeon Platinum 8380 mit 2.3 GHz und 40 Kernen
- 16 x 32 GB DDR4 3200 MHz
- 16 x 128 GB Intel Persistent Memory 200-Serie
- Boot-SSD: Intel 1 TB SATA
- Betriebssystem: Windows Server 2019
Synthetische Workload-Analyse für Unternehmen
Unser Enterprise-Shared-Storage-Benchmark-Prozess versetzt jedes Gerät in einen stabilen Zustand mit der gleichen Arbeitslast, mit der das Gerät getestet wird, unter einer hohen Last von 16 Threads mit einer ausstehenden Warteschlange von 16 pro Thread und wird dann in festgelegten Intervallen in mehreren Threads/Warteschlangen getestet Tiefenprofile zur Darstellung der Leistung bei leichter und starker Beanspruchung. Da wir auf jedem Gerät einen kleinen Speicherbedarf von 20 % testen, stellen wir nur die Hauptabschnitte jedes Tests grafisch dar.
Vorkonditionierung und primäre stationäre Tests:
- Durchsatz (Lese- und Schreib-IOPS-Aggregat)
- Durchschnittliche Latenz (Lese- und Schreiblatenz insgesamt gemittelt)
- Maximale Latenz (Spitzen-Lese- oder Schreiblatenz)
- Latenz-Standardabweichung (Lese- und Schreib-Standardabweichung insgesamt gemittelt)
Unsere Enterprise Synthetic Workload Analysis umfasst vier Profile, die auf realen Aufgaben basieren, mit einer 1T/1Q 4K-Workload, um sich auf die Leistung bei geringer Auslastung zu konzentrieren. Diese Profile wurden entwickelt, um den Vergleich mit unseren früheren Benchmarks sowie weit verbreiteten Werten wie maximaler Lese- und Schreibgeschwindigkeit von 4K und 8K 70/30, die häufig für Unternehmenslaufwerke verwendet wird, zu erleichtern.
- 4K 1T/1Q
- 100 % Lesen oder 100 % Schreiben
- 100 % 4K
- 4K 16T/16Q
- 100 % Lesen oder 100 % Schreiben
- 100 % 4K
- 8K 70/30
- 70 % lesen, 30 % schreiben
- 100 % 8K
- 8K (sequentiell)
- 100 % Lesen oder 100 % Schreiben
- 100 % 8K
- 128K (sequentiell)
- 100 % Lesen oder 100 % Schreiben
- 100 % 128K
Für unsere Tests haben wir uns drei Speicherkonfigurationen innerhalb der Intel-Serverplattform der 3. Generation angesehen. Dazu gehörten Folgendes:
- 16 x 128 GB Intel Persistent Memory 200 Series in zwei Namespaces (jeweils mit etwa 1 TB Speicher)
- 2 x 800 GB Intel P5800X Optane SSDs
- 8 x 7.68 TB Intel P5510 SSDs
Jede Gerätegruppe oder jeder Namespace wurde direkt mit einem FIO-Job getestet, wobei ein Gerätekapazitätsbedarf von 20 % verwendet wurde, um die nachhaltige Leistung zu messen. Jedem Gerät pro Gruppe wurde eine eigene Aufgabe zugewiesen und die Ergebnisse wurden aggregiert. Beispielsweise wurde für zwei getestete Geräte jeweils eine Arbeitslast von 1T/1Q zugewiesen, also insgesamt zwei Threads in einer Warteschlange für diese Arbeitslast. Acht Geräte wären insgesamt acht Threads in einer Warteschlange und so weiter.
In unserem ersten Test haben wir uns auf einen einzelnen Thread, eine einzelne Warteschlangentiefe und eine zufällige Lese- und Schreiblast von 4 KB konzentriert. Die Offline-Leistung ist für viele Anwendungen wichtig, da einige Geräte keine große E/A-Warteschlangentiefe hinter sich benötigen, um zu glänzen.
Intel PMem zeigte deutliche Vorteile bei der Leseleistung und erreichte fast das Doppelte im Vergleich zu zwei Intel P5800X SSDs oder acht Intel P5510 SSDs. Bei der Schreibleistung hatte PMem immer noch einen Vorsprung gegenüber den P5800X-SSDs, aber acht P5510-Laufwerke konnten einen höheren Durchsatz bieten.
Als Nächstes betrachten wir die durchschnittliche Latenzauswirkung unseres 1T/1Q 4K-Lese- und Schreibtests.
Intel PMem hat eine Latenz von 10 Mikrosekunden beim 4K-Zufallslesen gemessen, gefolgt vom P5800X mit 24 Mikrosekunden und den P5510 SSDs mit 81 Mikrosekunden. Bei der Betrachtung der Schreiblatenz haben wir 11 Mikrosekunden bei PMem, 23 bei den P5800x-SSDs und 27 ms bei den P5510-SSDs festgestellt.
Wir gehen zu einer schwereren Form des gleichen 4K-Lese- und Schreibtests über und schauen uns an, wo jeder Gerätetyp die besten Ergebnisse erzielt hat.
Die Gruppe der acht Intel P5510 SSDs bot mit fast 4.8 Mio. IOPS den höchsten Lesedurchsatz, gefolgt von PMem mit 3.2 Mio. IOPS und den beiden P5800X SSDs mit 1.7 Mio. IOPS. Beim 4K-Zufallsschreiben lagen die beiden P5800X-SSDs mit 1.91 Mio. IOPS an der Spitze, gefolgt von den acht P5510-SSDs mit 1.78 Mio. IOPS und den beiden PMem-Namespaces mit 1.35 Mio. IOPS.
Während der Durchsatz wichtig ist, ist einer der interessantesten Aspekte von Optane, sowohl als PMem als auch als SSD, wie gut es mit der Speicherlatenz umgeht. Wir sehen, dass dies auch bei unserem höheren 4K-Random-Lese- und Schreib-Workload zum Tragen kommt.
Intel PMem hatte mit 159 Mikrosekunden die niedrigste Leselatenz, gefolgt von den beiden P5800X-SSDs mit 296 Mikrosekunden und den acht P5510-SSDs auf der Rückseite mit 427 Mikrosekunden. Bei der Schreiblatenz lagen die beiden P5800X-SSDs mit 265 Mikrosekunden an der Spitze, gefolgt von PMem mit 377 Mikrosekunden und den acht herkömmlichen P5510-SSDs mit 1.147 ms.
Wenn wir die Blockgröße auf unsere 8K 70/30-Workload erhöhen, schauen wir uns die drei verschiedenen Speichertypen an und wie sie auf eine ständig steigende Anzahl von Threads und Warteschlangen reagieren.
Was die Spitzenleistung angeht, hat sich die Gruppe der acht Intel P5510 SSDs richtig ins Zeug gelegt und einige beeindruckende Spitzenwerte geliefert. An der Spitze erreichte es sein Maximum mit 4.34 Millionen IOPS bei 16T/16Q. Interessant ist jedoch, dass PMem und die beiden P5800X an einigen der unteren Thread- und Warteschlangenpunkte leicht nach vorne springen konnten.
Wenn wir den Fokus auf die durchschnittliche Latenz richten, sehen wir ein unterschiedliches Bild für die verschiedenen Speichertypen. Obwohl Intel PMem nicht den höchsten Durchsatz aufwies, konnte es sich in diesem Test mit einer der niedrigsten durchschnittlichen Latenzzeiten durchsetzen, dicht gefolgt von den P5800X-SSDs. Die acht P5510-SSDs weisen eine (relativ) deutlich höhere Latenz auf als die beiden Optane-Technologien, obwohl sie mit Abstand den höchsten Durchsatz boten.
Als nächstes gehen wir zu unseren sequentiellen Workloads über, beginnend mit unserer 8K-Übertragungsgröße.
Die Gruppe aus acht Intel P5510-SSDs konnte diesen Test mit 4.45 Mio. IOPS problemlos übertreffen, gefolgt von PMem mit 1.92 Mio. IOPS, gefolgt von den beiden P5800X-SSDs mit 1.71 Mio. IOPS. Beim Schreiben lag PMem mit 1.75 Mio. IOPS an der Spitze, gefolgt von den acht P5510-SSDs mit 1.55 Mio. IOPS, gefolgt von den beiden P5800X-SSDs mit 1.18 Mio. IOPS.
In unserem letzten Test betrachten wir die Spitzenbandbreite der drei verschiedenen Speichermedien. Bei beiden U.2-Gerätetypen ergibt sich ein Teil des begrenzten Top-Ends aus der Anzahl der Lanes für jede Bereitstellung.
An der Spitze der Lesebandbreite lagen die acht P5510 mit beeindruckenden 54 GB/s, gefolgt von PMem mit zwei Namespaces, die 44 GB/s bieten, und die beiden P5800X-SSDs mit 14 GB/s Lesebandbreite. Es ist interessant zu sehen, wie hoch PMem in Bezug auf die Bandbreite sein kann. Bei der Umstellung auf Large-Block-Schreiben lagen die acht P5510-SSDs mit 32.7 GB/s an der Spitze, gefolgt von PMem mit 14.3 GB/s und dann den beiden P5800X-SSDs mit 11.1 GB/s. Insgesamt sehr beeindruckende Zahlen auf ganzer Linie.
Fazit
Intel hat in den letzten Jahren intensiv mit Optane sowohl bei der PMem- als auch bei der SSD-Variante gearbeitet. Es ist deutlich zu erkennen, dass diese Speichertechnologie für sie von grundlegender Bedeutung ist, da sie eine umfassende Intel-Plattform-Geschichte zusammenstellen, um AMD im Rechenzentrum abzuwehren. Und bei geschäftskritischen Workloads bestätigen die Ergebnisse dies. Beim Storage-Tiering steht das P5800X ganz oben in der NVMe-Gerätehierarchie und verzeichnet einen enormen Leistungsschub gegenüber dem Vorgängermodell, was zum großen Teil auf PCIe Gen4 zurückzuführen ist. Dieser Anstieg ist tatsächlich so groß, dass er sich dem von PMem gebotenen Durchsatz, nicht jedoch der Bandbreite, annähert.
Während unserer Tests haben wir genau das gesehen, was wir erwartet hatten. PMem zeigte einen enormen Leistungswert, wenn es um Latenz und Durchsatz bei geringen Warteschlangentiefen geht. Es bietet auch enorme Bandbreitengewinne bei der Leseleistung. Die P5800X Optane SSD nähert sich PMem auf ganzer Linie sogar im Zweiereinsatz sehr an. Dadurch eignet sich das P5800X hervorragend als Kombination mit TLC- oder QLC-Laufwerken in einer Lösung, die diese als Cache oder Tier nutzen kann.
Ganz gleich, wo wir uns die Intel Gen3 Unsere Ergebnisse werden durch die immense Lesebandbreite von PMem von über 44 GB/s beim Lesen und die Latenz von 10 Mikrosekunden bei zufälligen 4K-Lese- und Schreib-Workloads mit geringer Warteschlangentiefe unterstrichen. Der P5800X bietet ähnliche Latenzvorteile, mit einer größeren Reichweite im häufigeren U.2-Schacht und misst etwa die doppelte Latenz von Intel PMem bei niedrigen Warteschlangen- und Thread-Anzahlen. Sogar die P5510-SSDs zeigten ihre Stärke, wenn es um Workloads in höheren Warteschlangen ging, und lieferten Spitzenwerte in sequentiellen oder zufälligen IO-Benchmarks.
Das Fazit ist, dass die neueste Runde der Intel-Speichergeräte, sowohl PMem als auch SSDs, im Vergleich zu den Produkten der vorherigen Generation erhebliche Fortschritte gemacht haben. Dies gilt insbesondere jetzt, da Intel in der Lage ist, den schnelleren BUS für DRAM und die PCIe-Gen4-Steckplätze bereitzustellen. Anhand dieser Bare-Metal-Daten können wir die spezifischen Stellen erkennen, an denen sich jede Technologie auszeichnet. Das Verständnis dieser Daten ermöglicht es Systementwicklern, Plattformen intelligent zu entwerfen, die jede Anwendung zu herausragenden Leistungen machen.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS Feed