Startseite Unternehmen AMD EPYC-Test der 4. Generation (AMD Genoa)

AMD EPYC-Test der 4. Generation (AMD Genoa)

by Jordan Ranous

AMD hat die allgemeine Verfügbarkeit der neuen EPYC 9004-CPUs der 4. Generation angekündigt. Die neue CPU-Reihe mit dem Codenamen AMD Genoa unterstützt 12 Kanäle DDR5-4800 (bis zu 6 TB Speicherkapazität pro Sockel), 128 Lanes PCIe Gen5, AMD Infinity Fabric/Guard-Technologie und bis zu 96 Kerne. Dies macht sie ideal für kritische Workloads in der Cloud, im Unternehmens- und Hochleistungs-Computing.

AMD hat die allgemeine Verfügbarkeit der neuen EPYC 9004-CPUs der 4. Generation angekündigt. Die neue CPU-Reihe mit dem Codenamen AMD Genoa unterstützt 12 Kanäle DDR5-4800 (bis zu 6 TB Speicherkapazität pro Sockel), 128 Lanes PCIe Gen5, AMD Infinity Fabric/Guard-Technologie und bis zu 96 Kerne. Dies macht sie ideal für kritische Workloads in der Cloud, im Unternehmens- und Hochleistungs-Computing.

Vorteile von EPYC 9004 CPUs der 4. Generation für Unternehmen

Mit der enormen Anzahl von 96 Kernen in einem einzigen Prozessor ermöglichen die neuen AMD Genoa-Prozessoren Unternehmen, ihren physischen Platzbedarf zu reduzieren, indem sie weniger Server einsetzen und gleichzeitig leistungsstärkere Server nutzen. Dies erhöht die Flexibilität von Rechenzentrumsökosystemen und hilft ihnen, Nachhaltigkeits- und Zukunftssicherheitsziele zu erreichen.

AMD Genua-Server

AMD hat bei der Entwicklung seiner neuen EPYC-Prozessoren großen Wert auf verbesserte Sicherheit gelegt, insbesondere durch die Erweiterung von AMD Infinity Guard, dem Funktionsumfang des Unternehmens, der seinen CPUs sowohl physische als auch virtuelle Schutzebenen bietet. Beispielsweise verfügt es über die doppelte Anzahl an Verschlüsselungsschlüsseln im Vergleich zu früheren Generationen, was Kunden dabei hilft, ihre Daten zu schützen, unabhängig davon, ob sie lokal, in der Cloud oder im Speicher gespeichert sind.

Unternehmen können von ihrem „All-in“-Funktionsumfang profitieren und haben die Möglichkeit, ein Modell mit der Kernanzahl und -häufigkeit (siehe Tabelle unten) auszuwählen, die ihren Anforderungen am besten entspricht. Darüber hinaus unterstützen die AMD EPYC-Prozessoren der 4. Generation jetzt DDR5-Speicher und PCIe Gen 5, die beide für KI- und ML-Anwendungen von entscheidender Bedeutung sind. Natürlich geben sich SSD-Anbieter für Unternehmen große Mühe, ihre Laufwerke in den Mainstream zu bringen und so doppelt so viel Bandbreitenpotenzial wie Gen 4 freizusetzen.

SKUs der AMD Genoa 9004-Serie

Modell Farben Standard-TDP cTDP Basis (GHz) Boost (GHz)
9654 96 360w 320-400w 2.4 3.7
9634 84 290w 240-300w 2.25 3.7
9554 64 360w 320-400w 3.1 3.75
9534 64 280w 240-300w 2.45 3.7
9454 48 290w 240-300w 2.75 3.8
9354 32 280w 240-300w 3.25 3.8
9334 32 210w 200-240w 2.7 3.9
9254 24 200w 200-240w 2.9 4.15
9224 24 200w 200-240w 2.5 3.7
9124 16 200w 200-240w 3.0 3.7
9474F 48 360w 320-400w 3.6 4.1
9374F 32 320w 320-400w 3.85 4.3
9274F 24 320w 320-400w 4.05 4.3
9174F 16 320w 320-400w 4.1 4.4
9654P 96 360w 320-400w 2.4 3.7
9554P 64 360w 320-400w 3.1 3.75
9454P 48 290w 240-300w 2.75 3.8
9354P 32 280w 240-300w 3.25 3.8

AMD Genua – Zen 4 Architektur

Zen 4 wurde im vergangenen September veröffentlicht und ist die neue Mikroarchitektur für die AMD EPYC 9004-CPUs mit dem bisher leistungsstärksten Kern von AMD. Dies trägt dazu bei, dass EPYC 9004-CPUs neue Maßstäbe in puncto Leistung und Energieeffizienz setzen und Kunden die Modernisierung von Rechenzentren beschleunigen können, um einen höheren Anwendungsdurchsatz und mehr umsetzbare Erkenntnisse zu erzielen. Zen 4 treibt auch die neuen Ryzen 7000-Desktop-Prozessoren der Verbraucherklasse an.

und Genua DRAM

Eine der größeren Änderungen, die Zen 4 mit sich bringt, besteht darin, dass es keinen DDR4-Speicher mehr unterstützt, sondern ausschließlich auf DDR5-Speicher umgestiegen ist. Darüber hinaus unterstützt Zen 4 neue AMD EXPO SPD-Profile, die eine umfassendere Speicheroptimierung und Übertaktung durch RAM-Hersteller ermöglichen.

Zu den weiteren neuen Funktionen gehören:

  • Schneller privater 1 MB L2-Cache
  • Weitere herausragende Fehler werden von L2 bis L3 pro Kern unterstützt
  • Weitere ausstehende Fehler werden von L3 bis zum Speicher unterstützt
  • Verbesserte L3- und L2-Fehlschläge BW
  • Eine höhere BW ermöglicht Prefetch-Verbesserungen

Übersicht über die Zen 4-Mikroarchitektur

Zen 4 vs. Zen 3

Verbesserungen der AMD EPYC 9004-Serie gegenüber früheren Generationen

Der neue AMD Genoa bietet eine Reihe spürbarer Verbesserungen, darunter eine Erhöhung der maximalen Kernanzahl auf satte 96 pro CPU. Dies ist im Vergleich zu den letzten Generationen von Bedeutung:

  • Maximal 64 Kerne pro CPU beim 7773X und 7763 (3rd Gen EPYC) Modelle
  • Maximal 40 Kerne pro CPU beim 8380 (3rd Gen Xeon Platinum) Modell

AMD gibt an, dass dies im Hinblick auf schnellere Lösungen zu einer etwa 2.3-fachen Leistung im Vergleich zur Konkurrenz (bzw. 1.6-facher Leistung pro Watt) führen wird. Dies wird die größte Steigerung der Gesamtleistung sein, die wir bei ihren Veröffentlichungen der nächsten Generation gesehen haben. Für Unternehmensgeschäftsvorgänge pro Sekunde beträgt der 4th Die Generation AMD geht davon aus, dass ihre EPYC-CPUs eine etwa 2.6-fache Leistung bieten und deutet gleichzeitig auf eine 2.4-fache Leistungssteigerung der Rendering-Geschwindigkeit bei Verwendung von Arnold Autodesk hin.

und Genua-Heatsync

Aufgrund der Zen 4-Architektur bietet es außerdem eine deutliche Steigerung der Kernleistung und eine potenzielle Steigerung des IPC-Uplifts um ca. 14 Prozent für Server-CPUs.

Die neue EPYC 9004-Serie verfügt außerdem über führende Plattformfunktionen, die für die Skalierung vorgesehen sind:

  • 12-Kanal-DDR5-4800 mit verbesserter Single-Rank-Leistung
  • 128L 32Gps und 8L 8Gps Multifunktions-SERDES (Serialisierer/Deserialisierer)

Darüber hinaus verfügt es über CXL1.1+-Speicherunterstützung (CXL „Type3“), die erweiterte Speicheranschlussfunktionen für DDR und neuen Speicher sowie SEV-SNP-, QoS- und Tiered-Memory-Management-Erweiterungen umfasst. Für mehr Sicherheit werden SEV-SNP-Schlüsselerweiterungen und AES-256-XTS unterstützt.

Speicher der AMD EPYC 9004-Serie

Die AMD Genoa-CPUs unterstützen 12 Kanäle pro CPU, 6 TB pro Sockelkapazität, bis zu DDR4800 und können theoretisch auch eine Spitzenbandbreite von bis zu 460 GB/s erreichen.

Hier ist ein Überblick über die Vergleiche zwischen der Speicherbandbreitenleistung der 3. und 4. Generation:

CPU-Positionierung der AMD EPYC 9004-Serie

Wie bei der Vorgängergeneration hat AMD seine neuen CPUs in drei verschiedene Gruppen eingeteilt:

  • Kernleistung, das aus Hochfrequenz-CPUs mit einem großen Cache/Kern-Verhältnis besteht. Zu den Modellen, die darunter fallen, gehören 9474F (48 Kerne bei 360 W), 9374F (32 Kerne bei 320 W), 9274F (24 Kerne bei 320 W) und 9174F (16 Kerne bei 320 W).
  • Kerndichte, die aus den CPUs mit der höchsten Kern- und Threadanzahl besteht. Zu den Modellen, die darunter fallen, gehören 9654/P (96 Kerne bei 360 W), 9634 (84 Kerne bei 290 W), 9554/P (64 Kerne bei 360 W), 9534 (64 Kerne bei 280 W) und 9454/P (48 Kerne bei 290 W). ).
  • Ausgewogene und optimierte Leistung, das aus CPUs besteht, die ein ausgewogenes Verhältnis von Leistung und Gesamtbetriebskosten aufweisen. Zu den Modellen, die darunter fallen, gehören 9354/P (32 Kerne bei 280 W), 9334 (32 Kerne bei 210 W), 9254 (24 Kerne bei 200 W), 9224 (24 Kerne bei 200 W) und 9124 (16 Kerne bei 200 W).

AMD Genoa 9004 CPU-Leistung

Benchmarking-Konfiguration

Für unsere ersten Tests haben wir die aktuellen Top-End-Plattformen von Intel und AMD in einer ersten Reihe CPU-intensiver Workloads gegeneinander positioniert. Für unsere Intel-Plattform haben wir unsere anfängliche Dual-CPU-Intel-8380-Plattform, die auf einem Intel-OEM-Server basiert, gegen unsere Dual-CPU-AMD-EPYC-9654-Plattform in einem Quanta-Gehäuse eingesetzt.

Spezifikationen der Intel-Plattform:
2 x Intel Xeon Platinum 8380 40-Core-CPUs
16 x 32 GB 3200 MHz DDR4
Betriebssystem Windows Server 2022

Spezifikationen der AMD-Plattform:
2 x AMD EPYC 9654 96-Core-CPUs
24 x 64 GB 4800 MHz DDR5
Betriebssystem Windows Server 2022

V-Ray

V-Ray Benchmark ist eine Anwendung der Chaos Group zum Bewerten und Vergleichen verschiedener CPUs und GPUs. Die Chaos Group ist bekannt für ihre Arbeit rund um Visualisierungen und Rendering mit Spezialisierung auf Raytracing-Technologie. Der V-Ray-Benchmark enthält eine benutzerdefinierte Testszene, um jede Kombination aus CPU und GPU zu testen und die Leistung eines Systems mit einem anderen zu vergleichen.

In unserem Labor haben wir den V-Ray-Benchmark im reinen CPU-Modus genutzt. Um mögliche Engpässe zu minimieren, haben wir eine Solidigm P5520 7.68 TB NVMe SSD und eine Neuinstallation von Windows Server 2022 verwendet. An der Spitze der Bestenliste für V-Ray stand zuvor ein 2x AMD EPYC 7K83 64-Core-Prozessorsystem, das eine Bewertung abgab beeindruckender Durchschnitt von 100,844 aus 6 Tests. Unser Beispielsystem mit 2x AMD EPYC Genoa 96-Core erzielte in 126,940 Tests einen Durchschnitt von 9. Im Vergleich zum Intel-System

Firefox-Build aus dem Quellcode

Firefox, der Browser von Mozilla, ist ein riesiges Open-Source-Projekt. Mozilla möchte Ihnen die Möglichkeit bieten, das Projekt selbst aus dem Quellcode zu kompilieren, was als Tool zum Leistungsvergleich mittlerweile allgegenwärtiger geworden ist. Der Download dafür beträgt mehrere Gigabyte und Tausende von Dateien müssen kompiliert werden.

Bei unseren Tests waren wir von der 6-Minuten- und 57-Sekunden-Zeit des Intel zweite Kompilierzeit. Zum Vergleich: Eine Workstation der Spitzenklasse wird diese Aufgabe in kaum weniger als 8380 Minuten erledigen können, wenn man sie regelmäßig mit flüssigem Stickstoff und Überspannung versorgt, was bedeutet, dass wir es von Anfang an mit einer Menge Rohleistung zu tun haben diese Chips.

FF Build aus dem Quellcode
2 x AMD 9654 96-Core 6:33.85
2 x Intel 8380 40-Core 6:57.85

Blender – CLI-Benchmark

Blender Benchmark ist ein etablierter Standard in der CPU- und GPU-Benchmarking-Szene. Blender ist ein Open-Source-3D-Modellierungs- und Animationstool, das hochentwickelt ist und als führend auf diesem Gebiet gilt. Passend zum Thema der Genoa EPYC-Prozessoren nutzen wir es, um die Flexibilität einer gemischten Architektur zu demonstrieren, die eine CPU und eine potenzielle GPU als Ersatz für Rack-Bereitstellungen mit hoher Dichte bietet.

Blender verfügt über drei Benchmarks: Monster, Junkshop und Classroom. Dabei handelt es sich um drei Szenen, die nacheinander gerendert werden und für jeden Abschnitt eine Punktzahl erhalten, die dann zu einer Gesamtpunktzahl addiert wird.

Mixertest 2 x AMD 9654 96-Core 2 x Intel 8380 40-Core
Monster 1788.189128 671.145395
Trödelladen 1062.533142 407.141514
Klassenzimmer 850.646333 320.507039
Total 3701.368603 1398.793948

Das Genoa-Rig erzielte insgesamt überwältigende 3701 Punkte, davon 1788.2 bei Monster, 1062.5 bei Junkshop und 850.6 bei der Classroom-Benchmark. Der Vergleich von Genoa mit dem Intel . Der AMD Genoa Chip ist dank seiner neueren Architektur, Befehlssätze und der Verwendung von DDR41 etwa 5 Prozent schneller als das Intel-Rig.

2 x AMD 9654 96-Core Relativer Prozentsatz der Intel-Kernanzahl 2 x Intel 8380 40-Core
192-Kern 41.67 Prozent 80-Kern
384 Thema 41.67 Prozent 160 Thema

 

2 x AMD 9654 96-Core 2 x Intel 8380 40-Core
Blender-Gesamtpunktzahl 3701 1399
Kerne / Threads 192/384 80/160
Anzahl der Intel-Kerne/AMD 41.67 Prozent
Direkter Punktevergleich Intel/AMD 37.79 Prozent
Kernnormalisierter AMD-Score 1542
Relativ Intel/AMD, Core normalisiert 90.70 Prozent

Cinebench R23

Cinebench von Maxon ist dank seiner standardisierten Testmethodik und der Verwendung realer Tests zum Benchmarking der Multicore- und Single-Core-Leistung seit einiger Zeit eine tragende Säule des Benchmarkings. R23, die neueste Version von Cinebench, weist eine Einschränkung auf, die wir bisher nicht umgehen mussten; Es ist nur in der Lage, 256 Kerne/Threads zu vergleichen. Unser Testgerät hat 384. Interessanterweise gab es viele „Standard“-Benchmarks und -Anwendungen, auf die wir gestoßen sind und deren Kernzahl auf 256 begrenzt war. Cinebench ist also nicht der Einzige, der ein Update für die Zukunft mit extremer Kernzahl benötigt in Richtung.

Um diese Einschränkung zu beheben, haben wir zwei Tests gleichzeitig ausgeführt und jede Instanz auf 196 Threads begrenzt, um zu versuchen, die Last gleichmäßig aufzuteilen. Normalerweise können Sie die CPU-Affinität im Task-Manager festlegen. Bei Cinebench wurde dieser Vorgang jedoch blockiert. Wir vermuten, dass es sich um ein Flag handelt, das in der zugrunde liegenden Art und Weise, wie die API für die CPU-Priorität aufgerufen wird, gesetzt wurde. Wir haben versucht, es als weniger privilegierte Benutzer auszuführen und mit dem Befehlszeilen-Flag „start /affinity NODE 0“ zu starten, um es zu erzwingen, konnten die Anwendung jedoch nicht auf einen einzelnen NUMA-Knoten sperren.

Da wir dem Programm keine bestimmte Affinität zuordnen konnten, haben wir die Anwendung einfach zweimal ausgeführt und beide gleichzeitig gestartet. Die Ergebnisse zeigten zwei drastisch unterschiedliche Werte für die beiden Instanzen der App. Bei der Überwachung der CPU-Auslastung konnten wir jedoch beobachten, dass die Auslastung während des Tests zwischen 80 und 100 Prozent schwankte.

Cinebench-Einzelinstanz 2 x AMD 9654 96-Core 2 x Intel 8380 40-Core
Multi Thread (256 Kappe) 85,160 70,540
Single Core 972 985
MP-Verhältnis 87.65x 71.63x

 

2 Cinebench-Instanzen
AMD-Testlauf 1 AMD-Testlauf 2
Partitur, 1. Instanz 82,063 68,231
Partitur, 2. Instanz 57,557 57,221
Total 139,620 125,452

Abschließende Überlegungen

Der Benchmarking-Prozess der AMD EPYC 9004-CPUs war, gelinde gesagt, eine interessante Übung. Die Herausforderungen, mit denen wir im frühen Überprüfungsprozess konfrontiert waren, sind ein Hinweis auf die allgemeinen Herausforderungen, denen sich Softwareentwickler stellen müssen, wenn die CPU-Landschaft auf das Modell mit ultrahoher Dichte umsteigt. Obwohl es einige handelsübliche Anwendungen gibt, die es nutzen können, haben wir zunehmend Grenzen von Software festgestellt, die bestimmte Schwellenwerte der Thread-Anzahl nicht überschreiten konnte.

Im Labor arbeiten wir an einigen selbst entwickelten Tensorflow Machine Learning-Benchmarks, um diese neuen CPUs in realen Szenarien testen zu können. Wir werden die Ergebnisse weiterverfolgen, wenn wir Vertrauen in die Ergebnisse der neuen Anwendung haben und sie über mehrere Plattformen und CPU-Generationen hinweg validiert haben.

Vorerst ist der Start von AMD Genoa jedoch sehr aufregend, wie wir bisher beim Quanta-Server gesehen haben. Plus, HPE und Dell haben ihre Server angekündigt, die jeweils vier Systeme, zwei 1-CPU-Gehäuse und zwei 2-CPU-Gehäuse bieten. Dadurch wird AMD Genoa sofort in das Unternehmen integriert und die Präsenz von Genoa schnell über die Hyperscaler hinaus erweitert.

AMD Genua nackte CPU

Die große Frage liegt also auf der Hand: Ist AMD Genoa die Investition wert? Dies hängt von der Arbeitsbelastung hinsichtlich der Rechtfertigung der Ausgaben ab, aber einfach so DPUs für VMware, haben diese neuen CPU-Technologien in Bezug auf Rechenleistung, Sicherheit und Effizienz viel zu bieten. Das Ersetzen des EPYC der 3. Generation durch diese ist wahrscheinlich etwas verfrüht, aber jeder, der auf einen Grund zum Einsteigen gewartet hat, sollte sehr erfreut sein zu sehen, was Genoa auf den Tisch gebracht hat.

Wir haben noch viel mehr Tests und Arbeit vor uns und da Intel Sapphire Rapids bald erhältlich sein wird, möchten wir das Beste vergleichen, was die einzelnen Modelle zu bieten haben. Aber im Moment ist AMD Genoa äußerst überzeugend und sollte in jedem PoC zur Infrastrukturaktualisierung enthalten sein, damit Unternehmen die Auswirkungen all dieser Kerne und Effizienzen, die AMD zu bieten hat, besser verstehen können.

AMD-Startvideo

Beteiligen Sie sich an StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed