Start Unternehmen AMD Bergamo/Genoa-X-Rezension

AMD Bergamo/Genoa-X-Rezension

by Jordan Ranous

Im Juni kündigte AMD Aktualisierungen an AMD EPYC-Familie der 4. Generation von Prozessoren, die für spezielle Arbeitslasten konzipiert sind, die zur Erfüllung der Anforderungen von Unternehmen erforderlich sind. Die Ankündigungen erfolgten während der Eröffnung des Rechenzentrums von AMD und der AI-Technologie-Premiere mit der Vorstellung der AMD EPYC 4X97-Prozessoren der 4. Generation, zuvor mit dem Codenamen AMD Bergamo. Die AMD EPYC 97X4-Prozessoren bieten eine höhere vCPU-Dichte und höhere Leistung für KI-Anwendungen und Anwendungen, die in der Cloud ausgeführt werden.

Im Juni kündigte AMD Aktualisierungen an AMD EPYC-Familie der 4. Generation von Prozessoren, die für spezielle Arbeitslasten konzipiert sind, die zur Erfüllung der Anforderungen von Unternehmen erforderlich sind. Die Ankündigungen erfolgten während der Eröffnung des Rechenzentrums von AMD und der AI-Technologie-Premiere mit der Vorstellung der AMD EPYC 4X97-Prozessoren der 4. Generation, zuvor mit dem Codenamen AMD Bergamo. Die AMD EPYC 97X4-Prozessoren bieten eine höhere vCPU-Dichte und höhere Leistung für KI-Anwendungen und Anwendungen, die in der Cloud ausgeführt werden.

AMD Bergamo CPU-Sockel

AMD Bergamo

Die mit 4D V-Cache ausgestatteten AMD EPYC Zen 3-Prozessoren mit dem Codenamen Genoa-X wurden kürzlich in einer Studie als führende x86-Server-CPU für technische Datenverarbeitung identifiziert SPEC.org Bericht. Diese Prozessoren bringen 3D-V-Cache auf die 96-Kern-Zen-4-Chips und eignen sich ideal für anspruchsvolle technische Rechenaufgaben.

AMD Bergamo CPU 9684X

Laut AMD kann die Anpassung der Produkt-Roadmap an die Umgebungen der Kunden die Leistung liefern, die für allgemeine, Cloud-native und technische Computing-Workloads erforderlich ist. AMD vertritt den Standpunkt, dass es keine Einheitsgröße gibt, die für alle passt. Diese neuen AMD EPYC-Prozessoren wurden nach diesem Konzept entwickelt, um eine höhere Leistung für bestimmte Arbeitslasten zu liefern.

AMD Bergamo CPU 9684X und 9754

Anwendungen werden zunehmend für Cloud-native Workloads konzipiert und ermöglichen eine schnelle Entwicklung, Bereitstellung und Aktualisierung. Die AMD EPYC 97X4-Prozessoren mit 128 Kernen können im Vergleich zu Ampere einen besseren Durchsatz und eine bis zu 3.7-mal bessere Leistung für wichtige Cloud-native Workloads liefern.

Modell Farben Maximale Threads Standard-TDP (W) Basisfrequenz (GHz) Boost-Frequenz1 (GHz) L3-Cache (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.20 3.00 256

Die AMD EPYC-Prozessoren der 4. Generation mit 3D V-Cache erfüllen den Bedarf an schnelleren Designiterationen und umfassenden Simulationen und bieten eine erstklassige x86-CPU für technische Rechenaufgaben wie Computational Fluid Dynamics (CFD), Finite-Elemente-Analyse (FEA), Electronic Design Automation (EDA) und Strukturanalyse. Diese Prozessoren verfügen über bis zu 96 „Zen 4“-Kerne und mehr als 1 GB L3-Cache und können die Produktentwicklung erheblich beschleunigen.

Modell Farben Maximale Threads Standard-TDP (W) Basisfrequenz (GHz) Boost-Frequenz1 (GHz) L3-Cache (MB)
9684X 96 192 400W 2.55 3.70 1,152
9384X 32 64 320W 3.10 3.90 768
9184X 16 32 320W 3.55 4.20 768

AMD Bergamo und Genoa-X Benchmarks

Wir haben zwei neue CPUs getestet und eine dritte simuliert, indem wir SMT deaktiviert haben. Im Labor hatten wir den 9754, einen Bergamo-Chip mit 128 Kernen und 256 Threads, und den 9684X, einen Genoa-X-Chip mit 96 Kernen und 192 Threads, gewaltigen 1.1 GB 3D-L3-Cache und einem höheren Takt als der Genoa. Um das dritte zu simulieren, haben wir SMT auf unserem 9754 deaktiviert, da AMD auch den 9754S Bergamo-Chip herausgebracht hat, der ohne Multithreading auskommt und nur aus reinen Kernen besteht. Unser Test des SMT-deaktivierten Chips erfolgt getrennt von diesem Testbericht.

Wir haben umfangreiche Benchmarks durchgeführt, um die Leistung der neu veröffentlichten AMD Bergamo- und Genoa-X-CPUs zu bewerten. Wir begannen mit Cinebench R23-Tests auf Multi- und Single-Core-Konfigurationen, die wertvolle Erkenntnisse über die Rendering-Fähigkeiten dieser Prozessoren lieferten.

Es scheint, dass die Anwendung Cinebench R23 selbst nur begrenzte Möglichkeiten hat, so viele Threads zu verarbeiten. Wir haben eine Obergrenze von 128 Kernen festgestellt, aber der 96-Kern-Genoa-X 3D-Cache glänzt wirklich in seiner Leistung, Themen, die allen Tests gemeinsam sind.

Als nächstes ließen wir y-cruncher auf 1-Milliarden- und 10-Milliarden-Stellenebene laufen, um ihre Rechenleistung zu bewerten, insbesondere für Aufgaben, die ein hohes Maß an Zahlenverarbeitung erfordern.

Hier gilt: Je niedriger, desto besser. Unsere Genoa-Ergebnisse mit 2 Prozessoren und 96 Kernen liegen nach umfangreichem Tuning vor und konnten einige gute Zahlen liefern. Die Standardkonfiguration der Genoa-X- und Bergamo-Chips zeigt vielversprechendes Potenzial für Tuning und Optimierungen, um noch beeindruckendere Rekordwerte zu erzielen.

Anschließend verwendeten wir Blender-Benchmarks, insbesondere die Monster-, Junkshop- und Classroom-Tests, um zu messen, wie gut diese CPUs in grafikintensiven Rendering-Szenarien abschneiden.

Im Blender-Benchmark kam die pure Leistung von 512 Threads voll zur Geltung und lag erneut an der Spitze der Charts mit nur einer Standardkonfiguration.

Zuletzt haben wir Geekbench 6 CPU-Tests durchgeführt, die für ihre umfassende Untersuchung der Prozessorleistung im Single-Core- und Multi-Core-Betrieb bekannt sind. Diese Testreihe lieferte uns einen umfassenden Überblick über die Gesamtfähigkeiten, Stärken und schrittweisen Verbesserungen der AMD Bergamo- und Genoa-X-Prozessoren.

Leistungsübersicht

Hier sind die Rohwerte für jeden der Benchmarks. Denken Sie daran, dass wir Monate Zeit hatten, das 96-Core-Genoa-System abzustimmen und zu konfigurieren, und nur eine Standardkonfiguration des neuen AMD Bergamo ausgeführt haben.

Benchmark 2p/96c Genua 1p/96c Genua-X 1p/128c Bergamo 2p/128c Bergamo
Cinebench R23 Multi 116744 93720 103876 102125
Cinebench R23 Single 1294 1301 1098 1089
Cinebench MP-Verhältnis 90.22 72.04 94.65 93.75
Y-Cruncher 1b 8.882 10.296 9.568 9.184
Y-Cruncher 10b 51.071 72.377 80.171 55.683
Mixer-Monster 1700.647985 879.580323 1031.49474 2038.714424
Blender Junkshop 1101.839271 605.445705 704.167826 1382.575225
Blender-Klassenzimmer 869.476693 421.318478 506.665693 1045.959162
Geekbench 6 CPU Single 2048 2093 1738 1723
Geekbench 6 CPU-Multi 20217 21329 18683 17916

AMD Bergamo für KI

Ausgestattet mit einer Reihe von KI-Inferenz-Engines von erstklassigen Anbietern UL Procyon KI-Inferenz-Benchmark deckt ein breites Spektrum an Hardware-Setups und -Anforderungen ab. Der Benchmark-Score bietet eine praktische und standardisierte Zusammenfassung der Inferenzleistung auf dem Gerät. Dies ermöglicht es uns, verschiedene Hardware-Setups in realen Situationen zu vergleichen und gegenüberzustellen, ohne dass dafür eigene Lösungen erforderlich sind.

Prozessor Modell Durchschnittliche Inferenzzeit Mittlere Inferenzzeit Gesamtzahl der Schlussfolgerungen
2p/96c Genua MobileNet V3 3.61 ms 3.63 ms 45,800
1p/96c Genua-X MobileNet V3 2.71 ms 2.72 ms 58,631
1p/128c Bergamo MobileNet V3 3.90 ms 3.91 ms 41,538
2p/128c Bergamo MobileNet V3 4.10 ms 4.16 ms 40,008
2p/96c Genua ResNet 50 6.36 ms 6.34 ms 26,525
1p/96c Genua-X ResNet 50 6.66 ms 6.64 ms 25,049
1p/128c Bergamo ResNet 50 10.14 ms 10.08 ms 16,919
2p/128c Bergamo ResNet 50 8.21 ms 8.22 ms 20,842
2p/96c Genua Inception V4 25.98 ms 25.99 ms 6,555
1p/96c Genua-X Inception V4 29.19 ms 29.18 ms 5,879
1p/128c Bergamo Inception V4 33.17 ms 33.04 ms 5,158
2p/128c Bergamo Inception V4 30.63 ms 30.68 ms 5,573
2p/96c Genua DeepLab V3 25.51 ms 25.33 ms 5,660
1p/96c Genua-X DeepLab V3 28.26 ms 27.86 ms 5,394
1p/128c Bergamo DeepLab V3 32.16 ms 32.09 ms 4,708
2p/128c Bergamo DeepLab V3 31.16 ms 30.57 ms 4,807
2p/96c Genua YOLO V3 34.10 ms 34.13 ms 4,818
1p/96c Genua-X YOLO V3 43.59 ms 43.58 ms 3,831
1p/128c Bergamo YOLO V3 44.50 ms 44.39 ms 3,739
2p/128c Bergamo YOLO V3 41.35 ms 41.38 ms 4,001
2p/96c Genua Echt-ESRGAN 2540.04 ms 2524.03 ms 71
1p/96c Genua-X Echt-ESRGAN 3725.07 ms 3720.35 ms 49
1p/128c Bergamo Echt-ESRGAN 2734.77 ms 2717.41 ms 66
2p/128c Bergamo Echt-ESRGAN 2291.66 ms 2301.35 ms 79

Abschließende Überlegungen

Unsere Tests mit der neuen AMD Bergamo CPU mit 128 Kernen spiegeln die erwarteten Zuwächse durch den Anstieg der Kernzahl wider. Was die reine Leistung anbelangt, bewältigte die neue CPU daten- und rechenintensive Aufgaben mit einer Leichtigkeit, die fast mühelos schien. Insbesondere unsere Tests mit 3D-Rendering- und Berechnungsanwendungen zeigten die wahre Leistungsfähigkeit dieser zusätzlichen Kerne.

AMD Epyc Bergamo CPU-Server

Wir haben einen deutlichen Anstieg der Verarbeitungsgeschwindigkeiten gegenüber dem Genoa mit 96 Kernen festgestellt, sowohl mit als auch ohne aktiviertem SMT, was die Effizienz des Chiplet-Designs von AMD unterstreicht. Während wir tiefer in die Ära des fortschrittlichen Computings mit ultrahoher Kernanzahl eintauchen, setzt dieses Monster mit 128 Kernen und 256 Threads einen neuen Maßstab in Sachen Rackdichte.

Beteiligen Sie sich an StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed