Im Juni kündigte AMD Aktualisierungen an AMD EPYC-Familie der 4. Generation von Prozessoren, die für spezielle Arbeitslasten konzipiert sind, die zur Erfüllung der Anforderungen von Unternehmen erforderlich sind. Die Ankündigungen erfolgten während der Eröffnung des Rechenzentrums von AMD und der AI-Technologie-Premiere mit der Vorstellung der AMD EPYC 4X97-Prozessoren der 4. Generation, zuvor mit dem Codenamen AMD Bergamo. Die AMD EPYC 97X4-Prozessoren bieten eine höhere vCPU-Dichte und höhere Leistung für KI-Anwendungen und Anwendungen, die in der Cloud ausgeführt werden.
Im Juni kündigte AMD Aktualisierungen an AMD EPYC-Familie der 4. Generation von Prozessoren, die für spezielle Arbeitslasten konzipiert sind, die zur Erfüllung der Anforderungen von Unternehmen erforderlich sind. Die Ankündigungen erfolgten während der Eröffnung des Rechenzentrums von AMD und der AI-Technologie-Premiere mit der Vorstellung der AMD EPYC 4X97-Prozessoren der 4. Generation, zuvor mit dem Codenamen AMD Bergamo. Die AMD EPYC 97X4-Prozessoren bieten eine höhere vCPU-Dichte und höhere Leistung für KI-Anwendungen und Anwendungen, die in der Cloud ausgeführt werden.
AMD Bergamo
Die mit 4D V-Cache ausgestatteten AMD EPYC Zen 3-Prozessoren mit dem Codenamen Genoa-X wurden kürzlich in einer Studie als führende x86-Server-CPU für technische Datenverarbeitung identifiziert SPEC.org Bericht. Diese Prozessoren bringen 3D-V-Cache auf die 96-Kern-Zen-4-Chips und eignen sich ideal für anspruchsvolle technische Rechenaufgaben.
Laut AMD kann die Anpassung der Produkt-Roadmap an die Umgebungen der Kunden die Leistung liefern, die für allgemeine, Cloud-native und technische Computing-Workloads erforderlich ist. AMD vertritt den Standpunkt, dass es keine Einheitsgröße gibt, die für alle passt. Diese neuen AMD EPYC-Prozessoren wurden nach diesem Konzept entwickelt, um eine höhere Leistung für bestimmte Arbeitslasten zu liefern.
Anwendungen werden zunehmend für Cloud-native Workloads konzipiert und ermöglichen eine schnelle Entwicklung, Bereitstellung und Aktualisierung. Die AMD EPYC 97X4-Prozessoren mit 128 Kernen können im Vergleich zu Ampere einen besseren Durchsatz und eine bis zu 3.7-mal bessere Leistung für wichtige Cloud-native Workloads liefern.
Modell | Farben | Maximale Threads | Standard-TDP (W) | Basisfrequenz (GHz) | Boost-Frequenz1 (GHz) | L3-Cache (MB) |
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.20 | 3.00 | 256 |
Die AMD EPYC-Prozessoren der 4. Generation mit 3D V-Cache erfüllen den Bedarf an schnelleren Designiterationen und umfassenden Simulationen und bieten eine erstklassige x86-CPU für technische Rechenaufgaben wie Computational Fluid Dynamics (CFD), Finite-Elemente-Analyse (FEA), Electronic Design Automation (EDA) und Strukturanalyse. Diese Prozessoren verfügen über bis zu 96 „Zen 4“-Kerne und mehr als 1 GB L3-Cache und können die Produktentwicklung erheblich beschleunigen.
Modell | Farben | Maximale Threads | Standard-TDP (W) | Basisfrequenz (GHz) | Boost-Frequenz1 (GHz) | L3-Cache (MB) |
9684X | 96 | 192 | 400W | 2.55 | 3.70 | 1,152 |
9384X | 32 | 64 | 320W | 3.10 | 3.90 | 768 |
9184X | 16 | 32 | 320W | 3.55 | 4.20 | 768 |
AMD Bergamo und Genoa-X Benchmarks
Wir haben zwei neue CPUs getestet und eine dritte simuliert, indem wir SMT deaktiviert haben. Im Labor hatten wir den 9754, einen Bergamo-Chip mit 128 Kernen und 256 Threads, und den 9684X, einen Genoa-X-Chip mit 96 Kernen und 192 Threads, gewaltigen 1.1 GB 3D-L3-Cache und einem höheren Takt als der Genoa. Um das dritte zu simulieren, haben wir SMT auf unserem 9754 deaktiviert, da AMD auch den 9754S Bergamo-Chip herausgebracht hat, der ohne Multithreading auskommt und nur aus reinen Kernen besteht. Unser Test des SMT-deaktivierten Chips erfolgt getrennt von diesem Testbericht.
Wir haben umfangreiche Benchmarks durchgeführt, um die Leistung der neu veröffentlichten AMD Bergamo- und Genoa-X-CPUs zu bewerten. Wir begannen mit Cinebench R23-Tests auf Multi- und Single-Core-Konfigurationen, die wertvolle Erkenntnisse über die Rendering-Fähigkeiten dieser Prozessoren lieferten.
Es scheint, dass die Anwendung Cinebench R23 selbst nur begrenzte Möglichkeiten hat, so viele Threads zu verarbeiten. Wir haben eine Obergrenze von 128 Kernen festgestellt, aber der 96-Kern-Genoa-X 3D-Cache glänzt wirklich in seiner Leistung, Themen, die allen Tests gemeinsam sind.
Als nächstes ließen wir y-cruncher auf 1-Milliarden- und 10-Milliarden-Stellenebene laufen, um ihre Rechenleistung zu bewerten, insbesondere für Aufgaben, die ein hohes Maß an Zahlenverarbeitung erfordern.
Hier gilt: Je niedriger, desto besser. Unsere Genoa-Ergebnisse mit 2 Prozessoren und 96 Kernen liegen nach umfangreichem Tuning vor und konnten einige gute Zahlen liefern. Die Standardkonfiguration der Genoa-X- und Bergamo-Chips zeigt vielversprechendes Potenzial für Tuning und Optimierungen, um noch beeindruckendere Rekordwerte zu erzielen.
Anschließend verwendeten wir Blender-Benchmarks, insbesondere die Monster-, Junkshop- und Classroom-Tests, um zu messen, wie gut diese CPUs in grafikintensiven Rendering-Szenarien abschneiden.
Im Blender-Benchmark kam die pure Leistung von 512 Threads voll zur Geltung und lag erneut an der Spitze der Charts mit nur einer Standardkonfiguration.
Zuletzt haben wir Geekbench 6 CPU-Tests durchgeführt, die für ihre umfassende Untersuchung der Prozessorleistung im Single-Core- und Multi-Core-Betrieb bekannt sind. Diese Testreihe lieferte uns einen umfassenden Überblick über die Gesamtfähigkeiten, Stärken und schrittweisen Verbesserungen der AMD Bergamo- und Genoa-X-Prozessoren.
Leistungsübersicht
Hier sind die Rohwerte für jeden der Benchmarks. Denken Sie daran, dass wir Monate Zeit hatten, das 96-Core-Genoa-System abzustimmen und zu konfigurieren, und nur eine Standardkonfiguration des neuen AMD Bergamo ausgeführt haben.
Benchmark | 2p/96c Genua | 1p/96c Genua-X | 1p/128c Bergamo | 2p/128c Bergamo | |
---|---|---|---|---|---|
Cinebench R23 Multi | 116744 | 93720 | 103876 | 102125 | |
Cinebench R23 Single | 1294 | 1301 | 1098 | 1089 | |
Cinebench MP-Verhältnis | 90.22 | 72.04 | 94.65 | 93.75 | |
Y-Cruncher 1b | 8.882 | 10.296 | 9.568 | 9.184 | |
Y-Cruncher 10b | 51.071 | 72.377 | 80.171 | 55.683 | |
Mixer-Monster | 1700.647985 | 879.580323 | 1031.49474 | 2038.714424 | |
Blender Junkshop | 1101.839271 | 605.445705 | 704.167826 | 1382.575225 | |
Blender-Klassenzimmer | 869.476693 | 421.318478 | 506.665693 | 1045.959162 | |
Geekbench 6 CPU Single | 2048 | 2093 | 1738 | 1723 | |
Geekbench 6 CPU-Multi | 20217 | 21329 | 18683 | 17916 |
AMD Bergamo für KI
Ausgestattet mit einer Reihe von KI-Inferenz-Engines von erstklassigen Anbietern UL Procyon KI-Inferenz-Benchmark deckt ein breites Spektrum an Hardware-Setups und -Anforderungen ab. Der Benchmark-Score bietet eine praktische und standardisierte Zusammenfassung der Inferenzleistung auf dem Gerät. Dies ermöglicht es uns, verschiedene Hardware-Setups in realen Situationen zu vergleichen und gegenüberzustellen, ohne dass dafür eigene Lösungen erforderlich sind.
Prozessor | Modell | Durchschnittliche Inferenzzeit | Mittlere Inferenzzeit | Gesamtzahl der Schlussfolgerungen |
---|---|---|---|---|
2p/96c Genua | MobileNet V3 | 3.61 ms | 3.63 ms | 45,800 |
1p/96c Genua-X | MobileNet V3 | 2.71 ms | 2.72 ms | 58,631 |
1p/128c Bergamo | MobileNet V3 | 3.90 ms | 3.91 ms | 41,538 |
2p/128c Bergamo | MobileNet V3 | 4.10 ms | 4.16 ms | 40,008 |
2p/96c Genua | ResNet 50 | 6.36 ms | 6.34 ms | 26,525 |
1p/96c Genua-X | ResNet 50 | 6.66 ms | 6.64 ms | 25,049 |
1p/128c Bergamo | ResNet 50 | 10.14 ms | 10.08 ms | 16,919 |
2p/128c Bergamo | ResNet 50 | 8.21 ms | 8.22 ms | 20,842 |
2p/96c Genua | Inception V4 | 25.98 ms | 25.99 ms | 6,555 |
1p/96c Genua-X | Inception V4 | 29.19 ms | 29.18 ms | 5,879 |
1p/128c Bergamo | Inception V4 | 33.17 ms | 33.04 ms | 5,158 |
2p/128c Bergamo | Inception V4 | 30.63 ms | 30.68 ms | 5,573 |
2p/96c Genua | DeepLab V3 | 25.51 ms | 25.33 ms | 5,660 |
1p/96c Genua-X | DeepLab V3 | 28.26 ms | 27.86 ms | 5,394 |
1p/128c Bergamo | DeepLab V3 | 32.16 ms | 32.09 ms | 4,708 |
2p/128c Bergamo | DeepLab V3 | 31.16 ms | 30.57 ms | 4,807 |
2p/96c Genua | YOLO V3 | 34.10 ms | 34.13 ms | 4,818 |
1p/96c Genua-X | YOLO V3 | 43.59 ms | 43.58 ms | 3,831 |
1p/128c Bergamo | YOLO V3 | 44.50 ms | 44.39 ms | 3,739 |
2p/128c Bergamo | YOLO V3 | 41.35 ms | 41.38 ms | 4,001 |
2p/96c Genua | Echt-ESRGAN | 2540.04 ms | 2524.03 ms | 71 |
1p/96c Genua-X | Echt-ESRGAN | 3725.07 ms | 3720.35 ms | 49 |
1p/128c Bergamo | Echt-ESRGAN | 2734.77 ms | 2717.41 ms | 66 |
2p/128c Bergamo | Echt-ESRGAN | 2291.66 ms | 2301.35 ms | 79 |
Abschließende Überlegungen
Unsere Tests mit der neuen AMD Bergamo CPU mit 128 Kernen spiegeln die erwarteten Zuwächse durch den Anstieg der Kernzahl wider. Was die reine Leistung anbelangt, bewältigte die neue CPU daten- und rechenintensive Aufgaben mit einer Leichtigkeit, die fast mühelos schien. Insbesondere unsere Tests mit 3D-Rendering- und Berechnungsanwendungen zeigten die wahre Leistungsfähigkeit dieser zusätzlichen Kerne.
Wir haben einen deutlichen Anstieg der Verarbeitungsgeschwindigkeiten gegenüber dem Genoa mit 96 Kernen festgestellt, sowohl mit als auch ohne aktiviertem SMT, was die Effizienz des Chiplet-Designs von AMD unterstreicht. Während wir tiefer in die Ära des fortschrittlichen Computings mit ultrahoher Kernanzahl eintauchen, setzt dieses Monster mit 128 Kernen und 256 Threads einen neuen Maßstab in Sachen Rackdichte.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed