Home Enterprise 4e generatie AMD EPYC Review (AMD Genua)

4e generatie AMD EPYC Review (AMD Genua)

by Jordaan Ranous

AMD heeft de algemene beschikbaarheid aangekondigd van de nieuwe EPYC 9004 4e generatie CPU's. De nieuwe reeks CPU's, met de codenaam AMD Genoa, ondersteunt 12 kanalen van DDR5-4800 (tot 6 TB geheugencapaciteit per socket), 128 rijstroken van PCIe Gen5, AMD Infinity Fabric/Guard-technologie en tot 96 cores. Dit maakt ze ideaal voor kritieke workloads in de cloud, enterprise en high-performance computing.

AMD heeft de algemene beschikbaarheid aangekondigd van de nieuwe EPYC 9004 4e generatie CPU's. De nieuwe reeks CPU's, met de codenaam AMD Genoa, ondersteunt 12 kanalen van DDR5-4800 (tot 6 TB geheugencapaciteit per socket), 128 rijstroken van PCIe Gen5, AMD Infinity Fabric/Guard-technologie en tot 96 cores. Dit maakt ze ideaal voor kritieke workloads in de cloud, enterprise en high-performance computing.

Voordelen van EPYC 9004 4e generatie CPU's voor bedrijven

Met het enorme aantal van 96 kernen in een enkele processor, stellen de nieuwe AMD Genoa-processors organisaties in staat hun fysieke voetafdruk te verkleinen door minder servers in te zetten terwijl ze gebruikmaken van krachtigere servers. Dit zorgt voor meer flexibiliteit in de ecosystemen van datacenters en helpt hen doelen op het gebied van duurzaamheid en toekomstbestendigheid te bereiken.

AMD Genoa-server

AMD bouwde hun nieuwe EPYC-processors met een enorme focus op verbeterde beveiliging, met name met de uitbreiding van AMD Infinity Guard, de set functies van het bedrijf die zowel fysieke als virtuele beschermingslagen biedt voor hun CPU's. Het beschikt bijvoorbeeld over tweemaal zoveel coderingssleutels in vergelijking met eerdere generaties, waardoor klanten hun gegevens veilig kunnen houden, of deze nu lokaal, in de cloud of in de opslag zijn opgeslagen.

Organisaties kunnen profiteren van hun "all-in" functieset, met opties om een ​​model te kiezen met het aantal cores en de frequentie (zie onderstaande tabel) die het beste bij hun behoeften passen. Bovendien ondersteunen de 4e generatie AMD EPYC-processors nu DDR5-geheugen en PCIe Gen 5, die beide essentieel zijn voor AI- en ML-toepassingen. Natuurlijk kauwen enterprise SSD-leveranciers op hun best om hun schijven mainstream te maken, waardoor twee keer zoveel bandbreedtepotentieel wordt ontgrendeld als Gen 4.

SKU's uit de AMD Genoa 9004-serie

Model Cores Standaard TDP cTDP Basis (GHz) Boost (GHz)
9654 96 360w 320-400w 2.4 3.7
9634 84 290w 240-300w 2.25 3.7
9554 64 360w 320-400w 3.1 3.75
9534 64 280w 240-300w 2.45 3.7
9454 48 290w 240-300w 2.75 3.8
9354 32 280w 240-300w 3.25 3.8
9334 32 210w 200-240w 2.7 3.9
9254 24 200w 200-240w 2.9 4.15
9224 24 200w 200-240w 2.5 3.7
9124 16 200w 200-240w 3.0 3.7
9474F 48 360w 320-400w 3.6 4.1
9374F 32 320w 320-400w 3.85 4.3
9274F 24 320w 320-400w 4.05 4.3
9174F 16 320w 320-400w 4.1 4.4
9654P 96 360w 320-400w 2.4 3.7
9554P 64 360w 320-400w 3.1 3.75
9454P 48 290w 240-300w 2.75 3.8
9354P 32 280w 240-300w 3.25 3.8

AMD Genua - Zen 4-architectuur

De Zen 4, die afgelopen september is uitgebracht, is de nieuwe microarchitectuur voor de AMD EPYC 9004 CPU's, met AMD's best presterende kern tot nu toe. Dit helpt EPYC 9004-CPU's om nieuwe niveaus van leiderschap op het gebied van prestaties en energie-efficiëntie te bereiken en stelt klanten in staat om de modernisering van datacenters te versnellen voor een grotere applicatiedoorvoer en meer bruikbare inzichten. Zen 4 voedt ook hun nieuwe Ryzen 7000-desktopprocessors voor consumenten.

en genua DRAM

Een van de grotere veranderingen die de Zen 4 met zich meebrengt, is dat het geen DDR4-geheugen meer ondersteunt, omdat het alleen naar DDR5 is verhuisd. Bovendien ondersteunt de Zen 4 nieuwe AMD EXPO SPD-profielen, waardoor meer uitgebreide geheugenafstemming en overklokken door RAM-fabrikanten mogelijk is.

Enkele van de andere nieuwe functies zijn:

  • Snelle privé 1M L2-cache
  • Meer openstaande missers worden ondersteund van L2 tot L3 per kern
  • Meer openstaande missers ondersteund van L3 tot geheugen
  • Verbeterde L3 en L2 missen BW
  • Hogere BW maakt prefetch-verbeteringen mogelijk

Zen 4 microarchitectuur overzicht

Zen 4 versus Zen 3

AMD EPYC 9004-serie verbeteringen ten opzichte van eerdere generaties

De nieuwe AMD Genoa biedt een reeks merkbare verbeteringen, waaronder een toename van het maximale aantal cores tot maar liefst 96 per CPU. Dit is aanzienlijk in vergelijking met de laatste paar generaties:

  • maximaal 64-kernen per CPU met de 7773X en 7763 (3rd Gen EPYC) modellen
  • maximaal 40-kernen per CPU met de 8380 (3rd Gen Xeon Platinum)-model

AMD geeft aan dat dit zich vertaalt naar ongeveer 2.3x de prestaties in vergelijking met de concurrentie (of 1.6x voor prestaties per watt) als het gaat om snellere time-to-oplossingen. Dit zal de grootste prestatieverbetering zijn die we hebben gezien van hun next-gen releases. Voor enterprise business operations per seconde, de 4th Gen AMD verwacht dat hun EPYC-CPU's ~ 2.6x de prestaties bieden, terwijl ze wijzen op een 2.4x prestatieverbetering in weergavesnelheden bij gebruik van Arnold Autodesk.

en genua heatsync

Het biedt ook een aanzienlijke upgrade van de kernprestaties dankzij de Zen 4-architectuur en een potentiële toename van ~ 14 procent in IPC-uplift voor server-CPU's.

De nieuwe EPYC 9004-serie heeft ook leiderschapsplatformmogelijkheden die zijn ingericht voor schaalbaarheid:

  • 12-kanaals DDR5-4800 met verbeterde single-rank prestaties
  • 128L 32Gps en 8L 8Gps multifunctionele SERDES (serializer/deserializer)

Bovendien beschikt het over CXL1.1+ geheugenondersteuning (CXL "Type3"), inclusief geavanceerde geheugenkoppeling voor DDR en opkomend geheugen, evenals SEV-SNP, QoS en gelaagde geheugenbeheeruitbreidingen. Voor verbeterde beveiliging ondersteunt het SEV-SNP-sleutelextensies en AES-256-XTS.

AMD EPYC 9004-serie geheugen

De AMD Genoa CPU's ondersteunen 12 kanalen per CPU, 6TB per socket capaciteit, tot DDR4800, en kunnen theoretisch ook tot 460GB/s in piekbandbreedte bereiken.

Hier is een overzicht van de vergelijkingen tussen de prestaties van de 3e generatie en 4e generatie geheugenbandbreedte:

AMD EPYC 9004-serie CPU-positionering

Net als bij hun vorige generatie heeft AMD hun nieuwe CPU's in drie verschillende groepen ingedeeld:

  • Kernprestaties, die bestaat uit hoogfrequente CPU's met een grote cache/core-verhouding. Modellen die hieronder vallen zijn 9474F (48 cores @ 360W), 9374F (32 cores @ 320W), 9274F (24 cores @ 320W) en 9174F (16 cores @ 320W).
  • Kerndichtheid, die bestaat uit CPU's met het hoogste aantal cores en threads. Modellen die hier onder vallen zijn 9654/P (96 cores @ 360W), 9634 (84 cores @ 290W), 9554/P (64 cores @ 360W), 9534 (64 cores @ 280W) en 9454/P (48 cores @ 290W ).
  • Evenwichtige en geoptimaliseerde prestaties, die bestaat uit CPU's met een balans tussen prestaties en TCO. Modellen die hieronder vallen zijn 9354/P (32 cores @ 280W), 9334 (32 cores @ 210W), 9254 (24 cores @ 200W), 9224 (24 cores @ 200W) en 9124 (16 cores @ 200W).

AMD Genua 9004 CPU-prestaties

Benchmarking configuratie

Voor onze eerste tests hebben we de huidige top-end Intel- en AMD-platforms tegen elkaar geplaatst in een eerste reeks CPU-intensieve workloads. Voor ons Intel-platform hebben we ons initiële dual-CPU Intel 8380-platform, gebouwd rond een Intel OEM-server, gebruikt tegen ons dual-CPU AMD EPYC 9654-platform in een Quanta-chassis.

Specificaties Intel-platform:
2 x Intel Xeon Platinum 8380 40-core CPU's
16 x 32 GB 3200 MHz DDR4
Windows Server 2022-besturingssysteem

AMD-platformspecificaties:
2 x AMD EPYC 9654 96-core CPU's
24 x 64 GB 4800 MHz DDR5
Windows Server 2022-besturingssysteem

V-Ray

V-Ray Benchmark is een applicatie van Chaos Group om verschillende CPU's en GPU's te scoren en te vergelijken. Chaos Group staat bekend om zijn werk rond visualisaties en weergave, gespecialiseerd in ray tracing-technologie. De V-Ray Benchmark bevat een op maat gemaakte testscène om elke combinatie van CPU en GPU te testen en de prestaties van een systeem met die van een ander te vergelijken.

In ons lab hebben we de V-Ray-benchmark gebruikt in de modus voor alleen CPU. Om mogelijke knelpunten te minimaliseren, gebruikten we een Solidigm P5520 7.68TB NVMe SSD en een schone installatie van Windows Server 2022. De top van het leaderboard voor V-Ray was voorheen een 2x AMD EPYC 7K83 64-Core processorsysteem dat een indrukwekkende 100,844 gemiddeld over 6 tests. Ons samplesysteem met 2x AMD EPYC Genoa 96-Core scoorde gemiddeld 126,940 over 9 tests. Vergeleken met het Intel-systeem

Firefox gebouwd vanaf de bron

Firefox, de browser van Mozilla, is een enorm open-sourceproject. Mozilla wil u graag de mogelijkheid bieden om het project zelf uit de broncode samen te stellen, iets dat alomtegenwoordiger is geworden als hulpmiddel om prestaties te vergelijken. De download hiervoor is in de verschillende gigabytes met duizenden bestanden die moeten worden gecompileerd.

In onze tests waren we meer dan onder de indruk van de tijd van 6 minuten en 57 seconden van de Intel Xeon 8380-rig, totdat we hem afvuurden op de Genoa-rig, die binnenkwam met een waanzinnig snelle 6 minuten 33- tweede compilatietijd. Ter vergelijking: een eersteklas werkstation zal deze taak in nauwelijks minder dan 10 minuten kunnen voltooien als je het een vast dieet van vloeibare stikstof en een te hoog voltage geeft, wat betekent dat we te maken hebben met serieuze brute pk's uit de poort met deze fiches.

FF Bouw vanaf de bron
2 x AMD 9654 96-core 6:33.85
2 x Intel 8380 40-core 6:57.85

Blender - CLI-benchmark

Blender Benchmark is een gevestigde standaard in de CPU- en GPU-benchmarkingscène. Blender is een open-source 3D-modellerings- en animatietool die zeer geavanceerd is en wordt beschouwd als een leider in de ruimte. In overeenstemming met het thema van de Genoa EPYC-processors, gebruiken we het om de flexibiliteit te demonstreren van een gemengde architectuur die geschikt is voor een CPU en een potentiële GPU-stand-in voor rackimplementaties met hoge dichtheid.

Blender heeft drie benchmarks, bekend als Monster, Junkshop en Classroom. Dit zijn drie scènes die opeenvolgend worden weergegeven en een score krijgen voor elke sectie, die vervolgens wordt opgeteld voor een totale score.

Blender-test 2 x AMD 9654 96-core 2 x Intel 8380 40-core
Monster 1788.189128 671.145395
Junkshop 1062.533142 407.141514
Klas 850.646333 320.507039
Totaal 3701.368603 1398.793948

De Genua-installatie scoorde in totaal een verpletterende 3701, met 1788.2 in Monster, 1062.5 in Junkshop en 850.6 in de Classroom-benchmark. Het vergelijken van Genua met de Intel Xeon Platinum lijkt in sommige opzichten misschien oneerlijk, aangezien Intel slechts aan slag komt met ongeveer 41 procent van het aantal kernen, maar als we naar de gegevens kijken en normaliseren voor het verschil in aantal kernen, worden de resultaten interessant . De AMD Genoa-chip is dankzij zijn nieuwere architectuur, instructiesets en gebruik van DDR5 ongeveer 10 procent sneller dan de Intel-machine.

2 x AMD 9654 96-core Relatief percentage Intel Core Count 2 x Intel 8380 40-core
192 Core 41.67 procent 80 Core
384 Thread 41.67 procent 160 Thread

 

2 x AMD 9654 96-core 2 x Intel 8380 40-core
Blender totaalscore 3701 1399
Kernen / draden 192/384 80/160
Intel Core-telling/AMD 41.67 procent
Directe scorevergelijking Intel/AMD 37.79 procent
Core genormaliseerde AMD-score 1542
Relatieve Intel/AMD, Core genormaliseerd 90.70 procent

Cinebench R23

Cinebench van Maxon is al geruime tijd een steunpilaar van benchmarking, dankzij de gestandaardiseerde testmethodologie en het gebruik van real-world tests om multicore- en single-coreprestaties te benchmarken. R23, de nieuwste iteratie van Cinebench, heeft een beperking waar we eerder niet omheen hoefden te werken; Het is alleen in staat om 256 cores/threads te benchmarken. Onze testopstelling heeft 384. Interessant genoeg waren er veel "standaard" benchmarks en applicaties die we tegenkwamen met een kernlimiet van 256, dus Cinebench is niet de enige die een update nodig heeft voor de ultra-core-count toekomst die we tegemoet gaan richting.

Om deze beperking aan te pakken, hebben we twee tests tegelijk uitgevoerd en elke instantie beperkt tot 196 threads om te proberen de belasting gelijkmatig te verdelen. Gewoonlijk kunt u de CPU-affiniteit instellen in Taakbeheer, maar iets blokkeerde deze bewerking met Cinebench, we vermoeden dat het een vlag is die is ingesteld in de onderliggende manier waarop de API wordt aangeroepen voor CPU-prioriteit. We hebben geprobeerd het uit te voeren als minder bevoorrechte gebruikers en te starten met de opdrachtregel "start /affinity NODE 0" -vlag om het te forceren, maar we konden de applicatie niet vergrendelen op een enkele NUMA Node.

Omdat we geen specifieke affiniteit voor het programma konden toewijzen, hebben we de applicatie twee keer uitgevoerd en samen gestart. De resultaten toonden twee drastisch verschillende scores van de twee instanties van de app, maar door het CPU-gebruik te monitoren, konden we zien dat het tijdens de test tussen de 80 en 100 procent werd gebruikt.

Cinebench enkele instantie 2 x AMD 9654 96-core 2 x Intel 8380 40-core
Meerdraads (256 dop) 85,160 70,540
Single Core 972 985
MP-verhouding 87.65x 71.63x

 

2 Cinebench-instanties
AMD-testrun 1 AMD-testrun 2
Scoren, 1e aanleg 82,063 68,231
Scoren, 2e aanleg 57,557 57,221
Totaal 139,620 125,452

Conclusie

Het benchmarkingproces van de AMD EPYC 9004 CPU's was op zijn zachtst gezegd een interessante oefening. De uitdagingen waarmee we in het vroege beoordelingsproces werden geconfronteerd, zijn indicatief voor de algemene uitdagingen waarmee softwareontwikkelaars te maken zullen krijgen naarmate het CPU-landschap verschuift naar het model met ultrahoge dichtheid. Hoewel er een aantal kant-en-klare toepassingen zijn die er gebruik van kunnen maken, ontdekten we steeds vaker dat er limieten waren aan software die niet in staat was om bepaalde drempels voor het aantal threads te overschrijden.

In het lab werken we aan enkele Tensorflow Machine Learning-benchmarks van eigen bodem om deze nieuwe CPU's in real-world scenario's te kunnen testen. We zullen de resultaten opvolgen wanneer we vertrouwen hebben in de resultaten van de nieuwe applicatie en deze hebben gevalideerd op meerdere platforms en generaties CPU's.

Voorlopig is de lancering van AMD Genoa echter erg spannend, zoals we tot nu toe hebben gezien met de Quanta-server. Plus, HPE en Dell hebben hun servers aangekondigd, elk met vier systemen, twee 1 CPU-chassis en twee 2 CPU-chassis. Dit zal AMD Genoa onmiddellijk naar de onderneming brengen, waardoor de voetafdruk van Genua snel wordt uitgebreid voorbij alleen de hyperscalers.

amd genua kale cpu

De grote vraag is dan duidelijk: is AMD Genoa de investering waard? Dit komt neer op werkdruk in termen van rechtvaardiging van de uitgaven, maar net als DPU's voor VMware, hebben deze nieuwe CPU-technologieën veel te bieden op het gebied van rekenkracht, beveiliging en efficiëntie. Het vervangen van de 3e generatie EPYC door deze is waarschijnlijk een beetje voorbarig, maar iedereen die heeft gewacht op een reden om te springen, zou heel blij moeten zijn om te zien wat Genua naar de tafel heeft gebracht.

We hebben nog veel meer testen en werk te doen en met de komst van Intel Sapphire Rapids willen we het beste dat elk te bieden heeft, vergelijken. Maar voor nu is AMD Genoa buitengewoon aantrekkelijk en zou in elke PoC voor het vernieuwen van de infrastructuur moeten zitten, zodat organisaties de impact van al deze cores en efficiëntie die AMD te bieden heeft beter kunnen begrijpen.

AMD Launch-video

Neem contact op met StorageReview

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed