Home Enterprise AMD EPYC CPU's en AMD Instinct Accelerator van de volgende generatie voor generatieve AI aangekondigd

AMD EPYC CPU's en AMD Instinct Accelerator van de volgende generatie voor generatieve AI aangekondigd

by Harold Frits

AMD gebruikte zijn "Data Center and AI Technology Premiere"-evenement om nieuwe producten aan te kondigen en te delen hoe het bedrijf vorm zal geven aan de volgende fase van datacenterinnovatie. De aankondiging omvat updates voor de 4e generatie EPYC-processorfamilie, de nieuwe AMD Instinct MI300 Series-acceleratorfamilie en een bijgewerkt netwerkportfolio.

AMD gebruikte zijn "Data Center and AI Technology Premiere"-evenement om nieuwe producten aan te kondigen en te delen hoe het bedrijf vorm zal geven aan de volgende fase van datacenterinnovatie. De aankondiging omvat updates voor de 4e generatie EPYC-processorfamilie, de nieuwe AMD Instinct MI300 Series-acceleratorfamilie en een bijgewerkt netwerkportfolio.

4e generatie EPYC-processor geoptimaliseerd voor het moderne datacenter

Updates voor de 4e generatie EPYC-familie die aan het begin van AMD's Data Center en AI Technology Premiere werden onthuld, omvatten werklastspecialisatie die tegemoetkomt aan specifieke zakelijke eisen. AMD introduceerde zijn 4e generatie AMD EPYC 97X4-processors, voorheen codenaam "Bergamo", die een grotere vCPU-dichtheid en betere prestaties bieden voor applicaties die in de cloud draaien.

Model Cores Max. threads Standaard TDP Basis Freq. (GHz) Boost-freq. (GHz) L3-cache (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.2 3.0 256

AMD geeft met deze aankondiging een belangrijke impuls aan het AI-ecosysteem, inclusief de nieuwe 4e generatie AMD EPYC 97X4-processors. Deze processors zijn speciaal ontworpen om te voldoen aan de gespecialiseerde eisen van moderne workloads. Met een indrukwekkend aantal kernen van 128 kernen (nog iemand trek in Pie?), bieden ze ongeëvenaarde rekenkracht voor AI-toepassingen.

AMD Bergamo-CPU

Dankzij het grotere aantal cores, samen met verbeterde energie- en vastgoedefficiëntie, kunnen deze processors complexe AI-berekeningen verwerken en tegelijkertijd tot drie keer meer containers per server ondersteunen. Deze vooruitgang draagt ​​bij aan de groeiende acceptatie van cloud-native AI-applicaties.

Model Cores Max. threads Standaard TDP Basis Freq. (GHz) Boost-freq. (GHz) L3-cache (MB)
9684X 96 192 400W 2.55 3.70 1,152
9384X 32 64 320W 3.10 3.90 768
9184X 16 32 320W 3.55 4.20 768

De nieuwste AMD EPYC Zen 4-processors, uitgerust met 3D V-Cache, codenaam Genoa-X, zijn geïdentificeerd als de toonaangevende x86-server-CPU voor technisch computergebruik in een recente SPEC.org rapport. Deze geavanceerde processors brengen 3D V-Cache naar de 96-core Zen 4-chips en bieden een uitgebreide L3-cache van meer dan 1 GB, wat een snelle productontwikkeling mogelijk maakt. Deze processors, zo beweert AMD, kunnen de productontwikkeling aanzienlijk versnellen, waarbij ze tot wel het dubbele aantal ontwerptaken per dag leveren, terwijl ze minder servers en minder energie gebruiken.

Het AI-platform vooruit helpen

AMD presenteerde zijn plan om zijn AI-platform te verbeteren door klanten een reeks hardwareproducten aan te bieden, van cloud tot edge tot endpoint, en uitgebreide samenwerking met branchesoftware om aanpasbare en wijdverspreide AI-oplossingen te creëren.

AMD heeft details gedeeld van de AMD Instinct MI300 Series-versneller familie, inclusief de AMD Instinct MI300X-versneller, een geavanceerde versneller voor generatieve AI.

De introductie van de AMD Instinct MI300X-versneller is intrigerend. Deze geavanceerde Accelerated Processing Unit (APU) maakt deel uit van AMD's next-gen CDNA 3-acceleratorarchitectuur en beschikt over tot 192 GB HBM3-geheugen. Deze uitgebreide geheugenpool is ontworpen om veeleisende AI-workloads aan te kunnen, met name die met LLM-inferentie (Large Language Model) en generatieve AI. De enorme capaciteit van de MI300X is geschikt voor zelfs de grootste taalmodellen, zoals Falcon-40B, op een enkele GPU-versneller. Dit vertegenwoordigt een potentieel transformerende stap voorwaarts voor AI-verwerking en -efficiëntie.

De introductie van de AMD MI300X op de markt zou NVIDIA's bestaande suprematie mogelijk kunnen verstoren, aangezien het is gemaakt om de regerende marktleider, de NVIDIA H100, uit te dagen. NVIDIA heeft het meerderheidsbelang in dit lucratieve en snelgroeiende marktsegment, met een marktaandeel van ongeveer 60 tot 70 procent in AI-servers. De introductie van zo'n capabele versneller op dit moment zal goed zijn voor het ecosysteem als geheel, dat voornamelijk verbonden is met NVIDIA's CUDA. Een extra 20 procent wordt bijgedragen door op maat gemaakte applicatiespecifieke geïntegreerde chips (ASIC's) gemaakt door cloudserverproviders, waaronder Amazon's Inferentia- en Trainium-chips en Alphabet's tensor processing units (TPU's).

AMD Infinity-architectuurplatform

AMD introduceerde ook het AMD Infinity Architecture Platform, dat acht MI300X-versnellers samenbrengt in een industriestandaard ontwerp voor verbeterde generatieve AI-inferentie en -training.

De MI300X is aan het samplen aan belangrijke klanten vanaf Q3. De eerste APU Accelerator voor HPC- en AI-workloads, de AMD Instinct MI300A, wordt nu gesampled bij klanten.

AMD benadrukte de samenwerking met marktleiders om een ​​open AI-ecosysteem samen te brengen en presenteerde het AMD ROCm-software-ecosysteem voor datacenterversnellers.   

Een netwerkportfolio voor Cloud en Enterprise 

AMD presenteerde ook zijn netwerkportfolio, waaronder de AMD Pensando DPU, AMD NIC's met ultralage latentie en AMD Adaptive NIC. AMD Pensando DPU's combineren een softwarestack met "zero trust security" en een programmeerbare pakketprocessor om creëer een intelligente en performante DPU.

AMD benadrukte de volgende generatie van zijn DPU, met de codenaam "Giglio", die hij wil brengen verbeterde prestaties en energie-efficiëntie in vergelijking met producten van de huidige generatie en zal naar verwachting eind 2023 beschikbaar zijn. 

De laatste aankondiging was gericht op AMD Pensando Software-in-Silicon Developer Kit (SSDK), geven klanten de mogelijkheid om snel services te ontwikkelen of te migreren om te implementeren op de AMD Pensando P4 programmeerbare DPU in coördinatie met de bestaande reeks functies die momenteel zijn geïmplementeerd op het AMD Pensando-platform. De AMD Pensando SSDK stelt klanten in staat om de kracht van de AMD Pensando DPU om te werken en netwerkvirtualisatie en beveiliging aan te passen functies binnen hun infrastructuur. 

4e generatie AMD EPYC-processors 

AMD Instinct-versnellers 

AMD-netwerkoplossingen 

Neem contact op met StorageReview

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed