Home EnterpriseAI AMD Instinct MI300-serie introduceert een nieuwe benadering van de AI Accelerator-architectuur

AMD Instinct MI300-serie introduceert een nieuwe benadering van de AI Accelerator-architectuur

by Jordaan Ranous

De AMD Instinct MI300-serie introduceert een nieuwe benadering van acceleratorarchitectuur voor AI, waarbij geavanceerde technologieën worden gecombineerd om vooruitgang te boeken op het gebied van high-performance computing en kunstmatige intelligentie. Met zijn geavanceerde ontwerp belooft de MI300-serie de grenzen van rekenkracht en efficiëntie te hervormen.

De AMD Instinct MI300-serie introduceert een nieuwe benadering van acceleratorarchitectuur voor AI, waarbij geavanceerde technologieën worden gecombineerd om vooruitgang te boeken op het gebied van high-performance computing en kunstmatige intelligentie. Met zijn geavanceerde ontwerp belooft de MI300-serie de grenzen van rekenkracht en efficiëntie te hervormen.

MI300-familieoverzicht

Er valt hier veel te bespreken, en de nuance tussen de twee is subtiel maar belangrijk.

Specificaties MI300x MI300a
CPU-cores 12 chiplets als één enkel apparaat
• Vier IOD en acht XCD
• Infinity Fabric AP en 3D-verpakking
13 chiplets als één APU
• 8c 16t x86 CPU x 3 CCD's (totaal 24 cores)
• Vier IOD, drie CCD's en zes XCD's
• Infinity Fabric AP en 3D-verpakking
Cachegeheugen (L3) 32 MB L3-cache gedeeld door acht cores Alleen L1 en L2
HBM3-capaciteit 196GB 128GB
Oneindige cache • 256 MB bij 17 TB/s piek-BW
• XCD-bandbreedteversterking
• HBM-vermogensreductie
• Multi-XCD- en CCD-cache-coherentie
• Prefetcher voor CPU-geheugenlatentie
• 256 MB bij 17 TB/s piek-BW
• XCD-bandbreedteversterking
• HBM-vermogensreductie
• Multi-XCD-cache-coherentie
Uniforme architectuur NB Uniforme HBM- en Infinity-cache
• CCD- en XCD-gegevens delen
• Verminderde gegevensbeweging
• Vereenvoudigde programmering

Zen 4 CPU Complex Die (CCD) en verbeteringen

Het hart van de MI300A APU wordt gevormd door de 'Zen 4' CPU Complex Die (CCD), met acht multithreaded AMD 'Zen 4' x86 cores, elk met 1 MB L2-cache en 32 MB gedeelde L3-cache. Deze robuuste architectuur ondersteunt gelijktijdige multithreading (SMT) en bevat essentiële ISA-updates, waaronder BFLOAT16, VNNI en AVX-512, met een 256b datapad. Het geheugensysteem is net zo indrukwekkend, met 48b/48b virtuele/fysieke adresseerbaarheid, wat uitgebreide geheugenondersteuning garandeert.

CDNA 3 rekeneenheid en geheugensysteem

De CDNA 3-rekeneenheid in de MI300-serie introduceert opmerkelijke verbeteringen. Elke Accelerator Complex Die (XCD) herbergt 38 CDNA 3-rekeneenheden, ondersteund door een gedeelde L4-cache van 2 MB en geoptimaliseerde L1-cache voor bytes/FLOP. Deze eenheden ondersteunen een reeks numerieke formaten zoals TF32 en FP8 en voldoen aan de OCP FP8-normen. Het geheugensysteem is ontworpen om de efficiëntie van het delen van gegevens te maximaliseren en de latentie te verminderen, dankzij AMD's innovatieve Infinity Cache en Infinity Fabric Interface.

3.5D Hybrid Bond-verpakking: een sprong in integratie

Een belangrijk hoogtepunt van de MI300-familie is de 3.5D Hybrid Bond-verpakking, die de rekencapaciteit en HBM (High Bandwidth Memory) binnen één pakket aanzienlijk vergroot. Deze verpakkingsmethode biedt dichte, energiezuinige chipletverbindingen, waardoor de algehele efficiëntie op systeemniveau wordt verbeterd. De MI300-serie maakt gebruik van een modulaire constructiebenadering, waardoor flexibele configuraties en schaalbaarheid mogelijk zijn.

Geavanceerd energiebeheer en thermisch ontwerp

Het energiebeheersysteem van de MI300-familie is op maat gemaakt om intensieve computerwerklasten aan te kunnen, met een ontwerpfocus op energie-efficiëntie en warmteafvoer. De unieke thermische architectuur ondersteunt TDP's (Thermal Design Power) van meer dan 550 W, waardoor betrouwbare prestaties worden gegarandeerd, zelfs onder veeleisende omstandigheden. Het stroomafgiftesysteem is ingenieus ontworpen om verschillende gestapelde matrijzen en oriëntaties mogelijk te maken, waardoor een nauwkeurige uitlijning en efficiëntie wordt gegarandeerd.

AMD MI300-prestaties

AMD heeft met zijn Instinct MI300X Platform een ​​interessant product op de markt gebracht en positioneert het als een sterke concurrent van Nvidia's moeilijk te vinden H100 HGX. Het MI300X-platform wordt geleverd met 1.5 TB HBM3-geheugen, wat de geheugencapaciteit van 640 GB van de H100 HGX aanzienlijk overschaduwt, iets waar elke ontwikkelaar blij mee zal zijn. Wat de brute rekenkracht betreft, neemt AMD het voortouw met ongeveer 10.4 petaFLOPS aan FP16/BF16-prestaties, ongeveer 1.3 maal die van de H100 HGX, wat verbeterde efficiëntie voor complexe berekeningen belooft.

Wat de andere belangrijke specificaties betreft, zijn de twee platforms dicht bij pariteit en komen ze overeen met de vooruitgang op het gebied van totale bidirectionele bandbreedte en netwerkinterfacemogelijkheden, die elk tot 400 GbE bieden en pariteit behouden met PCIe Gen 5-interfaces van 128 GB/s. Het duel tussen AMD en NVIDIA vertoont ongekende snelle innovatie in de HPC/AI-sector, terwijl fabrikanten nieuwe technologie blijven uitbrengen om te voldoen aan de groeiende vraag naar meer geheugen en snellere rekenkracht.

Sluiting Gedachten

De AMD Instinct MI300-serie, met zijn geavanceerde modulaire en chiplet-architectuur, krachtige CPU- en GPU-kernen en innovatieve verpakking en energiebeheer, heeft veel te bieden op het gebied van high-performance computing en kunstmatige intelligentie. Het ontwerp weerspiegelt een goed doordachte integratie van kracht, prestaties en efficiëntie, waardoor nieuwe maatstaven worden gezet voor toekomstige computertechnologieën.

Terwijl de computerwereld reikhalzend uitkijkt naar de volledige implementatie van de MI300-serie, zal het interessant zijn om te zien of AMD gelijke tred kan houden met het aanbod en de technologische vooruitgang en tegelijkertijd innovatie in de HPC- en AI-domeinen kan blijven stimuleren. AMD biedt een overtuigende, vergelijkbare oplossing met de MI300-serie.

Neem contact op met StorageReview

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed