Hem FöretagAI AMD Zen 5 Architecture och XDNA 2 tillkännages

AMD Zen 5 Architecture och XDNA 2 tillkännages

by Jordan Ranous

AMD Zen 5-arkitekturen använder en innovativ modulär design som gör att AMD kan skapa processorer för stationära datorer, servrar, klienter och inbyggda.

AMD:s 2024 Tech Day avslöjade detaljerna bakom de senaste framstegen och täckte en hel del mark, särskilt med deras senaste Zen 5 CPU och XDNA AI-centrerade arkitekturer. Det här evenemanget betonade AMD:s vision att revolutionera AI-effektivitet, kraftprestanda och sömlös integration över flera applikationer, vilket bekräftade dess ledarskap inom högpresterande datorsektorn.

Strategiskt samarbete med Microsoft satte scenen för AMD:s ledarskap inom AI PC-upplevelser, och erbjuder oöverträffad effektivitet, prestanda och integration över ett brett spektrum av applikationer. 5:e generationens EPYC-processorer, med upp till 192 kärnor och 384 trådar, lovar betydande vinster i energieffektivitet och AI-acceleration. Med avancerad grenprediktion, dubbla avkodningsrör och en ny Math Acceleration Unit, säger AMD att Zen 5 levererar en 35 % förbättring av singelkärniga AES-XTS-prestanda och en 32 % ökning av maskininlärningsuppgifter jämfört med sin föregångare. När AMD fortsätter att tänja på gränserna för processorkraft och effektivitet, står Zen 5-arkitekturen redo att revolutionera datacenter- och servermarknaderna.

AMD Zen 5 Event Live

AMD Zen 5-arkitekturen använder en innovativ modulär design som gör att AMD kan skapa produkter skräddarsydda för stationära, server-, klient- och inbäddade applikationer. Att integrera 4nm- och 3nm-processteknologier säkerställer att Zen5-baserade produkter kan leverera optimerad prestanda och energieffektivitet i olika användningsfall.

AMD Zen 5

I AMD:s presentation vid 2024 Tech Day, avslöjade Mark Papermaster betydande framsteg i sin Zen 5-arkitektur, särskilt med fokus på 5:e generationens EPYC-processorer. EPYC-linjen, som ska släppas under andra halvan av 2024, lovar att leverera oöverträffad prestanda och effektivitet, vilket pressar densitets- och prestandamåtten till det yttersta på server- och datacentermarknaderna.

5:e generationens EPYC-processorer har avsevärt ökat antal kärnor och gängningsförmåga. Dessa förbättringar inkluderar även förbättringar av energieffektiviteten, som möjliggjordes genom ett fortsatt partnerskap med TSMC och en optimerad metallstack. Den senare har särskilt förbättrat termisk och elektrisk prestanda. Arkitekturen utnyttjar avancerad AI-acceleration genom att introducera en ny Math Acceleration Unit som lovar upp till 35 % förbättring av AES-XTS-prestanda med en kärna och upp till 32 % i enkärniga maskininlärningsuppgifter jämfört med Zen 4.

De arkitektoniska framstegen i Zen 5 är omfattande. Instruktionshämtnings- och avkodningsstegen har förbättrats med avancerad grenprediktion och dubbla avkodningsrör för att minska latens och förbättra noggrannheten. Heltalsexekveringsenheterna ser en betydande uppgradering med 8-wide dispatch/retire-funktioner och en mer enhetlig ALU-schemaläggare, allt inom ett större exekveringsfönster. Förbättringarna för laddning/lagring inkluderar en 48KB 12-vägs L1-datacache med dubbel maximal bandbredd till både L1-cachen och Flytpunktsenheten, vilket är avgörande för datatunga operationer.

Zen 5-arkitekturen inkluderar också betydande förbättringar av databandbredd. Ladda/lagra framsteg, med en 48KB 12-vägs L1-datacache, har dubbla maximala bandbredden till L1-cachen och Floating-Point Unit, vilket är viktigt för dataintensiva operationer. Arkitekturens förmåga att hantera ett större antal flyttalsinstruktioner under flygning, med AVX-512 och en full 512-bitars dataväg, säkerställer betydande prestandavinster i AI och vektorarbetsbelastningar.

Exekvering av flytande komma- och vektormatematikenheter har också sett betydande förbättringar. AVX-512, med en fullständig 512-bitars dataväg och sex pipelines (som erbjuder två-cyklers latens för flyttalläggsoperationer), förbättrar avsevärt förmågan att hantera samtidiga flyttalsinstruktioner. Detta gynnar särskilt vektor- och AI-arbetsbelastningar, vilket möjliggör betydande prestandaförbättringar i maskininlärning och dataintensiva uppgifter. Detta kontrasterar Zen 4, där AMD "dubbelpumpade" 256-bitars vägen för att uppnå 512-bitars prestanda.

AMD Zen 5 Turin höjdpunkter

Zen 5 ger en genomsnittlig IPC-höjning på 16 % för stationära och mobila processorer jämfört med sin föregångare, Zen 4. Detta uppnås genom arkitektoniska förbättringar, inklusive bredare sändnings- och exekveringsenheter, ökad databandbredd och förbättrade förhämtningsalgoritmer. IPC-vinsterna omvandlas till verkliga prestandaförbättringar i olika applikationer, från spel till innehållsskapande och maskininlärning.

På GPU-fronten fortsätter AMD att optimera sin RDNA 3-arkitektur för effektiv kraftprestanda. AMD hävdar upp till 32 % högre prestanda per watt än tidigare Ryzen-processorer. Detta uppnås genom bättre minneshantering, dubbelhastighets vanliga spelstrukturer och förbättrade energihanteringsfunktioner.

AMD:s Zen 5-arkitektur är en imponerande utveckling av Zen-arkitekturen, speciellt för EPYC-linjen, som lovar att höja prestandastandarderna över hela linjen från stationära och mobila marknader till server- och datacentermarknader. Med betydande förbättringar i antal kärnor, trådning, energieffektivitet och AI-acceleration i vissa chip, är 5:e generationens EPYC-processorer positionerade för att möta de växande kraven från moderna datacentrerade arbetsbelastningar.

XDNA-förlängning

Vamsi Boppana, Senior Vice President för Artificial Intelligence Group, beskrev AMD:s nya AI-centrerade arkitekturs transformativa potential. Den exponentiella tillväxten och specialiseringen av AI-arbetsbelastningar kräver innovativa datorarkitekturer, och AMD:s svar är introduktionen av XDNA 2-arkitekturen.

Kärnan i denna innovation är AMD XDNA-arkitekturen, känd för sitt arv inom olika AI- och DSP-tillämpningar, som spänner över kommunikation, 5G-distribution, försvarsradarsignalbehandling, AI-bearbetning i realtid för 3D-synpunkter och sjukvårdsbildbehandling. Arkitekturen går från traditionella fasta beräkningar och cache-baserade minneshierarkier till en mer flexibel, anpassningsbar modell. Denna rumsliga omkonfigurerbarhet och sida vid sida dataflödesarkitektur möjliggör effektiv multitasking och garanterad realtidsprestanda.

Presentationen lyfte fram AMD:s x86-processor med en integrerad NPU, designad för att leverera hög effektivitet och prestanda för AI-arbetsbelastningar. 3:e generationens AMD Ryzen AI-processorer stoltserar med betydande framsteg i NPU-kapacitet, som uppnår upp till 50 TOPS (biljoner operationer per sekund) och innehåller upp till 12 CPU-kärnor och 16 GPU-beräkningsenheter. Dessa processorer är inställda på att driva över 100 AI-drivna upplevelser över plattformar som Adobe, Black Magic och Topaz Labs, vilket gör dem centrala för nästa generations AI PC-upplevelser.

AI-motorn inom XDNA 2-arkitekturen inkluderar förbättrat stöd för olika datatyper, såsom INT8 och Block FP16, vilket säkerställer hög prestanda och noggrannhet över en rad AI-applikationer. Den adaptiva AI-arkitekturen möjliggör skalbar integration över AMD:s produktportfölj, och erbjuder effektiv multitasking och garanterad realtidsprestanda genom rumslig omkonfigurerbarhet och en sida vid sida med dataflödesarkitektur.

Block FP16, i synnerhet, möjliggör en drop-in-ersättning för FP32-modeller med liten eller ingen precisionsförlust, vilket gör det mycket effektivt för uppgifter som bildgenerering, språkmodeller och realtidsljud- och videobehandling.

AMD Zen 5 och XDNA-arkitektur

En utmärkande funktion är möjligheten att konfigurera XDNA-tyget under körning. Detta möjliggör flexibilitet med datavägar och segmentering av NPU:n för att köra flera modeller av olika storlekar samtidigt. Det ger också flexibiliteten att leverera AI-drivna upplevelser som Copilot+ för ökad produktivitet och uppslukande samarbete. Att integrera den förenade AI-mjukvarustacken över AMD:s CPU-, GPU- och NPU-komponenter möjliggör brett modellstöd och optimerad prestanda, vilket gör det lättare för utvecklare att distribuera tusentals AI-modeller snabbt och effektivt.

AMD XDNA 2-arkitekturen visar ett betydande steg inom AI-teknik. Med upp till åtta samtidiga rumsliga strömmar fördubblar den strömeffektiviteten från tidigare generationer. Detta gör AMD:s lösning kraftfull och mycket effektiv, vilket banar väg för en ny era av AI-tillämpningar på datorer och utanför.

3:e generationens AMD Ryzen AI-processorer har också förbättrad säkerhet genom att introducera nya Trusted IO-funktioner. Denna säkerhetsförbättring är avgörande för att skydda känslig data och säkerställa tillförlitlig prestanda i AI-drivna applikationer, vilket förstärker AMD:s engagemang för säkra och effektiva AI-lösningar.

Specifikationer för AMD Zen 5 och XDNA 2

Zen 5-arkitektur
Leverans Detaljer
Processteknik 4nm och 3nm
Core Count Upp till 192 kärnor
Gäng Count Upp till 384 trådar
Cache 48KB 12-vägs L1-datacache
Bandbredd Dubbla den maximala bandbredden till L1-cache och flytande punktsenhet
Heltalsexekvering 8-bred utsändning/gå i pension, 6 ALU, 3 multiplicerar
Flytande punktutförande AVX-512 med full 512-bitars dataväg, 6 pipelines
AI-acceleration Ny matteaccelerationsenhet
IPC-höjning 16 % genomsnittlig IPC-höjning över Zen 4
Prestandavinster 35 % förbättring i enkelkärnig AES-XTS, 32 % ökning i maskininlärningsuppgifter
Effekt Effektivitet Optimerad för prestanda/watt med förbättrad metallstack
Användningsområden Desktop, mobil, server och datacenter
XDNA 2-arkitektur
AI-motorplattor Upp till 32
AI-prestanda Upp till 50 TOPS
Core Count Upp till 12 CPU-kärnor
GPU Compute Units Upp till 16
Datatyper som stöds INT8, Block FP16
Effektivitet 2x energieffektivitet jämfört med föregående generation
Konkurrentströmmar Upp till 8
Säkerhet Nya Trusted IO-funktioner
Programvara Stack Enhetlig AI-programvara stack över CPU, GPU och NPU
Realtidsprestanda Garanterad realtidsprestanda med rumslig arkitektur
Tillämpningar Spel, underhållning, personlig AI-assistans, innehållsskapande, företagsproduktivitet

Zen 5 Desktop-överklockning med Curve Shaper

AMD:s Curve Optimizer, en kännetecknande funktion från Ryzen 7000-serien, tillåter användare att aktivera PMFW/PBO-medveten dynamisk spänningsskalning eller underspänning. Detta kraftfulla verktyg förskjuter dynamiskt spänningskurvan genom justerbara "Curve Optimizer"-steg, vilket ger variabel spänning över frekvensspektrumet, med mer spänning allokerad vid högre frekvenser. Användare kan tillämpa denna optimering per kärna, per-CCD eller per CPU, vilket möjliggör granulär kontroll över deras CPU:s prestanda och effektivitet.

AMD bygger på grunden för Curve Optimizer och introducerar Curve Shaper, en sofistikerad förbättring som gör det möjligt för användare att omforma de underliggande spänningskurvorna för att maximera underspänningspotentialen. Curve Shaper använder samma steg som sin föregångare. Ändå ger det användarna flexibiliteten att selektivt lägga till eller ta bort steg från 15 distinkta frekvens-temperaturband (tre temperaturband och fem frekvensband). Denna finjusteringskapacitet tillåter användare att minska spänningen i stabila band ytterligare samtidigt som spänningen läggs till i områden där instabilitet observeras. Den omformade kurvan appliceras jämnt över alla kärnor, som kan justeras ytterligare med Curve Optimizer.

Utgående Tankar

AMD Tech Day 2024 var ett fantastiskt evenemang där vi fick den mycket uppskattade möjligheten att dyka djupt med ingenjörerna bakom produkterna. AMD:s senaste framsteg med XDNA 2-arkitekturen och Zen 5-processorer framhäver dess engagemang för att leda AI och högpresterande datorrevolutionen. Med banbrytande förbättringar i antal kärnor, trådning, energieffektivitet och AI-acceleration, är AMD inställd på att omdefiniera industristandarder och möta de växande kraven från moderna datacentrerade arbetsbelastningar, vilket säkerställer omfattande prestanda för stationära, mobila, server- och datacenterapplikationer.

Mer från AMD

Engagera dig med StorageReview

Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde