A giugno, AMD ha annunciato aggiornamenti al suo Famiglia AMD EPYC di quarta generazione di processori progettati per carichi di lavoro specializzati necessari per soddisfare le esigenze delle aziende. Gli annunci sono stati fatti durante l'apertura del Data Center e dell'AI Technology Premiere di AMD con la presentazione dei processori AMD EPYC 4X97 di quarta generazione, precedentemente nome in codice AMD Bergamo. I processori AMD EPYC 4X97 forniscono una maggiore densità vCPU e prestazioni migliorate destinate alle applicazioni AI e alle applicazioni in esecuzione nel cloud.
A giugno, AMD ha annunciato aggiornamenti al suo Famiglia AMD EPYC di quarta generazione di processori progettati per carichi di lavoro specializzati necessari per soddisfare le esigenze delle aziende. Gli annunci sono stati fatti durante l'apertura del Data Center e dell'AI Technology Premiere di AMD con la presentazione dei processori AMD EPYC 4X97 di quarta generazione, precedentemente nome in codice AMD Bergamo. I processori AMD EPYC 4X97 forniscono una maggiore densità vCPU e prestazioni migliorate destinate alle applicazioni AI e alle applicazioni in esecuzione nel cloud.
AMD Bergamo
I processori AMD EPYC Zen 4, dotati di 3D V-Cache, nome in codice Genoa-X, sono stati identificati come le principali CPU per server x86 per il calcolo tecnico in un recente SPEC.org rapporto. Questi processori portano 3D V-Cache nei chip Zen 96 a 4 core e sono ideali per carichi di lavoro di elaborazione tecnica impegnativi.
Secondo AMD, allineare la propria roadmap di prodotto agli ambienti dei clienti può fornire le prestazioni necessarie per carichi di lavoro informatici generici, nativi del cloud e tecnici. AMD ha preso la posizione secondo cui una soluzione unica non va bene per tutti. Questi nuovi processori AMD EPYC sono stati progettati attorno a questo concetto per offrire prestazioni migliorate per carichi di lavoro specifici.
Le applicazioni sono sempre più progettate per carichi di lavoro nativi del cloud, consentendo sviluppo, distribuzione e aggiornamenti rapidi. I processori AMD EPYC 97X4, con 128 core, possono offrire un throughput migliore, prestazioni fino a 3.7 volte migliori per i principali carichi di lavoro nativi del cloud rispetto ad Ampere.
Modello | Colori | Numero massimo di thread | TDP predefinito (W) | Frequenza di base (GHz) | Aumenta la frequenza1 (GHz) | Cache L3 (MB) |
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.20 | 3.00 | 256 |
Rispondendo all'esigenza di iterazioni di progettazione più rapide e simulazioni complete, i processori AMD EPYC di quarta generazione con 4D V-Cache offrono una CPU x3 migliore della categoria per carichi di lavoro di elaborazione tecnica come fluidodinamica computazionale (CFD), analisi degli elementi finiti (FEA) , automazione della progettazione elettronica (EDA) e analisi strutturale. Questi processori hanno fino a 86 core "Zen 96" e oltre 4 GB di cache L1 e possono accelerare notevolmente lo sviluppo del prodotto.
Modello | Colori | Numero massimo di thread | TDP predefinito (W) | Frequenza di base (GHz) | Aumenta la frequenza1 (GHz) | Cache L3 (MB) |
9684X | 96 | 192 | 400W | 2.55 | 3.70 | 1,152 |
9384X | 32 | 64 | 320W | 3.10 | 3.90 | 768 |
9184X | 16 | 32 | 320W | 3.55 | 4.20 | 768 |
Benchmark AMD Bergamo e Genoa-X
Abbiamo testato due nuove CPU e simulato una terza disabilitando SMT. In laboratorio avevamo il 9754, un chip Bergamo da 128 core e 256 thread, e il 9684X, un chip Genoa-X da 96 core e 192 thread con un enorme 1.1 GB di cache 3D L3 e un clock superiore rispetto al Genoa. Per simulare il terzo, abbiamo disabilitato SMT sul nostro 9754 poiché AMD ha rilasciato anche il chip 9754S Bergamo, che viene fornito senza multithreading ed è composto solo da core puri. I nostri test del chip con disabilitazione SMT saranno separati da questa recensione.
Abbiamo condotto una vasta serie di benchmark per valutare le prestazioni delle CPU AMD Bergamo e Genoa-X appena rilasciate. Abbiamo iniziato con i test Cinebench R23 su configurazioni multi e single-core, che hanno fornito preziose informazioni sulle capacità di rendering di questi processori.
Sembra che l'applicazione Cinebench R23 sia di per sé limitata nel modo in cui può gestire così tanti thread. Abbiamo notato un limite di 128 core, ma la cache 96D Genoa-X da 3 Core brilla davvero in termini di prestazioni, temi che saranno comuni a tutti i test.
Successivamente, abbiamo eseguito y-cruncher a livelli di 1 e 10 miliardi di cifre per valutare la loro capacità di calcolo, in particolare per attività che comportavano un alto grado di elaborazione dei numeri.
In questo caso più basso è meglio, i risultati dei nostri 2 processori 96 core Genoa sono stati dopo un'approfondita messa a punto e sono stati in grado di ottenere dei buoni numeri, e la configurazione stock di entrambi i chip Genoa-X e Bergamo mostra un potenziale promettente per la messa a punto e la messa a punto da mettere su alcuni numeri da record ancora più impressionanti.
Abbiamo quindi utilizzato i benchmark di Blender, in particolare i test Monster, Junkshop e Classroom, per misurare le prestazioni di queste CPU in scenari di rendering graficamente intensivi.
Nel benchmark di Blender, la potenza pura di 512 thread è stata davvero evidente, ancora una volta in cima alle classifiche con solo una configurazione stock.
Infine, abbiamo eseguito i test CPU Geekbench 6, noti per il loro ampio esame delle prestazioni del processore nelle operazioni single-core e multi-core. Questa serie di test ci ha fornito una visione completa delle capacità complessive, dei punti di forza e del miglioramento incrementale dei processori AMD Bergamo e Genoa-X.
Panoramica delle prestazioni
Ecco i punteggi grezzi per ciascuno dei benchmark. Tieni presente che abbiamo avuto mesi per mettere a punto e configurare il sistema Genoa a 96 core e abbiamo eseguito solo una configurazione stock del nuovo AMD Bergamo.
Segno di riferimento | 2p/96c Genova | 1p/96c Genova-X | 1p/128cBergamo | 2p/128cBergamo | |
---|---|---|---|---|---|
Cinebench R23 Multi | 116744 | 93720 | 103876 | 102125 | |
Cinebench R23 Single | 1294 | 1301 | 1098 | 1089 | |
Rapporto MP Cinebench | 90.22 | 72.04 | 94.65 | 93.75 | |
y-cruncher 1b | 8.882 | 10.296 | 9.568 | 9.184 | |
y-cruncher 10b | 51.071 | 72.377 | 80.171 | 55.683 | |
Mostro del frullatore | 1700.647985 | 879.580323 | 1031.49474 | 2038.714424 | |
Frullatore spazzatura | 1101.839271 | 605.445705 | 704.167826 | 1382.575225 | |
Aula frullatore | 869.476693 | 421.318478 | 506.665693 | 1045.959162 | |
Geekbench 6 CPU singola | 2048 | 2093 | 1738 | 1723 | |
Geekbench 6 CPU Multi | 20217 | 21329 | 18683 | 17916 |
AMD Bergamo per l'IA
Dotato di una serie di motori di inferenza AI di fornitori di alto livello, il Benchmark di inferenza AI UL Procyon soddisfa un ampio spettro di configurazioni e requisiti hardware. Il punteggio benchmark fornisce un riepilogo pratico e standardizzato delle prestazioni di inferenza sul dispositivo. Ciò ci consente di confrontare e contrapporre diverse configurazioni hardware in situazioni reali senza richiedere soluzioni interne.
Processore | Modello | Tempo medio di inferenza | Tempo di inferenza mediano | Conteggio totale delle inferenze |
---|---|---|---|---|
2p/96c Genova | Rete Mobile V3 | ms 3.61 | ms 3.63 | 45,800 |
1p/96c Genova-X | Rete Mobile V3 | ms 2.71 | ms 2.72 | 58,631 |
1p/128cBergamo | Rete Mobile V3 | ms 3.90 | ms 3.91 | 41,538 |
2p/128cBergamo | Rete Mobile V3 | ms 4.10 | ms 4.16 | 40,008 |
2p/96c Genova | Res Net 50 | ms 6.36 | ms 6.34 | 26,525 |
1p/96c Genova-X | Res Net 50 | ms 6.66 | ms 6.64 | 25,049 |
1p/128cBergamo | Res Net 50 | ms 10.14 | ms 10.08 | 16,919 |
2p/128cBergamo | Res Net 50 | ms 8.21 | ms 8.22 | 20,842 |
2p/96c Genova | Inizio V4 | ms 25.98 | ms 25.99 | 6,555 |
1p/96c Genova-X | Inizio V4 | ms 29.19 | ms 29.18 | 5,879 |
1p/128cBergamo | Inizio V4 | ms 33.17 | ms 33.04 | 5,158 |
2p/128cBergamo | Inizio V4 | ms 30.63 | ms 30.68 | 5,573 |
2p/96c Genova | Deep Lab V3 | ms 25.51 | ms 25.33 | 5,660 |
1p/96c Genova-X | Deep Lab V3 | ms 28.26 | ms 27.86 | 5,394 |
1p/128cBergamo | Deep Lab V3 | ms 32.16 | ms 32.09 | 4,708 |
2p/128cBergamo | Deep Lab V3 | ms 31.16 | ms 30.57 | 4,807 |
2p/96c Genova | YOLO V3 | ms 34.10 | ms 34.13 | 4,818 |
1p/96c Genova-X | YOLO V3 | ms 43.59 | ms 43.58 | 3,831 |
1p/128cBergamo | YOLO V3 | ms 44.50 | ms 44.39 | 3,739 |
2p/128cBergamo | YOLO V3 | ms 41.35 | ms 41.38 | 4,001 |
2p/96c Genova | Reale-ESRGAN | ms 2540.04 | ms 2524.03 | 71 |
1p/96c Genova-X | Reale-ESRGAN | ms 3725.07 | ms 3720.35 | 49 |
1p/128cBergamo | Reale-ESRGAN | ms 2734.77 | ms 2717.41 | 66 |
2p/128cBergamo | Reale-ESRGAN | ms 2291.66 | ms 2301.35 | 79 |
Considerazioni finali
I nostri test con la nuova CPU AMD Bergamo da 128 core riflettono i guadagni attesi dall'aumento del numero di core. Per quanto riguarda le prestazioni grezze, la nuova CPU ha gestito dati e attività ad alta intensità di calcolo con una facilità che sembrava quasi senza sforzo. Le nostre prove con applicazioni di rendering e calcolo 3D, in particolare, hanno dimostrato la vera abilità di questi core aggiuntivi.
Abbiamo notato un aumento significativo delle velocità di elaborazione rispetto al Genoa a 96 core, sia con che senza SMT abilitato, evidenziando l'efficienza del design del chiplet di AMD. Mentre ci addentriamo più a fondo nell'era dell'elaborazione avanzata con un numero di core ultra elevato, questo mostro da 128 core e 256 thread stabilisce un nuovo punto di riferimento nella densità del rack.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed