AMD ha annunciato la disponibilità generale delle nuove CPU EPYC 9004 di quarta generazione. Nome in codice AMD Genoa, la nuova linea di CPU supporta 4 canali DDR12-5 (capacità di memoria fino a 4800 TB per socket), 6 corsie PCIe Gen128, tecnologia AMD Infinity Fabric/Guard e fino a 5 core. Ciò li rende ideali per carichi di lavoro critici su cloud, aziende e computing ad alte prestazioni.
AMD ha annunciato la disponibilità generale delle nuove CPU EPYC 9004 di quarta generazione. Nome in codice AMD Genoa, la nuova linea di CPU supporta 4 canali DDR12-5 (capacità di memoria fino a 4800 TB per socket), 6 corsie PCIe Gen128, tecnologia AMD Infinity Fabric/Guard e fino a 5 core. Ciò li rende ideali per carichi di lavoro critici su cloud, aziende e computing ad alte prestazioni.
Vantaggi delle CPU EPYC 9004 di quarta generazione per le aziende
Con il loro enorme numero di 96 core in un singolo processore, i nuovi processori AMD Genoa consentiranno alle organizzazioni di ridurre il proprio ingombro fisico implementando meno server e sfruttando server più potenti. Ciò apporta maggiore flessibilità agli ecosistemi dei data center e li aiuta a raggiungere obiettivi di sostenibilità e a prova di futuro.
AMD ha costruito i suoi nuovi processori EPYC con un'attenzione particolare alla maggiore sicurezza, in particolare con l'espansione di AMD Infinity Guard, il set di funzionalità dell'azienda che offre livelli di protezione sia fisici che virtuali alle loro CPU. Ad esempio, presenta il doppio del numero di chiavi di crittografia rispetto alle generazioni precedenti, il che aiuta i clienti a mantenere i propri dati al sicuro sia che siano archiviati localmente, nel cloud o che risiedano nello spazio di archiviazione.
Le organizzazioni potranno beneficiare del loro set di funzionalità “tutto compreso”, con la possibilità di scegliere un modello con il numero di core e la frequenza (vedere la tabella seguente) che meglio si adatta alle loro esigenze. Inoltre, i processori AMD EPYC di quarta generazione ora supportano la memoria DDR4 e PCIe Gen 5, entrambi vitali per le applicazioni AI e ML. Naturalmente, i fornitori di SSD aziendali si stanno dando da fare per portare le loro unità sul mercato mainstream, sbloccando il doppio del potenziale di larghezza di banda rispetto alla Gen 5.
SKU AMD Genoa serie 9004
Modello | Colori | TDP predefinito | cTDP | Base (GHz) | Potenziamento (GHz) |
9654 | 96 | 360w | 320-400w | 2.4 | 3.7 |
9634 | 84 | 290w | 240-300w | 2.25 | 3.7 |
9554 | 64 | 360w | 320-400w | 3.1 | 3.75 |
9534 | 64 | 280w | 240-300w | 2.45 | 3.7 |
9454 | 48 | 290w | 240-300w | 2.75 | 3.8 |
9354 | 32 | 280w | 240-300w | 3.25 | 3.8 |
9334 | 32 | 210w | 200-240w | 2.7 | 3.9 |
9254 | 24 | 200w | 200-240w | 2.9 | 4.15 |
9224 | 24 | 200w | 200-240w | 2.5 | 3.7 |
9124 | 16 | 200w | 200-240w | 3.0 | 3.7 |
9474F | 48 | 360w | 320-400w | 3.6 | 4.1 |
9374F | 32 | 320w | 320-400w | 3.85 | 4.3 |
9274F | 24 | 320w | 320-400w | 4.05 | 4.3 |
9174F | 16 | 320w | 320-400w | 4.1 | 4.4 |
9654P | 96 | 360w | 320-400w | 2.4 | 3.7 |
9554P | 64 | 360w | 320-400w | 3.1 | 3.75 |
9454P | 48 | 290w | 240-300w | 2.75 | 3.8 |
9354P | 32 | 280w | 240-300w | 3.25 | 3.8 |
AMD Genova – Architettura Zen 4
Rilasciata lo scorso settembre, Zen 4 è la nuova microarchitettura per le CPU AMD EPYC 9004, dotata del core AMD con le prestazioni più elevate fino ad oggi. Ciò aiuta le CPU EPYC 9004 a fornire nuovi livelli di leadership in termini di prestazioni ed efficienza energetica e consente ai clienti di accelerare la modernizzazione del data center per una maggiore produttività delle applicazioni e informazioni più fruibili. Zen 4 alimenta anche i nuovi processori desktop Ryzen 7000 di livello consumer.
Uno dei cambiamenti più grandi apportati da Zen 4 è che non supporta più la memoria DDR4, poiché è passata esclusivamente a DDR5. Inoltre, Zen 4 supporta i nuovi profili AMD EXPO SPD, consentendo una regolazione della memoria e un overclocking più completi da parte dei produttori di RAM.
Alcune delle altre nuove funzionalità includono:
- Cache L1 privata veloce da 2 milione
- Altri errori eccezionali supportati da L2 a L3 per core
- Altri errori eccezionali supportati da L3 alla memoria
- L3 e L2 migliorati perdono BW
- Un BW più elevato consente miglioramenti al precaricamento
Panoramica della microarchitettura Zen 4
Zen 4 contro Zen 3
Miglioramenti della serie AMD EPYC 9004 rispetto alle generazioni precedenti
La nuova AMD Genoa offre una serie di notevoli miglioramenti, incluso un aumento del numero massimo di core fino a un enorme 96 per CPU. Questo è significativo rispetto alle ultime generazioni:
- Massimo Nuclei 64 per CPU con 7773X e 7763 (3rd modelli Gen EPYC).
- Massimo Nuclei 40 per CPU con l'8380 (3rd modello Gen Xeon Platinum).
AMD indica che ciò si tradurrà in circa 2.3 volte le prestazioni rispetto alla concorrenza (o 1.6 volte in termini di prestazioni per watt) quando si tratta di tempi di realizzazione più rapidi. Questo sarà il più grande incremento delle prestazioni complessive che abbiamo visto dalle loro versioni di nuova generazione. Per le operazioni aziendali al secondo, il valore 4th La generazione AMD prevede che le proprie CPU EPYC offrano prestazioni circa 2.6 volte superiori, suggerendo un aumento delle prestazioni di 2.4 volte nella velocità di rendering quando si utilizza Arnold Autodesk.
Offre inoltre un significativo miglioramento delle prestazioni core grazie all'architettura Zen 4 e un potenziale aumento di circa il 14% nell'incremento IPC per le CPU dei server.
La nuova serie EPYC 9004 dispone inoltre di funzionalità di piattaforma di leadership predisposte per la scalabilità:
- DDR12-5 a 4800 canali con prestazioni single-rank migliorate
- SERDES multifunzione 128L 32Gps e 8L 8Gps (serializzatore/deserializzatore)
Inoltre, presenta il supporto di memoria CXL1.1+ (CXL "Type3"), che include funzionalità avanzate di collegamento della memoria per DDR e memoria emergente, nonché SEV-SNP, QoS ed estensioni di gestione della memoria a più livelli. Per una maggiore sicurezza, supporta le estensioni chiave SEV-SNP e AES-256-XTS.
Memoria AMD EPYC serie 9004
Le CPU AMD Genoa supportano 12 canali per CPU, 6TB di capacità per socket, fino a DDR4800, e possono anche teoricamente raggiungere fino a 460GB/s di larghezza di banda di picco.
Ecco uno sguardo sintetico ai confronti tra le prestazioni della larghezza di banda della memoria di terza e quarta generazione:
Posizionamento della CPU AMD EPYC serie 9004
Come nella generazione precedente, AMD ha classificato le nuove CPU in tre diversi gruppi:
- Prestazioni principali, che comprende CPU ad alta frequenza con un ampio rapporto cache/core. I modelli che rientrano in questo ambito includono 9474F (48 core a 360 W), 9374F (32 core a 320 W), 9274F (24 core a 320 W) e 9174F (16 core a 320 W).
- Densità del nucleo, che comprende le CPU con il numero di core e thread più elevato. I modelli che rientrano in questo ambito includono 9654/P (96 core a 360 W), 9634 (84 core a 290 W), 9554/P (64 core a 360 W), 9534 (64 core a 280 W) e 9454/P (48 core a 290 W) ).
- Prestazioni bilanciate e ottimizzate, che comprende CPU che presentano un equilibrio tra prestazioni e TCO. I modelli che rientrano in questo ambito includono 9354/P (32 core a 280 W), 9334 (32 core a 210 W), 9254 (24 core a 200 W), 9224 (24 core a 200 W) e 9124 (16 core a 200 W).
Prestazioni della CPU AMD Genoa 9004
Configurazione di benchmarking
Per i nostri test iniziali, abbiamo posizionato le attuali piattaforme Intel e AMD di fascia alta l'una contro l'altra in un lotto iniziale di carichi di lavoro ad uso intensivo della CPU. Per la nostra piattaforma Intel, abbiamo sfruttato la nostra piattaforma iniziale Intel 8380 a doppia CPU costruita attorno a un server Intel OEM rispetto alla nostra piattaforma AMD EPYC 9654 a doppia CPU all'interno di uno chassis Quanta.
Specifiche della piattaforma Intel:
2 CPU Intel Xeon Platinum 8380 a 40 core
16 DDR32 da 3200 GB a 4 MHz
Sistema operativo Windows Server 2022
Specifiche della piattaforma AMD:
2 CPU AMD EPYC 9654 a 96 core
24 DDR64 da 4800 GB a 5 MHz
Sistema operativo Windows Server 2022
V-Ray
V-Ray Benchmark è un'applicazione di Chaos Group per valutare e confrontare varie CPU e GPU. Chaos Group è noto per il suo lavoro su visualizzazioni e rendering specializzato nella tecnologia di ray tracing. Il V-Ray Benchmark contiene una scena di test di build personalizzata per testare qualsiasi combinazione di CPU e GPU e confrontare le prestazioni di un sistema con un altro.
Nel nostro laboratorio abbiamo utilizzato il benchmark V-Ray in modalità solo CPU. Per ridurre al minimo eventuali colli di bottiglia, abbiamo utilizzato un SSD NVMe Solidigm P5520 da 7.68 TB e un'installazione pulita di Windows Server 2022. In cima alla classifica per V-Ray c'era in precedenza un sistema di processore 2x AMD EPYC 7K83 a 64 core che ha ottenuto un impressionante media di 100,844 in 6 test. Il nostro sistema campione con 2x AMD EPYC Genoa 96-Core ha ottenuto una media di 126,940 in 9 test. Rispetto al sistema Intel
Firefox creato dalla sorgente
Firefox, il browser di Mozilla, è un enorme progetto open source. Mozilla desidera offrirti la possibilità di compilare tu stesso il progetto dal codice sorgente, qualcosa che è diventato più onnipresente come strumento per confrontare le prestazioni. Il download per questo è di diversi gigabyte con migliaia di file da compilare.
Nei nostri test, siamo rimasti più che impressionati dal tempo di 6 minuti e 57 secondi dell'impianto Intel Xeon 8380, fino a quando non l'abbiamo acceso sull'impianto Genoa, che è arrivato ad un follemente veloce 6 minuti 33- secondo tempo di compilazione. Per fare un confronto, una workstation di alto livello sarà in grado di completare questo compito in poco meno di 10 minuti se la nutrite con una dieta costante di azoto liquido e tensione in eccesso, il che significa che abbiamo a che fare con una notevole potenza grezza pronta all'uso con queste patatine.
FF Compila dal sorgente | |
2 AMD 9654 a 96 core | 6:33.85 |
2 Intel 8380 40 core | 6:57.85 |
Blender: punto di riferimento della CLI
Blender Benchmark è uno standard consolidato nella scena del benchmarking di CPU e GPU. Blender è uno strumento di modellazione e animazione 3D open source altamente avanzato e considerato leader nel settore. Coerentemente con il tema dei processori Genoa EPYC, lo stiamo utilizzando per mostrare la flessibilità di avere un'architettura mista in grado di supportare una CPU e una potenziale GPU sostitutiva per implementazioni in rack ad alta densità.
Blender ha tre benchmark, noti come Monster, Junkshop e Classroom. Si tratta di tre scene riprodotte in sequenza e a cui viene assegnato un punteggio per ciascuna sezione, che viene poi sommato per ottenere un punteggio totale.
Prova del frullatore | 2 AMD 9654 a 96 core | 2 Intel 8380 40 core |
Mostro | 1788.189128 | 671.145395 |
Rigattiere | 1062.533142 | 407.141514 |
Aula | 850.646333 | 320.507039 |
Totale | 3701.368603 | 1398.793948 |
L'impianto di Genova ha ottenuto un totale schiacciante di 3701, con 1788.2 in Monster, 1062.5 in Junkshop e 850.6 sul benchmark Classroom. Confrontare il Genoa con l'Intel Xeon Platinum può sembrare ingiusto in qualche modo, considerando che Intel arriva solo con circa il 41% del numero di core, tuttavia, se guardiamo i dati e normalizziamo la differenza nel numero di core, i risultati diventano interessanti. . Il chip AMD Genoa, grazie alla sua nuova architettura, ai set di istruzioni e all'uso di DDR5, è circa il 10% più veloce dell'impianto Intel.
2 AMD 9654 a 96 core | Percentuale relativa del conteggio dei core Intel | 2 Intel 8380 40 core |
192 Core | 41.67 per cento | 80 Core |
384 Discussione | 41.67 per cento | 160 Discussione |
2 AMD 9654 a 96 core | 2 Intel 8380 40 core | |
Punteggio totale di Blender | 3701 | 1399 |
Anime / fili | 192/384 | 80/160 |
Conteggio Intel Core/AMD | 41.67 per cento | |
Confronto diretto dei punteggi Intel/AMD | 37.79 per cento | |
Punteggio AMD normalizzato core | 1542 | |
Intel/AMD relativo, core normalizzato | 90.70 per cento |
Cinebench R23
Cinebench di Maxon è ormai da tempo un pilastro del benchmarking, grazie alla sua metodologia di test standardizzata e all'uso di test reali per valutare le prestazioni multicore e single-core. R23, l'ultima iterazione di Cinebench, presenta una limitazione che non abbiamo dovuto aggirare in precedenza; È in grado di eseguire il benchmarking solo di 256 core/thread. Il nostro banco di prova ne ha 384. È interessante notare che ci sono stati molti benchmark e applicazioni "standard" in cui ci siamo imbattuti che avevano un limite massimo di core a 256, quindi Cinebench non è il solo ad aver bisogno di un aggiornamento per il futuro di ultra-core a cui siamo diretti. in direzione.
Per tentare di risolvere questa limitazione abbiamo eseguito due test simultaneamente e abbiamo limitato ciascuna istanza a 196 thread per provare a dividere equamente il carico. Di solito, è possibile impostare l'affinità della CPU nel Task Manager, tuttavia, qualcosa bloccava questa operazione con Cinebench, sospettiamo che si tratti di un flag impostato nel modo sottostante in cui l'API viene chiamata per la priorità della CPU. Abbiamo provato a eseguirlo come utenti con meno privilegi e ad avviarlo con il flag "start /affinity NODE 0" della riga di comando per provare a forzarlo, ma non siamo riusciti a bloccare l'applicazione su un singolo nodo NUMA.
Impossibile assegnare un'affinità specifica per il programma, abbiamo semplicemente eseguito l'applicazione due volte e le abbiamo avviate insieme. I risultati hanno mostrato due punteggi drasticamente diversi dalle due istanze dell'app, tuttavia monitorando l'utilizzo della CPU siamo stati in grado di osservare un rimbalzo tra l'80 e il 100% di utilizzo durante il test.
Istanza singola Cinebench | 2 AMD 9654 a 96 core | 2 Intel 8380 40 core |
Multifilo (256 cap) | 85,160 | 70,540 |
Single Core | 972 | 985 |
Rapporto MP | 87.65x | 71.63x |
2 istanze Cinebench | ||
Esecuzione del test AMD 1 | Esecuzione del test AMD 2 | |
Punteggio, 1a istanza | 82,063 | 68,231 |
Punteggio, 2a istanza | 57,557 | 57,221 |
Totale | 139,620 | 125,452 |
Considerazioni finali
Il processo di benchmarking delle CPU AMD EPYC 9004 è stato un esercizio a dir poco interessante. Le sfide che abbiamo affrontato nel processo di revisione iniziale sono indicative delle sfide generali che gli sviluppatori di software dovranno affrontare man mano che il panorama delle CPU si sposta verso il modello ad altissima densità. Sebbene esistano alcune applicazioni standard che possono utilizzarlo, abbiamo riscontrato sempre più limiti di software che non sono in grado di superare alcune soglie di numero di thread.
In laboratorio stiamo lavorando su alcuni benchmark interni di Tensorflow Machine Learning per poter testare queste nuove CPU in scenari reali. Seguiremo i risultati quando avremo fiducia nei risultati della nuova applicazione e la avremo convalidata su più piattaforme e generazioni di CPU.
Per ora, però, il lancio di AMD Genoa è molto entusiasmante, come abbiamo visto finora con il server Quanta. Più, HPE che a conca hanno annunciato i loro server, ciascuno dei quali offre quattro sistemi, due chassis da 1 CPU e due chassis da 2 CPU. Ciò porterà immediatamente AMD Genoa all’interno dell’azienda, espandendo rapidamente l’impronta di Genoa oltre i soli hyperscaler.
La grande domanda quindi è ovvia: vale la pena investire in AMD Genoa? Ciò si ridurrà al carico di lavoro in termini di giustificazione della spesa, ma proprio così DPU per VMware, queste nuove tecnologie di CPU hanno molto da offrire in termini di potenza di calcolo, sicurezza ed efficienza. Sostituire l’EPYC di terza generazione con questi è probabilmente un po’ prematuro, ma chiunque stesse aspettando un motivo per saltare dovrebbe essere molto felice di vedere cosa ha portato il Genoa in tavola.
Abbiamo molti più test e lavoro da svolgere e, con l'imminente arrivo di Intel Sapphire Rapids, vorremo confrontare il meglio che ciascuno di essi ha da offrire. Ma per ora, AMD Genoa è estremamente interessante e dovrebbe essere presente in qualsiasi PoC di aggiornamento dell'infrastruttura in modo che le organizzazioni possano comprendere meglio l'impatto di tutti questi core e di tutte le efficienze che AMD ha da offrire.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed