AMD EPYC 9754S è progettato per carichi di lavoro HPC con SMT disabilitato e offre 128 core e 128 thread con un TDP predefinito di 360 W.
L'anno scorso AMD ha ampliato la propria linea di CPU per server con EPYC di quarta generazione. Mentre l'EPYC 4 da 128 core e 256 thread ha ottenuto i migliori risultati, proprio sotto di esso nella matrice SKU c'è l'AMD EPYC 9754S. La differenza tra i due chip è semplice, ma drammatica. Il 9754S ha il multithreading simultaneo (SMT) disabilitato. Ciò significa che il 9754S offre gli stessi 9754 core del 128, ma con SMT disabilitato, solo 9754 thread, rispetto a 128. Questa modifica comporta un buon sconto per i clienti che disabilitano già SMT.
Modello | Colori | Numero massimo di thread | TDP predefinito | Frequenza di base (GHz) | Aumenta la frequenza (GHz) | Cache L3 (MB) |
---|---|---|---|---|---|---|
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.2 | 3.0 | 256 |
Cos'è AMD SMT e perché esiste il 9754S?
Con SMT, un singolo core della CPU EPYC può elaborare due thread contemporaneamente, questo può portare ad un utilizzo più efficiente delle risorse del processore. Quando un thread è in attesa che i dati vengano caricati dalla memoria o è altrimenti inattivo, l'altro thread può eseguire istruzioni. Ciò significa che il core trascorre meno tempo inattivo, migliorando potenzialmente le prestazioni. Ciò è particolarmente vero in casi d'uso come la virtualizzazione e il rendering.
Disabilitare SMT può consentire ai produttori di commercializzare questi chip come prodotti di livello inferiore, garantendo che soddisfino comunque criteri specifici di prestazioni e stabilità. Le CPU con SMT disabilitato possono essere influenzate da processi di binning, strategie di segmentazione del mercato e dal desiderio di soddisfare specifiche esigenze di prestazioni o efficienza, dimostrando l'approccio sfumato che i produttori adottano nella pianificazione e nel posizionamento dei prodotti.
Detto questo, non tutti i carichi di lavoro traggono vantaggio da SMT e, molte volte, un server AMD potrebbe avere SMT disabilitato nel BIOS. Sebbene ciò possa essere una modifica efficace, ciò fa emergere un altro punto importante. Il chip 9754S con SMT disabilitato è leggermente meno costoso del 9754. In entrambi i casi, le applicazioni a thread singolo, i carichi di lavoro computazionali e tutti i casi d'uso in cui la latenza della CPU è di fondamentale importanza possono trarre vantaggio dalla disabilitazione di SMT.
Prestazioni dell'AMD EPYC 9754S rispetto all'EPYC 9754
Vogliamo eseguire due dei nostri test regolari, y-cruncher e Cinebench 2024, e vedere quali differenze di prestazioni otteniamo con e senza SMT. Abbiamo confrontato 9754S e 9754 mentre eseguivamo il 9754 con SMT attivato e disattivato per vedere quali vantaggi ha il 9754S senza SMT.
Piattaforma di test e specifiche:
- TYAN Trasporto HX TN85-B8261
- 512GB DDR5
- Di Windows Server 2022
Cinebench 2024
Il primo è Cinebench 2024, con SMT abilitato sul nostro modello non S. Qui possiamo vedere che ci troviamo all'interno di differenze di variazione da esecuzione a esecuzione.
CPU Cinebench 2024 | 2xEPYC9754S | 2x EPIC 9754 |
---|---|---|
CPU multicore | 2,682 | 2,587 |
CPU single-core | 68 | 69 |
Rapporto MP | 39.19x | 37.64x |
y-Cruncher è stato scelto appositamente per l'architettura del programma, posizionata come un test totale del sistema. Eseguendo un calcolo Pi grande quanto adatto alla memoria di sistema, abbiamo mirato a dimostrare la nostra intuizione di lunga data, ovvero che SMT può avere un impatto negativo sui carichi di lavoro legati alla CPU e alla memoria. Diamo un'occhiata ai risultati prima di approfondire cosa significa.
y-cruncher 0.8.3
y-cruncher 0.8.3 Tempo di calcolo totale in secondi (è meglio più basso) |
2xEPYC9754S | 2x EPYC 9754 (SMT spento) | 2x EPYC 9754 (SMT attivato) | 9754 SMT Off Aumento delle prestazioni |
---|---|---|---|---|
1 Billion | 13.481 | 13.546 | 14.139 | 4.65% |
2.5 Billion | 23.818 | 24.144 | 28.111 | 15.27% |
5 Billion | 40.760 | 40.797 | 49.271 | 17.27% |
10 Billion | 77.409 | 77.959 | 95.420 | 18.88% |
25 Billion | 203.303 | 202.124 | 233.629 | 12.98% |
50 Billion | 475.557 | 476.949 | 520.349 | 8.61% |
100 Billion | 1,248.458 | 1,251.36 | 1,242.419 | -0.49% |
y-cruncher 0.8.4
y-cruncher 0.8.4 Tempo di calcolo totale in secondi (è meglio più basso) |
2xEPYC9754S | 2x EPYC 9754 (SMT spento) | 2x EPYC 9754 (SMT attivato) | 9754 SMT Off Aumento delle prestazioni |
---|---|---|---|---|
1 Billion | 13.480 | 13.56 | 14.573 | 7.50% |
2.5 Billion | 23.680 | 23.501 | 28.649 | 17.34% |
5 Billion | 40.819 | 40.547 | 50.082 | 18.50% |
10 Billion | 78.523 | 77.466 | 93.842 | 16.32% |
25 Billion | 206.399 | 206.078 | 236.070 | 12.57% |
50 Billion | 483.797 | 482.79 | 521.867 | 7.29% |
100 Billion | 1,269.484 | 1,266.83 | 1,253.446 | -1.28% |
Analisi dei risultati
Immergendosi nelle complessità di AMD SMT, c'è un dialogo avvincente all'interno della comunità tecnologica sulle sue implicazioni sulle prestazioni del sistema. Fondamentalmente, SMT sembra essere una scelta semplice per chi è alla ricerca di prestazioni migliorate. La teoria dice: se abilitare SMT può portare a una scalabilità ideale, allora perché non abbracciarla come una scelta architetturale vantaggiosa?
La relazione tra efficienza SMT e architettura di base non è in bianco e nero. Il ridimensionamento SMT poco brillante non indica necessariamente un difetto nella sua implementazione. In effetti, potrebbe suggerire un design di base robusto che difficilmente lascia spazio all'SMT per fare una differenza notevole. Questo paradosso sottolinea un'intuizione cruciale del settore: i produttori di processori non possono rivendicare un vantaggio unico per tutti con SMT o tecnologie simili. Riconoscono che mentre SMT può ottenere prestazioni aggiuntive in determinati casi d'uso, non è privo di difetti in altri scenari.
Attraverso la lente del calcolo ad alte prestazioni e delle attività di supercalcolo, i limiti dell’SMT diventano più evidenti. Sebbene l’idea di raddoppiare il numero di thread per core possa sembrare promettente, la realtà non è come avere il doppio dei core. In casi estremi, ciò può portare a cali di prestazioni poiché i thread competono per le risorse della cache. Tuttavia, per la maggior parte delle applicazioni multi-thread, in particolare quelle prive di concorrenza nella cache, SMT migliora le prestazioni, brillando soprattutto nelle attività che possono sfruttare appieno il suo potenziale.
Pensieri di chiusura
AMD SMT è incredibilmente utile per un'ampia varietà di carichi di lavoro comuni nelle aziende. Ma non tutti i carichi di lavoro necessitano o traggono vantaggio dall’SMT. Attraverso i nostri test abbiamo dimostrato come AMD sia in grado di sfruttare le variazioni nella produzione per fornire un prodotto solido con una proposta di valore unica. Le organizzazioni che progettano piattaforme per tipi specifici di carichi di lavoro che necessitano di core puro senza SMT, possono risparmiare un po' di denaro acquistando AMD EPYC 9754S, che ha SMT disabilitato permanentemente dalla fabbrica.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed