Casa Impresa Lancio dei processori scalabili Intel Xeon di quinta generazione

Lancio dei processori scalabili Intel Xeon di quinta generazione

by Lile Smith
Intel Xeon di quarta generazione scalabile con hbm

Intel ha lanciato i processori scalabili Intel Xeon di quarta generazione (Sapphire Rapids), la serie Intel Xeon CPU Max (Sapphire Rapids HBM) e la serie Intel Data Center GPU Max (Ponte Vecchio). Sono progettati appositamente per migliorare le prestazioni, l'efficienza, la sicurezza e le funzionalità dei data center per l'intelligenza artificiale, il cloud computing, le reti, l'edge computing e i supercomputer. Intel collabora con i clienti per offrire soluzioni e sistemi personalizzati utilizzando i nuovi prodotti per soddisfare le esigenze informatiche su larga scala.

Intel ha lanciato i processori scalabili Intel Xeon di quarta generazione (Sapphire Rapids), la serie Intel Xeon CPU Max (Sapphire Rapids HBM) e la serie Intel Data Center GPU Max (Ponte Vecchio). Sono progettati appositamente per migliorare le prestazioni, l'efficienza, la sicurezza e le funzionalità dei data center per l'intelligenza artificiale, il cloud computing, le reti, l'edge computing e i supercomputer. Intel collabora con i clienti per offrire soluzioni e sistemi personalizzati utilizzando i nuovi prodotti per soddisfare le esigenze informatiche su larga scala.

Attualmente sono oltre 100 milioni i singoli processori Xeon in uso in tutto il mondo. Perché sono così popolari? Bene, sono disponibili in varie configurazioni e sono progettati per essere scalabili, consentendone l'utilizzo in un'ampia gamma di applicazioni e ambienti. Possono anche essere personalizzati per carichi di lavoro o applicazioni specifici, offrono una gamma di funzionalità di sicurezza per proteggere da minacce come malware e violazioni dei dati e sono altamente efficienti dal punto di vista energetico.

Processore Intel Xeon di quarta generazione davanti e dietroModelli di CPU scalabili Intel Xeon di quarta generazione

I nuovi modelli Xeon sono disponibili in sei categorie, tra cui Max 9400, Platinum 8000, Gold 6000, Gold 5000, Silver 4000 e Bronze 3000, oltre alla serie Max. Ogni serie ha una gamma di modelli diversi che possono essere analizzati in dettaglio in base al caso d'uso target:

  • Scopo generale delle prestazioni
  • Scopo generale principale
  • Raffreddamento a liquido per uso generale
  • Presa singola per uso generale (Serie “Q”)
  • Uso di lunga durata (IoT) per scopi generali (serie “T”)
  • IMDB/Analisi/virtualizzazione ottimizzata (serie “H”)
  • Ottimizzato per 5G/rete (Serie “N”)
  • IaaS ottimizzato per il cloud (serie “P”, “V” e “M”)
  • Ottimizzazione dell'infrastruttura storage e iperconvergente (serie “S”)
  • Ottimizzato per HPC (ad esempio, la serie Intel Xeon CPU Max)

Silicio scalabile Intel Xeon di quarta generazione

Ad esempio, i potenti Platinum 8400 I processori sono progettati per analisi avanzate dei dati, intelligenza artificiale e data center cloud ibridi, offrendo prestazioni elevate, funzionalità della piattaforma e accelerazione del carico di lavoro, nonché una maggiore sicurezza basata su hardware ed elaborazione multi-socket. Questi processori offrono anche fino a 60 core per processore (un aumento di 20 core rispetto ai top Modello Xeon di terza generazione), otto canali di memoria e accelerazione AI con Intel AMX.

Intel Xeon di quarta generazione scalabile con hbm

Intel Xeon Gold 6400 che a Oro 5400 i processori sono ottimizzati per data center e carichi di lavoro multi-cloud. Offrono velocità di memoria, capacità, sicurezza e accelerazione del carico di lavoro migliorate. Intel Xeon Silver 4400 I processori forniscono prestazioni essenziali, velocità di memoria migliorata ed efficienza energetica per l'elaborazione, la rete e lo storage di data center entry-level.

Ecco una carrellata dettagliata di ciascuna CPU Xeon e del relativo caso d'uso mirato:

Caratteristiche Processori scalabili Intel Xeon di quarta generazione CPU Intel Xeon serie Max
Conteggio Nuclei Estremo (XCC) Conteggio medio dei core (MCC) Memoria a larghezza di banda elevata (HBM)
 

Costruzione dello stampo

Quattro riquadri collegati tramite MDF tramite Intel Embedded Multi-die Interconnect Bridge (EMIB)  

Un chip monolitico

Quattro riquadri collegati tramite MDF tramite Intel Embedded Multi-die Interconnect Bridge (EMIB)
Core Count Fino a 60 core attivi Fino a 32 core attivi Fino a 56 core attivi
Gamma TDP Da 225 a 350 W. Da 125 a 350 W. 350W
 

Memorie

DDR5 a 4800 (1 DPC), 4400 (2 DPC), DRAM da 16 Gb, 8 canali

Intel Optane PMem 300 (Crow Pass) @4400 MT/s

DDR5 @ 4800 (1 DPC), 4400 (2 DPC), 8 canali

Memoria HBM64e da ​​2 GB con un massimo di 1.14 GB/core

IntelUPI UPI 2.0 a 16 GT/s, fino a 4 interconnessioni Ultra Path UPI 2.0 a 16 GT/s, fino a 3 interconnessioni Ultra Path UPI 2.0 a 16 GT/s, fino a 4 interconnessioni Ultra Path
Scalabilità 1 presa, 2 prese, 4 prese, 8 prese 1 presa, 2 prese, 4 prese 1 presa, 2 prese
Collegamento PCIe/Compute Express PCIe 5.0 (80 corsie),

Fino a 4 dispositivi supportati tramite Compute Express Link (CXL) 1.1

Sicurezza Intel sgx

Dimensione minima della cache delle pagine Enclave (EPC) 256 MB

Intel SGX (solo modalità Flat)
Acceleratori IP integrati Intel QAT, DLB, IAA, DSA (fino a 4 dispositivi ciascuno) Intel QAT, DLB (fino a 2 dispositivi ciascuno), Intel  DSA, IAA (1 dispositivo ciascuno) Intel DSA (4 dispositivi)

I processori scalabili Intel Xeon di quarta generazione mirano a migliorare le prestazioni e ad affrontare varie sfide informatiche legate all'intelligenza artificiale, all'analisi, alla rete, alla sicurezza, allo storage e all'elaborazione ad alte prestazioni (HPC). Questi processori sono notevoli per avere il maggior numero di acceleratori integrati di qualsiasi CPU.

Secondo Intel, i clienti scalabili Intel Xeon di quarta generazione possono aspettarsi un miglioramento medio delle prestazioni nei seguenti aspetti:

  • 9 volte il miglioramento dell'efficienza per watt quando si utilizzano acceleratori integrati,
  • Risparmio energetico di 70 watt per CPU in modalità di alimentazione ottimizzata con perdita di prestazioni minima,
  • Riduzione del 55% del costo totale di proprietà e del consumo energetico rispetto alle generazioni precedenti.

Intel Xeon scalabile di quarta generazione: efficienza energetica migliorata

La nuova modalità di alimentazione ottimizzata può fornire fino al 20% di risparmio energetico sulla presa con un impatto sulle prestazioni inferiore al 5% per carichi di lavoro specifici. Le innovazioni nel raffreddamento ad aria e a liquido possono ridurre ulteriormente il consumo energetico totale del data center.

Le CPU scalabili Intel Xeon di quarta generazione sono dotate di un gran numero di acceleratori integrati, che possono aiutare a risparmiare energia a livello di piattaforma e ridurre la necessità di ulteriore accelerazione. Ciò può aiutare i loro clienti a raggiungere i loro obiettivi di sostenibilità. Inoltre, si prevede che la nuova modalità di alimentazione ottimizzata garantirà un risparmio energetico fino al 4% sulla presa con un impatto minimo sulle prestazioni per carichi di lavoro specifici.

Sostenibilità scalabile di Intel Xeon di quarta generazione

Le innovazioni nel raffreddamento ad aria e a liquido possono ridurre ulteriormente il consumo energetico totale del data center. I processori Xeon di quarta generazione sono stati inoltre prodotti utilizzando il 4% o più di elettricità rinnovabile presso i siti Intel dotati di impianti avanzati di recupero dell'acqua.

Nuovi progressi nelle prestazioni dell’intelligenza artificiale

Rispetto alla generazione precedente, si dice che i processori Xeon di quarta generazione raggiungano prestazioni di training e inferenza in tempo reale PyTorch fino a 4 volte superiori con l'uso degli acceleratori Advanced Matrix Extension (Intel AMX),

PyTorch è un framework di apprendimento automatico per la creazione e l'addestramento di reti neurali. L'inferenza in tempo reale implica l'utilizzo di un modello di rete neurale addestrato per effettuare previsioni o decisioni in tempo reale basate su nuovi dati di input. L'inferenza in tempo reale e le prestazioni di training di PyTorch più elevate sono essenziali per i processori Intel perché consentono loro di eseguire carichi di lavoro di machine learning che implicano previsioni in tempo reale o processi decisionali in modo più efficiente.

Ciò è particolarmente utile nelle applicazioni in cui previsioni o decisioni rapide e precise sono fondamentali. Inoltre, prestazioni più elevate nelle attività di machine learning possono portare a un addestramento più rapido dei modelli e a previsioni più accurate, nonché alla capacità di utilizzare modelli più grandi e complessi.

Pertanto, Intel afferma che i nuovi processori scalabili Intel Xeon di quarta generazione possono fornire ulteriori funzionalità per l'elaborazione del linguaggio naturale, dichiarando una velocità fino a 4 volte superiore su modelli linguistici di grandi dimensioni.

La suite software AI di Intel, testata con oltre 400 modelli di machine learning e deep learning in vari settori e applicazioni, può essere utilizzata con lo strumento AI preferito dallo sviluppatore per aumentare la produttività e accelerare lo sviluppo dell'IA. La suite è progettata per essere portatile, consentendone l'utilizzo sulla workstation e la distribuzione a livello periferico e nel cloud.

Capacità di rete

I processori scalabili Intel Xeon di quarta generazione offrono anche modelli specificamente ottimizzati per reti ad alte prestazioni e bassa latenza e carichi di lavoro edge. Questi processori svolgono un ruolo cruciale nel promuovere un futuro maggiormente definito dal software per settori quali telecomunicazioni, vendita al dettaglio, produzione e città intelligenti. Per i carichi di lavoro core 4G, gli acceleratori integrati possono contribuire ad aumentare il throughput e ridurre la latenza, mentre i miglioramenti della gestione energetica migliorano la reattività e l’efficienza della piattaforma.

Possono anche raddoppiare la capacità della rete di accesso radio virtualizzato (vRAN) rispetto a 3rdprocessori Xeon di nuova generazione (senza consumare più energia). In generale, i processori con una capacità vRAN più elevata possono gestire in modo più efficiente ed efficace il traffico dati di rete, riducendo ad esempio la latenza e migliorando le prestazioni complessive. Ciò è particolarmente importante per le applicazioni che richiedono comunicazione in tempo reale.

Intel indica che ciò consentirà ai fornitori di servizi di comunicazione di raddoppiare le prestazioni per watt e soddisfare le proprie esigenze di prestazioni ed efficienza energetica. L’aumento della vRAN consentirebbe inoltre alle organizzazioni di aumentare o diminuire più facilmente al variare del numero di carichi di lavoro vRAN, il che significa una maggiore flessibilità nelle risorse di rete (ad esempio, senza richiedere hardware, alimentazione o infrastruttura aggiuntivi).

HPC

Sistema HPC scalabile Intel Xeon di quarta generazione presso il laboratorio Intel

Blade di elaborazione (chassis aperto) presso il laboratorio Intel HPC

I prodotti Intel Xeon Scalable di quarta generazione e la serie Intel Max offrono un'architettura scalabile e bilanciata che combina CPU e GPU con l'ecosistema software aperto di oneAPI per carichi di lavoro di elaborazione impegnativi in ​​HPC e IA. Intel afferma che questa architettura è progettata specificamente per affrontare i problemi più difficili del mondo odierno.

Il software aperto OneAPI è un insieme di strumenti e librerie che consentono agli sviluppatori di scrivere codice che può essere eseguito su varie piattaforme hardware (incluse CPU, GPU e altri processori specializzati) utilizzando un unico set di interfacce di programmazione. Ciò può semplificare lo sviluppo e l'ottimizzazione delle applicazioni per diversi ambienti informatici.

Blade di elaborazione presso il laboratorio Intel HPC

Blade di elaborazione presso il laboratorio Intel HPC

Alla Jones Farm di Intel, StorageReview ha dato uno sguardo dietro le quinte di Borealis. Intel, HPE e Argonne National Laboratory stanno lavorando per fornire il supercomputer Aurora, che sarà implementato con le nuove piattaforme Xeon di quarta generazione e GPU Datacenter annunciate oggi.

Borealis è un mini-sistema a due rack situato presso il laboratorio Jones Farm in Oregon che convalida il sistema Aurora e le sue nuove tecnologie. Ha la stessa architettura e design di Aurora ed è in fase di test per convalidare tutti i componenti del software e dei sistemi di raffreddamento a liquido prima che il sistema venga installato su larga scala presso l'Argonne National Laboratory.

Sistema di raffreddamento ad acqua: il responsabile del laboratorio presso Jones Farm HPC Lab – Borealis mostra i tubi rossi e blu che fanno parte del sistema di raffreddamento ad acqua per mantenere freschi i rack.

Sistema di raffreddamento ad acqua: il responsabile del laboratorio presso Jones Farm HPC Lab – Borealis mostra i tubi rossi e blu che fanno parte del sistema di raffreddamento ad acqua per mantenere freschi i rack.

La serie Intel Xeon CPU/GPU Max

La serie Intel Xeon CPU Max è il primo processore x86 con memoria a larghezza di banda elevata ad arrivare sul mercato, consentendogli di accelerare molti carichi di lavoro HPC senza richiedere modifiche al codice. L'azienda definisce la serie Intel Data Center GPU Max come il processore a più alta densità, che sarà disponibile in vari fattori di forma per soddisfare una vasta gamma di esigenze dei clienti.

La serie Xeon CPU Max offre 64 GB di memoria a larghezza di banda elevata nel pacchetto, che aumenta significativamente il throughput dei dati per carichi di lavoro HPC e AI. Rispetto ai processori scalabili Intel Xeon di terza generazione di fascia alta, la serie Xeon CPU Max offre prestazioni fino a 3 volte superiori su varie applicazioni del mondo reale come la modellazione di sistemi energetici e terrestri. La larghezza di banda della CPU è essenziale per i carichi di lavoro HPC e AI, poiché spesso richiedono l'elaborazione e lo spostamento di una grande quantità di dati tra la CPU e la memoria. In caso contrario, ciò potrebbe ostacolare le prestazioni del sistema e portare a tempi di elaborazione più lunghi.

La serie Data Center GPU Max, che presenta oltre 100 miliardi di transistor in un pacchetto da 47 moduli, offre maggiore throughput ai carichi di lavoro che coinvolgono fisica, servizi finanziari e scienze della vita. Se combinata con la serie Xeon CPU Max, la piattaforma può raggiungere prestazioni fino a 12.8 volte superiori rispetto alla generazione precedente quando si esegue il simulatore di dinamica molecolare LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator) in codice open source.

GPU Intel per centri dati

Intel ha lanciato il Serie GPU Flex per data center nell'agosto 2022, una scheda basata su Xe HPG che offre fino a 16 (8 per GPU) X core, 16 TFLOPS e capacità di memoria di 16 GB.

Intel su richiesta

Intel On-Demand è un servizio che consente ai clienti di espandere o aggiornare gli acceleratori e le funzionalità migliorate dall'hardware disponibili sulla maggior parte dei processori scalabili Intel Xeon di quarta generazione. Il servizio è gestito da Intel e dai fornitori di hardware ed è costituito da un'API per l'ordinazione delle licenze e da un agente software per il provisioning e l'attivazione delle licenze.

I clienti possono scegliere di acquistare funzionalità on-demand al momento dell'acquisto o come aggiornamento post-acquisto e Intel sta anche lavorando a un modello di adozione di misurazione in cui le funzionalità possono essere attivate e disattivate in base alle necessità e il pagamento è basato su utilizzo. L’introduzione del modello di attivazione con i processori Xeon di quarta generazione consente ai clienti di scegliere SKU premium con funzionalità complete o aggiungere funzionalità in qualsiasi momento durante il ciclo di vita del processore.

I fornitori iniziali di servizi on-demand includono H3C, Inspur, Lenovo, Supermicro e Variscale, con Intel che collabora con altri fornitori sui propri piani di abilitazione.

Il DRM a livello di chip, o gestione dei diritti digitali, si riferisce alla tecnologia che controlla l'accesso a determinate caratteristiche o capacità dei chip del computer. Nel contesto di Intel On-Demand, il DRM a livello di chip potrebbe essere potenzialmente utilizzato per limitare l'accesso a determinate funzionalità o capacità dei processori scalabili Intel Xeon di quarta generazione, a meno che non siano acquistati o attivati ​​tramite il servizio On-Demand. Ciò potrebbe incidere sul diritto alla riparazione, poiché potrebbe rendere più difficile per singoli individui o officine di riparazione indipendenti l'accesso e la riparazione di determinati aspetti dei sistemi dotati di Intel On-Demand.

La sostenibilità ambientale è una considerazione importante quando si tratta di utilizzo e smaltimento di prodotti tecnologici, comprese le CPU aziendali. Sebbene Intel On-Demand possa consentire ai clienti di espandere o aggiornare le capacità dei propri processori, non è chiaro come questo servizio possa influire sulla sostenibilità ambientale dei prodotti. Poiché il TDP del pacchetto non cambia con l'attivazione, potrebbe essere necessario tenere conto del consumo energetico delle funzionalità non utilizzate e del potenziale aumento dei rifiuti elettronici dovuto ad aggiornamenti o sostituzioni. È fondamentale che aziende come Intel considerino l’impatto ambientale dei loro prodotti e servizi e lavorino verso soluzioni più sostenibili.

Prestazioni scalabili con Intel Xeon di quarta generazione Testing

L'enfasi del processore scalabile Intel Xeon di quarta generazione sul miglioramento dell'efficienza emerge in alcuni dei nostri primi benchmark. Si pubblicizza che questi nuovi processori raggiungono un aumento dell'efficienza del 4% (per scopi di elaborazione generici) rispetto ai processori scalabili Xeon di terza generazione attraverso perfezionamenti produttivi migliorati e carichi di lavoro mirati, un miglioramento dell'efficienza delle prestazioni medie per watt di 53 volte utilizzando acceleratori integrati.

Oltre a questi miglioramenti, i chip di livello intermedio di nuova generazione sono potenti quanto i modelli di livello superiore di ultima generazione, rendendoli un’opzione conveniente per gli operatori di data center. Questi chip di fascia media possono aiutare i data center a ottimizzare i costi e a ottenere una migliore efficienza complessiva offrendo prestazioni simili ai modelli di punta a un prezzo inferiore.

Avevamo alcune opzioni per testare le prestazioni di Sapphire Rapids e, per mostrare i miglioramenti in termini di efficienza, abbiamo testato una piattaforma di quarta generazione di fascia media con due Xeon 4Y ($ 8454) e l'abbiamo confrontata con una piattaforma top di gamma di terza generazione con doppia CPU 3,995 ($ 3). Con i nuovi miglioramenti della quarta generazione, il nostro sistema di fascia media è stato in grado di tenere il passo con i parametri di riferimento del modello di punta della generazione precedente.

Cinebench
2 x 4Y di quarta generazione (8452 GHz x 2.0) 2 x 3 di terza generazione (8380 GHz x 2.3)
Multi-Core 60075 70540
Single Core 841 985
Moltiplicatore principale 71.40x 71.63x
Benchmark di rendering della CLI di Blender
2 x 4Y di quarta generazione (8452 GHz x 2.0) 2 x 3 di terza generazione (8380 GHz x 2.3)
Mostro 652.526942 671.145395
Rigattiere 401.119468 407.141514
Aula 308.802541 320.507039
Totale 1362.448951 1398.793948

Inoltre, in un test di addestramento del modello AI interno, abbiamo notato un aumento delle prestazioni di circa il 5%, misurando 95 minuti per l'3 di terza generazione rispetto a 8380 minuti per l'90Y di quarta generazione. 

Nel complesso, i miglioramenti in termini di efficienza offerti dai processori scalabili Intel Xeon di quarta generazione li rendono un'opzione interessante per gli operatori di data center che desiderano ridurre il consumo energetico e i costi. I processori per uso generale offrono un eccezionale equilibrio tra prestazioni ed efficienza, rendendoli una scelta solida per un'ampia gamma di carichi di lavoro. Siamo entusiasti di iniziare a testare acceleratori specifici sui carichi di lavoro dei data center, incluso Data Storage Accelerator.

Impatto sul mercato

Con I processori scalabili Intel Xeon di quarta generazione sono finalmente disponibili per le aziende, i fornitori di servizi cloud li hanno già da qualche tempo, la battaglia è ancora aperta CPU AMD Genova nel data center. Anche se ad alto livello, è davvero facile guardare l’enorme numero di corsie del PCI di Genova e dichiararle vincitrici. Ma oggigiorno selezionare la CPU giusta è molto più complicato di così. Esiste un delicato equilibrio tra costi, energia, prestazioni e qualificazione con componenti aggiuntivi nel sistema. Oh, e non trascuriamo l'importanza di comprendere il carico di lavoro per allinearlo alla CPU corretta. 

Quindi oggi non c’è una risposta facile alla domanda su chi sia migliore, il Genoa o il Sapphire Rapids. Ciò richiederà tempo per concretizzarsi mentre Dell, HPE, Supermicro, Lenovo e altri lanciano i sistemi sul mercato. Con l'adozione del nuovo Fattori di forma SSD in corso proprio ora nei server, supporto per il throughput Gen5 e nuove opzioni di rete e acceleratore ad alta velocità come DPU, il gioco è in corso. Questa, tuttavia, non è una battaglia tra le schede tecniche. Spetta all'organizzazione IT aziendale essere il più diligente e informata possibile per garantire che stiano investendo in sistemi che supportino adeguatamente le loro esigenze applicative. E questa potrebbe essere la sfida più grande di tutte. Con così tante scelte, i partner IT sofisticati possono essere più critici che mai.

Interagisci con StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed