Al centro della Vision di Intel c’è una previsione significativa: gli investimenti aziendali nella GenAI sono destinati a quadruplicare, passando da 40 miliardi di dollari nel 2024 a ben 151 miliardi di dollari entro il 2027. Tuttavia, nonostante questo ottimismo, il percorso verso l’adozione aziendale è disseminato di ostacoli.
Al centro della Vision di Intel c’è una previsione significativa: gli investimenti aziendali nella GenAI sono destinati a quadruplicare, passando da 40 miliardi di dollari nel 2024 a ben 151 miliardi di dollari entro il 2027. Tuttavia, nonostante questo ottimismo, il percorso verso l’adozione aziendale è disseminato di ostacoli.
Intel è fermamente impegnata ad affrontare queste sfide offrendo soluzioni GenAI end-to-end scalabili e sicure che affrontano gli ostacoli più critici legati all'intelligenza artificiale, dalle complessità di sicurezza e integrazione alle preoccupazioni sui costi. Con una costante attenzione alla trasformazione, Intel sta elaborando una strategia globale di intelligenza artificiale aziendale, abbracciando un approccio aperto basato su un ecosistema in tutta la sua linea di prodotti, dai PC AI, all'edge computing e al data center.
Rubare la scena: Intel Gaudi 3 Accelerator
In prima linea nella visione di Intel c'è la presentazione dell'acceleratore AI Intel Gaudi 3, che cavalca l'onda delle prestazioni e dell'efficienza consolidate del suo predecessore, l'acceleratore AI Intel Gaudi 2. Offrendo ai clienti la flessibilità di un software aperto basato su comunità e di una rete Ethernet standard del settore, Gaudi 3 segna un significativo passo avanti nella scalabilità del sistema.
Progettato per le prestazioni e l'efficienza GenAI, Gaudi 3 offre miglioramenti impressionanti rispetto al suo predecessore. Con un calcolo AI 4x per BF16, un aumento di 1.5 volte della memoria e una larghezza di banda di rete 2x, promette una produttività senza precedenti per l'addestramento e l'inferenza dell'IA su modelli linguistici di grandi dimensioni (LLM) e modelli multimodali.
Justin Hotard, vicepresidente esecutivo di Intel e direttore generale del Data Center e del gruppo AI, sottolinea l'importanza di Gaudi 3 nell'affrontare il panorama in evoluzione del mercato dell'intelligenza artificiale. Sottolinea la richiesta di una maggiore scelta tra le imprese e sottolinea l'avvincente combinazione di rapporto prezzo/prestazioni, scalabilità e vantaggio time-to-value di Gaudi 3.
In settori critici come la finanza, la produzione e la sanità, le imprese stanno rapidamente espandendo l’accessibilità all’intelligenza artificiale, passando dall’implementazione sperimentale a quella su vasta scala di progetti di intelligenza artificiale generativa (GenAI). Intel ritiene che l'acceleratore Gaudi 3 sia fondamentale per soddisfare questi requisiti, offrendo versatilità attraverso un software aperto basato sulla comunità e una rete Ethernet standard per scalare i sistemi e le applicazioni di intelligenza artificiale in modo flessibile.
L'architettura personalizzata di Gaudi 3 è adattata per un efficiente calcolo AI su larga scala, prodotta con un processo a 5 nanometri (nm) e dotata di caratteristiche chiave:
- Motore di calcolo dedicato all'intelligenza artificiale: dotato di un motore di calcolo eterogeneo che comprende 64 Tensor Processor Core (TPC) programmabili e personalizzati dall'intelligenza artificiale e otto motori di moltiplicazione di matrice (MME), Gaudi 3 eccelle nella gestione di operazioni di matrice complesse fondamentali per gli algoritmi di deep learning.
- Aumento della memoria per i requisiti di capacità LLM: con ampia capacità di memoria, larghezza di banda e memoria ad accesso casuale statico (SRAM) integrata, Gaudi 3 elabora in modo efficiente set di dati GenAI di grandi dimensioni, migliorando le prestazioni del carico di lavoro e l'efficienza dei costi del data center.
- Scalabilità efficiente del sistema per GenAI aziendale: integrato con ventiquattro porte Ethernet da 200 gigabit, Gaudi 3 consente reti flessibili e standard aperti, facilitando una scalabilità efficiente per supportare cluster di elaborazione di grandi dimensioni eliminando i vincoli al fornitore.
- Software di settore aperto per la produttività degli sviluppatori: il software Gaudi integra il framework PyTorch e fornisce modelli Hugging Face ottimizzati basati sulla comunità, migliorando la produttività degli sviluppatori e la facilità di trasferimento dei modelli su tipi di hardware.
- Gaudi 3 PCIe: introducendo un nuovo fattore di forma nella linea di prodotti, la scheda aggiuntiva Gaudi 3 PCIe offre elevata efficienza e consumo energetico ridotto, ideale per carichi di lavoro come regolazione fine, inferenza e generazione aumentata di recupero (RAG).
L’acceleratore Gaudi 3, che dovrebbe fornire miglioramenti significativi delle prestazioni per attività di training e inferenza sui principali modelli GenAI, è pronto a rivoluzionare l’intelligenza artificiale e il calcolo ad alte prestazioni (HPC). Svolgerà un ruolo fondamentale in Falcon Shores, la GPU Intel di prossima generazione, integrando la proprietà intellettuale di Intel Gaudi e Intel Xe con un'unica interfaccia di programmazione GPU basata sulla specifica Intel oneAPI.
Intel Gaudi 3 contro NVIDIA
Durante la sessione di apertura, Pat Gelsinger, CEO di Intel, è stato al centro della scena per presentare l'acceleratore AI Intel Gaudi 3. Si prevede che Gaudi 3 garantirà un time-to-train più veloce del 50% rispetto a NVIDIA H100 con i parametri Llama2 7B e 13B e GPT-3 175B. Inoltre, l'acceleratore Gaudi 3 è in grado di produrre un throughput di inferenza superiore del 50% e un'efficienza energetica di inferenza migliore del 40% sui parametri Llama 7B e 70B e sui modelli di parametri Falcone 180B rispetto a NVIDIA H200. Inoltre, Gaudi 3 ha dimostrato un'inferenza più veloce del 30% rispetto a NVIDIA H200 sui parametri Llama 7B e 70B e sui modelli di parametri Falcon 180B.
Dotato di parametri prestazionali impressionanti, Gaudi 3 vanta un notevole throughput di inferenza del 50% migliore e un'efficienza energetica migliore del 60% rispetto alle alternative del settore.
Supportata dai principali OEM come Dell Technologies, Supermicro, Lenovo e HPE e migliorata con funzionalità come il supporto della scheda PCIe, Gaudi 3 emerge come una GPU con un enorme potenziale nel panorama dell'intelligenza artificiale.
Processori Intel Xeon 6
Oltre all'acceleratore Intel Gaudi 3, Intel ha fornito aggiornamenti sui suoi prodotti e servizi di prossima generazione in tutti i segmenti dell'intelligenza artificiale aziendale, con i nuovi processori Intel Xeon 6.
I processori Intel Xeon 6 offriranno soluzioni efficienti in termini di prestazioni per eseguire le attuali soluzioni GenAI, incluso RAG, che producono risultati specifici del business utilizzando dati proprietari. Intel ha introdotto un nuovo marchio per i suoi processori di prossima generazione per data center, cloud ed edge. I processori Intel Xeon 6 con i nuovi Efficient-core (E-core) garantiranno efficienza. Allo stesso tempo, Intel Xeon 6 con core ad alte prestazioni (P-core) offrirà prestazioni IA migliorate e verrà lanciato subito dopo i processori E-core.
Si prevede che i processori Intel Xeon 6 con E-core (precedentemente nome in codice Sierra Forest) forniranno prestazioni per watt migliorate di 2.4 volte e una densità rack 2.7 volte migliore rispetto ai processori Intel Xeon di seconda generazione. I processori Intel Xeon 2 con P-core (precedentemente nome in codice Granite Rapids) incorporano il supporto software per il formato dati MXFP6, riducendo la successiva latenza dei token fino a 4 volte rispetto agli Xeon di quarta generazione utilizzando FP6.5 e la capacità di eseguire 4 miliardi di parametri Llama16 Modelli.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed