La memoria aumentata di WEKA per l'inferenza AI aumenta l'efficienza della GPU, riducendo la latenza e i costi, e al contempo adattando i modelli AI ai carichi di lavoro aziendali.
WEKA ha annunciato la sua integrazione strategica con il design di riferimento della piattaforma dati AI NVIDIA. Ha ottenuto le certificazioni di storage NVIDIA fondamentali per fornire un'infrastruttura ottimizzata, espressamente pensata per l'intelligenza artificiale agentica e modelli di ragionamento complessi. Insieme a questo annuncio, WEKA ha introdotto la sua innovativa capacità Augmented Memory Grid e ulteriori certificazioni NVIDIA Cloud Partner (NCP) Reference Architectures, tra cui NVIDIA GB200 NVL72 e NVIDIA-Certified Systems Storage per distribuzioni AI factory su scala aziendale.
Accelerare gli agenti AI
La piattaforma dati AI NVIDIA rappresenta un significativo balzo in avanti nell'infrastruttura AI aziendale, integrando perfettamente l'architettura NVIDIA Blackwell, le DPU NVIDIA BlueField, il networking Spectrum-X e il software NVIDIA AI Enterprise. Associando questa avanzata infrastruttura NVIDIA alla piattaforma dati WEKA, le aziende possono implementare una base di storage altamente scalabile progettata esplicitamente per carichi di lavoro di inferenza AI ad alte prestazioni.
Questa soluzione integrata affronta direttamente le crescenti richieste di intelligenza artificiale aziendale, fornendo agli agenti di query di intelligenza artificiale un accesso fluido e accelerato a business intelligence critica, con conseguenti prestazioni di inferenza e accuratezza del ragionamento notevolmente migliorate. La piattaforma dati di WEKA garantisce che i sistemi di intelligenza artificiale possano trasformare rapidamente i dati in informazioni fruibili, supportando così il ragionamento sofisticato richiesto dai modelli di intelligenza artificiale di prossima generazione.
Griglia di memoria aumentata WEKA
I modelli Agentic AI si evolvono continuamente e possono gestire finestre di contesto più grandi, conteggi di parametri espansivi e requisiti di memoria più significativi. Questi progressi spesso spingono i limiti delle tradizionali capacità di memoria GPU, creando colli di bottiglia nell'inferenza AI. WEKA affronta queste sfide con la sua rivoluzionaria soluzione Augmented Memory Grid, un'innovazione che estende la memoria disponibile per i carichi di lavoro AI, fornendo incrementi su scala petabyte, ben oltre le attuali limitazioni di un singolo terabyte.
L'Augmented Memory Grid di WEKA migliora significativamente l'inferenza AI combinando il software della piattaforma dati di WEKA con le tecnologie di elaborazione e networking accelerate di NVIDIA. Questa combinazione consente un accesso a velocità quasi di memoria con latenza di microsecondi, migliorando notevolmente le prestazioni di elaborazione dei token e l'efficienza complessiva dell'inferenza AI.
I principali vantaggi della griglia di memoria aumentata di WEKA includono:
-
Latenza notevolmente ridotta: Nei test condotti su 105,000 token, la Augmented Memory Grid di WEKA ha prodotto un notevole miglioramento di 41 volte nel tempo per il primo token rispetto ai metodi di ricalcolo tradizionali.
-
Throughput token ottimizzato:La soluzione WEKA gestisce in modo efficiente i carichi di lavoro di inferenza tra cluster, ottenendo una maggiore produttività dei token a un costo complessivo ridotto, riducendo il costo per token elaborato fino al 24% nell'intero sistema.
Questi miglioramenti in termini di prestazioni si traducono direttamente in una maggiore efficienza economica, consentendo alle aziende di accelerare l'innovazione basata sull'intelligenza artificiale senza compromettere le capacità del modello o le prestazioni dell'infrastruttura.
WEKApod Nitro
Le appliance WEKApod Nitro Data Platform hanno ottenuto numerose certificazioni NVIDIA, affermando WEKA come fornitore leader di storage ad alte prestazioni per l'intelligenza artificiale aziendale:
-
Certificazione NVIDIA Cloud Partner (NCP): WEKApod Nitro è tra le prime soluzioni di storage certificate per le architetture di riferimento NCP di NVIDIA, tra cui HGX H200, B200 e GB200 NVL72. Questi dispositivi potenziano i provider di servizi e gli sviluppatori supportando enormi cluster GPU, fino a 1,152 GPU in una configurazione 8U, mantenendo al contempo una densità di prestazioni ed efficienza energetica eccezionali.
-
Designazione di archiviazione dei sistemi certificati NVIDIA: Le appliance WEKApod Nitro hanno ricevuto la nuova certificazione di storage aziendale di NVIDIA, che garantisce la compatibilità con le architetture di riferimento aziendali NVIDIA e le best practice. Questa designazione convalida che la piattaforma dati di WEKA offre prestazioni di storage ottimali, efficienza e scalabilità per le distribuzioni AI e HPC aziendali più esigenti.
Nilesh Patel, Chief Product Officer di WEKA, ha sottolineato il potenziale trasformativo di questa partnership con NVIDIA. Paragonando questo sviluppo alle innovazioni nel settore aerospaziale, Patel ha affermato: "Così come la rottura della barriera del suono ha aperto nuove frontiere, la Augmented Memory Grid di WEKA infrange la barriera della memoria AI, espandendo drasticamente la memoria GPU e ottimizzando l'efficienza dei token. Questa innovazione trasforma radicalmente l'economia dei token AI, consentendo un'innovazione più rapida e costi inferiori senza sacrificare le prestazioni".
Rob Davis, Vice President of Storage Networking Technology presso NVIDIA, ha ulteriormente sottolineato l'importanza di questa integrazione: "Le aziende che implementano modelli di ragionamento e AI agentici richiedono efficienza e scalabilità senza precedenti. La combinazione delle tecnologie NVIDIA e WEKA garantisce che gli agenti AI possano accedere ed elaborare i dati con velocità e accuratezza senza pari durante l'inferenza".
Disponibilità
- L'architettura di riferimento NCP di WEKA per i sistemi NVIDIA Blackwell sarà disponibile a marzo.
- La funzionalità WEKA Augmented Memory Grid sarà generalmente disponibile per i clienti della piattaforma dati WEKA nella primavera del 2025.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed