NVIDIA ha attirato l'attenzione ad AWS re:Invent presentando NVIDIA NeMo Retriever, un nuovo microservizio di intelligenza artificiale generativa che promette di migliorare il panorama dell'intelligenza artificiale aziendale consentendo l'integrazione di modelli LLM (Large Language Model) personalizzati con i dati aziendali. L’obiettivo è che NeMo Retriever fornisca risposte accurate senza precedenti per le applicazioni IA in azienda.
NVIDIA ha attirato l'attenzione ad AWS re:Invent presentando NVIDIA NeMo Retriever, un nuovo microservizio di intelligenza artificiale generativa che promette di migliorare il panorama dell'intelligenza artificiale aziendale consentendo l'integrazione di modelli LLM (Large Language Model) personalizzati con i dati aziendali. L’obiettivo è che NeMo Retriever fornisca risposte accurate senza precedenti per le applicazioni IA in azienda.
NVIDIA NeMo Retriever è l'ultima aggiunta alla famiglia NeMo, nota per i suoi framework e strumenti avanzati progettati per creare, personalizzare e distribuire modelli di IA generativa all'avanguardia. Questo microservizio di recupero semantico di livello aziendale è progettato per migliorare le applicazioni di intelligenza artificiale generativa con robuste funzionalità RAG (retrieval-augmented generation).
Ciò che distingue NeMo Retriever è la sua capacità di fornire risposte più accurate attraverso algoritmi ottimizzati da NVIDIA. Questo microservizio consente agli sviluppatori di connettere senza soluzione di continuità le proprie applicazioni AI a diversi dati aziendali, indipendentemente dalla posizione, nei cloud o nei data center. Parte della piattaforma software NVIDIA AI Enterprise, è comodamente disponibile nel Marketplace AWS.
NVIDIA NeMo Retriever già in uso
L’impatto della tecnologia è già avvertito dalla collaborazione di leader del settore come Cadence, Dropbox, SAP e ServiceNow con NVIDIA. Stanno integrando questa tecnologia nelle loro applicazioni e servizi personalizzati di intelligenza artificiale generativa, spingendo i confini di ciò che è possibile nella business intelligence.
“L’intelligenza artificiale generativa introduce approcci innovativi per soddisfare le esigenze dei clienti, come strumenti per scoprire potenziali difetti nelle prime fasi del processo di progettazione”, Anirudh Devgan, presidente e CEO di Cadence
Cadence, leader globale nella progettazione di sistemi elettronici, sta sfruttando NeMo Retriever per sviluppare funzionalità RAG per applicazioni IA nella progettazione elettronica industriale. Anirudh Devgan, CEO di Cadence, ha evidenziato il potenziale dell’intelligenza artificiale generativa nello scoprire tempestivamente i difetti di progettazione, accelerando così lo sviluppo di prodotti di alta qualità.
A differenza dei toolkit RAG open source, NeMo Retriever sta arrivando sul mercato con la sua posizione pronta per la produzione, offrendo modelli commercialmente validi, stabilità API, patch di sicurezza e supporto aziendale. I suoi modelli di incorporamento ottimizzati rappresentano un importante progresso tecnologico, catturando complesse relazioni tra parole e migliorando le capacità di elaborazione e analisi dei LLM.
Perché NVIDIA NeMo Retriever è importante
La capacità di NeMo Retriever di connettere LLM a più fonti di dati e basi di conoscenza è notevole. Consente agli utenti di interagire con i dati attraverso semplici istruzioni conversazionali, ottenendo risposte precise e aggiornate. Questa funzionalità si estende a varie modalità di dati, inclusi testo, PDF, immagini e video, garantendo un accesso completo e sicuro alle informazioni.
La cosa più interessante è che NVIDIA NeMo Retriever promette risultati più accurati con meno formazione, accelerando il time-to-market e supportando l'efficienza energetica nel flusso di lavoro di sviluppo di applicazioni di intelligenza artificiale generativa.
È qui che NeMo Retriever brilla davvero. Integrando RAG con LLM, NeMo Retriever supera i limiti dei modelli tradizionali. RAG combina la potenza del recupero delle informazioni con i LLM, in particolare per le applicazioni di risposta alle domande in dominio aperto, migliorando così in modo significativo l'accesso dei LLM a basi di conoscenza vaste e aggiornabili.
Uno sguardo alla pipeline RAG
NeMo Retriever ottimizza i processi RAG, partendo dalla codifica della knowledge base in fase offline. In questa fase, i documenti in vari formati vengono suddivisi e incorporati utilizzando un modello di deep learning per produrre rappresentazioni vettoriali dense. Questi vengono poi archiviati in un database vettoriale, fondamentale per le successive ricerche semantiche. Il processo di incorporamento è fondamentale, poiché cattura le relazioni tra le parole, consentendo agli LLM di elaborare e analizzare i dati testuali con maggiore precisione.
Dietro il cofano, nella produzione e nel rispondere alle domande è dove le capacità di NeMo Retriever brillano davvero. Prevede due fasi cruciali: il recupero dal database dei vettori e la generazione della risposta. Quando un utente inserisce una query, NeMo Retriever incorpora innanzitutto questa query come un vettore denso, utilizzandola per effettuare ricerche nel database dei vettori. Questo database recupera quindi i blocchi di documenti più rilevanti relativi alla query. Nella fase finale, questi blocchi vengono combinati per formare un contesto che, insieme alla query dell’utente, viene inserito nel LLM. Questo processo garantisce che le risposte generate siano accurate e altamente pertinenti alla query dell'utente.
Superare le sfide aziendali con NVIDIA NeMo
Costruire una pipeline RAG per le applicazioni aziendali è una sfida significativa. Dalla complessità delle query del mondo reale alla richiesta di conversazioni multi-turn, le aziende necessitano di una soluzione che sia tecnologicamente avanzata, conforme e commercialmente valida. NeMo Retriever mira a svolgere questo compito fornendo componenti pronti per la produzione ottimizzati per bassa latenza e throughput elevato, promettendo che le aziende possano implementare queste funzionalità nelle loro applicazioni IA.
L'impegno di NVIDIA nei confronti di questa tecnologia si estende al miglioramento continuo dei suoi modelli e servizi, come con il modello di incorporamento di recupero di domande e risposte NVIDIA. In quanto codificatore trasformatore, NVIDIA afferma che è stato ottimizzato per fornire gli incorporamenti più accurati per le risposte alle domande basate su testo, sfruttando set di dati sia privati che pubblici.
Potenziare le imprese con un'intelligenza artificiale all'avanguardia
Le applicazioni pratiche di NeMo Retriever sono vaste e varie. Dagli assistenti IT e HR agli assistenti di ricerca R&S, la capacità di NeMo Retriever di connettere LLM a più origini dati e basi di conoscenza consente alle aziende di interagire con i dati in modo più colloquiale e intuitivo. NeMo Retriever è pronto a migliorare l'esperienza dell'utente e a promuovere l'efficienza e la produttività in varie funzioni aziendali nelle aziende.
Gli sviluppatori desiderosi di sfruttare questa tecnologia rivoluzionaria possono registrarsi per ottenere l'accesso anticipato a NVIDIA NeMo Retriever.
L’entusiasmo che circonda questa versione è palpabile, poiché migliora le attuali capacità di intelligenza artificiale e apre una serie di possibilità per l’adozione del LLM nel settore aziendale. Il termine "punto di svolta" viene utilizzato più spesso nelle recenti notizie sull'intelligenza artificiale. Tuttavia, NeMo Retriever è una chiave di volta nel collegare l’intelligenza artificiale generativa e la business intelligence fruibile, fornendo un ponte tangibile tra capacità avanzate di intelligenza artificiale e applicazioni aziendali del mondo reale.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed