NVIDIA ha dato il via alla sessione GTC 2022 con un keynote del CEO Jensen Huang ricco di grafica e animazioni impressionanti. Il keynote aveva qualcosa per tutti. I giocatori ricevono una nuova GPU GeForce RTX 40; rendering neurale impressionante per giochi e applicazioni; NVIDIA Hopper entra in piena produzione; i servizi cloud di grandi modelli linguistici fanno avanzare l’intelligenza artificiale; Servizi cloud omniverse; Sistemi informatici OVX; una GPU per designer e creatori; automobilistico ottenere DRIVE Thor; Jetson Orin Nano per l'IA entry-level; e la piattaforma di elaborazione AI IGX Edge.
NVIDIA ha dato il via alla sessione GTC 2022 con un keynote del CEO Jensen Huang ricco di grafica e animazioni impressionanti. Il keynote aveva qualcosa per tutti. I giocatori ricevono una nuova GPU GeForce RTX 40; rendering neurale impressionante per giochi e applicazioni; NVIDIA Hopper entra in piena produzione; i servizi cloud di grandi modelli linguistici fanno avanzare l’intelligenza artificiale; Servizi cloud omniverse; Sistemi informatici OVX; una GPU per designer e creatori; automobilistico ottenere DRIVE Thor; Jetson Orin Nano per l'IA entry-level; e la piattaforma di elaborazione AI IGX Edge.
GeForce RTX 40
Il primo all'ordine del giorno è stato l'annuncio delle GPU GeForce RTX serie 40 di nuova generazione alimentate da ADA Lovelace, progettate per offrire prestazioni estreme a giocatori e creatori. Il nuovo modello di punta, la GPU RTX 4090, offre fino a 4 volte le prestazioni del suo predecessore.
Prima GPU basata sulla nuova architettura NVIDIA Ada Lovelace, la serie RTX 40 offre miglioramenti in termini di prestazioni ed efficienza e rappresenta una nuova era di ray tracing in tempo reale e rendering neurale, che utilizza l'intelligenza artificiale per generare pixel. Le GPU RTX serie 40 presentano una gamma di nuove innovazioni tecnologiche, tra cui:
- Multiprocessori di streaming con un massimo di 83 teraflop di potenza shader: 2 volte rispetto alla generazione precedente.
- Core RT di terza generazione con un massimo di 191 teraflop di ray-tracing effettivi: 2.8 volte rispetto alla generazione precedente.
- Tensor Core di quarta generazione con un massimo di 1.32 petaflop Tensor: 5 volte rispetto alla generazione precedente utilizzando l'accelerazione FP8.
- Shader Execution Reordering (SER) migliora l'efficienza di esecuzione riprogrammando al volo i carichi di lavoro di shading per utilizzare meglio le risorse della GPU. SER migliora le prestazioni del ray tracing fino a 3 volte e il frame rate in-game fino al 25%.
- Ada Optical Flow Accelerator con prestazioni 2 volte più veloci consente a DLSS 3 di prevedere il movimento in una scena, consentendo alla rete neurale di aumentare il frame rate mantenendo la qualità dell'immagine.
- I miglioramenti architettonici strettamente associati alla tecnologia di processo personalizzata TSMC 4N comportano un incremento fino a 2 volte dell'efficienza energetica.
- I doppi codificatori NVIDIA (NVENC) riducono i tempi di esportazione fino alla metà e dispongono del supporto AV1. La codifica NVENC AV1 viene adottata da OBS, Blackmagic Design, DaVinci Resolve, Discord e altri.
DLSS 3 genera interi frame per un gioco più veloce
Poi è arrivata NVIDIA DLSS 3, la rivoluzione successiva nella tecnologia grafica neurale Deep Learning Super Sampling dell'azienda per giochi e app creative. La tecnologia basata sull'intelligenza artificiale può generare interi fotogrammi per un gameplay estremamente veloce, superando i limiti delle prestazioni della CPU nei giochi consentendo alla GPU di generare interi fotogrammi indipendentemente.
La tecnologia sta arrivando su popolari motori di gioco come Unity e Unreal Engine e ha ricevuto il supporto dei principali sviluppatori di giochi, con più di 35 giochi e app in arrivo.
GPU H100 Tensor Core
Le GPU NVIDIA H100 Tensor Core è in piena produzione e i partner stanno pianificando il lancio di ottobre per la prima ondata di prodotti e servizi basati sull'architettura NVIDIA Hopper.
L'H100, annunciato a marzo, è costruito con 80 miliardi di transistor e beneficia di un nuovo potente Transformer Engine e di un'interconnessione NVIDIA NVLink per accelerare i più grandi modelli di intelligenza artificiale, come sistemi di raccomandazione avanzati e modelli linguistici di grandi dimensioni, e per promuovere innovazioni in campi come IA conversazionale e scoperta di farmaci.
La GPU H100 è alimentata da diverse innovazioni chiave nella piattaforma di elaborazione dati accelerata di NVIDIA, tra cui GPU multi-istanza di seconda generazione, elaborazione riservata, NVIDIA NVLink di quarta generazione e istruzioni DPX.
Una licenza quinquennale per la suite software NVIDIA AI Enterprise è ora inclusa con H100 per i server mainstream. Ciò ottimizza lo sviluppo e l'implementazione dei flussi di lavoro dell'intelligenza artificiale e garantisce che le organizzazioni abbiano accesso ai framework e agli strumenti di intelligenza artificiale necessari per creare chatbot IA, motori di raccomandazione, intelligenza artificiale visiva e altro ancora.
Venendo su una piattaforma vicino a te
Per i clienti che desiderano provare immediatamente la nuova tecnologia, NVIDIA ha annunciato che H100 sui server Dell PowerEdge è ora disponibile su Nvidia LaunchPad, che fornisce laboratori pratici gratuiti, offrendo alle aziende l'accesso all'hardware e al software NVIDIA AI più recenti.
I clienti possono anche iniziare a ordinare i sistemi NVIDIA DGX H100, che includono otto GPU H100 e forniscono 32 petaflop di prestazioni con precisione FP8. Il software NVIDIA Base Command e NVIDIA AI Enterprise alimenta ogni sistema DGX, consentendo implementazioni da un singolo nodo a un NVIDIA DGX SuperPOD, supportando lo sviluppo avanzato di intelligenza artificiale di modelli linguistici di grandi dimensioni e altri carichi di lavoro massicci.
I partner che realizzano sistemi includono Atos, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo e Supermicro.
Inoltre, alcuni dei principali istituti di istruzione superiore e di ricerca del mondo utilizzeranno l’H100 per alimentare i loro supercomputer di prossima generazione. Tra questi ci sono il Barcelona Supercomputing Center, il Los Alamos National Lab, lo Swiss National Supercomputing Center (CSCS), il Texas Advanced Computing Center e l'Università di Tsukuba.
H100 in arrivo sul cloud
Amazon Web Services, Google Cloud, Microsoft Azure e Oracle Cloud Infrastructure saranno tra i primi a distribuire istanze basate su H100 nel cloud a partire dal prossimo anno.
Servizi AI cloud NVIDIA Large Language Model
Sono stati annunciati il servizio NVIDIA NeMo Large Language Model Service e il servizio NVIDIA BioNeMo LLM, servizi AI cloud per modelli linguistici di grandi dimensioni. Questo nuovo servizio LLM consente agli sviluppatori di adattare facilmente LLM e distribuire applicazioni IA personalizzate per la generazione di contenuti, il riepilogo di testi, i chatbot, lo sviluppo di codici, la struttura delle proteine e le previsioni sulle proprietà biomolecolari e altro ancora.
Il servizio NeMo LLM consente agli sviluppatori di personalizzare rapidamente una serie di modelli di base pre-addestrati utilizzando un metodo di formazione chiamato apprendimento rapido sull'infrastruttura gestita da NVIDIA. Il servizio NVIDIA BioNeMo è un'interfaccia di programmazione delle applicazioni (API) cloud che espande i casi d'uso LLM oltre le applicazioni linguistiche e scientifiche per accelerare la scoperta di farmaci per le aziende farmaceutiche e biotecnologiche.
Onniverso
NVIDIA Omniverse Cloud è la prima offerta di software e infrastruttura come servizio dell'azienda. Omniverse è una suite di servizi cloud che consente ad artisti, sviluppatori e team aziendali di progettare, pubblicare, utilizzare e sperimentare applicazioni metaverse ovunque.
Utilizzando Omniverse Cloud, individui e team possono sperimentare con un clic la capacità di progettare e collaborare su flussi di lavoro 3D senza la necessità di alcuna potenza di elaborazione locale. Gli esperti di robotica possono addestrare, simulare, testare e distribuire macchine intelligenti abilitate all'intelligenza artificiale con maggiore scalabilità e accessibilità. Gli ingegneri dei veicoli autonomi possono generare dati provenienti da sensori basati sulla fisica e simulare scenari di traffico per testare varie condizioni stradali e meteorologiche per un'implementazione sicura della guida autonoma.
I primi sostenitori di Omniverse Cloud includono RIMAC Group, WPP e Siemens.
Servizi Cloud Omniverse
I servizi Omniverse Cloud vengono eseguiti su Omniverse Cloud Computer, un sistema informatico composto da NVIDIA OVX per la simulazione grafica e fisica, NVIDIA HGX per carichi di lavoro avanzati di intelligenza artificiale e NVIDIA Graphics Delivery Network (GDN), una rete di data center distribuiti su scala globale per la fornitura grafica metaverse ad alte prestazioni e a bassa latenza all'edge.
I servizi Omniverse Cloud includono:
- Omniverse Nucleus Cloud: offre ai progettisti e ai team 3D la libertà di collaborare e accedere a scene e dati 3D condivisi basati su Universal Scene Description (USD). Nucleus Cloud consente a qualsiasi progettista, creatore o sviluppatore di salvare modifiche, condividere, apportare modifiche in tempo reale e visualizzare le modifiche in una scena praticamente ovunque.
- Omniverse App Streaming: consente agli utenti senza GPU NVIDIA RTX™ di eseguire lo streaming di applicazioni di riferimento Omniverse come Omniverse Create, un'app per designer e creatori per costruire mondi virtuali basati su USD; Omniverse View, un'app per revisioni e approvazioni; e NVIDIA Isaac Sim, per la formazione e il test dei robot.
- Omniverse Replicator: consente a ricercatori, sviluppatori e aziende di generare dati sintetici 3D fisicamente accurati e di creare facilmente strumenti personalizzati per la generazione di dati sintetici per accelerare la formazione e l'accuratezza delle reti di percezione e integrarsi facilmente con i servizi cloud NVIDIA AI.
- Omniverse Farm: consente agli utenti e alle aziende di sfruttare più istanze di cloud computing per scalare le attività Omniverse come il rendering e la generazione di dati sintetici.
- NVIDIA Isaac Sim: un'applicazione scalabile di simulazione robotica e uno strumento di generazione di dati sintetici che alimenta ambienti virtuali fotorealistici e fisicamente accurati per sviluppare, testare e gestire robot basati sull'intelligenza artificiale.
- NVIDIA DRIVE Sim: una piattaforma di simulazione end-to-end per eseguire simulazioni multisensore su larga scala e fisicamente accurate per supportare lo sviluppo e la convalida di veicoli autonomi dall'ideazione all'implementazione, migliorando la produttività degli sviluppatori e accelerando il time-to-market.
Servizi informatici OVX
NVIDIA ha annunciato la seconda generazione di NVIDIA OVX, basata sull'architettura GPU NVIDIA Ada Lovelace e su una tecnologia di rete avanzata, per offrire funzionalità di simulazione di grafica in tempo reale, intelligenza artificiale e digital twin.
I nuovi sistemi NVIDIA OVX sono progettati per costruire mondi virtuali 3D utilizzando le principali applicazioni software 3D e per eseguire simulazioni immersive di gemelli digitali in NVIDIA Omniverse Enterprise, una piattaforma scalabile end-to-end che consente alle aziende di creare e gestire applicazioni metaverse.
NVIDIA OVX è un sistema informatico progettato per alimentare i gemelli digitali Omniverse su larga scala. Sarà consegnato ad alcuni dei team di progettazione e ingegneria più sofisticati del mondo presso aziende come BMW Group e Jaguar Land Rover.
Ad alimentare i nuovi sistemi OVX è la GPU NVIDIA L40, anch'essa basata sull'architettura GPU NVIDIA Ada Lovelace, che offre i più alti livelli di potenza e prestazioni per la costruzione di complessi gemelli digitali industriali.
I core RT di terza generazione e i core Tensor di quarta generazione della GPU L40 offriranno potenti funzionalità ai carichi di lavoro Omniverse in esecuzione su OVX, tra cui rendering accelerato di materiali con ray tracing e path tracing, simulazioni fisicamente accurate e generazione di dati sintetici 3D fotorealistici. L'L40 sarà disponibile anche nei server NVIDIA-Certified Systems dei principali fornitori OEM per alimentare i carichi di lavoro RTX dal data center.
NVIDIA OVX include anche NVIDIA ConnectX-7 SmartNIC, che fornisce prestazioni di rete e storage migliorate e la sincronizzazione temporale di precisione richiesta per i gemelli digitali realistici. ConnectX-7 include il supporto per la rete 200G su ciascuna porta e la crittografia rapida dei dati in linea per accelerare lo spostamento dei dati e aumentare la sicurezza per i gemelli digitali.
GPU per workstation NVIDIA RTX 6000
La GPU NVIDIA RTX 6000 Ada Generation offre rendering, grafica e intelligenza artificiale in tempo reale. Progettisti e ingegneri possono gestire flussi di lavoro avanzati basati sulla simulazione per creare e convalidare progetti più sofisticati. Gli artisti possono portare la narrazione a un livello superiore, creando contenuti più avvincenti e costruendo ambienti virtuali coinvolgenti. Scienziati, ricercatori e professionisti medici possono accelerare lo sviluppo di farmaci e procedure salvavita con la potenza di supercalcolo sulle loro postazioni di lavoro. Il tutto con prestazioni fino a 2-4 volte superiori a quelle dell'RTX A6000 della generazione precedente.
Progettata per la grafica neurale e la simulazione avanzata del mondo virtuale, RTX 6000, con AI di generazione Ada e tecnologia shader programmabile, è la piattaforma ideale per creare contenuti e strumenti per il metaverso con NVIDIA Omniverse Enterprise. L'RTX 6000 consente agli utenti di creare contenuti dettagliati, sviluppare simulazioni complesse e formare gli elementi costitutivi necessari per costruire mondi virtuali avvincenti e coinvolgenti.
Tecnologia RTX di nuova generazione
Basata sull'architettura NVIDIA Ada, NVIDIA RTX 6000 è dotata della tecnologia NVIDIA RTX all'avanguardia con funzionalità come:
- Core RT di terza generazione: Fino a 2 volte il throughput della generazione precedente con la possibilità di eseguire contemporaneamente ray tracing con funzionalità di shading o denoising.
- Tensor Core di quarta generazione: Prestazioni di formazione AI fino a 2 volte più veloci rispetto alla generazione precedente con supporto esteso per il formato dati FP8.
- Nuclei CUDA: Fino a 2 volte il throughput in virgola mobile a precisione singola rispetto alla generazione precedente.
- Memoria GPU: Dispone di 48 GB di memoria GDDR6 per lavorare con i modelli 3D più grandi, immagini di rendering, simulazioni e set di dati AI.
- Virtualization: supporterà il software NVIDIA Virtual GPU (vGPU) per più istanze di workstation virtuali ad alte prestazioni, consentendo agli utenti remoti di condividere risorse e gestire carichi di lavoro di progettazione, intelligenza artificiale ed elaborazione di fascia alta.
- XR: Offre prestazioni di codifica video 3 volte superiori rispetto alla generazione precedente per lo streaming di più sessioni XR simultanee utilizzando NVIDIA CloudXR.
NVIDIA DRIVE Orin
Inizia la produzione del computer per veicoli autonomi NVIDIA DRIVE Orin, vengono presentati i nuovi produttori automobilistici che adottano la piattaforma NVIDIA DRIVE™ e svelata la prossima generazione della sua architettura NVIDIA DRIVE Hyperion. NVIDIA ha inoltre annunciato che la sua produzione automobilistica sarà aumentata fino a superare gli 11 miliardi di dollari nei prossimi sei anni, a seguito di una serie di successi di progettazione con produttori di veicoli di tutto il mondo.
Più di 25 produttori di veicoli hanno adottato il sistema su chip (SoC) NVIDIA DRIVE Orin. A partire da quest’anno, verranno introdotti veicoli definiti dal software costruiti sulla piattaforma di calcolo IA centralizzata.
DRIVE Hyperion con NVIDIA Orin funge da sistema nervoso centrale e cervello AI per i veicoli a nuova energia, offrendo funzionalità AI all'avanguardia e in costante miglioramento garantendo al contempo capacità di guida sicure e protette.
È stata inoltre annunciata la prossima generazione dell'architettura DRIVE Hyperion, costruita sul computer Atlan, per i veicoli che inizieranno a essere spediti nel 2026. La piattaforma DRIVE Hyperion è progettata per scalare tra generazioni in modo che i clienti possano sfruttare gli investimenti attuali per le architetture future.
La piattaforma di prossima generazione aumenterà le prestazioni per l'elaborazione dei dati dei sensori ed estenderà gli ambiti operativi della guida completamente autonoma. DRIVE Hyperion 9 sarà dotato di 14 telecamere, nove radar, tre lidar e 20 ultrasuoni come parte della sua suite di sensori.
NVIDIA DRIVEThor
NVIDIA DRIVE Thor è il computer centralizzato di nuova generazione per veicoli autonomi sicuri e protetti. DRIVE Thor raggiunge fino a 2,000 teraflop e unifica funzioni intelligenti, tra cui guida automatizzata e assistita, parcheggio, monitoraggio del conducente e degli occupanti, quadro strumenti digitale, infotainment di bordo (IVI) e intrattenimento dei sedili posteriori in un'unica architettura per una maggiore efficienza e costo complessivo del sistema inferiore.
Il superchip di nuova generazione è dotato delle funzionalità IA all'avanguardia introdotte per la prima volta nell'architettura GPU multi-istanza NVIDIA Hopper, insieme alla CPU NVIDIA Grace e alla GPU NVIDIA Ada Lovelace. DRIVE Thor, con il supporto MIG per grafica e calcolo, consente a IVI e ai sistemi avanzati di assistenza alla guida di eseguire l'isolamento del dominio, che consente l'esecuzione simultanea di processi critici in termini di tempo senza interruzioni. Disponibile per i modelli 2025 delle case automobilistiche, accelererà i piani di produzione portando sul mercato prestazioni più elevate e funzionalità avanzate nella stessa sequenza temporale.
NVIDIA Jetson Orin Nano
NVIDIA ha annunciato l'espansione della gamma NVIDIA Jetson con il lancio dei nuovi system-on-modules Jetson Orin Nano che offrono prestazioni fino a 80 volte superiori rispetto alla generazione precedente, stabilendo un nuovo standard per l'intelligenza artificiale e la robotica entry-level.
La famiglia NVIDIA Jetson comprende ora sei moduli di produzione basati su Orin che supportano una gamma completa di applicazioni di robotica e IA edge. Ciò include Orin Nano, che offre fino a 40 trilioni di operazioni al secondo (TOPS) di prestazioni AI nel più piccolo fattore di forma Jetson, fino all'AGX Orin, che offre 275 TOPS per macchine autonome avanzate.
Jetson Orin è dotato di GPU con architettura NVIDIA Ampere, CPU basate su Arm, acceleratori di visione e deep learning di nuova generazione, interfacce ad alta velocità, larghezza di banda di memoria veloce e supporto di sensori multimodali. Queste prestazioni e versatilità consentono a un numero maggiore di clienti di commercializzare prodotti che una volta sembravano impossibili, dagli ingegneri che implementano applicazioni AI all'avanguardia agli sviluppatori di sistemi operativi robotici (ROS) che costruiscono macchine intelligenti di prossima generazione.
NVIDIA IGX Edge AI
La piattaforma NVIDIA IGX è stata annunciata oggi. IGX viene utilizzato per l'intelligenza artificiale edge ad alta precisione, offrendo sicurezza avanzata e proattiva a settori sensibili come la produzione, la logistica e la sanità. In passato, tali settori richiedevano soluzioni costose realizzate su misura per casi d’uso specifici, ma la piattaforma IGX è facilmente programmabile e configurabile per soddisfare le diverse esigenze.
IGX fornisce un ulteriore livello di sicurezza nelle fabbriche e nei magazzini del mondo fisico altamente regolamentati per la produzione e la logistica. Per i casi d’uso dell’IA medicale, IGX offre un’inferenza AI sicura e a bassa latenza per soddisfare la richiesta clinica di informazioni istantanee da vari strumenti e sensori per procedure mediche, come la chirurgia assistita da robot e il monitoraggio dei pazienti.
Piattaforma NVIDIA IGX: garanzia di conformità nell'Edge AI
La piattaforma NVIDIA IGX è una potente combinazione di hardware e software che include NVIDIA IGX Orin, un supercomputer AI potente, compatto ed efficiente dal punto di vista energetico per macchine industriali e dispositivi medici autonomi.
I kit per sviluppatori IGX Orin saranno disponibili all'inizio del prossimo anno per consentire alle aziende di prototipare e testare i prodotti. Ogni kit è dotato di GPU e CPU integrate per elaborazione AI ad alte prestazioni e di uno SmartNIC NVIDIA ConnectX-7 per fornire reti ad alte prestazioni con latenza ultrabassa e sicurezza avanzata.
È incluso anche un potente stack software con funzionalità critiche di sicurezza e protezione che possono essere programmate e configurate per diversi casi d'uso. Queste funzionalità consentono alle aziende di aggiungere sicurezza proattiva negli ambienti in cui esseri umani e robot lavorano fianco a fianco, come magazzini e sale operatorie.
La piattaforma IGX può eseguire il software NVIDIA AI Enterprise, ottimizzando lo sviluppo e l'implementazione dei flussi di lavoro AI e garantendo alle organizzazioni l'accesso ai framework e agli strumenti AI necessari. NVIDIA sta inoltre collaborando con partner di sistemi operativi come Canonical, Red Hat e SUSE per offrire alla piattaforma un supporto completo e a lungo termine.
Per la gestione di IGX in ambienti industriali e medici, NVIDIA Fleet Command consente alle organizzazioni di distribuire software e aggiornamenti di sistema sicuri e via etere da una console cloud centrale.
Fare clic sul collegamento per leggere la storia completa su Discorso chiave del GTC 2022.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed