NVIDIA et Microsoft Azure s'enflamment avec de nouvelles offres comme AI Foundry et GenAI, des simulateurs AV

La semaine a été chargée pour NVIDIA, et ce n'est pas fini. NVIDIA déploie un service de fonderie d'IA sur Microsoft Azure, et il s'agit d'un nouvel outil puissant pour les entreprises qui se lancent dans l'IA générative personnalisée.

Voici ce que le service de fonderie d'IA de NVIDIA apporte :

Modèles NVIDIA AI Foundation : ce sont vos éléments de base en matière d'IA.
Framework et outils NVIDIA NeMo : la boîte à outils pour affiner votre IA.
Services NVIDIA DGX Cloud AI Supercomputing : la centrale pour transformer vos rêves en matière d'IA en réalité.

Ces éléments permettent aux entreprises de créer leurs propres modèles d'IA pour des tâches telles que la recherche intelligente et la création de contenu, le tout optimisé par le logiciel NVIDIA AI Enterprise.

Modèles personnalisés pour les applications génératives basées sur l'IA

Le service de fonderie d'IA de NVIDIA peut personnaliser des modèles pour des applications génératives basées sur l'IA dans tous les secteurs, notamment les logiciels d'entreprise, les télécommunications et les médias. Lorsque les modèles personnalisés sont prêts à être déployés, les entreprises peuvent utiliser une technique appelée génération augmentée par récupération (RAG) pour connecter leurs modèles aux données de leur entreprise et accéder à de nouvelles informations.

Le service de NVIDIA n'est pas seulement destiné au spectacle ; c'est pratique. Les leaders du secteur SAP SE, Amdocs et Getty Images créent déjà des modèles personnalisés avec ce service. Les industries du logiciel aux télécommunications peuvent désormais créer des applications d’IA adaptées à leurs besoins. SAP l'utilise pour son copilote d'IA, Joule, et Amdocs améliore son cadre amAIz pour les solutions d'IA de télécommunications.

Jensen Huang, PDG de NVIDIA, souligne la capacité du service à adapter l'IA à l'aide des données uniques d'une entreprise. Et Satya Nadella, PDG de Microsoft, s'efforce de promouvoir l'innovation en matière d'IA sur Azure avec l'aide de NVIDIA.

Némotron-3 8B

NVIDIA propose une variété de modèles AI Foundation, y compris la famille polyvalente Nemotron-3 8B, disponible sur les catalogues Azure AI et NVIDIA NGC. Ces modèles sont prêts pour une utilisation multilingue et diverses applications. Optimisés pour NVIDIA pour le calcul accéléré, les modèles communautaires tels que les modèles Llama 2 de Meta sont également disponibles sur NVIDIA NGC et arriveront bientôt dans le catalogue de modèles Azure AI.

NVIDIA DGX Cloud arrive sur la place de marché Azure

Le supercalcul NVIDIA DGX Cloud AI est désormais sur Azure Marketplace. Louez ce dont vous avez besoin, évoluez facilement et profitez du logiciel NVIDIA AI Enterprise pour une personnalisation LLM rapide. Il propose des instances que les clients peuvent louer, évolutives vers des milliers de GPU NVIDIA Tensor Core, et est livré avec le logiciel NVIDIA AI Enterprise, dont NeMo, pour accélérer la personnalisation LLM.

Avec NVIDIA AI Enterprise intégré à Azure Machine Learning, les utilisateurs bénéficient d’une plateforme d’IA stable et sécurisée. Il est également disponible sur Azure Marketplace, offrant une gamme de possibilités de développement et de déploiement d'IA.

Le service de fonderie d'IA de NVIDIA sur Azure n'est pas seulement une mise à jour ; c'est une approche innovante du développement d'IA personnalisé.

NVIDIA et Microsoft améliorent Azure avec des capacités d'IA avancées

Microsoft améliore son jeu d'IA sur Azure, en introduisant de nouvelles machines virtuelles basées sur H100 et en planifiant l'ajout futur du GPU H200 Tensor Core. Annoncée lors de la conférence Ignite, la nouvelle série de VM NC H100 v5 est une première dans le cloud computing, dotée des GPU NVIDIA H100 NVL. Ces machines virtuelles ont du punch avec deux GPU H100 basés sur PCIe reliés par NVIDIA NVLink, offrant près de 4 pétaflops de calcul IA et 188 Go de mémoire HBM3 haute vitesse. Le GPU H100 NVL est une centrale électrique, offrant des performances jusqu'à 12 fois supérieures sur le GPT-3 175B par rapport aux modèles précédents, parfait pour les charges de travail d'inférence et de formation grand public.

Intégration du GPU NVIDIA H200 Tensor Core dans Azure

Microsoft prévoit d'intégrer le GPU NVIDIA H200 Tensor Core dans Azure l'année prochaine. Cette mise à niveau est conçue pour gérer l'inférence de modèles plus importants sans augmentation de la latence, ce qui est idéal pour les LLM et les modèles d'IA génératifs. Le H200 se distingue par ses 141 Go de mémoire HBM3e et sa bande passante mémoire maximale de 4.8 To/s, surpassant largement le H100.

De plus, Microsoft étend ses offres accélérées par NVIDIA avec le NCC H100 v5, une nouvelle VM confidentielle. Ces machines virtuelles confidentielles Azure, équipées de GPU NVIDIA H100 Tensor Core, garantissent la confidentialité et l'intégrité des données et des applications pendant leur utilisation. Cette fonctionnalité de sécurité améliorée, combinée aux capacités d'accélération du H100, devrait être bientôt disponible en avant-première privée.

Ces avancées réalisées par NVIDIA et Microsoft marquent une avancée significative dans les capacités de cloud computing et d'IA d'Azure, offrant une puissance et une sécurité sans précédent pour les charges de travail d'IA exigeantes.

NVIDIA stimule la digitalisation automobile avec de nouveaux moteurs de simulation sur Omniverse Cloud

NVIDIA intensifie son jeu dans l'industrie automobile en introduisant deux nouveaux moteurs de simulation sur Omniverse Cloud : le moteur de simulation d'usine virtuelle et le moteur de simulation de véhicule autonome (AV). Hébergé sur Microsoft Azure, Omniverse Cloud transforme la façon dont les constructeurs automobiles gèrent le cycle de vie de leurs produits, en passant de processus physiques et manuels à des systèmes numériques pilotés par logiciels et améliorés par l'IA.

Moteur de simulation d'usine virtuelle : un outil qui change la donne pour les constructeurs automobiles

Ce moteur est une boîte à outils permettant aux équipes de planification d'usine de se connecter et de collaborer sur des ensembles de données industrielles à grande échelle en temps réel. Il permet aux équipes de conception de créer des usines virtuelles et de partager leur travail de manière transparente. Cela augmente la qualité et le débit de la production et permet d'économiser beaucoup de temps et d'argent en évitant les modifications post-construction.

Les fonctionnalités clés incluent la compatibilité avec les logiciels existants tels qu'Autodesk Factory Planning et NX de Siemens, améliorant ainsi la collaboration entre diverses plates-formes. T-Systems et SoftServe exploitent déjà ce moteur pour développer des applications d'usine virtuelle personnalisées.

Moteur de simulation AV : révolutionner le développement de véhicules autonomes

Le moteur de simulation audiovisuelle est conçu pour fournir une simulation de capteurs haute fidélité, essentielle au développement d'architectures audiovisuelles de nouvelle génération. Il permet aux développeurs de tester des systèmes autonomes dans un environnement virtuel, en intégrant des couches de la pile de véhicules telles que la perception, la planification et le contrôle.

Ce moteur est crucial pour le développement d’architectures audiovisuelles unifiées avancées, nécessitant une simulation de données de capteurs de haute qualité. NVIDIA intègre ses pipelines de simulation de capteurs DRIVE Sim et Isaac Sim dans ce moteur, fournissant des simulations réalistes pour les caméras, radars, lidars et autres capteurs.

Accélérer la transformation numérique

Le moteur de simulation d'usine est désormais disponible sur Azure Marketplace, proposant des systèmes NVIDIA OVX et le logiciel géré Omniverse. Le moteur de simulation de capteurs devrait bientôt suivre. De plus, les entreprises peuvent déployer Omniverse Enterprise sur des machines virtuelles Azure optimisées, rationalisant ainsi davantage le processus de numérisation dans le secteur automobile.

Les nouveaux moteurs de simulation de NVIDIA sur Omniverse Cloud marquent une étape importante dans la numérisation automobile, offrant des outils puissants pour la planification d'usines virtuelles et le développement audiovisuel.

AI Revolution arrive sur Windows 11 : le grand pas de NVIDIA avec les GPU RTX

NVIDIA remodèle le paysage Windows 11, en tirant parti de la puissance des GPU RTX pour apporter une nouvelle dimension aux expériences des joueurs, des créateurs et des utilisateurs quotidiens de PC. Avec une base d'utilisateurs de plus de 100 millions de PC Windows équipés de GPU RTX, les dernières innovations de NVIDIA sont sur le point d'élever la productivité et la créativité vers de nouveaux sommets.

Au premier plan de ces développements se trouve l’introduction de deux nouveaux moteurs de simulation sur Omniverse Cloud : l’usine virtuelle et les moteurs de simulation de véhicules autonomes (AV). Hébergés sur Microsoft Azure, ces moteurs révolutionnent le cycle de vie des produits de l'industrie automobile, passant des processus manuels traditionnels à des systèmes numériques efficaces améliorés par l'IA.

RTX 3090 avant

Dans une mise à jour importante, le logiciel open source de NVIDIA, TensorRT-LLM, devrait améliorer les performances d'inférence de l'IA. Cette mise à jour étendra la prise en charge de nouveaux modèles de langages volumineux, rendant les charges de travail d'IA complexes plus accessibles sur les ordinateurs de bureau et portables équipés de GPU RTX à partir de 8 Go de VRAM. Cette amélioration change la donne, notamment avec la compatibilité prochaine de TensorRT-LLM pour Windows avec l'API Chat d'OpenAI. Cette intégration signifie que de nombreux projets et applications de développeurs peuvent désormais s'exécuter localement sur des PC RTX, permettant aux utilisateurs de conserver les données sensibles en toute sécurité sur leurs PC Windows 11, loin du cloud.

NVIDIA présente également AI Workbench, une boîte à outils complète conçue pour rationaliser le processus de développement pour les créateurs. Cette plate-forme simplifie la création, les tests et la personnalisation de modèles d'IA génératifs et de LLM pré-entraînés, permettant aux développeurs de gérer efficacement leurs projets d'IA et d'adapter les modèles à des cas d'utilisation spécifiques.

En collaboration avec Microsoft, NVIDIA améliore DirectML, qui promet d'accélérer les modèles d'IA fondamentaux comme Llama 2. Cette collaboration élargit la portée du déploiement entre fournisseurs et établit une nouvelle référence en matière de normes de performances.

La prochaine version de TensorRT-LLM v0.6.0 constitue un autre pas en avant, promettant des performances d'inférence jusqu'à cinq fois plus rapides. Il prendra également en charge d'autres LLM populaires, notamment Mistral 7B et Nemotron-3 8B. Ces modèles seront accessibles sur les GPU GeForce RTX 30 et 40 avec 8 Go de RAM ou plus, rendant les capacités d'IA avancées disponibles même sur les appareils Windows les plus portables.

Pour prendre en charge ces avancées, NVIDIA met à disposition la nouvelle version de TensorRT-LLM et des modèles optimisés sur son référentiel GitHub et ngc.nvidia.com.

Avec ces innovations, NVIDIA n'améliore pas seulement l'expérience PC de sa vaste base d'utilisateurs ; cela ouvre la voie à une nouvelle ère dans l'informatique améliorée par l'IA sur Windows 11, marquant un moment charnière à l'intersection de la technologie et de la vie quotidienne.

S'engager avec StorageReview