Accueil Entreprise Intel Vision donne vie à Gaudi 3

Intel Vision donne vie à Gaudi 3

by Harold Fritt

Au cœur de la vision d'Intel se trouve une prévision importante : l'investissement des entreprises dans GenAI est sur le point de quadrupler, passant de 40 milliards de dollars en 2024 à un chiffre impressionnant de 151 milliards de dollars d'ici 2027. Cependant, au milieu de cet optimisme, le chemin vers l'adoption par les entreprises est semé d'obstacles.

Au cœur de la vision d'Intel se trouve une prévision importante : l'investissement des entreprises dans GenAI est sur le point de quadrupler, passant de 40 milliards de dollars en 2024 à un chiffre impressionnant de 151 milliards de dollars d'ici 2027. Cependant, au milieu de cet optimisme, le chemin vers l'adoption par les entreprises est semé d'obstacles.

Intel s'engage fermement à relever ces défis en proposant des solutions GenAI évolutives, sécurisées et de bout en bout qui affrontent les obstacles les plus critiques en matière d'IA, depuis les complexités de sécurité et d'intégration jusqu'aux problèmes de coûts. En mettant résolument l'accent sur la transformation, Intel élabore une stratégie globale d'IA d'entreprise, adoptant une approche basée sur un écosystème ouvert sur l'ensemble de sa gamme de produits, couvrant les PC IA, l'informatique de pointe et le centre de données.

Voler la vedette : l'accélérateur Intel Gaudi 3

À l'avant-garde de la vision d'Intel se trouve le dévoilement de l'accélérateur Intel Gaudi 3 AI, qui s'appuie sur les performances et l'efficacité établies de son prédécesseur, l'accélérateur Intel Gaudi 2 AI. Offrant aux clients la flexibilité d’un logiciel communautaire ouvert et d’un réseau Ethernet standard, le Gaudi 3 marque un pas en avant significatif dans l’évolutivité du système.

Intel Gaudi 3

Conçu pour les performances et l'efficacité de GenAI, le Gaudi 3 offre des améliorations impressionnantes par rapport à son prédécesseur. Avec un calcul IA 4x pour BF16, une mémoire 1.5x augmentée et une bande passante réseau 2x, il promet une productivité inégalée pour la formation et l'inférence IA sur les grands modèles linguistiques (LLM) et les modèles multimodaux.

Justin Hotard, vice-président exécutif d'Intel et directeur général du groupe Data Center and AI, souligne l'importance de Gaudi 3 pour aborder le paysage en évolution du marché de l'IA. Il souligne la demande d'un choix accru parmi les entreprises et met l'accent sur la combinaison convaincante de Gaudi 3 en matière de rapport qualité-prix, d'évolutivité et d'avantage en matière de délai de rentabilisation.

Dans des secteurs critiques comme la finance, l’industrie manufacturière et la santé, les entreprises élargissent rapidement l’accessibilité à l’IA, passant de la mise en œuvre expérimentale à la mise en œuvre à grande échelle de projets d’IA générative (GenAI). Intel considère l'accélérateur Gaudi 3 comme essentiel pour répondre à ces exigences, offrant une polyvalence grâce à des logiciels communautaires ouverts et à un réseau Ethernet standard pour faire évoluer les systèmes et applications d'IA de manière flexible.

L'architecture personnalisée de Gaudi 3 est conçue pour un calcul efficace de l'IA à grande échelle, fabriquée selon un processus de 5 nanomètres (nm) et dotée de fonctionnalités clés :

  • Moteur de calcul dédié à l'IA : doté d'un moteur de calcul hétérogène comprenant 64 cœurs de processeur Tensor (TPC) personnalisés et programmables par l'IA et huit moteurs de multiplication matricielle (MME), le Gaudi 3 excelle dans la gestion des opérations matricielles complexes fondamentales pour les algorithmes d'apprentissage en profondeur.
  • Augmentation de la mémoire pour les exigences de capacité LLM : Avec une capacité de mémoire, une bande passante et une mémoire vive statique (SRAM) intégrée, le Gaudi 3 traite efficacement de grands ensembles de données GenAI, améliorant ainsi les performances de la charge de travail et la rentabilité du centre de données.
  • Mise à l'échelle efficace du système pour Enterprise GenAI : Intégré à vingt-quatre ports Ethernet de 200 gigabits, le Gaudi 3 permet une mise en réseau flexible et aux normes ouvertes, facilitant une mise à l'échelle efficace pour prendre en charge de grands clusters de calcul tout en éliminant le verrouillage du fournisseur.
  • Logiciel industriel ouvert pour la productivité des développeurs : le logiciel Gaudi intègre le framework PyTorch et fournit des modèles optimisés basés sur la communauté Hugging Face, améliorant ainsi la productivité des développeurs et facilitant le portage des modèles sur tous les types de matériel.
  • Gaudi 3 PCIe : présentant un nouveau facteur de forme dans la gamme de produits, la carte d'extension Gaudi 3 PCIe offre un rendement élevé et une consommation d'énergie réduite, idéale pour les charges de travail telles que le réglage fin, l'inférence et la génération augmentée par récupération (RAG).

Attendu pour apporter des améliorations significatives des performances pour les tâches de formation et d'inférence sur les principaux modèles GenAI, l'accélérateur Gaudi 3 est sur le point de révolutionner l'IA et le calcul haute performance (HPC). Il jouera un rôle essentiel dans Falcon Shores, le GPU de nouvelle génération d'Intel, intégrant la propriété intellectuelle Intel Gaudi et Intel Xe avec une interface de programmation GPU unique basée sur la spécification Intel oneAPI.

Intel Gaudi 3 contre NVIDIA

Lors de la séance d'ouverture, Pat Gelsinger, PDG d'Intel, a occupé le devant de la scène pour présenter l'accélérateur Intel Gaudi 3 AI. Gaudi 3 devrait offrir un temps de formation 50 % plus rapide par rapport à NVIDIA H100 sur les paramètres Llama2 7B et 13B et GPT-3 175B. De plus, l'accélérateur Gaudi 3 peut produire un débit d'inférence 50 % plus élevé et une efficacité énergétique d'inférence 40 % supérieure pour les paramètres Llama 7B et 70B et les modèles de paramètres Falcone 180B par rapport au NVIDIA H200. De plus, Gaudi 3 a démontré une inférence 30 % plus rapide que NVIDIA H200 sur les paramètres Llama 7B et 70B et les modèles de paramètres Falcon 180B.

Doté de mesures de performances impressionnantes, Gaudi 3 offre un débit d'inférence remarquablement supérieur de 50 % et une efficacité énergétique supérieure de 60 % par rapport aux alternatives industrielles.

Pris en charge par les principaux constructeurs OEM tels que Dell Technologies, Supermicro, Lenovo et HPE et amélioré par des fonctionnalités telles que la prise en charge des cartes PCIe, Gaudi 3 apparaît comme un GPU doté d'un énorme potentiel dans le paysage de l'IA.

Processeurs Intel Xeon 6

En plus de l'accélérateur Intel Gaudi 3, Intel a fourni des mises à jour sur ses produits et services de nouvelle génération dans tous les segments de l'IA d'entreprise, avec les nouveaux processeurs Intel Xeon 6.

Les processeurs Intel Xeon 6 offriront des solutions efficaces en termes de performances pour exécuter les solutions GenAI actuelles, notamment RAG, qui produisent des résultats spécifiques à l'entreprise à l'aide de données propriétaires. Intel a présenté une nouvelle marque pour ses processeurs de nouvelle génération destinés aux centres de données, au cloud et à la périphérie. Les processeurs Intel Xeon 6 dotés de nouveaux cœurs efficaces (E-core) offriront une efficacité. Dans le même temps, Intel Xeon 6 avec cœurs de performance (P-core) offrira des performances d'IA accrues et sera lancé peu de temps après les processeurs E-core.

Les processeurs Intel Xeon 6 avec cœurs E (anciennement nommés Sierra Forest) devraient offrir des performances par watt améliorées de 2.4 fois et une densité de rack 2.7 fois supérieure à celle des processeurs Intel Xeon de 2e génération. Les processeurs Intel Xeon 6 avec cœurs P (anciennement nommés Granite Rapids) intègrent la prise en charge logicielle du format de données MXFP4, réduisant ainsi la latence des jetons ultérieurs jusqu'à 6.5 fois par rapport au Xeon de 4e génération utilisant FP16 et la possibilité d'exécuter 70 milliards de paramètres Llama2. des modèles.

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS