La mémoire augmentée de WEKA pour l'inférence de l'IA augmente l'efficacité du GPU, réduisant la latence et les coûts tout en faisant évoluer les modèles d'IA pour les charges de travail de l'entreprise.
WEKA a annoncé son intégration stratégique avec la plateforme de données IA de référence NVIDIA. La société a obtenu des certifications de stockage NVIDIA essentielles pour fournir une infrastructure optimisée, spécifiquement adaptée à l'IA agentique et aux modèles de raisonnement complexes. Parallèlement à cette annonce, WEKA a présenté sa fonctionnalité innovante de grille de mémoire augmentée et d'autres certifications NVIDIA Cloud Partner (NCP) pour les architectures de référence, notamment NVIDIA GB200 NVL72 et NVIDIA-Certified Systems Storage pour les déploiements d'IA en usine à l'échelle de l'entreprise.
Accélération des agents d'IA
La plateforme de données NVIDIA AI représente une avancée significative dans l'infrastructure d'IA d'entreprise, intégrant parfaitement l'architecture NVIDIA Blackwell, les processeurs de données NVIDIA BlueField, le réseau Spectrum-X et le logiciel NVIDIA AI Enterprise. En associant cette infrastructure NVIDIA avancée à la plateforme de données WEKA, les entreprises peuvent déployer une base de stockage hautement évolutive, conçue spécifiquement pour les charges de travail d'inférence IA hautes performances.
Cette solution intégrée répond directement aux exigences croissantes de l'IA d'entreprise, offrant aux agents de requête IA un accès fluide et accéléré aux informations stratégiques critiques, améliorant ainsi considérablement les performances d'inférence et la précision du raisonnement. La plateforme de données de WEKA garantit que les systèmes d'IA peuvent rapidement transformer les données en informations exploitables, prenant ainsi en charge le raisonnement sophistiqué requis par les modèles d'IA de nouvelle génération.
Grille de mémoire augmentée WEKA
Les modèles d'IA agentique évoluent en permanence et peuvent gérer des fenêtres de contexte plus larges, un nombre de paramètres plus important et des besoins en mémoire plus importants. Ces avancées repoussent souvent les limites des capacités mémoire des GPU traditionnels, créant des goulots d'étranglement dans l'inférence de l'IA. WEKA relève ces défis avec sa solution révolutionnaire Augmented Memory Grid, une innovation qui étend la mémoire disponible pour les charges de travail d'IA, offrant des incréments à l'échelle du pétaoctet, bien au-delà des limites actuelles du téraoctet.
La grille de mémoire augmentée de WEKA améliore considérablement l'inférence de l'IA en combinant le logiciel de la plateforme de données de WEKA avec les technologies de calcul et de réseau accélérées de NVIDIA. Cette combinaison permet un accès à une vitesse proche de celle de la mémoire avec une latence de l'ordre de la microseconde, améliorant ainsi considérablement les performances de traitement des jetons et l'efficacité globale de l'inférence de l'IA.
Les principaux avantages de la grille de mémoire augmentée de WEKA comprennent :
-
Latence considérablement réduite:Lors de tests portant sur 105,000 41 jetons, la grille de mémoire augmentée de WEKA a permis une amélioration remarquable de XNUMX fois le temps d'obtention du premier jeton par rapport aux méthodes de recalcul traditionnelles.
-
Débit de jetons optimisé:La solution de WEKA gère efficacement les charges de travail d'inférence sur les clusters, obtenant un débit de jetons plus élevé à un coût global réduit, réduisant le coût par jeton traité jusqu'à 24 % à l'échelle du système.
Ces gains de performance se traduisent directement par une efficacité économique accrue, permettant aux entreprises d’accélérer l’innovation basée sur l’IA sans compromettre les capacités du modèle ou les performances de l’infrastructure.
WEKApod Nitro
Les appliances WEKApod Nitro Data Platform ont obtenu plusieurs certifications NVIDIA, établissant WEKA comme l'un des principaux fournisseurs de stockage haute performance pour l'IA d'entreprise :
-
Certification NVIDIA Cloud Partner (NCP)WEKApod Nitro est l'une des premières solutions de stockage certifiées pour les architectures de référence NCP de NVIDIA, notamment les architectures HGX H200, B200 et GB200 NVL72. Ces appliances permettent aux fournisseurs de services et aux développeurs de prendre en charge des clusters GPU massifs (jusqu'à 1,152 8 GPU dans une configuration XNUMXU) tout en maintenant une densité de performances et une efficacité énergétique exceptionnelles.
-
Désignation de stockage des systèmes certifiés NVIDIALes appliances WEKApod Nitro ont reçu la nouvelle certification de stockage d'entreprise de NVIDIA, garantissant leur compatibilité avec les architectures de référence d'entreprise et les meilleures pratiques de NVIDIA. Cette certification confirme que la plateforme de données WEKA offre des performances de stockage, une efficacité et une évolutivité optimales pour les déploiements exigeants d'IA et de HPC en entreprise.
Nilesh Patel, directeur des produits chez WEKA, a souligné le potentiel transformateur de ce partenariat avec NVIDIA. Comparant ce développement aux avancées majeures de l'aérospatiale, Patel a déclaré : « De même que le franchissement du mur du son a ouvert de nouvelles perspectives, la grille de mémoire augmentée de WEKA brise la barrière de la mémoire de l'IA, augmentant considérablement la mémoire GPU et optimisant l'efficacité des jetons. Cette innovation transforme fondamentalement l'économie des jetons d'IA, permettant une innovation plus rapide et des coûts réduits sans sacrifier les performances. »
Rob Davis, vice-président des technologies de réseau de stockage chez NVIDIA, a également souligné l'importance de cette intégration : « Les entreprises qui déploient des modèles d'IA et de raisonnement agentiques exigent une efficacité et une évolutivité sans précédent. L'association des technologies NVIDIA et WEKA garantit aux agents d'IA un accès et un traitement des données avec une rapidité et une précision inégalées lors de l'inférence. »
Disponibilité
- L'architecture de référence NCP de WEKA pour les systèmes NVIDIA Blackwell sera disponible en mars.
- La fonctionnalité WEKA Augmented Memory Grid sera généralement disponible pour les clients de la plateforme de données WEKA au printemps 2025.
S'engager avec StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS