La memoria aumentada de WEKA para la inferencia de IA aumenta la eficiencia de la GPU, lo que reduce la latencia y los costos al tiempo que escala los modelos de IA para cargas de trabajo empresariales.
WEKA anunció su integración estratégica con el diseño de referencia de la Plataforma de Datos de IA de NVIDIA. Obtuvo certificaciones de almacenamiento de NVIDIA cruciales para proporcionar una infraestructura optimizada, específicamente diseñada para IA con agentes y modelos de razonamiento complejo. Junto con este anuncio, WEKA presentó su innovadora función Augmented Memory Grid y certificaciones adicionales de Arquitecturas de Referencia de NVIDIA Cloud Partner (NCP), como NVIDIA GB200 NVL72 y Almacenamiento de Sistemas Certificado por NVIDIA para implementaciones de fábricas de IA a escala empresarial.
Acelerando los agentes de IA
La Plataforma de Datos de IA de NVIDIA representa un avance significativo en la infraestructura de IA empresarial, integrando a la perfección la arquitectura NVIDIA Blackwell, las DPU NVIDIA BlueField, la red Spectrum-X y el software NVIDIA AI Enterprise. Al combinar esta infraestructura avanzada de NVIDIA con la Plataforma de Datos WEKA, las empresas pueden implementar una base de almacenamiento altamente escalable, diseñada específicamente para cargas de trabajo de inferencia de IA de alto rendimiento.
Esta solución integrada aborda directamente las crecientes demandas de la IA empresarial, proporcionando a los agentes de consulta de IA un acceso ágil y sin interrupciones a inteligencia empresarial crítica, lo que se traduce en una mejora significativa del rendimiento de inferencia y la precisión del razonamiento. La Plataforma de Datos de WEKA garantiza que los sistemas de IA puedan transformar rápidamente los datos en inteligencia procesable, lo que facilita el razonamiento sofisticado que requieren los modelos de IA de próxima generación.
Cuadrícula de memoria aumentada WEKA
Los modelos de IA de Agentic evolucionan continuamente y pueden gestionar ventanas de contexto más amplias, un mayor número de parámetros y requisitos de memoria más significativos. Estos avances suelen superar los límites de la capacidad de memoria de las GPU tradicionales, lo que crea cuellos de botella en la inferencia de IA. WEKA aborda estos desafíos con su revolucionaria solución Augmented Memory Grid, una innovación que amplía la memoria disponible para las cargas de trabajo de IA, proporcionando incrementos a escala de petabytes, mucho más allá de las limitaciones actuales de un solo terabyte.
La Red de Memoria Aumentada de WEKA mejora significativamente la inferencia de IA al combinar el software de la plataforma de datos de WEKA con las tecnologías de computación y redes aceleradas de NVIDIA. Esta combinación permite un acceso a velocidad cercana a la de la memoria con una latencia de microsegundos, lo que mejora drásticamente el rendimiento del procesamiento de tokens y la eficiencia general de la inferencia de IA.
Las principales ventajas de la cuadrícula de memoria aumentada de WEKA incluyen:
-
Latencia drásticamente reducidaEn pruebas con 105,000 tokens, la cuadrícula de memoria aumentada de WEKA proporcionó una notable mejora de 41 veces en el tiempo hasta el primer token en comparación con los métodos de recálculo tradicionales.
-
Rendimiento de tokens optimizadoLa solución de WEKA maneja eficientemente las cargas de trabajo de inferencia en todos los clústeres, logrando un mayor rendimiento de tokens a un costo general reducido, disminuyendo el costo por token procesado hasta en un 24 % en todo el sistema.
Estas mejoras de rendimiento se traducen directamente en una mayor eficiencia económica, lo que permite a las empresas acelerar la innovación impulsada por IA sin comprometer las capacidades del modelo ni el rendimiento de la infraestructura.
WEKApod Nitro
Los dispositivos WEKApod Nitro Data Platform han obtenido múltiples certificaciones NVIDIA, lo que establece a WEKA como un proveedor líder de almacenamiento de alto rendimiento para IA empresarial:
-
Certificación de socio de nube de NVIDIA (NCP)WEKApod Nitro es una de las primeras soluciones de almacenamiento certificadas para las arquitecturas de referencia NCP de NVIDIA, incluyendo HGX H200, B200 y GB200 NVL72. Estos dispositivos potencian a los proveedores de servicios y desarrolladores al admitir clústeres de GPU masivos (hasta 1,152 GPU en una configuración de 8U), a la vez que mantienen una densidad de rendimiento y una eficiencia energética excepcionales.
-
Designación de almacenamiento de sistemas certificados por NVIDIALos dispositivos WEKApod Nitro han recibido la nueva certificación de almacenamiento empresarial de NVIDIA, que garantiza su compatibilidad con las arquitecturas de referencia empresarial de NVIDIA y las mejores prácticas. Esta designación confirma que la plataforma de datos de WEKA ofrece un rendimiento, una eficiencia y una escalabilidad de almacenamiento óptimos para las exigentes implementaciones empresariales de IA y HPC.
Nilesh Patel, director de producto de WEKA, destacó el potencial transformador de esta colaboración con NVIDIA. Al comparar este desarrollo con los avances en el sector aeroespacial, Patel afirmó: «Así como romper la barrera del sonido abrió nuevas fronteras, la Red de Memoria Aumentada de WEKA rompe la barrera de la memoria de la IA, expandiendo drásticamente la memoria de la GPU y optimizando la eficiencia de los tokens. Esta innovación transforma radicalmente la economía de los tokens de IA, permitiendo una innovación más rápida y menores costos sin sacrificar el rendimiento».
Rob Davis, vicepresidente de Tecnología de Redes de Almacenamiento de NVIDIA, destacó la importancia de esta integración: «Las empresas que implementan IA de agentes y modelos de razonamiento requieren una eficiencia y escalabilidad sin precedentes. La combinación de las tecnologías NVIDIA y WEKA garantiza que los agentes de IA puedan acceder y procesar datos con una velocidad y precisión inigualables durante la inferencia».
Disponibilidad
- La arquitectura de referencia NCP de WEKA para los sistemas NVIDIA Blackwell estará disponible en marzo.
- La capacidad de cuadrícula de memoria aumentada WEKA estará disponible de forma general para los clientes de la plataforma de datos WEKA en la primavera de 2025.
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed