A IBM adicionará aceleradores AMD Instinct MI300X como um serviço no IBM Cloud para melhorar o desempenho e a eficiência energética dos modelos GenAI.
A IBM anunciou uma colaboração expandida com a AMD para introduzir os aceleradores AMD Instinct MI300X como um serviço na IBM Cloud. Esta solução aprimora o desempenho e a eficiência energética para modelos de IA generativa (GenAI) e aplicativos de computação de alto desempenho (HPC), abordando a crescente demanda por soluções de IA escaláveis entre clientes corporativos.
A parceria estende o suporte para Aceleradores AMD Instinct MI300X em todo o ecossistema de IA e dados da IBM, incluindo a plataforma watsonx AI e o Red Hat® Enterprise Linux® para inferência de IA. Isso se alinha com o portfólio existente da IBM Cloud, que já apresenta Intel Gaudí 3 aceleradores e extensões GPU Nvidia H100 Tensor Core instâncias, aprimorando ainda mais sua capacidade de fornecer cargas de trabalho de IA e HPC de alto desempenho.
Capacidades avançadas dos aceleradores AMD Instinct MI300X
Os aceleradores AMD Instinct MI300X, equipados com 192 GB de memória de alta largura de banda (HBM3), são projetados para oferecer suporte à inferência de modelos grandes e ao ajuste fino para aplicativos de IA empresarial. Sua alta capacidade de memória permite que as empresas executem modelos de IA maiores com menos GPUs, reduzindo custos e mantendo o desempenho e a escalabilidade. Testamos recentemente esses aceleradores em nosso Análise do XE9680.
Ao oferecer esses aceleradores como um serviço no IBM Cloud Virtual Servers for VPC e por meio de soluções em contêineres como o IBM Cloud Kubernetes Service e o IBM Red Hat OpenShift, a IBM visa fornecer aos clientes corporativos um ambiente seguro e de alto desempenho otimizado para suas cargas de trabalho de IA. Essa flexibilidade permite que as organizações dimensionem suas implantações de IA de forma eficiente, mantendo segurança e conformidade robustas — particularmente vitais para clientes em setores altamente regulamentados.
Integração com IBM watsonx e Red Hat Platforms
Para atender às necessidades de cargas de trabalho de inferência de IA generativa, a IBM planeja integrar aceleradores AMD Instinct MI300X com sua plataforma watsonx AI. Isso equipará os clientes watsonx com recursos adicionais de infraestrutura de IA, permitindo que eles dimensionem cargas de trabalho perfeitamente em ambientes de nuvem híbrida. Os aceleradores também oferecerão suporte às plataformas Red Hat Enterprise Linux AI e Red Hat OpenShift AI, permitindo que as empresas implantem grandes modelos de linguagem (LLMs) como a família Granite com ferramentas de alinhamento avançadas como o InstructLab.
Essas integrações ressaltam a capacidade dos aceleradores de lidar com cargas de trabalho intensivas em computação com maior flexibilidade, permitindo que as empresas priorizem desempenho, eficiência de custos e escalabilidade em suas implantações de IA.
Philip Guido, vice-presidente executivo e diretor comercial da AMD, destacou a importância do desempenho e da flexibilidade no processamento de cargas de trabalho intensivas em computação, especialmente à medida que as empresas adotam modelos de IA maiores. Ele observou que os aceleradores AMD Instinct, pareados com o software AMD ROCm, oferecem amplo suporte ao ecossistema para plataformas como IBM watsonx AI e Red Hat OpenShift AI, permitindo que os clientes executem e dimensionem a inferência GenAI sem comprometer a eficiência ou o custo.
Alan Peacock, gerente geral da IBM Cloud, ecoou esses sentimentos, enfatizando a visão compartilhada da AMD e da IBM de levar soluções de IA para empresas. Ele afirmou que alavancar aceleradores AMD na IBM Cloud fornece aos clientes corporativos opções escaláveis e econômicas para atender seus objetivos de IA, apoiadas pelo compromisso da IBM com segurança, conformidade e soluções orientadas a resultados.
A colaboração traz segurança e conformidade aprimoradas
A colaboração aproveita os renomados recursos de segurança e conformidade da IBM Cloud, garantindo que as empresas, incluindo aquelas em setores altamente regulamentados, possam adotar com confiança a infraestrutura de IA alimentada por aceleradores AMD. Esse compromisso com a segurança é essencial para a estratégia da IBM e da AMD de dar suporte à adoção de IA empresarial em escala.
Com essa colaboração, a IBM e a AMD fornecem às empresas uma infraestrutura de IA de ponta que equilibra desempenho, escalabilidade e eficiência. A adição dos aceleradores AMD Instinct MI300X à IBM Cloud está pronta para atender às crescentes demandas de cargas de trabalho de IA empresarial, capacitando as organizações a desbloquear novas possibilidades em aplicativos de IA e HPC.
Disponibilidade
Espera-se que os serviços IBM Cloud com aceleradores AMD Instinct MI300X estejam disponíveis no primeiro semestre de 2025, expandindo ainda mais o portfólio de soluções de IA e HPC de alto desempenho da IBM.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed