IBM gaat AMD Instinct MI300X-accelerators toevoegen als een service op IBM Cloud om de prestaties en energie-efficiëntie van GenAI-modellen te verbeteren.
IBM heeft een uitgebreide samenwerking met AMD aangekondigd om AMD Instinct MI300X-accelerators te introduceren als een service op IBM Cloud. Deze oplossing verbetert de prestaties en energie-efficiëntie voor generatieve AI (GenAI)-modellen en high-performance computing (HPC)-toepassingen, waarmee wordt ingespeeld op de toenemende vraag naar schaalbare AI-oplossingen onder zakelijke klanten.
Het partnerschap breidt de ondersteuning uit voor AMD Instinct MI300X-versnellers in het AI- en data-ecosysteem van IBM, inclusief het watsonx AI-platform en Red Hat® Enterprise Linux® voor AI-inferencing. Dit sluit aan bij het bestaande portfolio van IBM Cloud, dat al IntelGaudi3 versnellers en verlengstukken NVIDIA H100 Tensor Core-GPU waardoor de capaciteit om AI- en HPC-workloads met hoge prestaties te leveren verder wordt vergroot.
Geavanceerde mogelijkheden van AMD Instinct MI300X-versnellers
De AMD Instinct MI300X-accelerators, uitgerust met 192 GB aan geheugen met hoge bandbreedte (HBM3), zijn ontworpen om grote modelinferentie en fine-tuning voor zakelijke AI-toepassingen te ondersteunen. Hun hoge geheugencapaciteit stelt bedrijven in staat om grotere AI-modellen te draaien met minder GPU's, waardoor kosten worden verlaagd en prestaties en schaalbaarheid behouden blijven. We hebben deze accelerators onlangs getest in onze XE9680 beoordeling.
Door deze accelerators aan te bieden als een service op IBM Cloud Virtual Servers voor VPC en via containeroplossingen zoals de IBM Cloud Kubernetes Service en IBM Red Hat OpenShift, wil IBM zakelijke klanten een veilige, krachtige omgeving bieden die is geoptimaliseerd voor hun AI-workloads. Deze flexibiliteit stelt organisaties in staat hun AI-implementaties efficiënt te schalen en tegelijkertijd robuuste beveiliging en naleving te behouden, wat met name van vitaal belang is voor klanten in sterk gereguleerde sectoren.
Integratie met IBM WatsonX en Red Hat Platforms
Om te voldoen aan de behoeften van generatieve AI-inferentiewerklasten, is IBM van plan om AMD Instinct MI300X-accelerators te integreren met zijn watsonx AI-platform. Dit zal watsonx-clients voorzien van extra AI-infrastructuurbronnen, waardoor ze werklasten naadloos kunnen schalen in hybride cloudomgevingen. De accelerators zullen ook Red Hat Enterprise Linux AI- en Red Hat OpenShift AI-platformen ondersteunen, waardoor ondernemingen grote taalmodellen (LLM's) zoals de Granite-familie kunnen implementeren met geavanceerde uitlijningshulpmiddelen zoals InstructLab.
Deze integraties benadrukken het vermogen van de accelerators om rekenintensieve workloads met grotere flexibiliteit te verwerken, waardoor ondernemingen prioriteit kunnen geven aan prestaties, kostenefficiëntie en schaalbaarheid bij hun AI-implementaties.
Philip Guido, Executive Vice President en Chief Commercial Officer bij AMD, benadrukte het belang van prestaties en flexibiliteit bij het verwerken van rekenintensieve workloads, vooral nu ondernemingen grotere AI-modellen omarmen. Hij merkte op dat AMD Instinct-accelerators, gecombineerd met AMD ROCm-software, uitgebreide ecosysteemondersteuning bieden voor platforms zoals IBM watsonx AI en Red Hat OpenShift AI, waardoor klanten GenAI-inferencing kunnen uitvoeren en schalen zonder dat dit ten koste gaat van de efficiëntie of kosten.
Alan Peacock, General Manager van IBM Cloud, gaf deze gevoelens weer en benadrukte de gedeelde visie van AMD en IBM om AI-oplossingen naar bedrijven te brengen. Hij stelde dat het benutten van AMD-accelerators op IBM Cloud zakelijke klanten schaalbare, kosteneffectieve opties biedt om hun AI-doelstellingen te behalen, ondersteund door IBM's toewijding aan beveiliging, naleving en resultaatgerichte oplossingen.
Samenwerking zorgt voor verbeterde beveiliging en naleving
De samenwerking maakt gebruik van de befaamde beveiligings- en compliancemogelijkheden van IBM Cloud, waardoor ondernemingen, waaronder die in zwaar gereguleerde sectoren, vol vertrouwen AI-infrastructuur kunnen adopteren die wordt aangestuurd door AMD-accelerators. Deze toewijding aan beveiliging is integraal aan de strategie van IBM en AMD om de adoptie van enterprise AI op schaal te ondersteunen.
Met deze samenwerking bieden IBM en AMD ondernemingen een geavanceerde AI-infrastructuur die prestaties, schaalbaarheid en efficiëntie in evenwicht brengt. De toevoeging van AMD Instinct MI300X-accelerators aan IBM Cloud is klaar om te voldoen aan de groeiende vraag naar enterprise AI-workloads, waardoor organisaties nieuwe mogelijkheden kunnen ontsluiten in AI- en HPC-toepassingen.
Beschikbaarheid
IBM Cloud-services met AMD Instinct MI300X-accelerators zullen naar verwachting in de eerste helft van 2025 algemeen beschikbaar zijn, waarmee IBM's portfolio met hoogwaardige AI- en HPC-oplossingen verder wordt uitgebreid.
Neem contact op met StorageReview
Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed