홈페이지 EnterpriseAI IBM과 AMD, IBM 클라우드에서 MI300X 가속기를 서비스로 제공하기 위해 협업 확대

IBM과 AMD, IBM 클라우드에서 MI300X 가속기를 서비스로 제공하기 위해 협업 확대

by 해롤드 프리츠

IBM은 GenAI 모델의 성능과 에너지 효율성을 향상하기 위해 IBM Cloud에 AMD Instinct MI300X 가속기를 서비스로 추가할 예정입니다.

IBM은 IBM Cloud에서 AMD Instinct MI300X 가속기를 서비스로 출시하기 위해 AMD와의 협력을 확대한다고 발표했습니다. 이 솔루션은 생성 AI(GenAI) 모델과 고성능 컴퓨팅(HPC) 애플리케이션의 성능과 에너지 효율성을 향상시켜 기업 고객 사이에서 확장 가능한 AI 솔루션에 대한 수요가 증가하는 것을 해결합니다.

이 파트너십은 다음에 대한 지원을 확대합니다. AMD Instinct MI300X 가속기 IBM의 AI 및 데이터 생태계 전반에 걸쳐 watsonx AI 플랫폼과 AI 추론을 위한 Red Hat® Enterprise Linux®가 포함됩니다. 이는 이미 다음을 제공하는 IBM Cloud의 기존 포트폴리오와 일치합니다. 인텔 가우디 3 가속기 및 확장 NVIDIA H100 텐서 코어 GPU 인스턴스를 더욱 강화하여 고성능 AI 및 HPC 워크로드를 제공하는 능력을 향상시킵니다.

AMD Instinct MI300X 가속기의 고급 기능

300GB의 고대역폭 메모리(HBM192)를 탑재한 AMD Instinct MI3X 가속기는 엔터프라이즈 AI 애플리케이션에 대한 대규모 모델 추론 및 미세 조정을 지원하도록 설계되었습니다. 높은 메모리 용량 덕분에 엔터프라이즈는 더 적은 GPU로 더 큰 AI 모델을 실행하여 성능과 확장성을 유지하면서 비용을 절감할 수 있습니다. 최근 이러한 가속기를 테스트했습니다. XE9680 리뷰.

IBM은 VPC용 IBM Cloud Virtual Servers에서 이러한 가속기를 서비스로 제공하고 IBM Cloud Kubernetes Service 및 IBM Red Hat OpenShift와 같은 컨테이너화된 솔루션을 통해 기업 고객에게 AI 워크로드에 최적화된 안전하고 고성능 환경을 제공하고자 합니다. 이러한 유연성을 통해 조직은 강력한 보안 및 규정 준수를 유지하면서도 AI 배포를 효율적으로 확장할 수 있습니다. 이는 특히 규제가 엄격한 산업의 고객에게 매우 중요합니다.

IBM watsonx 및 Red Hat 플랫폼과의 통합

생성적 AI 추론 워크로드의 요구 사항을 해결하기 위해 IBM은 AMD Instinct MI300X 가속기를 watsonx AI 플랫폼과 통합할 계획입니다. 이를 통해 watsonx 클라이언트는 추가 AI 인프라 리소스를 갖추고 하이브리드 클라우드 환경에서 워크로드를 원활하게 확장할 수 있습니다. 가속기는 또한 Red Hat Enterprise Linux AI 및 Red Hat OpenShift AI 플랫폼을 지원하여 기업이 InstructLab과 같은 고급 정렬 도구를 사용하여 Granite 제품군과 같은 대규모 언어 모델(LLM)을 배포할 수 있습니다.

이러한 통합은 가속기가 더욱 유연하게 컴퓨팅 집약적 워크로드를 처리할 수 있는 역량을 강조하며, 기업은 AI 배포에서 성능, 비용 효율성, 확장성을 우선시할 수 있습니다.

AMD의 부사장 겸 최고상업책임자인 필립 귀도는 특히 기업이 대규모 AI 모델을 채택함에 따라 컴퓨팅 집약적 워크로드를 처리하는 데 있어 성능과 유연성의 중요성을 강조했습니다. 그는 AMD ROCm 소프트웨어와 결합된 AMD Instinct 가속기가 IBM watsonx AI 및 Red Hat OpenShift AI와 같은 플랫폼에 대한 광범위한 생태계 지원을 제공하여 클라이언트가 효율성이나 비용을 손상시키지 않고 GenAI 추론을 실행하고 확장할 수 있도록 한다고 언급했습니다.

IBM Cloud의 총괄 매니저인 앨런 피콕은 이러한 감정에 공감하며 기업에 AI 솔루션을 제공하려는 AMD와 IBM의 공동 비전을 강조했습니다. 그는 IBM Cloud에서 AMD 가속기를 활용하면 기업 고객에게 확장 가능하고 비용 효율적인 옵션을 제공하여 AI 목표를 달성할 수 있으며, 이는 IBM의 보안, 규정 준수 및 성과 중심 솔루션에 대한 헌신에 뒷받침된다고 말했습니다.

협업은 향상된 보안 및 규정 준수를 제공합니다.

이 협업은 IBM Cloud의 유명한 보안 및 규정 준수 역량을 활용하여, 엄격하게 규제되는 산업을 포함한 기업이 AMD 가속기로 구동되는 AI 인프라를 자신 있게 도입할 수 있도록 보장합니다. 보안에 대한 이러한 노력은 IBM과 AMD가 대규모로 기업 AI 도입을 지원하는 전략에 필수적입니다.

이 협업을 통해 IBM과 AMD는 기업에 성능, 확장성 및 효율성을 균형 있게 제공하는 최첨단 AI 인프라를 제공합니다. IBM Cloud에 AMD Instinct MI300X 가속기를 추가하면 기업 AI 워크로드의 증가하는 수요를 충족할 수 있으며, 조직이 AI 및 HPC 애플리케이션에서 새로운 가능성을 열 수 있습니다.

유효성

AMD Instinct MI300X 가속기를 탑재한 IBM Cloud 서비스는 2025년 상반기에 출시될 예정이며, 이를 통해 IBM의 고성능 AI 및 HPC 솔루션 포트폴리오가 더욱 확대될 것입니다.

StorageReview에 참여

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드