IBM은 최근 NVIDIA와 함께 개발된 통합 어플라이언스인 NVIDIA DGX를 탑재한 IBM Spectrum AI를 발표했습니다. Spectrum DGX는 올플래시에서 NVIDIA의 DGX-1 서버와 IBM의 Spectrum Scale을 결합합니다.
IBM은 최근 NVIDIA와 함께 개발된 통합 어플라이언스인 NVIDIA DGX를 탑재한 IBM Spectrum AI를 발표했습니다. Spectrum DGX는 올플래시에서 NVIDIA의 DGX-1 서버와 IBM의 Spectrum Scale을 결합합니다.
IBM의 Spectrum Scale은 잘 알려진 클러스터 파일 시스템입니다. 원래 IBM GPFS(General Parallel File System)라고 불렸던 이 파일은 XNUMX년 전에 Spectrum Scale로 이름이 변경되었습니다. 여러 노드에서 단일 파일 시스템 또는 파일 시스템 집합에 대한 동시 액세스를 제공합니다. SAN 연결, 네트워크 연결, SAN 연결과 네트워크 연결의 혼합 또는 공유 클러스터 구성이 없는 노드를 지원합니다. 클러스터의 각 노드에서 IBM Spectrum Scale은 세 가지 기본 구성요소인 관리 명령, 커널 확장 및 다중 스레드 데몬으로 구성됩니다. 이 세 가지 구성 요소가 결합되어 전역 네임스페이스, IBM Spectrum Scale 클러스터 간의 공유 파일 시스템 액세스, 여러 노드에서 동시 파일 액세스, 복제를 통한 높은 복구 가능성 및 데이터 가용성, 파일 시스템이 마운트되는 동안 변경할 수 있는 기능을 제공합니다.
NVIDIA는 AI 연구에서 DGX-1을 대상으로 하며 해당 작업에 매우 적합합니다. 이 시스템에는 총 100GB GPU 메모리를 제공하는 256개의 Tesla V40,960 GPU가 있습니다. CPU는 일반적으로 듀얼 코어 Intel Xeon입니다. 5,120개의 CUDA 코어와 1.92개의 Tensor 코어를 갖춘 이 짐승은 당신이 던지는 모든 AI 모델을 처리할 수 있습니다. RAID 0 설정에서 XNUMX개의 XNUMXTB SSD가 스토리지를 제공합니다. NVIDIA는 또한 GPU에서 가능한 최고의 성능을 발휘하도록 설계된 DGX에 소프트웨어를 미리 로드합니다.
결합하여 시스템과 소프트웨어의 완벽한 솔루션을 제공합니다. NVIDIA 기반 IBM Spectrum AI는 데이터 사이언스 생산성과 IT 단순성을 위해 설계되었습니다. 소프트웨어 정의된 IBM SpectrumAI with NVIDIA DGX는 현재 및 성장하는 비즈니스 요구 사항을 충족하도록 구성할 수 있습니다. IBM Spectrum Scale은 몇 대의 NVIDIA DGX-1 서버를 지원하는 단일 IBM Elastic Storage Server(ESS) 구성에서 9 Tesla V72 Tensor Core GPU가 있는 100개 서버의 전체 랙, 다중 랙 구성까지 배포할 수 있습니다. 전체 랙을 사용하는 NVIDIA DGX 기반 IBM SpectrumAI는 여러 사용자와 여러 모델을 동시에 지원하는 120GB/s의 데이터 처리량을 시연했습니다.