AMD Instinct MI300 시리즈는 AI용 가속기 아키텍처에 대한 새로운 접근 방식을 도입하여 고급 기술을 결합하여 고성능 컴퓨팅 및 인공 지능의 발전을 주도합니다. 정교한 디자인을 갖춘 MI300 시리즈는 컴퓨팅 성능과 효율성의 경계를 재편할 것을 약속합니다.
AMD Instinct MI300 시리즈는 AI용 가속기 아키텍처에 대한 새로운 접근 방식을 도입하여 고급 기술을 결합하여 고성능 컴퓨팅 및 인공 지능의 발전을 주도합니다. 정교한 디자인을 갖춘 MI300 시리즈는 컴퓨팅 성능과 효율성의 경계를 재편할 것을 약속합니다.
MI300 제품군 개요
여기서 다루어야 할 내용이 많으며 둘 사이의 뉘앙스는 미묘하지만 중요합니다.
스펙 | MI300x | MI300a |
---|---|---|
CPU 코어 | 단일 장치로 12개의 칩렛 • IOD XNUMX개 및 XCD XNUMX개 • Infinity Fabric AP 및 3D 패키징 |
단일 APU로 13개의 칩렛 • 8c 16t x86 CPU x 3 CCD(총 24개 코어) • IOD XNUMX개, CCD XNUMX개, XCD XNUMX개 • Infinity Fabric AP 및 3D 패키징 |
캐시(L3) | 32개 코어가 공유하는 3MB LXNUMX 캐시 | L1 및 L2만 |
HBM3 용량 | 196GB | 128GB |
인피니티 캐시 | • 256TB/s 최대 BW에서 17MB • XCD 대역폭 증폭 • HBM 전력 절감 • 다중 XCD 및 CCD 캐시 일관성 • CPU 메모리 지연 시간을 위한 프리페처 |
• 256TB/s 최대 BW에서 17MB • XCD 대역폭 증폭 • HBM 전력 절감 • 다중 XCD 캐시 일관성 |
통합 아키텍처 | N/A | 통합 HBM 및 Infinity Cache • CCD 및 XCD 데이터 공유 • 데이터 이동 감소 • 단순화된 프로그래밍 |
Zen 4 CPU 복합 다이(CCD) 및 개선 사항
MI300A APU의 중심에는 4개의 멀티스레드 AMD 'Zen 4' x86 코어를 특징으로 하는 'Zen 1' CCD(CPU Complex Die)가 있으며, 각 코어는 2MB L32 캐시와 3MB 공유 L16 캐시를 자랑합니다. 이 강력한 아키텍처는 동시 멀티스레딩(SMT)을 지원하고 BFLOAT512, VNNI 및 AVX-256를 포함한 필수 ISA 업데이트를 48b 데이터 경로와 통합합니다. 48b/XNUMXb 가상/물리적 주소 지정 기능을 갖춘 메모리 시스템도 마찬가지로 인상적이며 광범위한 메모리 지원을 보장합니다.
CDNA 3 컴퓨팅 유닛 및 메모리 시스템
MI3 시리즈의 CDNA 300 컴퓨팅 유닛은 주목할 만한 개선 사항을 도입했습니다. 각 XCD(Accelerator Complex Die)에는 38MB 공유 L3 캐시와 바이트/FLOP에 최적화된 L4 캐시가 지원되는 2개의 CDNA 1 컴퓨팅 유닛이 들어 있습니다. 이 장치는 TF32 및 FP8과 같은 다양한 숫자 형식을 지원하고 OCP FP8 표준을 준수합니다. 메모리 시스템은 AMD의 혁신적인 Infinity Cache 및 Infinity Fabric 인터페이스 덕분에 데이터 공유 효율성을 극대화하고 대기 시간을 줄이도록 설계되었습니다.
3.5D 하이브리드 채권 패키징: 통합의 도약
MI300 제품군의 주요 특징은 3.5D 하이브리드 본드 패키징으로, 패키지 내 컴퓨팅 및 HBM(고대역폭 메모리)을 크게 향상시킵니다. 이 패키징 방법은 밀도가 높고 전력 효율적인 칩렛 상호 연결을 제공하여 전체 시스템 수준 효율성을 향상시킵니다. MI300 시리즈는 모듈식 구성 접근 방식을 사용하므로 유연한 구성과 확장성이 가능합니다.
고급 전력 관리 및 열 설계
MI300 제품군의 전력 관리 시스템은 전력 효율성과 열 추출에 중점을 두고 설계되어 집중적인 계산 작업 부하를 처리하도록 맞춤화되었습니다. 고유한 열 아키텍처는 550W를 초과하는 TDP(Thermal Design Power)를 지원하여 까다로운 조건에서도 안정적인 성능을 보장합니다. 전원 공급 시스템은 다양한 적층형 다이와 방향을 수용하도록 독창적으로 설계되어 정확한 정렬과 효율성을 보장합니다.
AMD MI300 성능
AMD는 Instinct MI300X 플랫폼을 통해 흥미로운 제품을 시장에 출시했으며 이를 Nvidia의 찾기 힘든 H100 HGX의 강력한 경쟁자로 자리매김하고 있습니다. MI300X 플랫폼에는 1.5TB의 HBM3 메모리가 함께 제공됩니다. 이는 모든 개발자가 만족할 H640 HGX의 100GB 메모리 용량을 크게 능가합니다. 원시 컴퓨팅 성능 측면에서 AMD는 H10.4 HGX의 약 16배인 약 16페타플롭스의 FP1.3/BF100 성능으로 선두를 달리고 있어 복잡한 계산에 대한 향상된 효율성을 약속합니다.
다른 주요 사양과 관련하여 두 플랫폼은 패리티에 가깝고 총 양방향 대역폭과 네트워크 인터페이스 기능의 발전을 일치시키며 각각 최대 400GbE를 제공하고 5GB/s의 PCIe Gen 128 인터페이스와 패리티를 유지합니다. 제조업체가 더 많은 메모리와 더 빠른 컴퓨팅에 대한 증가하는 요구를 충족하기 위해 계속해서 새로운 기술을 출시함에 따라 AMD와 NVIDIA 간의 결투는 HPC/AI 부문에서 전례 없는 빠른 혁신을 보여줍니다.
생각을 폐쇄
고급 모듈식 및 칩렛 아키텍처, 강력한 CPU 및 GPU 코어, 혁신적인 패키징 및 전원 관리 기능을 갖춘 AMD Instinct MI300 시리즈는 고성능 컴퓨팅 및 인공 지능 분야에서 많은 기능을 제공합니다. 이 디자인은 전력, 성능 및 효율성의 신중한 통합을 반영하여 미래 컴퓨팅 기술에 대한 새로운 벤치마크를 설정합니다.
컴퓨팅 세계는 MI300 시리즈의 전체 배포를 간절히 기대하고 있으므로 AMD가 HPC 및 AI 영역에서 지속적으로 혁신을 주도하면서 공급 및 기술 발전에 보조를 맞출 수 있는지 보는 것이 흥미로울 것입니다. AMD는 MI300 시리즈와 함께 강력하고 유사한 솔루션을 제공하고 있습니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드