새로운 벤치마크에 따르면 AMD EPYC CPU는 AI 및 데이터 센터 워크로드에서 Nvidia Grace보다 우수한 성능을 보였으며, Ryzen AI MAX+ 395는 노트북 AI를 새롭게 정의했습니다.
AMD는 Nvidia의 Grace 프로세서에 대한 EPYC CPU의 경쟁력 있는 벤치마크를 선보였습니다. 또한 소비자용 노트북을 위한 Ryzen AI MAX+ 395 프로세서를 공개하고 우주 인증을 받은 Versal AI Edge 적응형 시스템 온 칩(SoC)을 소개했습니다.
AMD EPYC CPU, AI 성능 테스트에서 Nvidia Grace보다 앞서나감
AMD는 특히 데이터 센터 및 AI 워크로드에서 Nvidia의 Grace CPU에 비해 EPYC 프로세서의 명확한 성능 이점을 보여주는 벤치마크 비교를 제시했습니다. 성숙한 x86 아키텍처를 활용하는 EPYC 프로세서는 Nvidia Grace와 같은 새로운 Arm 기반 솔루션에 비해 강력한 성능, 확장성 및 호환성 이점을 제공합니다.
AMD는 다음을 포함하여 EPYC 프로세서가 Nvidia의 Grace보다 우수한 점을 보여주는 몇 가지 주요 벤치마크를 강조했습니다.
- 비교할 수 없는 밀도: EPYC 프로세서는 Grace Superchip의 33개 Arm Neoverse 코어보다 192% 더 높은 밀도와 소켓당 144개 코어 SKU를 제공합니다.
- 전력 효율 : 듀얼 소켓 SPECpower® 테스트에서 EPYC CPU는 2.75배 더 뛰어난 전력 효율을 제공하여 대규모 배포 시 에너지 효율성이 크게 향상되었습니다.
- 데이터베이스 성능: EPYC 프로세서는 MySQL TPROC-C 워크로드에서 두 배 이상의 성능을 보였습니다. 이는 상당한 벡터 데이터베이스가 필요한 자율적인 RAG 시스템을 더 많이 배포함에 따라 점점 더 중요해지고 있습니다.
- 비디오 인코딩 : FFmpeg VP9 코덱을 사용하여 비디오를 인코딩할 때 EPYC는 2.9배 더 높은 처리량을 달성하여 더 빠르고 효율적인 미디어 처리가 가능해졌습니다.
- GPU 가속 워크로드: EPYC CPU는 다른 주요 x20 솔루션보다 최대 86% 더 높은 처리량을 제공하여 GPU를 많이 사용하는 AI 작업에 특히 효과적입니다.
- 클럭 속도: 최대 5GHz의 클럭 속도를 자랑하는 EPYC 프로세서는 Nvidia Grace의 기본 주파수인 3.1GHz를 크게 앞지르며 컴퓨팅 집약적 애플리케이션에 뛰어난 원시 성능을 제공합니다.
- 리소스 활용: AMD의 동시 멀티스레딩(SMT) 기술은 리소스 효율성을 더욱 향상시켜 EPYC 프로세서가 더 많은 작업을 동시에 효과적으로 처리할 수 있게 해줍니다.
이러한 벤치마크는 실시간 추천 시스템, 예측 유지 관리, 비전 및 언어 처리 작업을 포함한 다양한 엔터프라이즈 AI 애플리케이션에 EPYC가 적합함을 보여줍니다.
Ryzen AI MAX+ 395, 새로운 소비자용 노트북 AI 성능 표준 설정
AMD는 또한 프리미엄 씬앤라이트 노트북을 위한 가장 강력한 x395 APU로 포지셔닝된 Ryzen AI MAX+ 86 프로세서("Strix Halo")를 출시했습니다. 16개의 Zen 5 CPU 코어, 2TOPS 이상을 제공하는 XDNA™ 50 Neural Processing Unit, 40개의 AMD RDNA™ 3.5 Compute Unit이 통합된 그래픽을 결합합니다.
AMD의 벤치마크는 Ryzen AI MAX+ 395가 다양한 AI 워크로드에서 Intel의 Copilot+ 프로세서보다 상당히 우수한 성능을 보인다는 것을 보여줍니다. 토큰 처리량 테스트에서 AMD의 새로운 프로세서는 Intel의 Arc 2.2V가 장착된 노트북보다 최대 140배 높은 성능을 제공했습니다. 지연 시간 개선은 특히 인상적입니다. 3.2억 개의 매개변수가 있는 Llama 3와 같은 소형 모델은 최대 7배 더 빠르게 실행되었습니다. 8억~9.1억 개의 매개변수가 있는 중형 모델은 최대 14배 더 빠른 응답 시간을 경험했습니다. 이에 비해 약 12.2억 개의 매개변수가 있는 대형 모델은 Intel의 Core Ultra 258V에 비해 최대 XNUMX배의 지연 시간 감소를 달성했습니다.
Ryzen AI MAX+ 395는 비전 기반 AI 작업에서도 뛰어난 성과를 보였으며, IBM의 Granite Vision 모델(3.2억 개의 매개변수)을 최대 4배 더 빠르게 실행하고 Google의 Gemma Vision 모델(4.6억 개의 매개변수)을 최대 12배 더 빠르게 실행했습니다. XNUMX억 개의 매개변수를 가진 Google의 Gemma Vision과 같은 더 큰 비전 모델도 Intel의 제품에 비해 최대 XNUMX배 더 높은 성능을 보였습니다.
AMD의 새로운 프로세서는 원시 성능 외에도 인상적인 128GB의 통합 메모리를 지원하여 경쟁업체가 제공하는 최대 32GB를 능가합니다. 또한 AMD의 가변 그래픽 메모리 기술을 통해 노트북은 최대 96GB의 이 메모리를 VRAM으로 동적으로 할당할 수 있습니다. 이러한 유연성 덕분에 사용자는 최대 27억 개의 매개변수를 갖춘 Google의 Gemma Vision을 포함하여 대규모 AI 모델을 노트북에서 직접 편안하게 실행할 수 있습니다.
Ryzen AI MAX+ 플랫폼은 사용자가 기술 전문 지식 없이도 자신의 노트북에서 직접 고급 로컬 언어 및 비전 모델을 실행할 수 있도록 하여 사용자 경험을 획기적으로 향상시킵니다. 이는 LM Studio와 같은 애플리케이션에서 입증되었습니다.
Versal AI Edge XQRVE2303 적응형 SoC, 우주 비행 자격 달성
AMD는 또 다른 획기적인 발표에서 Versal AI Edge XQRVE2303 적응형 시스템 온 칩(SoC)이 클래스 B 우주 비행 자격을 완료하여, 우주 임무에 적합한 AMD의 두 번째 내방사선 Versal 장치가 되었다고 밝혔습니다.
XQRVE2302는 향상된 AMD AI 엔진(AIE-ML)을 통해 고급 AI 추론 기능을 우주로 가져오도록 설계되었습니다. 이 엔진은 8세대 AI 엔진에 비해 INT16의 두 배, BFLOAT16의 23배의 성능을 제공하며, 지연 시간은 줄고 메모리 대역폭은 개선되었습니다. 23mm x XNUMXmm의 소형 폼 팩터는 우주 애플리케이션을 위한 가장 작은 적응형 SoC로, 전력 소비와 보드 공간을 줄이면서 고성능을 제공합니다.
듀얼 코어 Arm® Cortex®-A72 애플리케이션 프로세서, 듀얼 코어 Arm Cortex-R5F 실시간 프로세서, DSP 블록, FPGA 프로그래밍 가능 로직을 탑재한 XQRVE2302는 이미지 분류, 자율 주행, 센서 데이터 처리와 같은 엣지 처리 작업에 이상적입니다. 이러한 기능을 통해 산불 감지, 식물 모니터링, 지구 관측 위성의 구름 감지와 같은 애플리케이션을 구현할 수 있습니다.
AMD는 Alpha Data와 협력하여 XQRVE2302에 대한 방사선 내성 참조 설계를 개발했습니다. ADM-VB630 설계 플랫폼은 차세대 위성 시스템의 신속한 프로토타입 제작과 비용 효율적인 개발을 용이하게 합니다.
Versal XQR 시리즈는 우주 시스템에서 보완적인 역할을 하도록 설계되었습니다. 더 큰 XQRVC1902는 중부하 신호 처리를 처리하는 반면, 더 작은 XQRVE2302는 명령 및 제어 기능, AI 추론 및 엣지 컴퓨팅에 중점을 둡니다. 두 장치 모두 우주의 혹독한 방사선 환경에서 개발 및 배포 후 무제한 재프로그래밍을 지원합니다.
결론
AMD의 최근 발표는 기업 및 소비자 시장에서 강력한 입지를 강조합니다. EPYC 프로세서가 중요한 벤치마크(특히 데이터 센터 및 AI 워크로드)에서 Nvidia의 Grace CPU를 분명히 능가하고 Ryzen AI MAX+ 395가 소비자 노트북 AI 성능에서 새로운 기준을 설정하면서 AMD는 다양한 애플리케이션에서 견고하고 효율적이며 고성능 컴퓨팅 솔루션을 제공할 수 있는 역량을 보여줍니다.
또한, 우주 비행 자격을 달성한 Versal AI Edge XQRVE2303 적응형 SoC는 AMD가 기술적 경계를 더욱 넓히려는 노력을 강조합니다. AMD는 우주 임무를 위한 강력하고 다재다능하며 방사선에 강한 AI 처리 기능을 제공함으로써 항공우주 분야에서 가능성을 확장하고 있으며, 까다로운 환경에서도 고급 컴퓨팅을 사용할 수 있게 합니다. 이러한 혁신은 AMD를 AI 및 고성능 컴퓨팅 발전의 최전선에 위치시킵니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드