홈페이지 Enterprise 4세대 AMD EPYC 리뷰(AMD Genoa)

4세대 AMD EPYC 리뷰(AMD Genoa)

by 조던 라누스

AMD는 새로운 EPYC 9004 4세대 CPU의 일반 가용성을 발표했습니다. 코드명이 AMD Genoa인 새로운 CPU 라인은 DDR12-5 채널 4800개(소켓당 최대 6TB 메모리 용량), PCIe Gen128 레인 5개, AMD Infinity Fabric/Guard 기술 및 최대 96개 코어를 지원합니다. 따라서 클라우드, 엔터프라이즈 및 고성능 컴퓨팅 전반의 중요한 워크로드에 이상적입니다.

AMD는 새로운 EPYC 9004 4세대 CPU의 일반 가용성을 발표했습니다. 코드명이 AMD Genoa인 새로운 CPU 라인은 DDR12-5 채널 4800개(소켓당 최대 6TB 메모리 용량), PCIe Gen128 레인 5개, AMD Infinity Fabric/Guard 기술 및 최대 96개 코어를 지원합니다. 따라서 클라우드, 엔터프라이즈 및 고성능 컴퓨팅 전반의 중요한 워크로드에 이상적입니다.

기업을 위한 EPYC 9004 4세대 CPU의 이점

단일 프로세서에 96개 코어를 탑재한 새로운 AMD Genoa 프로세서를 사용하면 조직은 더 적은 수의 서버를 배포하는 동시에 더 강력한 서버를 활용하여 물리적 설치 공간을 줄일 수 있습니다. 이는 데이터 센터 에코시스템에 더 큰 유연성을 제공하고 지속 가능성 및 미래 보장 목표를 달성하는 데 도움이 됩니다.

AMD 제노아 서버

AMD는 향상된 보안에 중점을 두고 새로운 EPYC 프로세서를 구축했으며, 특히 CPU에 대한 물리적 보호 계층과 가상 보호 계층을 모두 제공하는 회사의 기능 세트인 AMD Infinity Guard를 확장했습니다. 예를 들어, 이전 세대에 비해 두 배의 암호화 키를 제공하므로 고객이 데이터를 로컬로 저장하든, 클라우드에 저장하든, 스토리지에 상주하든 관계없이 데이터를 안전하게 유지할 수 있습니다.

조직은 요구 사항에 가장 적합한 코어 수 및 빈도(아래 표 참조)가 포함된 모델을 선택할 수 있는 옵션과 함께 "올인" 기능 세트의 이점을 누릴 수 있습니다. 또한 4세대 AMD EPYC 프로세서는 이제 AI 및 ML 애플리케이션에 필수적인 DDR5 메모리와 PCIe Gen 5를 지원합니다. 물론 엔터프라이즈 SSD 공급업체는 드라이브를 주류로 끌어들이고 Gen 4보다 XNUMX배 더 많은 대역폭 잠재력을 잠금 해제하기 위해 조금씩 노력하고 있습니다.

AMD Genoa 9004 시리즈 SKU

모델 코어 기본 TDP cTDP 베이스(GHz) 부스트(GHz)
9654 96 360w 320-400w 2.4 3.7
9634 84 290w 240-300w 2.25 3.7
9554 64 360w 320-400w 3.1 3.75
9534 64 280w 240-300w 2.45 3.7
9454 48 290w 240-300w 2.75 3.8
9354 32 280w 240-300w 3.25 3.8
9334 32 210w 200-240w 2.7 3.9
9254 24 200w 200-240w 2.9 4.15
9224 24 200w 200-240w 2.5 3.7
9124 16 200w 200-240w 3.0 3.7
9474F 48 360w 320-400w 3.6 4.1
9374F 32 320w 320-400w 3.85 4.3
9274F 24 320w 320-400w 4.05 4.3
9174F 16 320w 320-400w 4.1 4.4
9654P 96 360w 320-400w 2.4 3.7
9554P 64 360w 320-400w 3.1 3.75
9454P 48 290w 240-300w 2.75 3.8
9354P 32 280w 240-300w 3.25 3.8

AMD 제노아 – Zen 4 아키텍처

지난 4월에 출시된 Zen 9004는 AMD EPYC 9004 CPU를 위한 새로운 마이크로아키텍처로 현재까지 AMD의 최고 성능 코어를 특징으로 합니다. 이를 통해 EPYC 4 CPU는 성능 및 에너지 효율성에서 새로운 수준의 리더십을 제공하고 고객이 데이터 센터 현대화를 가속화하여 애플리케이션 처리량을 높이고 실행 가능한 통찰력을 높일 수 있도록 합니다. Zen 7000는 또한 새로운 소비자 등급 Ryzen XNUMX 데스크탑 프로세서를 구동합니다.

AMD 제노아 DRAM

Zen 4가 가져온 더 큰 변화 중 하나는 DDR4 전용으로 이동했기 때문에 더 이상 DDR5 메모리를 지원하지 않는다는 것입니다. 또한 Zen 4는 새로운 AMD EXPO SPD 프로필을 지원하므로 RAM 제조업체가 보다 포괄적인 메모리 튜닝 및 오버클럭킹을 수행할 수 있습니다.

다른 새로운 기능 중 일부는 다음과 같습니다.

  • 빠른 개인용 1M L2 캐시
  • 코어당 L2에서 L3로 더 많은 미스 지원
  • L3에서 메모리로 더 많은 미스 지원
  • 향상된 L3 및 L2 미스 BW
  • BW가 높을수록 프리페치 개선이 가능합니다.

Zen 4 마이크로아키텍처 개요

Zen 4 대 Zen 3

이전 세대에 비해 AMD EPYC 9004 시리즈 개선 사항

새로운 AMD Genoa는 최대 코어 수가 CPU당 무려 96개로 증가하는 등 다양한 눈에 띄는 개선 사항을 제공합니다. 이것은 지난 몇 세대에 비해 중요합니다.

  • 최고 64 코어 7773X 및 7763의 CPU당(3rd Gen EPYC) 모델
  • 최고 40 코어 8380으로 CPU당(3rd Gen Xeon Platinum) 모델

AMD는 이것이 더 빠른 솔루션 제공 시간과 관련하여 경쟁 제품에 비해 약 2.3배의 성능(또는 와트당 성능의 경우 1.6배)으로 변환될 것이라고 밝혔습니다. 이것은 차세대 릴리스에서 본 전체 성능에서 가장 큰 향상이 될 것입니다. 초당 엔터프라이즈 비즈니스 작업의 경우 4th Gen AMD는 EPYC CPU가 Arnold Autodesk를 사용할 때 렌더링 속도에서 2.6배의 성능 향상을 암시하면서 최대 2.4배의 성능을 제공할 것으로 기대합니다.

AMD 제노아 히트싱크

또한 Zen 4 아키텍처로 인해 코어 성능이 크게 업그레이드되고 서버 CPU에 대한 IPC 향상이 최대 14%까지 증가할 수 있습니다.

새로운 EPYC 9004 시리즈에는 확장을 위해 프로비저닝된 리더십 플랫폼 기능도 있습니다.

  • 단일 등급 성능이 향상된 12채널 DDR5-4800
  • 128L 32Gps 및 8L 8Gps 다기능 SERDES(시리얼라이저/디시리얼라이저)

또한 CXL1.1+ 메모리 지원(CXL "Type3")을 특징으로 하며 여기에는 DDR 및 새로운 메모리를 위한 고급 메모리 연결 기능과 SEV-SNP, QoS 및 계층형 메모리 관리 확장이 포함됩니다. 보안 강화를 위해 SEV-SNP 키 확장 및 AES-256-XTS를 지원합니다.

AMD EPYC 9004 시리즈 메모리

AMD Genoa CPU는 CPU당 12채널, 소켓당 6TB 용량, 최대 DDR4800을 지원하며 이론적으로 최고 대역폭에서 최대 460GB/s까지 도달할 수 있습니다.

다음은 3세대와 4세대 메모리 대역폭 성능을 한눈에 비교한 것입니다.

AMD EPYC 9004 시리즈 CPU 포지셔닝

이전 세대와 마찬가지로 AMD는 새로운 CPU를 세 가지 그룹으로 분류했습니다.

  • 핵심 성능, 캐시/코어 비율이 큰 고주파수 CPU로 구성됩니다. 이에 해당하는 모델로는 9474F(48코어 @ 360W), 9374F(32코어 @ 320W), 9274F(24코어 @ 320W), 9174F(16코어 @ 320W)가 있다.
  • 코어 밀도, 가장 높은 코어 및 스레드 수 CPU로 구성됩니다. 이에 해당하는 모델에는 9654/P(96코어 @ 360W), 9634(84코어 @ 290W), 9554/P(64코어 @ 360W), 9534(64코어 @ 280W) 및 9454/P(48코어 @ 290W)가 포함됩니다. ).
  • 균형 잡힌 최적화된 성능, 성능과 TCO의 균형을 갖춘 CPU로 구성됩니다. 이에 해당하는 모델에는 9354/P(32코어 @ 280W), 9334(32코어 @ 210W), 9254(24코어 @ 200W), 9224(24코어 @ 200W) 및 9124(16코어 @ 200W)가 포함됩니다.

AMD 제노아 9004 CPU 성능

벤치마킹 구성

초기 테스트를 위해 우리는 CPU 집약적인 워크로드의 초기 배치에서 현재 최고급 Intel 및 AMD 플랫폼을 서로 배치했습니다. Intel 플랫폼의 경우 Quanta 섀시 내부의 이중 CPU AMD EPYC 8380 플랫폼에 대해 Intel OEM 서버를 중심으로 구축된 초기 이중 CPU Intel 9654 플랫폼을 활용했습니다.

인텔 플랫폼 사양:
Intel Xeon Platinum 2 8380코어 CPU 40개
16GB 32MHz DDR3200 4개
윈도우 서버 2022 운영체제

AMD 플랫폼 사양:
AMD EPYC 2 9654코어 CPU 96개
24GB 64MHz DDR4800 5개
윈도우 서버 2022 운영체제

V- 레이

V-Ray Benchmark는 다양한 CPU와 GPU를 점수화하고 비교하기 위한 Chaos Group의 애플리케이션입니다. Chaos Group은 레이 트레이싱 기술에 특화된 시각화 및 렌더링 작업으로 유명합니다. V-Ray Benchmark에는 CPU와 GPU의 모든 조합을 테스트하고 시스템 성능을 다른 시스템과 비교하기 위한 사용자 지정 빌드 테스트 장면이 포함되어 있습니다.

우리 연구실에서는 CPU 전용 모드에서 V-Ray 벤치마크를 활용했습니다. 잠재적인 병목 현상을 최소화하기 위해 Solidigm P5520 7.68TB NVMe SSD와 Windows Server 2022를 새로 설치했습니다. V-Ray의 리더보드 상단은 이전에 2x AMD EPYC 7K83 64코어 프로세서 시스템으로 100,844번의 테스트에서 인상적인 6 평균. 2x AMD EPYC Genoa 96-Core를 사용하는 샘플 시스템은 126,940개의 테스트에서 평균 9점을 받았습니다. 인텔 시스템과 비교

소스에서 Firefox 빌드

Mozilla의 브라우저인 Firefox는 거대한 오픈 소스 프로젝트입니다. Mozilla는 소스 코드에서 직접 프로젝트를 컴파일할 수 있는 기능을 제공하고자 합니다. 이 기능은 성능을 비교하는 도구로서 더욱 보편화되었습니다. 이를 위한 다운로드는 수천 개의 파일을 컴파일해야 하는 몇 기가바이트입니다.

테스트에서 우리는 Intel Xeon 6 장비의 57분 8380초 시간에 깊은 인상을 받았습니다. 두 번째 컴파일 시간. 비교를 위해 최상위 워크스테이션은 액체 질소와 과도한 전압을 지속적으로 공급하면 거의 6분 안에 이 작업을 완료할 수 있습니다. 이 칩들.

FF 소스에서 빌드
AMD 2 9654코어 96개 6:33.85
인텔 2 8380코어 40개 6:57.85

블렌더 – CLI 벤치마크

Blender Benchmark는 CPU 및 GPU 벤치마킹 분야에서 확립된 표준입니다. Blender는 오픈 소스 3D 모델링 및 애니메이션 도구로 업계에서 선두주자로 인정받고 있습니다. Genoa EPYC 프로세서의 주제와 일관되게 이를 활용하여 CPU와 고밀도 랙 배치를 위한 잠재적인 GPU 스탠드인이 가능한 혼합 아키텍처를 갖는 유연성을 보여주고 있습니다.

Blender에는 Monster, Junkshop 및 Classroom이라는 세 가지 벤치마크가 있습니다. 이들은 순차적으로 렌더링되고 각 섹션에 대한 점수가 부여된 다음 총 점수에 대해 합산되는 세 개의 장면입니다.

블렌더 테스트 AMD 2 9654코어 96개 인텔 2 8380코어 40개
몬스터 1788.189128 671.145395
정크샵 1062.533142 407.141514
교실 850.646333 320.507039
금액 3701.368603 1398.793948

Genoa 리그는 Monster에서 3701, Junkshop에서 1788.2, Classroom 벤치마크에서 1062.5으로 총 850.6점을 기록했습니다. Genoa와 Intel Xeon Platinum을 비교하는 것은 어떤 면에서 불공평해 보일 수 있습니다. Intel이 코어 수의 약 41%만 가지고 타석에 오른다는 점을 고려하면, 데이터를 보고 코어 수의 차이에 대해 정규화하면 결과가 흥미로워집니다. . 최신 아키텍처, 명령어 세트 및 DDR5 사용 덕분에 AMD Genoa Chip은 Intel 장비보다 약 10% 더 빠릅니다.

AMD 2 9654코어 96개 상대 인텔 코어 수 백분율 인텔 2 8380코어 40개
192 코어 41.67 비율 80 코어
384 스레드 41.67 비율 160 스레드

 

AMD 2 9654코어 96개 인텔 2 8380코어 40개
블렌더 총점 3701 1399
코어 / 스레드 192/384 80/160
인텔 코어 카운트/AMD 41.67 비율
직접 점수 비교 Intel/AMD 37.79 비율
코어 표준화 AMD 점수 1542
상대 Intel/AMD, 코어 정규화 90.70 비율

Cinebench R23

Maxon의 Cinebench는 표준화된 테스트 방법론과 멀티코어 및 단일 코어 성능을 벤치마킹하기 위한 실제 테스트 사용 덕분에 한동안 벤치마킹의 중심이었습니다. Cinebench의 최신 버전인 R23에는 이전에는 해결할 필요가 없었던 제한이 있습니다. 256개의 코어/스레드만 벤치마킹할 수 있습니다. 우리의 테스트 장비는 384개입니다. 흥미롭게도 우리가 실행한 많은 "표준" 벤치마크와 응용 프로그램은 코어가 256개로 제한되어 있었습니다. 따라서 Cinebench만이 우리가 향하고 있는 울트라 코어 수의 미래에 대한 업데이트가 필요한 것은 아닙니다. 쪽으로.

이 제한 사항을 해결하기 위해 두 가지 테스트를 동시에 실행하고 각 인스턴스를 196개의 스레드로 제한하여 로드를 균등하게 분할했습니다. 일반적으로 작업 관리자에서 CPU 친화도를 설정할 수 있지만 Cinebench에서 무언가가 이 작업을 차단하고 있었습니다. API가 CPU 우선 순위에 대해 호출되는 기본 방식으로 설정된 플래그인 것으로 의심됩니다. 권한이 낮은 사용자로 실행하고 명령줄 "start /affinity NODE 0" 플래그로 시작하여 강제 실행하려고 시도했지만 응용 프로그램을 단일 NUMA 노드에 잠글 수 없었습니다.

프로그램에 특정 선호도를 할당할 수 없으므로 애플리케이션을 두 번 실행하고 함께 시작했습니다. 결과는 앱의 두 인스턴스에서 두 개의 크게 다른 점수를 보여주었지만 CPU 사용량을 모니터링하면서 테스트 중에 사용률이 80~100% 사이에서 튀어오르는 것을 관찰할 수 있었습니다.

시네벤치 단일 인스턴스 AMD 2 9654코어 96개 인텔 2 8380코어 40개
멀티 스레드(256 캡) 85,160 70,540
싱글 코어 972 985
MP 비율 SR 87.65x SR 71.63x

 

시네벤치 인스턴스 2개
AMD 테스트 실행 1 AMD 테스트 실행 2
점수, 첫 번째 인스턴스 82,063 68,231
점수, 두 번째 인스턴스 57,557 57,221
금액 139,620 125,452

최종 생각

AMD EPYC 9004 CPU의 벤치마킹 프로세스는 적어도 흥미로운 작업이었습니다. 초기 검토 프로세스에서 우리가 직면한 문제는 CPU 환경이 초고밀도 모델로 전환함에 따라 소프트웨어 개발자가 해결해야 하는 전반적인 문제를 나타냅니다. 이를 활용할 수 있는 기성품 응용 프로그램이 일부 있지만 스레드 수의 일부 임계값을 초과하여 확장할 수 없는 소프트웨어의 한계를 점차 발견했습니다.

실험실에서는 실제 시나리오에서 이러한 새로운 CPU를 테스트할 수 있도록 일부 자체 개발 Tensorflow 기계 학습 벤치마크를 작업하고 있습니다. 새 응용 프로그램의 결과에 대한 확신이 있고 여러 플랫폼과 여러 세대의 CPU에 걸쳐 이를 검증한 후에 결과를 후속 조치할 것입니다.

하지만 지금까지 Quanta 서버에서 본 것처럼 AMD Genoa의 출시는 매우 흥미진진합니다. 을 더한, HPE and 작은 골짜기 에서 각각 1개의 시스템, 2개의 XNUMX CPU 섀시 및 XNUMX개의 XNUMX CPU 섀시를 제공하는 서버를 발표했습니다. 이를 통해 AMD Genoa는 즉시 기업에 도입되어 하이퍼스케일러를 넘어 Genoa의 입지를 빠르게 확장할 것입니다.

amd 제노아 베어 cpu

큰 질문은 분명합니다. AMD Genoa가 투자할 가치가 있습니까? 이것은 지출을 정당화하는 측면에서 작업량으로 귀결되지만 VMware용 DPU, 이러한 새로운 CPU 기술은 컴퓨팅 성능, 보안 및 효율성 측면에서 많은 것을 제공합니다. 3세대 EPYC를 이것들로 교체하는 것은 아마도 다소 시기상조일 것입니다.

우리는 훨씬 더 많은 테스트와 작업을 수행해야 하며 Intel Sapphire Rapids가 곧 출시될 예정이므로 각 제품이 제공해야 하는 최고를 비교하고자 합니다. 그러나 현재 AMD Genoa는 매우 매력적이며 조직이 AMD가 제공해야 하는 이러한 모든 코어와 효율성의 영향을 더 잘 이해할 수 있도록 모든 인프라 갱신 PoC에 있어야 합니다.

AMD 출시 비디오

StorageReview에 참여

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드