홈페이지 소비자 AMD Radeon PRO W7900 및 W7800 GPU 검토

AMD Radeon PRO W7900 및 W7800 GPU 검토

by 찰스 P. 제프리
AMD Radeon PRO W7900 그래픽 카드

AMD Radeon PRO W7900 및 W7800은 AMD의 최신 최고급 워크스테이션 GPU입니다. 이들은 최초의 칩렛 GPU이자 DisplayPort 2.1을 지원하는 최초의 GPU입니다. 이 카드를 NVIDIA의 RTX A6000과 비교하여 고급 워크스테이션 사용자가 가장 까다로운 AI, 렌더링 및 기타 전문 애플리케이션 워크로드를 위해 실행 가능한 새로운 GPU를 선택할 수 있는지 확인하십시오.

AMD Radeon PRO W7900 및 W7800은 AMD의 최신 최고급 워크스테이션 GPU입니다. 이들은 최초의 칩렛 GPU이자 DisplayPort 2.1을 지원하는 최초의 GPU입니다. 이 카드를 NVIDIA의 RTX A6000과 비교하여 고급 워크스테이션 사용자가 가장 까다로운 AI, 렌더링 및 기타 전문 애플리케이션 워크로드를 위해 실행 가능한 새로운 GPU를 선택할 수 있는지 확인하십시오.

AMD Radeon PRO W7900 및 W7800 사양

새로운 Radeon PRO W7900 및 W7800은 AMD의 3세대 그래픽 아키텍처인 RDNA XNUMX을 사용합니다. 이 세대의 근본적인 변화는 향상된 유연성, 전력 및 비용 효율성을 위해 서로 다른 프로세스 노드의 칩을 결합하는 칩렛 아키텍처로의 이동입니다.

이에 비해 이전 세대의 RNDA 2 아키텍처는 모든 구성 요소가 동일한 7nm 프로세스에 구축된 모놀리식이었습니다. RDNA 3는 성능 부품에 5nm 다이를 사용하고 메모리 캐시에 6nm 다이를 사용합니다.

AMD Radeon PRO W7900 그래픽 카드

AMD는 RDNA 3가 차세대 레이 트레이싱 가속기도 제공한다고 말합니다. 컴퓨팅 장치에는 데이터 추론 성능을 향상시키는 "AI 가속기"가 내장되어 있습니다. 미디어의 경우 RNDA 3는 하드웨어 가속 AV1 인코딩을 최대 8K60까지 추가합니다. 또한 AVC 및 HEVC에 대해 두 개의 동시 인코딩 또는 디코딩 스트림을 지원합니다.

아래의 Radeon PRO W7800 및 W7900의 전체 사양과 이전 세대 Radeon PRO W6800을 참조하십시오. 우리의 분석은 다음과 같습니다.

라데온 PRO W7900 라데온 PRO W7800 라데온 PRO W6800
GPU 아키텍처 AMD RDNA 3 AMD RDNA 2
트랜지스터 수 57.7억(5nm GDC 6nm MCD) 26.8억(7nm 공정)
스트림 프로세서 6144(96 컴퓨팅 유닛) 4480(70 컴퓨팅 유닛) 3840(60 컴퓨팅 유닛)
최대 FP16 처리량(하프 정밀도) 122.64 Teraflops 90.50 Teraflops 35.66 Teraflops
최대 FP32 처리량(단정밀도) 61.32 Teraflops 45.25 Teraflops 17.83 Teraflops
AMD 인피니티 캐시(L3) 96MB 64MB 128MB
전용 그래픽 메모리 48GB GDDR6 32GB GDDR6 32GB GDDR6
메모리 버스 384-bit 256-bit 256-bit
피크 메모리 대역폭 864 GB / 초 576 GB / 초 512 GB / 초
PCI 익스프레스 지원 4.0(x4)/3.0 하위 호환성
오류 수정 코드(ECC) 지원 가능
디스플레이 커넥터 3x DisplayPort 1.2; 1x 향상된 미니 DisplayPort 2.1 6x Mini-DisplayPort 1.4(DSC 포함)
디스플레이 출력
  • 4x @ 3840x2160px(4K)
  • 4x @ 5120x2880px(5K)
  • 2x @ 7680x4320px(8K)
  • 1x @ 12288x6912px(12K)
  • 6x @ 3840x2160px(4K)
  • 6x @ 5120×2880(5K)
  • 2x @ 7680x4320px(8K)
총 보드 전력 295 승 260 승 250 승
전원 커넥터 2x 8- 핀 6- 핀 + 8- 핀
PSU 권장 사항 최소 650와트
보드 폼 팩터 전체 높이, 3슬롯, 11"(280mm) 길이 전체 높이, 2슬롯, 11"(280mm) 길이 전체 높이, 2슬롯, 10.5"(267mm)

Radeon PRO W7800은 거의 모든 영역에서 이전 세대 제품을 능가합니다. 트랜지스터 수는 최대 FP26.8 및 FP57.7 처리량과 마찬가지로 16억에서 32억으로 두 배 이상 증가했습니다. W7800의 인피니티 캐시는 더 작지만(64MB 대신 128MB) 256비트 버스를 유지함에도 불구하고 메모리 대역폭을 포함한 다른 모든 부분에서 더 강력합니다. 그럼에도 불구하고 총 보드 전력은 10와트 증가한 260와트에 그쳤습니다. AMD는 RDNA 3 아키텍처가 훨씬 더 에너지 효율적이라고 농담하지 않았습니다.

그리고 AMD Radeon PRO W7900이라는 괴물이 있습니다. W7800의 트랜지스터 수를 공유하지만 다른 곳에서는 훨씬 앞서 있습니다. 96개 대 70개의 컴퓨팅 유닛이 있으며 이는 훨씬 더 많은 컴퓨팅 성능을 의미합니다. (이는 우리의 벤치마크에서 분명해질 것입니다.)

또한 W96의 64GB/s에 비해 384GB/s의 최대 메모리 대역폭을 제공하는 더 큰 Infinity Cache(864MB 대 7800MB)와 훨씬 더 넓은 576비트 메모리 버스도 주목할 만합니다. 이러한 성능은 더 큰 3슬롯 카드 디자인과 보드 전력이 260와트에서 295와트로 상대적으로 완만하게 증가하는 비용으로 제공됩니다.

AMD Radeon PRO W7800 그래픽 카드

흥미롭게도 새로운 Radeon PRO 카드는 후자가 출시될 때마다 8개의 12K 비압축 디스플레이 또는 단일 12,288K(6,912 x 8 픽셀) 디스플레이를 지원합니다. (2.1K 디스플레이는 찾기가 어렵습니다.) 디스플레이 출력에 대해 AMD는 이 새로운 Radeon PRO 카드가 DisplayPort 54가 있는 RDNA 2 카드에서 지원하는 대역폭의 두 배인 1.4Gbps의 대역폭을 제공하는 DisplayPort XNUMX을 처음으로 지원한다고 말합니다.

가장 중요한 소프트웨어 측면에서 Radeon PRO W7800 및 W7900에는 AMD Software: PRO Edition을 통해 사용할 수 있는 특수 드라이버가 있습니다. AMD는 ISV(Independent Software Vendor) 프로그램을 통해 100개 이상의 애플리케이션으로 이러한 카드를 인증하고 제로데이 ISV 인증 프로그램을 보유하고 있습니다. AMD는 또한 개발자가 HIP 성능 API를 확장하여 AMD 및 기타 GPU에 대한 이식 가능한 코드를 작성하도록 권장합니다.

AMD Radeon PRO W7900 대. NVIDIA RTX A6000 Ada 세대

이제 AMD와 NVIDIA의 주력 워크스테이션 카드인 Radeon PRO W7900과 RTX A6000 Ada Generation을 함께 살펴보겠습니다. 성능 비교에 사용할 카드인 이전 세대 RTX A6000도 포함했습니다. 많은 사람들이 오렌지에서 오렌지가 아니기 때문에 특정 사양만 포함했습니다. 카드 간의 아키텍처가 너무 다릅니다.

(참조 NVIDIA 자세한 기술 정보는.)

AMD 라데온 프로 W7900 NVIDIA RTX A6000 Ada 세대 엔비디아 RTX A6000
메모리 48GB GDDR6 ECC
메모리 인터페이스 384-bit
메모리 대역폭 864 GB / 초 960 GB / 초 768 GB / 초
단정밀도 성능 61.32 Teraflops 91.1 Teraflops 38.7 Teraflops
총 보드 전력 295 w 300 w
폼 팩터 11인치 길이, 3슬롯 10.5인치 길이, 2슬롯
전원 커넥터 2x 8- 핀 PCIe CEM1 5핀 16개 1x 8- 핀
디스플레이 커넥터 3x DisplayPort 1.2; 1x 향상된 미니 DisplayPort 2.1 4x 디스플레이 포트 1.2a

세 가지 모두 48GB GDDR6 ECC 프레임 버퍼와 384비트 메모리 버스가 있습니다. NVIDIA Tensor/CUDA 코어 또는 AMD Compute 코어 수는 NVIDIA의 에코시스템 내에서도 비교할 수 없기 때문에 포함하지 않았지만 단정밀도 성능은 좋은 기준을 제공합니다. Radeon PRO W7900은 해당 메트릭에서 RTX A6000보다 분명히 한 단계 높지만 RTX A6000 Ada Generation은 아닙니다.

NVIDIA 카드는 7900개의 슬롯만 필요한 크기 이점이 있는 반면 Radeon PRO W2.1은 XNUMX인치 더 길고 XNUMX개의 슬롯이 필요합니다. 총 보드 전력은 모든 카드에서 거의 동일합니다. AMD는 지원 모니터가 필요하지만 DisplayPort XNUMX 지원에 이점이 있습니다.

AMD Radeon PRO W7900 및 W7800 디자인

AMD Radeon PRO W7900 및 W7800은 워크스테이션 카드이므로 현란한 RGB 조명이나 화려한 쿨러는 볼 수 없습니다. 두 카드 모두 길이가 11인치(280mm)이고 워크스테이션 공기 흐름에 이상적인 송풍기 스타일 쿨러를 자랑합니다. 모든 냉각 배출구는 카드 뒷면으로 나갑니다.

AMD Radeon PRO W7800 및 AMD Radeon PRO W7900

슬롯 높이는 카드가 다른 부분입니다. Radeon PRO W7800은 7900개의 슬롯을 사용하는 반면 WXNUMX은 XNUMX개를 사용합니다.

AMD Radeon PRO W7800 및 AMD Radeon PRO W7900 높이

두 카드 모두 기존의 2x 8핀 전원 설정을 사용합니다. AMD는 최소 650와트 전원 공급 장치를 권장합니다.

AMD Radeon PRO W7900 전원 커넥터

카드를 뒤집으면 다시 멋진 것이 보이지 않지만 이 카드는 성능에 관한 것이며 송풍기 냉각기의 단순한 브랜딩을 넘어 미학을 최소화합니다.

AMD Radeon PRO W7900 쿨러

AMD Radeon PRO W7900 및 W7800 성능

자체 제작하여 사용하고 있습니다 StorageReview 테스트 장비 성능 테스트를 위해; 데스크탑은 다음과 같이 구성됩니다.

  • 수냉식 인텔 코어 i9-12900K CPU
  • Asus ROG Strix Z690-E 게이밍 WiFi 마더보드
  • 마이크로 소프트 윈도우 11
  • 32GB Kingston Fury DDR5-5200 RAM(2x 16GB)
  • 씨게이트 파이어쿠다 530 2TB SSD

이것은 워크스테이션 또는 서버급 CPU를 사용하지 않는다는 점에서 워크스테이션이 아니지만 PCIe 4.0을 지원한다는 이점이 있습니다. 이 새로운 그래픽 카드에 필요한 대역폭을 감안할 때 필요합니다.

Radeon PRO 카드를 NVIDIA와 비교하고 있습니다. RTX-A6000. 이것은 Ada Generation 아키텍처를 기반으로 하는 카드가 아닌 이전 세대 카드이지만 여전히 확실한 비교를 제공할 것입니다. 이 검토를 위해 카드를 다시 테스트했습니다.

모니터 해상도를 3840 x 2160(4K/UHD)으로 설정한 상태에서 모든 테스트를 실행했습니다. 테스트를 시작하겠습니다.

UL 연구소 Procyon AI 벤치마크

최상위 공급업체의 다양한 인공 지능 추론 엔진을 특징으로 하는 UL Procyon AI 추론 벤치마크 광범위한 하드웨어 설정 및 요구 사항을 충족합니다. 벤치마크 점수는 온디바이스 추론 성능에 대한 편리하고 표준화된 요약을 제공합니다. 이를 통해 사내 솔루션 없이도 실제 상황에서 다양한 하드웨어 설정을 비교하고 대조할 수 있습니다.

 

AMD 카드는 Tensor 벤치마크를 실행할 수 없다는 점을 고려하는 것이 중요합니다. 그러나 성능의 차이를 보여주기 위해 포함합니다. Windows AI 테스트를 선택하고 새로운 W7900 및 W7800과 NVIDIA의 A6000을 비교했습니다. 새로운 AMD Radeon PRO W7900은 일부 테스트와 전체 점수에서 AI 추론에서 NVIDIA A6000을 능가하지만 각 테스트의 세분화된 결과를 살펴보는 것이 중요합니다.

Test A6000
텐서(참조)
A6000
윈도우 AI
W7900
윈도우 아이
W7800
윈도우 AI
전체 점수 1068 818 846 729
MobileNet V3 평균. 추론 시간 0.57 0.68 0.46 0.48
ResNet 50 평균. 추론 시간 1.45 1.64 1.60 2.14
인셉션 V4 평균. 추론 시간 4.56 4.06 6.65 7.44
DeepLab V3 평균 추론 시간 4.99 14.58 15.50 17.63
YOLO V3 평균 추론 시간 4.38 6.31 6.92 8.39
REAL-ESRGAN 평균 추론 시간 127.24 125.34 80.74 92.22

SPECviewperf2020

SPECviewperf 2020 벤치마크는 OpenGL 및 Direct X 애플리케이션 프로그래밍 인터페이스에서 실행되는 전문 애플리케이션의 그래픽 성능을 측정하기 위한 세계적인 표준입니다. 뷰 세트(또는 벤치마크)는 애플리케이션 자체를 설치할 필요 없이 실제 애플리케이션의 그래픽 콘텐츠 및 동작을 나타냅니다. 이러한 뷰 세트에는 3D Max, CATIA, Creo, Energy, Maya, Medical, Siemens NX 및 Solidworks가 포함됩니다. 숫자가 높을수록 좋습니다.

Radeon PRO W7900과 RTX A6000 사이에는 약간의 줄다리기가 있으며 일반적으로 전리품은 후자에게 돌아갑니다. Radeon PRO W7800은 W7900이 약 15%에서 34% 더 나은 성능을 발휘하여 더 강력한 제품을 따릅니다. 이것은 의미가 있습니다. Radeon PRO W7900은 W37보다 컴퓨팅 유닛이 7800% 더 많습니다(96 대 70).

뷰셋 AMD 라데온 프로 W7900 AMD 라데온 프로 W7800 NVIDIA RTX-A6000
3dsmax-07 112.84 98.44 141.57
카티아-06 19.01 18.3 102.24
크레오-03 150.26 125.2 159.46
에너지-03 67.22 49.99 42.59
마야-06 301.14 230.9 352.93
의료-03 75.78 56.26 34.75
Snx-04 322.58 282.52 449.85
솔리드웍스-05 204.29 153.82 169.7

ESRI

다음은 환경 시스템 연구소(Esri) 벤치마크입니다. Esri는 지리 정보 시스템(GIS) 소프트웨어 공급업체입니다. Esri의 성능 팀은 ArcGIS Pro를 자동으로 시작하도록 PerfTool 애드인 스크립트를 설계했습니다. 이 애플리케이션은 "ZoomToBookmarks" 기능을 사용하여 사전 정의된 다양한 북마크를 탐색하고 사용자 경험을 예측하는 데 필요한 모든 주요 데이터 포인트가 포함된 로그 파일을 생성합니다. 스크립트는 캐싱(메모리 및 디스크 캐시)을 고려하여 책갈피를 자동으로 세 번 반복합니다. 즉, 이 벤치마크는 Esri의 ArcGIS Pro 소프트웨어를 통해 볼 수 있는 과도한 그래픽 사용을 시뮬레이션합니다.

테스트는 세 가지 주요 데이터 세트로 구성됩니다. 두 개는 펜실베이니아주 필라델피아와 QC주 몬트리올의 3D 도시 전망입니다. 이러한 도시 보기에는 지형 모델에 드리워진 질감이 있는 3D 멀티패치 건물과 드리워진 항공 이미지가 포함되어 있습니다. 세 번째 데이터 세트는 OR 지역의 Portland에 대한 2D 지도 보기입니다. 이 데이터에는 도로, 토지 사용 구획, 공원 및 학교, 강, 호수 및 언덕 음영 지형에 대한 자세한 정보가 포함되어 있습니다.

몬트리올 애니메이션이 먼저입니다. 다가올 일의 조짐으로 RTX A6000은 AMD 듀오를 격파했습니다. W7900에 비해 Radeon PRO W7800의 성능 이점은 평균 fps 수치에 따라 최대 44%까지 증가했습니다.

ESRI ArcGIS Pro 2.3 몬트리올
평균 FPS 평균
AMD 라데온 프로 W7900 265.07
AMD 라데온 프로 W7800 183.44
엔비디아 RTX A6000 601.50
최소 FPS 평균
AMD 라데온 프로 W7900 108.65
AMD 라데온 프로 W7800 88.10
엔비디아 RTX A6000 324.85

다음은 Philly 뷰셋입니다. RTX A6000의 월등한 성능은 계속됩니다. W7900에 비해 Radeon PRO W7800의 이점은 여기서 덜 두드러집니다.

ESRI ArcGIS Pro 2.3 필라델피아
평균 FPS 평균
AMD 라데온 프로 W7900 252.36
AMD 라데온 프로 W7800 199.17
엔비디아 RTX A6000 474.97
최소 FPS 평균
AMD 라데온 프로 W7900 107.28
AMD 라데온 프로 W7800 106.99
엔비디아 RTX A6000 276.65

마지막은 RTX A6000이 단순히 도망가는 포틀랜드입니다. Radeon PRO W7800 및 W7900은 이 하위 테스트가 CPU에 의존하기 때문에 거의 동일하게 수행됩니다.

ESRI ArcGIS Pro 2.3 포틀랜드
평균 FPS 평균
AMD 라데온 프로 W7900 332.23
AMD 라데온 프로 W7800 322.56
엔비디아 RTX A6000 3,513.32
최소 FPS 평균
AMD 라데온 프로 W7900 201.55
AMD 라데온 프로 W7800 208.67
엔비디아 RTX A6000 1,641.34

럭스마크

우리가 살펴볼 또 다른 3D 벤치마크는 OpenCL GPU 벤치마킹 유틸리티인 LuxMark입니다. 여기에서 Radeon PRO W7900은 RTX A6000에 비해 상당한 이점을 보여줍니다. Radeon PRO W7800은 RTX A6000과 같은 수준이 아닙니다.

LuxMark(높을수록 좋음)
카테고리 AMD 라데온 프로 W7900 AMD 라데온 프로 W7800 엔비디아 RTX A6000
홀벤치 22,538 16,692 20,867
식품 10,264 5,542 7,869

블렌더 옵틱스

다음은 오픈 소스 3D 모델링 애플리케이션인 Blender입니다. 이 벤치마크는 선택한 렌더링 방법으로 NVIDIA OptiX와 함께 Blender Benchmark 유틸리티를 사용하여 실행되었습니다. 점수는 분당 샘플이며 높을수록 좋습니다.

이 벤치마크는 NVIDIA에 최적화된 것으로 보입니다. RTX A6000은 Radeon PRO W7900보다 훨씬 앞서 있습니다.

Blender OptiX, 분당 샘플(높을수록 좋음)
카테고리 AMD 라데온 프로 W7900 AMD 라데온 프로 W7800 엔비디아 RTX A6000
몬스터 1,820.20 1,268.35 2,818.73
정크샵 960.66 684.83 1,794.18
교실 843.99 635.85 1,535.98

Blackmagic RAW 속도 테스트

마지막 테스트는 새로운 Blackmagic RAW Speed ​​Test입니다. OpenCL의 Radeon PRO는 CUDA로 RTX A6000을 따라잡지 못했습니다.

Blackmagic RAW(높을수록 좋음)
  AMD 라데온 프로 W7900 AMD 라데온 프로 W7800 엔비디아 RTX A6000
8K GPU 36의 FPS 35의 FPS 139의 FPS

결론

AMD Radeon PRO W7900 및 W7800은 일반적으로 벤치마크에서 NVIDIA RTX A6000을 따라잡지 못했지만 몇 번의 승리를 거두었습니다. 즉, AMD는 Radeon PRO W7900이 확실히 RTX A6000을 이길 것이라고 주장한 적이 없습니다. 목표는 Radeon PRO WXNUMX을 따라잡아 훨씬 낮은 가격대로 새로운 AMD GPU 제품군을 제공하는 것이었습니다. 가격 책정은 이러한 카드, 특히 많은 조직이 비즈니스 영향을 더 잘 처리할 때까지 AI 투자를 측정하려고 하는 AI에서 중요한 개념입니다.

워크스테이션 그래픽 카드 구매 프로세스의 대부분은 사용 중인 소프트웨어와 카드의 성능을 결정하는 AMD 또는 NVIDIA의 지원 정도에 달려 있습니다. 우리가 실행한 SPECviewperf2020 벤치마크는 아마도 3D OpenGL 및 DirectX에서 기대할 수 있는 가장 일반적인 보기를 제공할 것입니다. 그것은 Radeon PRO W7900과 RTX A6000이 타격을 주고받은 유일한 테스트 중 하나였습니다. 하위 테스트 중 일부는 비슷했고 다른 일부는 한 카드 또는 다른 카드에 크게 유리했습니다. 따라서 Radeon PRO W7900은 일부 상황에서 우위를 점할 수 있습니다.

CUDA 또는 Tensor 최적화가 작용하는 Blackmagic RAW 또는 Procyon과 같은 영역에서 NVIDIA 제품은 여전히 ​​상당한 우위를 점하고 있습니다. 그것은 다소 닭과 달걀 상황입니다. GPU 최적화는 시장 포화를 따르므로 특정 모델이 인기를 얻으면 이를 위한 최적화가 뒤따릅니다. 여기의 성능 수치에서 배운 것이 있다면 AMD가 매우 긍정적인 방향으로 나아가고 있다는 것이 분명하며, 이는 물론 채택에 도움이 될 것입니다.

언급했듯이 구멍에 있는 AMD의 진정한 비결은 가격입니다. Radeon PRO W7900의 MSRP는 3,999달러인 반면 NVIDIA RTX A6000 Ada Generation은 약 6,800달러이고 여기에서 비교한 비 Ada는 약 5,400달러입니다. AMD 카드로 얻을 수 있는 달러당 상대적 성능은 종종 유리하게 작용할 수 있습니다.

전반적으로 우리는 새로운 Radeon PRO 카드가 칩렛 아키텍처를 GPU에 도입하게 되어 기쁩니다. 우리는 또한 AMD의 전향적 기술, 특히 처음으로 DisplayPort 2.1을 포함하는 것을 좋아합니다. Team Red의 이러한 새로운 항목은 일부 시나리오에서 NVIDIA를 능가할 수 있고 다른 시나리오에서는 그렇지 않을 수 있으며 전반적으로 가격대와 청중에 대해 잘 수행되는 것 같습니다. 더 많은 옵션을 제공하는 것은 업계의 승리이며, 분명히 AMD는 워크스테이션 GPU 시장에서 강력한 경쟁자가 되려는 의도를 보여주고 있습니다.

StorageReview에 참여

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | 디스코드 | RSS 피드