홈페이지 소비자클라이언트 액세서리 NVIDIA Quadro RTX 4000 검토

NVIDIA Quadro RTX 4000 검토

by StorageReview 소비자 데스크

작년 4000월에 발표된 Quadro RTX 4000은 NVIDIA의 전문 GPU 제품군의 일부입니다. RTX XNUMX은 CAD 소프트웨어 전문가를 위해 특별히 설계되어 디자인과의 강렬한 현실감과 몰입형 상호 작용을 제공합니다. 결과적으로 로컬 워크스테이션에서 고급 시뮬레이션 및 분석을 실행할 수 있습니다.


작년 4000월에 발표된 Quadro RTX 4000은 NVIDIA의 전문 GPU 제품군의 일부입니다. RTX XNUMX은 CAD 소프트웨어 전문가를 위해 특별히 설계되어 디자인과의 강렬한 현실감과 몰입형 상호 작용을 제공합니다. 결과적으로 로컬 워크스테이션에서 고급 시뮬레이션 및 분석을 실행할 수 있습니다.

다른 NVIDIA GPU와 달리 RTX 4000은 NVIDIA Quadro SVS(Scalable Visual Solution)를 활용합니다. 결과적으로 각 개별 RTX 4000 카드는 5Hz에서 최대 60개의 8K 모니터 또는 듀얼 4000K 디스플레이를 지원할 수 있습니다. 32개의 Quadro Sync II 보드를 사용할 때 하나의 시스템은 최대 40개의 RTX 4000 GPU를 지원하여 8개의 개별 디스플레이를 동기화할 수 있습니다. NVIDIA는 부분적으로 6GB의 GDDRXNUMX 그래픽 메모리 덕분에 이전 세대 Quadro PXNUMX보다 대역폭이 XNUMX% 향상되었다고 주장합니다.

RTX 4000은 4.4인치 H x 9.5인치 L 단일 슬롯 폼 팩터를 자랑하므로 GPU를 다양한 워크스테이션 섀시에 맞출 수 있습니다. 이 슬림한 폼 팩터에서 NVIDIA는 2304개의 CUDA 코어, 288개의 Tensor 코어, 36개의 RT 코어 및 8GB GDDR6 메모리를 장착할 수 있었습니다. 이 하드웨어는 집약적인 AEC, DCC, AI, VR 및 그래픽 워크로드용으로 설계되었습니다. RTX 4000은 VirtualLink와 함께 제공되어 차세대 고해상도 VR 헤드 마운트 디스플레이에 대한 연결을 단순화합니다.

쿼드로 RTX 4000 사양

아키텍처 엔비디아 튜링
GPU 메모리 8GB GDDR6
메모리 인터페이스 256-bit
메모리 대역폭 최대 416GB/s
NVIDIA CUDA 코어 2,304
NVIDIA 텐서 코어 288
NVIDIA RT 코어 36
단정밀도 성능 7.1 TFLOPS
텐서 성능 57.0 TFLOPS
시스템 인터페이스 PCI 익스프레스 3.0 x 16
전력 소비 총 보드 전력: 160W
총 그래픽 전력: 125W
열 솔루션 활성
폼 팩터 4.4" H x 9.5" L, 단일 슬롯
최대 동시 디스플레이 4x 3840×2160 @ 120Hz
4x 5120×2880 @ 60Hz
2x 7680×4320 @ 60Hz
VR 준비 가능
그래픽 API 셰이더 모델 5.1
OpenGL 4.5
다이렉트 12.0
불칸 1.0
컴퓨팅 API CUDA
다이렉트컴퓨트
OpenCL

퍼포먼스

NVIDIA Quadro RTX 4000 GPU에서 새로운 아키텍처의 성능을 테스트하기 위해 Windows 920을 실행하는 Lenovo ThinkSystem P10 워크스테이션에 설치했습니다. 각 카드의 성능을 종합적으로 살펴보기 위해 여러 업계 벤치마크와 GPU 가속을 활용했습니다. 테스트 중인 카드를 최대한 활용할 수 있는 소프트웨어입니다. Turning 아키텍처를 공유하는 NVIDIA Quadro RTX 5000과 비교할 뿐만 아니라 P6000Walk Through California 프로그램, P5000및 P4000. 이것은 더 적고, 더 낫고, 선택한 GPU에서 기대할 수 있는 것입니다.

이러한 GPU가 다른 아키텍처에서 어떻게 확장되었는지 더 잘 이해하기 위해 현재 RTX에 대한 다음 표를 포함했습니다. RTX 4000은 분명히 P 시리즈 카드가 P1000으로 시작된 제품군의 보급형 카드입니다. 물론 RTX 제품군은 RTX 8000까지 확장되어 더 많은 그래픽 메모리, 대역폭 및 코어를 제공합니다.

엔비디아 쿼드로 GPU
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPU 메모리 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
메모리 인터페이스 256-bit 256-bit 384-bit 384-bit
메모리 대역폭 최대 416GB/s 최대 448GB/s 최대 672GB/s 최대 672GB/s
NVIDIA CUDA 코어 2,304 3,072 4,608 4,608
NVIDIA 텐서 코어 288 384 576 576
NVIDIA RT 코어 36 48 72 72
단정밀도 성능 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
텐서 성능 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

첫 번째 벤치마크는 LuxMark 크로스 플랫폼 OpenCL 벤치마크 도구입니다. LuxMark는 LuxCore API를 기반으로 하며 LuxCoreRender 제품군의 프로모션 구성 요소로 제공됩니다. 벤치마크를 위한 추가 렌더링으로 새로운 마이크로 커널 기반 OpenCL 경로 추적기를 사용하여 주어진 워크스테이션에 설치된 GPU에 스트레스를 주는 독특한 방법을 제공합니다.

럭스마크
GPU 결과
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Pascal GPU가 LuxMark에서 좋은 결과를 얻었지만 Turning GPU를 보면 성능이 확연히 향상되었습니다. RTX 4000은 5000점으로 RTX 28,338에 이어 XNUMX위를 차지했습니다.

다음은 RandomControl에서 개발한 CUDA 벤치마킹 도구인 Arion으로 워크스테이션이 렌더링 응용 프로그램에서 CPU 또는 GPU에 스트레스를 줄 수 있습니다. ArionBench는 2D 장면에서 빛의 흐름을 시뮬레이션하는 작업을 통해 CPU/GPU에 과도한 스트레스를 주는 Arion 3 기술 기반 소프트웨어 도구입니다.

아리온
GPU 결과
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

RTX 4000과 함께 Pascal에서 Turing으로 가는 점수의 또 다른 큰 점프는 P6000보다 상당히 큰 점프입니다.

우리의 다음 벤치마크는 SolidWorks 2019와 Audi R3, 건설 굴착기, 제트 엔진 및 랠리카를 포함하는 8개의 3D 모델을 활용합니다. Solidworks는 Windows 기반 시스템에서 작동하는 업계 최고의 GPU 가속 165,000D CAD 모델링 응용 프로그램입니다. SolidWorks는 Dassault Systèmes에서 개발했으며 전 세계적으로 2019만 명 이상의 엔지니어와 4.5개 이상의 회사에서 사용하고 있습니다. 벤치마킹을 위해 SolidWorks XNUMX 내부의 새로운 "성능 파이프라인" 기능을 활용합니다. 이 아키텍처는 특히 대형 모델에 대해 보다 반응이 빠른 실시간 디스플레이를 제공합니다. 최신 OpenGL(XNUMX) 및 하드웨어 가속 렌더링을 활용하여 대형 모델을 이동, 확대/축소 또는 회전할 때 높은 수준의 세부 정보와 프레임 속도를 유지합니다.

각 모델이 렌더링된 후 스크립트는 각 모델을 XNUMX번 회전하고 이 작업을 완료하는 데 필요한 시간을 측정합니다. 그런 다음 이를 렌더링된 프레임 수로 나누고 섹션당 평균 프레임 수(FPS) 점수를 계산합니다.

SolidWorks
솔리드웍스 R8 평균
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
솔리드웍스 파는 사람 평균
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
솔리드웍스 제트 엔진 평균
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
솔리드웍스 랠리카 평균
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Solidworks R8 및 Rally Car를 사용하면 Turing 모델의 성능이 약간 떨어지지만 Digger 및 Jet Engine은 크게 향상됩니다. Solidworks 테스트에서 우리는 Audi R8 및 RallyCar 어셈블리에서 볼 수 있는 비정상적인 스케일링의 원인일 수 있는 베타 디스플레이 모드를 사용하고 있었습니다.

다음은 환경 시스템 연구소(Esri) 벤치마크입니다. Esri는 지리 정보 시스템(GIS) 소프트웨어 공급업체입니다. Esri의 성능 팀은 ArcGIS Pro를 자동으로 실행하도록 PerfTool 애드인 스크립트를 설계했습니다. 이 애플리케이션은 "ZoomToBookmarks" 기능을 사용하여 미리 정의된 다양한 북마크를 찾아보고 사용자 경험을 예측하는 데 필요한 모든 주요 데이터 포인트가 포함된 로그 파일을 생성합니다. 스크립트는 캐싱(메모리 및 디스크 캐시)을 고려하여 책갈피를 자동으로 세 번 반복합니다. 즉, 이 벤치마크는 Esri의 ArcGIS Pro 2.3 소프트웨어를 통해 볼 수 있는 과도한 그래픽 사용을 시뮬레이션합니다.

테스트는 세 가지 주요 데이터 세트로 구성됩니다. 두 개는 펜실베이니아주 필라델피아와 QC주 몬트리올의 3D 도시 전망입니다. 이러한 도시 보기에는 지형 모델에 드리워진 질감이 있는 3D 멀티패치 건물과 드리워진 항공 이미지가 포함되어 있습니다. 세 번째 데이터 세트는 OR 지역의 Portland에 대한 2D 지도 보기입니다. 이 데이터에는 도로, 토지 사용 구획, 공원 및 학교, 강, 호수 및 그늘진 지형에 대한 자세한 정보가 포함되어 있습니다.

몬트리올 모델의 드로우타임을 보면 엔비디아 쿼드로 RTX 4000의 평균 드로우타임은 00:01:31.284로 평균 FPS는 502.395, 최소 FPS는 180.699를 나타냈다.

ESRI ArcGIS Pro 2.3 몬트리올
드로우타임 평균
쿼드로 P4000 00:01:31.084
쿼드로 P5000 00 : 01 : 31 : 082
쿼드로 P6000 00:01:31.081
쿼드로 RTX 4000 00:01:31.284
쿼드로 RTX 5000 00:01:31.067
평균 FPS 평균
쿼드로 P4000 432.327
쿼드로 P5000 489.889
쿼드로 P6000 521.551
쿼드로 RTX 4000 502.395
쿼드로 RTX 5000 527.636
최소 FPS 평균
쿼드로 P4000 164.546
쿼드로 P5000 194.218
쿼드로 P6000 190.336
쿼드로 RTX 4000 180.699
쿼드로 RTX 5000 190.775

다음은 Philly 모델로 RTX 4000의 평균 드로우 타임은 00:01:00.231, 평균 및 최소 FPS는 각각 434.170 및 196.825입니다.

ESRI ArcGIS Pro 2.3 필라델피아
드로우타임 평균
쿼드로 P4000 00:02:53.928
쿼드로 P5000 00:01:01.109
쿼드로 P6000 00:01:01.245
쿼드로 RTX 4000 00:01:00.231
쿼드로 RTX 5000 00:01:01.111
평균 FPS 평균
쿼드로 P4000 304.340
쿼드로 P5000 451.826
쿼드로 P6000 469.879
쿼드로 RTX 4000 434.170
쿼드로 RTX 5000 531.315
최소 FPS 평균
쿼드로 P4000 160.152
쿼드로 P5000 212.910
쿼드로 P6000 207.879
쿼드로 RTX 4000 196.825
쿼드로 RTX 5000 224.341

마지막 모델은 포틀랜드입니다. 여기서 RTX 4000의 평균 드로우타임은 00:00:32.646이었습니다. 평균 FPS는 2,821.928, 최소 FPS는 1,083.260를 나타냈습니다.

ESRI ArcGIS Pro 2.3 포틀랜드
드로우타임 평균
쿼드로 P4000 00:00:32.426
쿼드로 P5000 00:00:32.310
쿼드로 P6000 00:00:32.552
쿼드로 RTX 4000 00:00:32.646
쿼드로 RTX 5000 00:00:32.541
평균 FPS 평균
쿼드로 P4000 2,051.053
쿼드로 P5000 2,057.395
쿼드로 P6000 2,343.948
쿼드로 RTX 4000 2,821.928
쿼드로 RTX 5000 2,783.547
최소 FPS 평균
쿼드로 P4000 1,179.974
쿼드로 P5000 1,189.524
쿼드로 P6000 1,282.045
쿼드로 RTX 4000 1,083.260
쿼드로 RTX 5000 1,007.309

결론

NVIDIA Quadro RTX 4000은 하위 수준의 Turing 아키텍처 GPU이지만 강력하지 않다는 의미는 아닙니다. RTX 4000에는 2304개의 CUDA 코어와 8GB GDDR6 GPU가 장착되어 있습니다. 모든 Quadro RTX와 마찬가지로 4000은 액세스 가능한 단일 슬롯 폼 팩터에서 가속화된 레이 트레이싱, 딥 러닝 및 고급 음영을 제공할 수 있습니다. 이를 통해 크리에이티브 전문가는 창의적인 노력을 가속화하면서 통찰력을 얻을 수 있는 시간을 단축할 수 있습니다. RTX 4000에는 차세대 고해상도 VR 헤드 마운트 디스플레이에 대한 연결을 간소화하는 VirtualLink도 함께 제공됩니다.

성능 측면에서 RTX 4000은 특히 새로운 GPU의 하단에 있다는 점을 고려할 때 매우 잘 수행되었습니다. LuxMark 벤치마크에서는 Pascal에 비해 거의 두 배가 되었으며 심지어 P6000을 능가했습니다. Arion에서 RTX 4000은 P4000보다 6000배 이상 많았고 다시 P4000을 쉽게 능가했습니다. Solidworks 벤치마크에서 RTX 4000은 P4000을 쉽게 능가했으며 Digger 및 Jet Engine 벤치마크에서 더 빛났습니다. ESRi에서 RTX 4000은 P5000(경우에 따라 P6000)보다 성능이 훨씬 좋았지만 P4000이 더 나은 작업 부하가 있습니다. RTX 6000은 Turing 아키텍처의 로우엔드에 있고 PXNUMX은 Pascal 아키텍처의 최상위에 있다는 점을 명심해야 합니다.

대체로 Quadro RTX 4000은 NVIDIA의 인상적인 GPU 라인에 추가된 매우 환영받는 제품이며 약 900달러의 가격표를 달고 보급형 카드에 대해 매우 인상적인 성능 수치를 제공합니다.

Amazon의 Quadro RTX 4000

Quadro RTX 4000 제품 페이지

이 리뷰에 대해 토론하기

StorageReview 뉴스레터 신청