Home 消費財クライアントアクセサリ NVIDIA Quadro RTX 4000 レビュー

NVIDIA Quadro RTX 4000 レビュー

昨年 4000 月に発表された Quadro RTX 4000 は、NVIDIA のプロフェッショナル GPU ファミリの一部です。 RTX XNUMX は、CAD ソフトウェア プロフェッショナル向けに特別に設計されており、設計に対する強烈なリアリズムと没入型のインタラクションを提供します。その結果、ローカル ワークステーション上で高度なシミュレーションと分析を実行できるようになります。


昨年 4000 月に発表された Quadro RTX 4000 は、NVIDIA のプロフェッショナル GPU ファミリの一部です。 RTX XNUMX は、CAD ソフトウェア プロフェッショナル向けに特別に設計されており、設計に対する強烈なリアリズムと没入型のインタラクションを提供します。その結果、ローカル ワークステーション上で高度なシミュレーションと分析を実行できるようになります。

他の NVIDIA GPU と同様に、RTX 4000 は NVIDIA Quadro スケーラブル ビジュアル ソリューション (SVS) を利用します。その結果、個々の RTX 4000 カードは、5 Hz で最大 60 台の 8K モニター、またはデュアル 4000K ディスプレイをサポートできます。 32 つの Quadro Sync II ボードを利用すると、40 つのシステムで最大 4000 つの RTX 8 GPU をサポートし、6 の個別のディスプレイを同期できます。 NVIDIA はまた、XNUMX GB の GDDRXNUMX グラフィックス メモリのおかげで、前世代の Quadro PXNUMX よりも帯域幅が XNUMX% 向上したと主張しています。

RTX 4000 は、高さ 4.4 インチ x 長さ 9.5 インチのシングル スロット フォーム ファクターを備えており、GPU をさまざまなワークステーション シャーシに適合させることができます。このスリムなフォームファクターに NVIDIA は、2304 個の CUDA コア、288 個の Tensor コア、36 個の RT コア、および 8GB GDDR6 メモリを搭載することができました。このハードウェアは、激しい AEC、DCC、AI、VR、およびグラフィックスのワークロード向けに設計されています。 RTX 4000 には、次世代の高解像度 VR ヘッドマウント ディスプレイへの接続を簡素化する VirtualLink が付属しています。

Quadro RTX 4000の仕様

アーキテクチャ NVIDIA チューリング
GPUメモリ 8GB GDDR6
メモリインターフェイス 256ビット
メモリ帯域幅 最大416GB/秒
NVIDIACUDAコア 2,304
NVIDIAテンソルコア 288
NVIDIARTコア 36
単精度のパフォーマンス 7.1 TFLOPS
テンソル性能 57.0 TFLOPS
システムインターフェース PCI Express 3.0×16
消費電力 総ボード電力: 160W
総グラフィックパワー: 125W
サーマルソリューションアクティブ
フォームファクター 高さ 4.4 インチ x 長さ 9.5 インチ、シングルスロット
最大同時表示数 4x 3840×2160 @ 120 Hz
4x 5120×2880 @ 60 Hz
2x 7680×4320 @ 60 Hz
VRレディ Yes
グラフィックス API シェイダーモデル5.1
OpenGL 4.5
DirectXの12.0
Vulkan 1.0
コンピューティングAPI CUDA
ダイレクトコンピューティング
オープンCL

性能

NVIDIA Quadro RTX 4000 GPU の新しいアーキテクチャのパフォーマンスをテストするために、Windows 920 を実行している Lenovo ThinkSystem P10 ワークステーションにインストールしました。各カードのパフォーマンスを包括的に確認するために、複数の業界ベンチマークと GPU アクセラレーションを活用しました。テスト対象のカードを最大限に活用できるソフトウェア。 Turning アーキテクチャを共有する NVIDIA Quadro RTX 5000 と比較するだけでなく、以前の Pascal Quadro シリーズとの比較も行います。 P6000  P5000、 そしてその P4000。これは、どちらが優れているかということよりも、選択した GPU で何を期待できるかということです。

これらの GPU がさまざまなアーキテクチャからどのようにスケールされているかをよりよく理解するために、現在の RTX に関する次の表を含めました。 RTX 4000 は明らかに、P シリーズ カードが P1000 から始まったこのファミリーのエントリーレベルのカードです。もちろん、RTX ファミリは RTX 8000 までスケールアップし、より多くのグラフィックス メモリ、帯域幅、コアを提供します。

NVIDIA Quadro GPU
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPUメモリ 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
メモリインターフェイス 256ビット 256ビット 384ビット 384ビット
メモリ帯域幅 最大416GB/秒 最大448GB/秒 最大672GB/秒 最大672GB/秒
NVIDIACUDAコア 2,304 3,072 4,608 4,608
NVIDIAテンソルコア 288 384 576 576
NVIDIARTコア 36 48 72 72
単精度のパフォーマンス 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
テンソル性能 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

最初のベンチマークは、LuxMark クロスプラットフォーム OpenCL ベンチマーク ツールです。 LuxMark は LuxCore API に基づいており、LuxCoreRender スイートのプロモーション コンポーネントとして提供されます。新しいマイクロカーネル ベースの OpenCL パス トレーサーをベンチマークのレンダリングとして使用し、特定のワークステーションにインストールされている GPU に負荷をかける独自の方法を提供します。

ラックスマーク
GPU 結果
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Pascal GPU は LuxMark で良好な結果を得ましたが、Turning GPU を見ると明らかにパフォーマンスが向上しています。 RTX 4000 は 5000 のスコアで RTX 28,338 に次いで XNUMX 位になりました。

次は、RandomControl によって開発された CUDA ベンチマーク ツールである Arion です。これを使用すると、ワークステーションがレンダリング アプリケーションで CPU または GPU に負荷をかけることができます。 ArionBench は、Arion 2 テクノロジーに基づくソフトウェア ツールで、3D シーンでの光の流れをシミュレートするタスクを通じて CPU/GPU に大きな負荷をかけます。

アリオン
GPU 結果
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

RTX 4000 が P6000 を大幅に上回り、Pascal から Turing へとスコアがさらに大きく上昇しました。

次のベンチマークでは、SolidWorks 2019 と、アウディ R3、建設掘削機、ジェット エンジン、ラリーカーをカバーする 8 つの 3D モデルを利用します。 Solidworks は、Windows ベースのシステム上で動作する、業界をリードする GPU アクセラレーションの 165,000D CAD モデリング アプリケーションです。 SolidWorks はダッソー システムズによって開発され、世界中で 2019 万人以上のエンジニアと 4.5 社以上の企業によって使用されています。ベンチマークの目的で、SolidWorks XNUMX 内の新しい「パフォーマンス パイプライン」機能を活用します。このアーキテクチャは、特に大規模なモデルに対して、より応答性の高いリアルタイム表示を提供します。最新の OpenGL (XNUMX) とハードウェア アクセラレーションによるレンダリングを利用して、大きなモデルをパン、ズーム、回転するときに高レベルの詳細とフレーム レートを維持します。

各モデルがレンダリングされた後、スクリプトは各モデルを 5 回回転し、このタスクを完了するのに必要な時間を測定します。次に、それをレンダリングされたフレーム数で割って、セクションあたりの平均フレーム数 (FPS) スコアを計算します。

SolidWorksの
ソリッドワークス R8 平均
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
ソリッドワークスディガー 平均
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
ソリッドワークス ジェット エンジン 平均
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
ソリッドワークス ラリーカー 平均
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Solidworks R8 と Rally Car では、Turing モデルのパフォーマンスがわずかに低下しますが、Digger と Jet Engine では大幅な向上があります。 Solidworks のテストではベータ表示モードを使用していましたが、これが Audi R8 および RallyCar アセンブリで見られる異常なスケーリングの原因である可能性があります。

次に、Environment Systems Research Institute (Esri) のベンチマークです。 Esri は、地理情報システム (GIS) ソフトウェアのサプライヤーです。 Esri のパフォーマンス チームは、ArcGIS Pro を自動的に起動する PerfTool アドイン スクリプトを設計しました。このアプリケーションは、「ZoomToBookmarks」機能を使用して、さまざまな事前定義されたブックマークを参照し、ユーザー エクスペリエンスを予測するために必要なすべての主要なデータ ポイントを含むログ ファイルを作成します。スクリプトは、キャッシュ (メモリおよびディスク キャッシュ) を考慮して、ブックマークを自動的に 2.3 回ループします。言い換えれば、このベンチマークは、Esri の ArcGIS Pro XNUMX ソフトウェアを通じて見られるような大量のグラフィックの使用をシミュレートします。

テストは 3 つの主要なデータセットで構成されます。 3 つはペンシルベニア州フィラデルフィアとケニア州モントリオールの 2D 都市ビューです。これらの都市ビューには、地形モデル上にドレープされたテクスチャ付きの XNUMXD マルチパッチの建物と、ドレープされた航空画像が含まれています。 XNUMX 番目のデータセットは、オレゴン州ポートランド地域の XNUMXD マップ ビューです。このデータには、道路、土地利用区画、公園や学校、川、湖、陰影のある地形に関する詳細情報が含まれています。

モントリオール モデルの描画時間を確認すると、NVIDIA Quadro RTX 4000 の平均描画時間は 00:01:31.284 で、平均 FPS と最小 FPS はそれぞれ 502.395 と 180.699 でした。

ESRI ArcGIS Pro 2.3 モントリオール
ドロータイム 平均
クアドロP4000 00:01:31.084
クアドロP5000 00:01:31:082
クアドロP6000 00:01:31.081
クアドロ RTX 4000 00:01:31.284
クアドロ RTX 5000 00:01:31.067
平均FPS 平均
クアドロP4000 432.327
クアドロP5000 489.889
クアドロP6000 521.551
クアドロ RTX 4000 502.395
クアドロ RTX 5000 527.636
最小 FPS 平均
クアドロP4000 164.546
クアドロP5000 194.218
クアドロP6000 190.336
クアドロ RTX 4000 180.699
クアドロ RTX 5000 190.775

次はフィラデルフィア モデルです。RTX 4000 の平均描画時間は 00:01:00.231 で、平均 FPS と最小 FPS はそれぞれ 434.170 と 196.825 でした。

ESRI ArcGIS Pro 2.3 フィラデルフィア
ドロータイム 平均
クアドロP4000 00:02:53.928
クアドロP5000 00:01:01.109
クアドロP6000 00:01:01.245
クアドロ RTX 4000 00:01:00.231
クアドロ RTX 5000 00:01:01.111
平均FPS 平均
クアドロP4000 304.340
クアドロP5000 451.826
クアドロP6000 469.879
クアドロ RTX 4000 434.170
クアドロ RTX 5000 531.315
最小 FPS 平均
クアドロP4000 160.152
クアドロP5000 212.910
クアドロP6000 207.879
クアドロ RTX 4000 196.825
クアドロ RTX 5000 224.341

最後のモデルはポートランドです。ここで、RTX 4000 の平均描画時間は 00:00:32.646 でした。平均 FPS は 2,821.928 を示し、最小 FPS は 1,083.260 を示しました。

ESRI ArcGIS Pro 2.3 ポートランド
ドロータイム 平均
クアドロP4000 00:00:32.426
クアドロP5000 00:00:32.310
クアドロP6000 00:00:32.552
クアドロ RTX 4000 00:00:32.646
クアドロ RTX 5000 00:00:32.541
平均FPS 平均
クアドロP4000 2,051.053
クアドロP5000 2,057.395
クアドロP6000 2,343.948
クアドロ RTX 4000 2,821.928
クアドロ RTX 5000 2,783.547
最小 FPS 平均
クアドロP4000 1,179.974
クアドロP5000 1,189.524
クアドロP6000 1,282.045
クアドロ RTX 4000 1,083.260
クアドロ RTX 5000 1,007.309

まとめ

NVIDIA Quadro RTX 4000 は下位レベルの Turing アーキテクチャ GPU ですが、それは強力ではないという意味ではありません。 RTX 4000 には、2304 CUDA コアと 8GB GDDR6 GPU が搭載されています。すべての Quadro RTX と同様に、4000 は、アクセス可能なシングル スロット フォーム ファクターで、高速化されたレイ トレーシング、ディープ ラーニング、高度なシェーディングを実現できます。これにより、クリエイティブなプロフェッショナルは洞察を得るまでの時間が短縮され、クリエイティブな取り組みが加速されます。 RTX 4000 には、次世代の高解像度 VR ヘッドマウント ディスプレイへの接続を簡素化する VirtualLink も付属しています。

パフォーマンスの面では、特に新しい GPU の下位にあることを考慮すると、RTX 4000 は非常に優れたパフォーマンスを示しました。 LuxMark ベンチマークでは、Pascal のほぼ 6000 倍となり、P4000 をも上回りました。 Arion では、RTX 4000 が P6000 の 4000 倍以上となり、再び P4000 を簡単に上回りました。 Solidworks ベンチマークでは、RTX 4000 が P4000 を容易に上回り、Digger および Jet Engine ベンチマークではさらに輝きを放ちました。 ESRi では、RTX 5000 は P6000 (場合によっては P4000) よりもはるかに優れたパフォーマンスを発揮しましたが、ワークロードによっては P6000 の方が優れたパフォーマンスを発揮するものもあります。 RTX XNUMX は Turing アーキテクチャのローエンドにあり、PXNUMX は Pascal アーキテクチャのハイエンドにあることに留意してください。

全体として、Quadro RTX 4000 は、NVIDIA の優れた GPU の大規模な製品ラインへの待望の追加製品であり、わずか 900 ドル程度の価格でありながら、エントリーレベルのカードとしては非常に優れたパフォーマンス数値を提供します。

AmazonでのQuadro RTX 4000

Quadro RTX 4000 製品ページ

このレビューについて話し合う

StorageReview ニュースレターにサインアップする