昨年 4000 月に発表された Quadro RTX 4000 は、NVIDIA のプロフェッショナル GPU ファミリの一部です。 RTX XNUMX は、CAD ソフトウェア プロフェッショナル向けに特別に設計されており、設計に対する強烈なリアリズムと没入型のインタラクションを提供します。その結果、ローカル ワークステーション上で高度なシミュレーションと分析を実行できるようになります。
昨年 4000 月に発表された Quadro RTX 4000 は、NVIDIA のプロフェッショナル GPU ファミリの一部です。 RTX XNUMX は、CAD ソフトウェア プロフェッショナル向けに特別に設計されており、設計に対する強烈なリアリズムと没入型のインタラクションを提供します。その結果、ローカル ワークステーション上で高度なシミュレーションと分析を実行できるようになります。
他の NVIDIA GPU と同様に、RTX 4000 は NVIDIA Quadro スケーラブル ビジュアル ソリューション (SVS) を利用します。その結果、個々の RTX 4000 カードは、5 Hz で最大 60 台の 8K モニター、またはデュアル 4000K ディスプレイをサポートできます。 32 つの Quadro Sync II ボードを利用すると、40 つのシステムで最大 4000 つの RTX 8 GPU をサポートし、6 の個別のディスプレイを同期できます。 NVIDIA はまた、XNUMX GB の GDDRXNUMX グラフィックス メモリのおかげで、前世代の Quadro PXNUMX よりも帯域幅が XNUMX% 向上したと主張しています。
RTX 4000 は、高さ 4.4 インチ x 長さ 9.5 インチのシングル スロット フォーム ファクターを備えており、GPU をさまざまなワークステーション シャーシに適合させることができます。このスリムなフォームファクターに NVIDIA は、2304 個の CUDA コア、288 個の Tensor コア、36 個の RT コア、および 8GB GDDR6 メモリを搭載することができました。このハードウェアは、激しい AEC、DCC、AI、VR、およびグラフィックスのワークロード向けに設計されています。 RTX 4000 には、次世代の高解像度 VR ヘッドマウント ディスプレイへの接続を簡素化する VirtualLink が付属しています。
Quadro RTX 4000の仕様
アーキテクチャ | NVIDIA チューリング |
GPUメモリ | 8GB GDDR6 |
メモリインターフェイス | 256ビット |
メモリ帯域幅 | 最大416GB/秒 |
NVIDIACUDAコア | 2,304 |
NVIDIAテンソルコア | 288 |
NVIDIARTコア | 36 |
単精度のパフォーマンス | 7.1 TFLOPS |
テンソル性能 | 57.0 TFLOPS |
システムインターフェース | PCI Express 3.0×16 |
消費電力 | 総ボード電力: 160W 総グラフィックパワー: 125W サーマルソリューションアクティブ |
フォームファクター | 高さ 4.4 インチ x 長さ 9.5 インチ、シングルスロット |
最大同時表示数 | 4x 3840×2160 @ 120 Hz 4x 5120×2880 @ 60 Hz 2x 7680×4320 @ 60 Hz |
VRレディ | Yes |
グラフィックス API | シェイダーモデル5.1 OpenGL 4.5 DirectXの12.0 Vulkan 1.0 |
コンピューティングAPI | CUDA ダイレクトコンピューティング オープンCL |
性能
NVIDIA Quadro RTX 4000 GPU の新しいアーキテクチャのパフォーマンスをテストするために、Windows 920 を実行している Lenovo ThinkSystem P10 ワークステーションにインストールしました。各カードのパフォーマンスを包括的に確認するために、複数の業界ベンチマークと GPU アクセラレーションを活用しました。テスト対象のカードを最大限に活用できるソフトウェア。 Turning アーキテクチャを共有する NVIDIA Quadro RTX 5000 と比較するだけでなく、以前の Pascal Quadro シリーズとの比較も行います。 P6000 P5000、 そしてその P4000。これは、どちらが優れているかということよりも、選択した GPU で何を期待できるかということです。
これらの GPU がさまざまなアーキテクチャからどのようにスケールされているかをよりよく理解するために、現在の RTX に関する次の表を含めました。 RTX 4000 は明らかに、P シリーズ カードが P1000 から始まったこのファミリーのエントリーレベルのカードです。もちろん、RTX ファミリは RTX 8000 までスケールアップし、より多くのグラフィックス メモリ、帯域幅、コアを提供します。
NVIDIA Quadro GPU | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPUメモリ | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
メモリインターフェイス | 256ビット | 256ビット | 384ビット | 384ビット |
メモリ帯域幅 | 最大416GB/秒 | 最大448GB/秒 | 最大672GB/秒 | 最大672GB/秒 |
NVIDIACUDAコア | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIAテンソルコア | 288 | 384 | 576 | 576 |
NVIDIARTコア | 36 | 48 | 72 | 72 |
単精度のパフォーマンス | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
テンソル性能 | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
最初のベンチマークは、LuxMark クロスプラットフォーム OpenCL ベンチマーク ツールです。 LuxMark は LuxCore API に基づいており、LuxCoreRender スイートのプロモーション コンポーネントとして提供されます。新しいマイクロカーネル ベースの OpenCL パス トレーサーをベンチマークのレンダリングとして使用し、特定のワークステーションにインストールされている GPU に負荷をかける独自の方法を提供します。
ラックスマーク | |
---|---|
GPU | 結果 |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Pascal GPU は LuxMark で良好な結果を得ましたが、Turning GPU を見ると明らかにパフォーマンスが向上しています。 RTX 4000 は 5000 のスコアで RTX 28,338 に次いで XNUMX 位になりました。
次は、RandomControl によって開発された CUDA ベンチマーク ツールである Arion です。これを使用すると、ワークステーションがレンダリング アプリケーションで CPU または GPU に負荷をかけることができます。 ArionBench は、Arion 2 テクノロジーに基づくソフトウェア ツールで、3D シーンでの光の流れをシミュレートするタスクを通じて CPU/GPU に大きな負荷をかけます。
アリオン | |
---|---|
GPU | 結果 |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
RTX 4000 が P6000 を大幅に上回り、Pascal から Turing へとスコアがさらに大きく上昇しました。
次のベンチマークでは、SolidWorks 2019 と、アウディ R3、建設掘削機、ジェット エンジン、ラリーカーをカバーする 8 つの 3D モデルを利用します。 Solidworks は、Windows ベースのシステム上で動作する、業界をリードする GPU アクセラレーションの 165,000D CAD モデリング アプリケーションです。 SolidWorks はダッソー システムズによって開発され、世界中で 2019 万人以上のエンジニアと 4.5 社以上の企業によって使用されています。ベンチマークの目的で、SolidWorks XNUMX 内の新しい「パフォーマンス パイプライン」機能を活用します。このアーキテクチャは、特に大規模なモデルに対して、より応答性の高いリアルタイム表示を提供します。最新の OpenGL (XNUMX) とハードウェア アクセラレーションによるレンダリングを利用して、大きなモデルをパン、ズーム、回転するときに高レベルの詳細とフレーム レートを維持します。
各モデルがレンダリングされた後、スクリプトは各モデルを 5 回回転し、このタスクを完了するのに必要な時間を測定します。次に、それをレンダリングされたフレーム数で割って、セクションあたりの平均フレーム数 (FPS) スコアを計算します。
SolidWorksの | |
---|---|
ソリッドワークス R8 | 平均 |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
ソリッドワークスディガー | 平均 |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
ソリッドワークス ジェット エンジン | 平均 |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
ソリッドワークス ラリーカー | 平均 |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Solidworks R8 と Rally Car では、Turing モデルのパフォーマンスがわずかに低下しますが、Digger と Jet Engine では大幅な向上があります。 Solidworks のテストではベータ表示モードを使用していましたが、これが Audi R8 および RallyCar アセンブリで見られる異常なスケーリングの原因である可能性があります。
次に、Environment Systems Research Institute (Esri) のベンチマークです。 Esri は、地理情報システム (GIS) ソフトウェアのサプライヤーです。 Esri のパフォーマンス チームは、ArcGIS Pro を自動的に起動する PerfTool アドイン スクリプトを設計しました。このアプリケーションは、「ZoomToBookmarks」機能を使用して、さまざまな事前定義されたブックマークを参照し、ユーザー エクスペリエンスを予測するために必要なすべての主要なデータ ポイントを含むログ ファイルを作成します。スクリプトは、キャッシュ (メモリおよびディスク キャッシュ) を考慮して、ブックマークを自動的に 2.3 回ループします。言い換えれば、このベンチマークは、Esri の ArcGIS Pro XNUMX ソフトウェアを通じて見られるような大量のグラフィックの使用をシミュレートします。
テストは 3 つの主要なデータセットで構成されます。 3 つはペンシルベニア州フィラデルフィアとケニア州モントリオールの 2D 都市ビューです。これらの都市ビューには、地形モデル上にドレープされたテクスチャ付きの XNUMXD マルチパッチの建物と、ドレープされた航空画像が含まれています。 XNUMX 番目のデータセットは、オレゴン州ポートランド地域の XNUMXD マップ ビューです。このデータには、道路、土地利用区画、公園や学校、川、湖、陰影のある地形に関する詳細情報が含まれています。
モントリオール モデルの描画時間を確認すると、NVIDIA Quadro RTX 4000 の平均描画時間は 00:01:31.284 で、平均 FPS と最小 FPS はそれぞれ 502.395 と 180.699 でした。
ESRI ArcGIS Pro 2.3 モントリオール | |
---|---|
ドロータイム | 平均 |
クアドロP4000 | 00:01:31.084 |
クアドロP5000 | 00:01:31:082 |
クアドロP6000 | 00:01:31.081 |
クアドロ RTX 4000 | 00:01:31.284 |
クアドロ RTX 5000 | 00:01:31.067 |
平均FPS | 平均 |
クアドロP4000 | 432.327 |
クアドロP5000 | 489.889 |
クアドロP6000 | 521.551 |
クアドロ RTX 4000 | 502.395 |
クアドロ RTX 5000 | 527.636 |
最小 FPS | 平均 |
クアドロP4000 | 164.546 |
クアドロP5000 | 194.218 |
クアドロP6000 | 190.336 |
クアドロ RTX 4000 | 180.699 |
クアドロ RTX 5000 | 190.775 |
次はフィラデルフィア モデルです。RTX 4000 の平均描画時間は 00:01:00.231 で、平均 FPS と最小 FPS はそれぞれ 434.170 と 196.825 でした。
ESRI ArcGIS Pro 2.3 フィラデルフィア | |
---|---|
ドロータイム | 平均 |
クアドロP4000 | 00:02:53.928 |
クアドロP5000 | 00:01:01.109 |
クアドロP6000 | 00:01:01.245 |
クアドロ RTX 4000 | 00:01:00.231 |
クアドロ RTX 5000 | 00:01:01.111 |
平均FPS | 平均 |
クアドロP4000 | 304.340 |
クアドロP5000 | 451.826 |
クアドロP6000 | 469.879 |
クアドロ RTX 4000 | 434.170 |
クアドロ RTX 5000 | 531.315 |
最小 FPS | 平均 |
クアドロP4000 | 160.152 |
クアドロP5000 | 212.910 |
クアドロP6000 | 207.879 |
クアドロ RTX 4000 | 196.825 |
クアドロ RTX 5000 | 224.341 |
最後のモデルはポートランドです。ここで、RTX 4000 の平均描画時間は 00:00:32.646 でした。平均 FPS は 2,821.928 を示し、最小 FPS は 1,083.260 を示しました。
ESRI ArcGIS Pro 2.3 ポートランド | |
---|---|
ドロータイム | 平均 |
クアドロP4000 | 00:00:32.426 |
クアドロP5000 | 00:00:32.310 |
クアドロP6000 | 00:00:32.552 |
クアドロ RTX 4000 | 00:00:32.646 |
クアドロ RTX 5000 | 00:00:32.541 |
平均FPS | 平均 |
クアドロP4000 | 2,051.053 |
クアドロP5000 | 2,057.395 |
クアドロP6000 | 2,343.948 |
クアドロ RTX 4000 | 2,821.928 |
クアドロ RTX 5000 | 2,783.547 |
最小 FPS | 平均 |
クアドロP4000 | 1,179.974 |
クアドロP5000 | 1,189.524 |
クアドロP6000 | 1,282.045 |
クアドロ RTX 4000 | 1,083.260 |
クアドロ RTX 5000 | 1,007.309 |
まとめ
NVIDIA Quadro RTX 4000 は下位レベルの Turing アーキテクチャ GPU ですが、それは強力ではないという意味ではありません。 RTX 4000 には、2304 CUDA コアと 8GB GDDR6 GPU が搭載されています。すべての Quadro RTX と同様に、4000 は、アクセス可能なシングル スロット フォーム ファクターで、高速化されたレイ トレーシング、ディープ ラーニング、高度なシェーディングを実現できます。これにより、クリエイティブなプロフェッショナルは洞察を得るまでの時間が短縮され、クリエイティブな取り組みが加速されます。 RTX 4000 には、次世代の高解像度 VR ヘッドマウント ディスプレイへの接続を簡素化する VirtualLink も付属しています。
パフォーマンスの面では、特に新しい GPU の下位にあることを考慮すると、RTX 4000 は非常に優れたパフォーマンスを示しました。 LuxMark ベンチマークでは、Pascal のほぼ 6000 倍となり、P4000 をも上回りました。 Arion では、RTX 4000 が P6000 の 4000 倍以上となり、再び P4000 を簡単に上回りました。 Solidworks ベンチマークでは、RTX 4000 が P4000 を容易に上回り、Digger および Jet Engine ベンチマークではさらに輝きを放ちました。 ESRi では、RTX 5000 は P6000 (場合によっては P4000) よりもはるかに優れたパフォーマンスを発揮しましたが、ワークロードによっては P6000 の方が優れたパフォーマンスを発揮するものもあります。 RTX XNUMX は Turing アーキテクチャのローエンドにあり、PXNUMX は Pascal アーキテクチャのハイエンドにあることに留意してください。
全体として、Quadro RTX 4000 は、NVIDIA の優れた GPU の大規模な製品ラインへの待望の追加製品であり、わずか 900 ドル程度の価格でありながら、エントリーレベルのカードとしては非常に優れたパフォーマンス数値を提供します。
StorageReview ニュースレターにサインアップする