Home 消費財クライアントアクセサリ NVIDIA Quadro RTX 5000 レビュー

NVIDIA Quadro RTX 5000 レビュー

by アダムアームストロング

5000 月の SIGGRAPH で、NVIDIA はまったく新しいグラフィックス アーキテクチャである Turing と新しい Quadro RTX GPU を発表しました。そこで発表されたいくつかの新しい GPU のうち、今日は特に NVIDIA Quadro RTX 5000 GPU を取り上げます。ディープラーニングと高度なシェーディングも使用する初のレイトレーシング GPU として宣伝されています。 RTX XNUMX は、フォトリアリスティックなシーンをリアルタイムでレンダリングできる可能性を備えた次世代のワークロード向けに設計されており、ビデオ編集者や自動車および建築のデザイナーに恩恵をもたらします。


5000 月の SIGGRAPH で、NVIDIA はまったく新しいグラフィックス アーキテクチャである Turing と新しい Quadro RTX GPU を発表しました。そこで発表されたいくつかの新しい GPU のうち、今日は特に NVIDIA Quadro RTX 5000 GPU を取り上げます。ディープラーニングと高度なシェーディングも使用する初のレイトレーシング GPU として宣伝されています。 RTX XNUMX は、フォトリアリスティックなシーンをリアルタイムでレンダリングできる可能性を備えた次世代のワークロード向けに設計されており、ビデオ編集者や自動車および建築のデザイナーに恩恵をもたらします。

GPU の新しい波の原動力は、NVIDIA の新しい Turing アーキテクチャです。同社は GPU のリーダーシップで尊敬されており、これを新しいコア GPU アーキテクチャで構築しました。アーキテクチャの主題は、ここで触れるには少し深すぎるのですが、要約すると、チューリングはいくつかのハードウェアの進歩を利用して、印象的な新しい結果を達成しています。レイ トレーシングの場合、このアーキテクチャは RT コアと呼ばれるプロセッサを活用し、3D 環境で光と音がどのように伝わるかの計算を 10 秒あたり最大 500 ギガ レイで高速化します。ストリーミング マルチプロセッサによりラスター パフォーマンスが向上し、強化されたグラフィックス パイプラインと新しいプログラマブル シェーディング テクノロジが追加されます。 Turing には、16 秒あたり 16 兆回のテンソル演算を提供する新しい Tensor コアが付属しています。また、Turing を使用すると、ユーザーはより多くの CUDA コアを活用して、XNUMX 秒あたり XNUMX 兆の整数演算と並行して最大 XNUMX 兆の浮動小数点演算をサポートできます。

NVIDIA Quadro RTX 5000 は、複雑なプロジェクトに迅速かつ効果的に取り組む必要があるクリエイティブなプロフェッショナル向けに設計されています。 GPU には 3,072 個の CUDA コア、384 個の Tensor コア、48 個の RT コア、および 16GB GDDR6 メモリが搭載されています。この驚異的な量のハードウェアにより、物理的に正確な影、反射、屈折を使用して複雑なモデルやシーンをレンダリングできます。 RTX 5000 は NVIDIA NVLink をサポートしており、ユーザーは複数の GPU 構成でメモリとパフォーマンスを拡張できます。ワークステーションにスペースがあると仮定すると、ユーザーは 5000 つの Quadro RTX 50 GPU を接続して、最大 32 GB/秒の帯域幅と合計 6 GB の GDDRXNUMX メモリを実現できます。 GPU には、次世代の高解像度 VR ヘッドマウント ディスプレイへの接続を提供する VirtualLink も付属しています。

NVIDIA Quadro RTX 5000 の仕様

アーキテクチャ NVIDIA チューリング
GPUメモリ 16GB GDDR6
メモリインターフェイス 256ビット
メモリ帯域幅 最大448GB /秒
ECC Yes
NVIDIACUDAコア 3,072
NVIDIAテンソルコア 384
NVIDIARTコア 48
単精度のパフォーマンス 11.2 TFLOPS
テンソル性能 89.2 TFLOPS
NVIDIA NVリンク 2 つの Quadro RTX 5000 GPU を接続
NVIDIA NVLink 帯域幅 50GB/秒(双方向)
システムインターフェース PCI Express 3.0×16
消費電力 総ボード電力: 265W
総グラフィックパワー: 230W
サーマルソリューションアクティブ
フォームファクター 高さ 4.4 インチ x 長さ 10.5 インチ、デュアルスロット、フルハイト
ディスプレイコネクタ 4xDP 1.4、1x USB-C
最大同時表示数 4x 4096×2160 @ 120 Hz
4x 5120×2880 @ 60 Hz
2x 7680×4320 @ 60 Hz
エンコード/デコード エンジン 1X エンコード、2X デコード
VRレディ Yes
グラフィックス API DirectXの12.0
シェイダーモデル5.1
OpenGL 4.5
Vulkan 1.0
コンピューティングAPI
CUDA
ダイレクトコンピューティング
オープンCL

性能

NVIDIA Quadro RTX 5000 GPU の新しいアーキテクチャのパフォーマンスをテストするために、Windows 920 を実行している Lenovo ThinkSystem P10 ワークステーションにインストールしました。各カードのパフォーマンスを包括的に確認するために、複数の業界ベンチマークと GPU アクセラレーションを活用しました。テスト対象のカードを最大限に活用できるソフトウェア。 Turning アーキテクチャを共有する NVIDIA Quadro RTX 4000 と比較するだけでなく、以前の Pascal Quadro シリーズとの比較も行います。 P6000  P5000、 そしてその P4000。これは、どちらが優れているかということよりも、選択した GPU で何を期待できるかということです。

これらの GPU がさまざまなアーキテクチャからどのように拡張されてきたかをよりよく理解するために、現在の RTX ファミリを要約した次の表を含めました。 RTX 5000 は、エントリー RTX 4000 から 6000 つ上の、より強力な 8000 つの兄弟である RTX XNUMX および RTX XNUMX の下にある、中間のスロットに位置します。

NVIDIA Quadro GPU
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPUメモリ 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
メモリインターフェイス 256ビット 256ビット 384ビット 384ビット
メモリ帯域幅 最大416GB/秒 最大448GB/秒 最大672GB/秒 最大672GB/秒
NVIDIACUDAコア 2,304 3,072 4,608 4,608
NVIDIAテンソルコア 288 384  576 576
NVIDIARTコア 36 48 72 72
単精度のパフォーマンス 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
テンソル性能 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

最初のベンチマークは、LuxMark クロスプラットフォーム OpenCL ベンチマーク ツールです。 LuxMark は LuxCore API に基づいており、LuxCoreRender スイートのプロモーション コンポーネントとして提供されます。新しいマイクロカーネル ベースの OpenCL パス トレーサーをベンチマークのレンダリングとして使用し、特定のワークステーションにインストールされている GPU に負荷をかける独自の方法を提供します。

ラックスマーク
GPU 結果
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Pascal GPU は LuxMark で良好な結果を得ましたが、Turning GPU を見ると明らかにパフォーマンスが向上しています。当然のことながら RTX 5000 が 29,404 のスコアでトップパフォーマンスでした。

次は、RandomControl によって開発された CUDA ベンチマーク ツールである Arion です。これを使用すると、ワークステーションがレンダリング アプリケーションで CPU または GPU に負荷をかけることができます。 ArionBench は、Arion 2 テクノロジーに基づくソフトウェア ツールで、3D シーンでの光の流れをシミュレートするタスクを通じて CPU/GPU に大きな負荷をかけます。

アリオン
GPU 結果
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

RTX 5000 が他を大きくリードし、P6000 よりも大幅に速くなり、Pascal から Turing へとスコアがさらに大幅に上昇しました。

次のベンチマークでは、SolidWorks 2019 と、アウディ R3、建設掘削機、ジェット エンジン、ラリーカーをカバーする 8 つの 3D モデルを利用します。 Solidworks は、Windows ベースのシステム上で動作する、業界をリードする GPU アクセラレーションの 165,000D CAD モデリング アプリケーションです。 SolidWorks はダッソー システムズによって開発され、世界中で 2019 万人以上のエンジニアと 4.5 社以上の企業によって使用されています。ベンチマークの目的で、SolidWorks XNUMX 内の新しい「パフォーマンス パイプライン」機能を活用します。このアーキテクチャは、特に大規模なモデルに対して、より応答性の高いリアルタイム表示を提供します。最新の OpenGL (XNUMX) とハードウェア アクセラレーションによるレンダリングを利用して、大きなモデルをパン、ズーム、回転するときに高レベルの詳細とフレーム レートを維持します。

各モデルがレンダリングされた後、スクリプトは各モデルを 5 回回転し、このタスクを完了するのに必要な時間を測定します。次に、それをレンダリングされたフレーム数で割って、セクションあたりの平均フレーム数 (FPS) スコアを計算します。

SolidWorksの
ソリッドワークス R8 平均FPS
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
ソリッドワークスディガー 平均FPS
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
ソリッドワークス ジェット エンジン 平均FPS
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
ソリッドワークス ラリーカー 平均FPS
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Solidworks R8 および Rally Car の Turing GPU のパフォーマンスが Pascal と比較してわずかに低下しているのは興味深いことですが、これらのファイルは新しい GPU を十分に活用していない可能性があります。 RTX 5000 は、Digger と Jet Engine で優れたパフォーマンスを提供し、他のエンジンを大きく上回りました。 Solidworks ではベータ表示モードを使用していましたが、これが Audi R8 および RallyCar アセンブリで見られる異常なスケーリングの原因である可能性があります。

次に、Environment Systems Research Institute (Esri) のベンチマークです。 Esri は、地理情報システム (GIS) ソフトウェアのサプライヤーです。 Esri のパフォーマンス チームは、ArcGIS Pro を自動的に起動する PerfTool アドイン スクリプトを設計しました。このアプリケーションは、「ZoomToBookmarks」機能を使用して、さまざまな事前定義されたブックマークを参照し、ユーザー エクスペリエンスを予測するために必要なすべての主要なデータ ポイントを含むログ ファイルを作成します。スクリプトは、キャッシュ (メモリおよびディスク キャッシュ) を考慮して、ブックマークを自動的に 2.3 回ループします。言い換えれば、このベンチマークは、Esri の ArcGIS Pro XNUMX ソフトウェアを通じて見られるような大量のグラフィックの使用をシミュレートします。

テストは 3 つの主要なデータセットで構成されます。 3 つはペンシルベニア州フィラデルフィアとケニア州モントリオールの 2D 都市ビューです。これらの都市ビューには、地形モデル上にドレープされたテクスチャ付きの XNUMXD マルチパッチの建物と、ドレープされた航空画像が含まれています。 XNUMX 番目のデータセットは、オレゴン州ポートランド地域の XNUMXD マップ ビューです。このデータには、道路、土地利用区画、公園や学校、川、湖、陰影のある地形に関する詳細情報が含まれています。

モントリオール モデルの描画時間を確認すると、NVIDIA Quadro RTX 5000 の平均描画時間は 00:01:31.067 で、平均 FPS と最小 FPS はそれぞれ 527.636 と 190.775 でした。

ESRI ArcGIS Pro 2.3 モントリオール
ドロータイム 平均
クアドロP4000 00:01:31.084
クアドロP5000 00:01:31:082
クアドロP6000 00:01:31.081
クアドロ RTX 4000 00:01:31.284
クアドロ RTX 5000 00:01:31.067
平均FPS 平均
クアドロP4000 432.327
クアドロP5000 489.889
クアドロP6000 521.551
クアドロ RTX 4000 502.395
クアドロ RTX 5000 527.636
最小 FPS 平均
クアドロP4000 164.546
クアドロP5000 194.218
クアドロP6000 190.336
クアドロ RTX 4000 180.699
クアドロ RTX 5000 190.775

次はフィラデルフィア モデルです。RTX 5000 の平均描画時間は 00:01:01.111 で、平均 FPS と最小 FPS はそれぞれ 531.315 と 224.341 でした。

ESRI ArcGIS Pro 2.3 フィラデルフィア
ドロータイム 平均
クアドロP4000 00:02:53.928
クアドロP5000 00:01:01.109
クアドロP6000 00:01:01.245
クアドロ RTX 4000 00:01:00.231
クアドロ RTX 5000 00:01:01.111
平均FPS 平均
クアドロP4000 304.340
クアドロP5000 451.826
クアドロP6000 469.879
クアドロ RTX 4000 434.170
クアドロ RTX 5000 531.315
最小 FPS 平均
クアドロP4000 160.152
クアドロP5000 212.910
クアドロP6000 207.879
クアドロ RTX 4000 196.825
クアドロ RTX 5000 224.341

最後のモデルはポートランドです。ここで、RTX 5000 の平均描画時間は 00:00:32.541 でした。平均 FPS は 2,783.547 を示し、最小 FPS は 1,007.309 を示しました。

ESRI ArcGIS Pro 2.3 ポートランド
ドロータイム 平均
クアドロP4000 00:00:32.426
クアドロP5000 00:00:32.310
クアドロP6000 00:00:32.552
クアドロ RTX 4000 00:00:32.646
クアドロ RTX 5000 00:00:32.541
平均FPS 平均
クアドロP4000 2,051.053
クアドロP5000 2,057.395
クアドロP6000 2,343.948
クアドロ RTX 4000 2,821.928
クアドロ RTX 5000 2,783.547
最小 FPS 平均
クアドロP4000 1,179.974
クアドロP5000 1,189.524
クアドロP6000 1,282.045
クアドロ RTX 4000 1,083.260
クアドロ RTX 5000 1,007.309

まとめ

NVIDIA Quadro RTX 5000 は、Turing アーキテクチャに基づいた同社の新しい GPU の 5000 つです。 NVIDIA は将来の開発を見据えて現状を変えようとしているため、Turing は GPU アーキテクチャに対する全く新しいものになる予定です。 RTX 3,072 は、効率的かつ素早い作業が必要な複雑なプロジェクトに取り組むクリエイティブなプロフェッショナルを対象としており、384 個の CUDA コア、48 個の Tensor コア、16 個の RT コア、6GB GDDRXNUMX メモリなどの優れたハードウェアを内部に搭載しています。さらに多くの GPU パフォーマンスが必要な場合は、RTX を NVIDIA NVLink 経由で XNUMX 番目の GPU で拡張できます。

優れたパフォーマンスを実現する必要があるすべてのコンポーネントについて、新旧を問わず数多くのテストを実施して、何ができるかを確認しました。誰もが驚くことではありませんが、NVIDIA Quadro RTX 5000 がほとんどのテストで最高のパフォーマンスを示しました。 LuxMark と Arion では、RTX 5000 は P5000 のスコアを 5000 倍以上上回りました。 RTX 5000 は、Solidworks Digger および Jet Engine ベンチマークで優れたパフォーマンスを示しました。 RTX XNUMX は強力ですが、Turing GPU の最上位ではないことに留意する必要があります。

クリエイティブなプロフェッショナルがほとんどの分野でパフォーマンスの大幅な向上を求めている場合、NVIDIA Quadro RTX 5000 がこの要件に適合します。上記のパフォーマンス結果は、RTX 5000 が優れている領域と、Pascal ベースの GPU が十分に優れたパフォーマンスを発揮するいくつかの領域を強調しています。全体として、NVIDIA は RTX ファミリによって、デスクトップ内でクリエイティブが利用できるものの限界を押し広げるという素晴らしい仕事を続けてきました。一方、RTX 5000 はミッドレンジ製品を十分に満たしており、パフォーマンスと価格のバランスが取れています。

NVIDIA RTX 5000 を Amazon で販売

このレビューについて話し合う

StorageReview ニュースレターにサインアップする