5000 月の SIGGRAPH で、NVIDIA はまったく新しいグラフィックス アーキテクチャである Turing と新しい Quadro RTX GPU を発表しました。そこで発表されたいくつかの新しい GPU のうち、今日は特に NVIDIA Quadro RTX 5000 GPU を取り上げます。ディープラーニングと高度なシェーディングも使用する初のレイトレーシング GPU として宣伝されています。 RTX XNUMX は、フォトリアリスティックなシーンをリアルタイムでレンダリングできる可能性を備えた次世代のワークロード向けに設計されており、ビデオ編集者や自動車および建築のデザイナーに恩恵をもたらします。
5000 月の SIGGRAPH で、NVIDIA はまったく新しいグラフィックス アーキテクチャである Turing と新しい Quadro RTX GPU を発表しました。そこで発表されたいくつかの新しい GPU のうち、今日は特に NVIDIA Quadro RTX 5000 GPU を取り上げます。ディープラーニングと高度なシェーディングも使用する初のレイトレーシング GPU として宣伝されています。 RTX XNUMX は、フォトリアリスティックなシーンをリアルタイムでレンダリングできる可能性を備えた次世代のワークロード向けに設計されており、ビデオ編集者や自動車および建築のデザイナーに恩恵をもたらします。
GPU の新しい波の原動力は、NVIDIA の新しい Turing アーキテクチャです。同社は GPU のリーダーシップで尊敬されており、これを新しいコア GPU アーキテクチャで構築しました。アーキテクチャの主題は、ここで触れるには少し深すぎるのですが、要約すると、チューリングはいくつかのハードウェアの進歩を利用して、印象的な新しい結果を達成しています。レイ トレーシングの場合、このアーキテクチャは RT コアと呼ばれるプロセッサを活用し、3D 環境で光と音がどのように伝わるかの計算を 10 秒あたり最大 500 ギガ レイで高速化します。ストリーミング マルチプロセッサによりラスター パフォーマンスが向上し、強化されたグラフィックス パイプラインと新しいプログラマブル シェーディング テクノロジが追加されます。 Turing には、16 秒あたり 16 兆回のテンソル演算を提供する新しい Tensor コアが付属しています。また、Turing を使用すると、ユーザーはより多くの CUDA コアを活用して、XNUMX 秒あたり XNUMX 兆の整数演算と並行して最大 XNUMX 兆の浮動小数点演算をサポートできます。
NVIDIA Quadro RTX 5000 は、複雑なプロジェクトに迅速かつ効果的に取り組む必要があるクリエイティブなプロフェッショナル向けに設計されています。 GPU には 3,072 個の CUDA コア、384 個の Tensor コア、48 個の RT コア、および 16GB GDDR6 メモリが搭載されています。この驚異的な量のハードウェアにより、物理的に正確な影、反射、屈折を使用して複雑なモデルやシーンをレンダリングできます。 RTX 5000 は NVIDIA NVLink をサポートしており、ユーザーは複数の GPU 構成でメモリとパフォーマンスを拡張できます。ワークステーションにスペースがあると仮定すると、ユーザーは 5000 つの Quadro RTX 50 GPU を接続して、最大 32 GB/秒の帯域幅と合計 6 GB の GDDRXNUMX メモリを実現できます。 GPU には、次世代の高解像度 VR ヘッドマウント ディスプレイへの接続を提供する VirtualLink も付属しています。
NVIDIA Quadro RTX 5000 の仕様
アーキテクチャ | NVIDIA チューリング |
GPUメモリ | 16GB GDDR6 |
メモリインターフェイス | 256ビット |
メモリ帯域幅 | 最大448GB /秒 |
ECC | Yes |
NVIDIACUDAコア | 3,072 |
NVIDIAテンソルコア | 384 |
NVIDIARTコア | 48 |
単精度のパフォーマンス | 11.2 TFLOPS |
テンソル性能 | 89.2 TFLOPS |
NVIDIA NVリンク | 2 つの Quadro RTX 5000 GPU を接続 |
NVIDIA NVLink 帯域幅 | 50GB/秒(双方向) |
システムインターフェース | PCI Express 3.0×16 |
消費電力 | 総ボード電力: 265W 総グラフィックパワー: 230W サーマルソリューションアクティブ |
フォームファクター | 高さ 4.4 インチ x 長さ 10.5 インチ、デュアルスロット、フルハイト |
ディスプレイコネクタ | 4xDP 1.4、1x USB-C |
最大同時表示数 | 4x 4096×2160 @ 120 Hz 4x 5120×2880 @ 60 Hz 2x 7680×4320 @ 60 Hz |
エンコード/デコード エンジン | 1X エンコード、2X デコード |
VRレディ | Yes |
グラフィックス API | DirectXの12.0 シェイダーモデル5.1 OpenGL 4.5 Vulkan 1.0 コンピューティングAPI CUDA ダイレクトコンピューティング オープンCL |
性能
NVIDIA Quadro RTX 5000 GPU の新しいアーキテクチャのパフォーマンスをテストするために、Windows 920 を実行している Lenovo ThinkSystem P10 ワークステーションにインストールしました。各カードのパフォーマンスを包括的に確認するために、複数の業界ベンチマークと GPU アクセラレーションを活用しました。テスト対象のカードを最大限に活用できるソフトウェア。 Turning アーキテクチャを共有する NVIDIA Quadro RTX 4000 と比較するだけでなく、以前の Pascal Quadro シリーズとの比較も行います。 P6000 P5000、 そしてその P4000。これは、どちらが優れているかということよりも、選択した GPU で何を期待できるかということです。
これらの GPU がさまざまなアーキテクチャからどのように拡張されてきたかをよりよく理解するために、現在の RTX ファミリを要約した次の表を含めました。 RTX 5000 は、エントリー RTX 4000 から 6000 つ上の、より強力な 8000 つの兄弟である RTX XNUMX および RTX XNUMX の下にある、中間のスロットに位置します。
NVIDIA Quadro GPU | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPUメモリ | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
メモリインターフェイス | 256ビット | 256ビット | 384ビット | 384ビット |
メモリ帯域幅 | 最大416GB/秒 | 最大448GB/秒 | 最大672GB/秒 | 最大672GB/秒 |
NVIDIACUDAコア | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIAテンソルコア | 288 | 384 | 576 | 576 |
NVIDIARTコア | 36 | 48 | 72 | 72 |
単精度のパフォーマンス | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
テンソル性能 | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
最初のベンチマークは、LuxMark クロスプラットフォーム OpenCL ベンチマーク ツールです。 LuxMark は LuxCore API に基づいており、LuxCoreRender スイートのプロモーション コンポーネントとして提供されます。新しいマイクロカーネル ベースの OpenCL パス トレーサーをベンチマークのレンダリングとして使用し、特定のワークステーションにインストールされている GPU に負荷をかける独自の方法を提供します。
ラックスマーク | |
---|---|
GPU | 結果 |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Pascal GPU は LuxMark で良好な結果を得ましたが、Turning GPU を見ると明らかにパフォーマンスが向上しています。当然のことながら RTX 5000 が 29,404 のスコアでトップパフォーマンスでした。
次は、RandomControl によって開発された CUDA ベンチマーク ツールである Arion です。これを使用すると、ワークステーションがレンダリング アプリケーションで CPU または GPU に負荷をかけることができます。 ArionBench は、Arion 2 テクノロジーに基づくソフトウェア ツールで、3D シーンでの光の流れをシミュレートするタスクを通じて CPU/GPU に大きな負荷をかけます。
アリオン | |
---|---|
GPU | 結果 |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
RTX 5000 が他を大きくリードし、P6000 よりも大幅に速くなり、Pascal から Turing へとスコアがさらに大幅に上昇しました。
次のベンチマークでは、SolidWorks 2019 と、アウディ R3、建設掘削機、ジェット エンジン、ラリーカーをカバーする 8 つの 3D モデルを利用します。 Solidworks は、Windows ベースのシステム上で動作する、業界をリードする GPU アクセラレーションの 165,000D CAD モデリング アプリケーションです。 SolidWorks はダッソー システムズによって開発され、世界中で 2019 万人以上のエンジニアと 4.5 社以上の企業によって使用されています。ベンチマークの目的で、SolidWorks XNUMX 内の新しい「パフォーマンス パイプライン」機能を活用します。このアーキテクチャは、特に大規模なモデルに対して、より応答性の高いリアルタイム表示を提供します。最新の OpenGL (XNUMX) とハードウェア アクセラレーションによるレンダリングを利用して、大きなモデルをパン、ズーム、回転するときに高レベルの詳細とフレーム レートを維持します。
各モデルがレンダリングされた後、スクリプトは各モデルを 5 回回転し、このタスクを完了するのに必要な時間を測定します。次に、それをレンダリングされたフレーム数で割って、セクションあたりの平均フレーム数 (FPS) スコアを計算します。
SolidWorksの | |
---|---|
ソリッドワークス R8 | 平均FPS |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
ソリッドワークスディガー | 平均FPS |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
ソリッドワークス ジェット エンジン | 平均FPS |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
ソリッドワークス ラリーカー | 平均FPS |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Solidworks R8 および Rally Car の Turing GPU のパフォーマンスが Pascal と比較してわずかに低下しているのは興味深いことですが、これらのファイルは新しい GPU を十分に活用していない可能性があります。 RTX 5000 は、Digger と Jet Engine で優れたパフォーマンスを提供し、他のエンジンを大きく上回りました。 Solidworks ではベータ表示モードを使用していましたが、これが Audi R8 および RallyCar アセンブリで見られる異常なスケーリングの原因である可能性があります。
次に、Environment Systems Research Institute (Esri) のベンチマークです。 Esri は、地理情報システム (GIS) ソフトウェアのサプライヤーです。 Esri のパフォーマンス チームは、ArcGIS Pro を自動的に起動する PerfTool アドイン スクリプトを設計しました。このアプリケーションは、「ZoomToBookmarks」機能を使用して、さまざまな事前定義されたブックマークを参照し、ユーザー エクスペリエンスを予測するために必要なすべての主要なデータ ポイントを含むログ ファイルを作成します。スクリプトは、キャッシュ (メモリおよびディスク キャッシュ) を考慮して、ブックマークを自動的に 2.3 回ループします。言い換えれば、このベンチマークは、Esri の ArcGIS Pro XNUMX ソフトウェアを通じて見られるような大量のグラフィックの使用をシミュレートします。
テストは 3 つの主要なデータセットで構成されます。 3 つはペンシルベニア州フィラデルフィアとケニア州モントリオールの 2D 都市ビューです。これらの都市ビューには、地形モデル上にドレープされたテクスチャ付きの XNUMXD マルチパッチの建物と、ドレープされた航空画像が含まれています。 XNUMX 番目のデータセットは、オレゴン州ポートランド地域の XNUMXD マップ ビューです。このデータには、道路、土地利用区画、公園や学校、川、湖、陰影のある地形に関する詳細情報が含まれています。
モントリオール モデルの描画時間を確認すると、NVIDIA Quadro RTX 5000 の平均描画時間は 00:01:31.067 で、平均 FPS と最小 FPS はそれぞれ 527.636 と 190.775 でした。
ESRI ArcGIS Pro 2.3 モントリオール | |
---|---|
ドロータイム | 平均 |
クアドロP4000 | 00:01:31.084 |
クアドロP5000 | 00:01:31:082 |
クアドロP6000 | 00:01:31.081 |
クアドロ RTX 4000 | 00:01:31.284 |
クアドロ RTX 5000 | 00:01:31.067 |
平均FPS | 平均 |
クアドロP4000 | 432.327 |
クアドロP5000 | 489.889 |
クアドロP6000 | 521.551 |
クアドロ RTX 4000 | 502.395 |
クアドロ RTX 5000 | 527.636 |
最小 FPS | 平均 |
クアドロP4000 | 164.546 |
クアドロP5000 | 194.218 |
クアドロP6000 | 190.336 |
クアドロ RTX 4000 | 180.699 |
クアドロ RTX 5000 | 190.775 |
次はフィラデルフィア モデルです。RTX 5000 の平均描画時間は 00:01:01.111 で、平均 FPS と最小 FPS はそれぞれ 531.315 と 224.341 でした。
ESRI ArcGIS Pro 2.3 フィラデルフィア | |
---|---|
ドロータイム | 平均 |
クアドロP4000 | 00:02:53.928 |
クアドロP5000 | 00:01:01.109 |
クアドロP6000 | 00:01:01.245 |
クアドロ RTX 4000 | 00:01:00.231 |
クアドロ RTX 5000 | 00:01:01.111 |
平均FPS | 平均 |
クアドロP4000 | 304.340 |
クアドロP5000 | 451.826 |
クアドロP6000 | 469.879 |
クアドロ RTX 4000 | 434.170 |
クアドロ RTX 5000 | 531.315 |
最小 FPS | 平均 |
クアドロP4000 | 160.152 |
クアドロP5000 | 212.910 |
クアドロP6000 | 207.879 |
クアドロ RTX 4000 | 196.825 |
クアドロ RTX 5000 | 224.341 |
最後のモデルはポートランドです。ここで、RTX 5000 の平均描画時間は 00:00:32.541 でした。平均 FPS は 2,783.547 を示し、最小 FPS は 1,007.309 を示しました。
ESRI ArcGIS Pro 2.3 ポートランド | |
---|---|
ドロータイム | 平均 |
クアドロP4000 | 00:00:32.426 |
クアドロP5000 | 00:00:32.310 |
クアドロP6000 | 00:00:32.552 |
クアドロ RTX 4000 | 00:00:32.646 |
クアドロ RTX 5000 | 00:00:32.541 |
平均FPS | 平均 |
クアドロP4000 | 2,051.053 |
クアドロP5000 | 2,057.395 |
クアドロP6000 | 2,343.948 |
クアドロ RTX 4000 | 2,821.928 |
クアドロ RTX 5000 | 2,783.547 |
最小 FPS | 平均 |
クアドロP4000 | 1,179.974 |
クアドロP5000 | 1,189.524 |
クアドロP6000 | 1,282.045 |
クアドロ RTX 4000 | 1,083.260 |
クアドロ RTX 5000 | 1,007.309 |
まとめ
NVIDIA Quadro RTX 5000 は、Turing アーキテクチャに基づいた同社の新しい GPU の 5000 つです。 NVIDIA は将来の開発を見据えて現状を変えようとしているため、Turing は GPU アーキテクチャに対する全く新しいものになる予定です。 RTX 3,072 は、効率的かつ素早い作業が必要な複雑なプロジェクトに取り組むクリエイティブなプロフェッショナルを対象としており、384 個の CUDA コア、48 個の Tensor コア、16 個の RT コア、6GB GDDRXNUMX メモリなどの優れたハードウェアを内部に搭載しています。さらに多くの GPU パフォーマンスが必要な場合は、RTX を NVIDIA NVLink 経由で XNUMX 番目の GPU で拡張できます。
優れたパフォーマンスを実現する必要があるすべてのコンポーネントについて、新旧を問わず数多くのテストを実施して、何ができるかを確認しました。誰もが驚くことではありませんが、NVIDIA Quadro RTX 5000 がほとんどのテストで最高のパフォーマンスを示しました。 LuxMark と Arion では、RTX 5000 は P5000 のスコアを 5000 倍以上上回りました。 RTX 5000 は、Solidworks Digger および Jet Engine ベンチマークで優れたパフォーマンスを示しました。 RTX XNUMX は強力ですが、Turing GPU の最上位ではないことに留意する必要があります。
クリエイティブなプロフェッショナルがほとんどの分野でパフォーマンスの大幅な向上を求めている場合、NVIDIA Quadro RTX 5000 がこの要件に適合します。上記のパフォーマンス結果は、RTX 5000 が優れている領域と、Pascal ベースの GPU が十分に優れたパフォーマンスを発揮するいくつかの領域を強調しています。全体として、NVIDIA は RTX ファミリによって、デスクトップ内でクリエイティブが利用できるものの限界を押し広げるという素晴らしい仕事を続けてきました。一方、RTX 5000 はミッドレンジ製品を十分に満たしており、パフォーマンスと価格のバランスが取れています。
StorageReview ニュースレターにサインアップする