NVIDIA RTX A4000 は、リアルタイム レイ トレーシング、AI 高速化コンピューティング、高性能グラフィックスなどの高性能を必要とするデスクトップ ワークステーション向けの、同社の最新デスクトップ プロフェッショナル GPU ラインナップの一部です。 NVIDIA は、第 4000 世代 RTX アーキテクチャを活用し、AXNUMX はプロフェッショナル向けの市場で入手可能な最も強力なシングルスロット GPU であると主張しています。
NVIDIA RTX A4000 は、リアルタイム レイ トレーシング、AI 高速化コンピューティング、高性能グラフィックスなどの高性能を必要とするデスクトップ ワークステーション向けの、同社の最新デスクトップ プロフェッショナル GPU ラインナップの一部です。 NVIDIA は、第 4000 世代 RTX アーキテクチャを活用し、AXNUMX はプロフェッショナル向けの市場で入手可能な最も強力なシングルスロット GPU であると主張しています。
A4000 は RTX A5000 のすぐ後ろにあり、 RTX-A6000 48 RT コア (2nd gen)、192 個の第 6,144 世代 Tensor コア、および 16 個の CUDA コアと 4000 GB のグラフィックス メモリを備えています。 NVIDIA は、プロフェッショナル ラインを区別するために Quadro の名前をやめましたが、RTX AXNUMX は、Quadro ラインで知られていたものと同じプロフェッショナル機能、ハードウェアおよびソフトウェア認定、認定ドライバーを引き続き備えています。
接続性については、高さ 4.4 インチ x 長さ 9.5 インチの A4000 には、1.4 つの DisplayPort 1a ポートと、通常の 6x XNUMX ピン PCIe 電源ポートが搭載されています。換気は各 DisplayPort の上部とカードの前面に沿って行われ、反対側には小型のファンが配置されています。
NVIDIA RTX A4000 と Quadro RTX 4000 の比較
NVIDIA は RTX A4000 をその後継機として検討しています。 クアドロ RTX 4000、このレビューの時点で数年前の古いカードです。 2019 年のレビューでは、RTX 4000 はエントリーレベルのカードとしては非常に印象的なパフォーマンスを示しており、発売時の価格がおよそ 900 ドルであったにもかかわらず、同社の印象的なポートフォリオに素晴らしい追加となりました。とはいえ、NVIDIA が最近 GPU アーキテクチャで行った進歩により、私たちは彼らがワークステーション クラスのカードに何を用意しているのかを常に楽しみにしています。
A4000 では、Quadro カードの GPU メモリが 16 倍の 448 GB になり、CUDA コア数がほぼ 4000 倍になっていることがすぐにわかります。これにメモリ帯域幅のわずかな増加 (3070GB/秒) を組み合わせることで、新しい AXNUMX はすでに大幅に改善されています。これらの仕様により、NVIDIA の高性能デスクトップ コンシューマ カードである RTX XNUMX とより一致します。
NVIDIAアンペア
で述べたように RTX A6000 レビュー、同社の次世代プロフェッショナル グラフィックス カードへの最も重要なアップグレードは、 NVIDIAアンペア。ここに、パフォーマンスの真の飛躍があります。 8 億個のトランジスタを備えた Samsung の 28nm NVIDIA カスタム プロセスを活用したこの新しいアーキテクチャのハイライト。また、改良されたストリーミング マルチプロセッサー、第 XNUMX 世代レイ トレーシング コア (レイ トレーシング ハードウェア アクセラレーションを向上させる)、および第 XNUMX 世代 Tensor コアも備えています。後者は AI 推論パフォーマンスと DLSS を向上させ、結果として高解像度でのパフォーマンスが向上します。
また、Ampere アーキテクチャでは、前世代モデルと比較して、CUDA コアが単精度浮動小数点で最大 3 倍増加しています。これは、XNUMXD モデル開発やコンピュータ支援エンジニアリングのデスクトップ シミュレーションなどのタスクの分野で顕著なパフォーマンスの向上を意味します。
3 年間の保証が付いた NVIDIA RTX A4000 の価格は、ブランドによって異なりますが、約 2,000 ドルです。
NVIDIA RTX A4000の仕様
GPU メモリ | 16 GB GDDR6 |
メモリインターフェース | 256ビット |
メモリ帯域幅 | 448 GB / sの |
エラー訂正コード(ECC) | Yes |
NVIDIA Ampere アーキテクチャベースの CUDA コア | 6,144 |
NVIDIA 第 3 世代 Tensor コア | 192 |
NVIDIA 第 2 世代 RT コア | 48 |
単精度のパフォーマンス | 19.2 TFLOPS3 |
RTコアのパフォーマンス | 37.4TFLOPS3 |
テンソルのパフォーマンス | 153.4TFLOPS4 |
システムインターフェース | PCI Express 4.0 x16 |
消費電力 | ボード合計電力: 140 W |
サーマルソリューション | 従軍中 |
フォームファクター | 高さ4.4インチ x 長さ9.5インチ、
シングルスロット |
ディスプレイコネクタ | 4x DisplayPort 1.4a |
最大同時表示数 | 4x 4096 x 2160 @ 120 Hz、
4x 5120 x 2880 @ 60 Hz、 2x 7680 x 4320 @ 60 Hz |
電源コネクタ | 1x 6 ピン PCIe |
エンコード/デコード エンジン | 1x エンコード、1x デコード (+AV1 デコード) |
VR対応 | Yes |
グラフィックス API | DirectX 12.075、シェーダーモデル 5.175、
OpenGL 4.686、Vulkan 1.26 |
コンピューティングAPI | CUDA、ダイレクトコンピューティング、OpenCL™ |
Nvidia RTX A4000 性能
そのパフォーマンスを評価するために、RTX A4000 にリソースを大量に使用する一連のテストを実施し、上位クラスの RTX A6000 と比較して、第 4000 世代 RTX アーキテクチャのスペクトルの両端の違いを示しました。 A6000 と AXNUMX の両方を内部に設置しました。 Lenovo ThinkStation P620 と HP Zセントラル 4R テスト用。
HP ZCentral 4R:
- Intel Xeon 2295 (3.0 GHz の基本周波数、Intel vPro テクノロジーで最大 4.6 GHz)
- 64GB DDR4-2933 ECC SDRAM
- 1TB M.2 SSD
レノボ ThinkStation P620:
- AMD Ryzen Threadripper Pro 3995WX プロセッサー (2.70 GHz、最大ブースト 4.20 GHz、64 コア、128 スレッド、32 MB キャッシュ)
- DDR64 RAMの4GB
- 1TB PM981 SSD
SPECviewperf 2020
まず、SPECviewperf 2020 ベンチマークです。これは、OpenGL および Direct X アプリケーション プログラミング インターフェイスで実行されるプロフェッショナル アプリケーションのグラフィックス パフォーマンスを測定するための世界標準です。ビューセット (またはベンチマーク) は、アプリケーション自体をインストールすることなく、実際のアプリケーションのグラフィックス コンテンツと動作を表します。これらのビューセットには、3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX、Solidworks が含まれます。
ビューセット | NVIDIA RTX 4000 レノボ ThinkStation P620 |
Nvidia RTX A4000 HP Zセントラル 4R |
Nvidia RTX A6000 Lenovo ThinkStation P620 | NVIDIA RTX A6000 HP Zセントラル 4R |
3dsmax-07 | 90.29 | 90.8 | 131.96 | 127.89 |
カティア-06 | 67.54 | 58.75 | 90.99 | 75.32 |
クレオ-03 | 103.84 | 90.65 | 125.88 | 99.54 |
エネルギー-03 | 21.97 | 22.16 | 42.22 | 38.83 |
マヤ-06 | 224.81 | 215.15 | 314.82 | 273.01 |
医療-03 | 22.55 | 21.53 | 34.87 | 30.58 |
SNX-04 | 322.7 | 328.37 | 450.72 | 422.01 |
SW-05 | 107.06 | 108.76 | 161.4 | 152.19 |
このベンチマークでは、RTX A4000 は、新しい Ampere アーキテクチャにより、Lenovo システムと HP システム (非常に似た結果を示した) の両方で優れたパフォーマンスを示しました。残りのベンチマークでも同じ傾向が見られるでしょう。
上位モデル (A6000) とのパフォーマンスの差は場合によっては大きくなりますが、A4000 は最も集中的な使用ケースに対して十分なパフォーマンスを提供します。
次に、ワークステーションのパフォーマンスのすべての重要な側面をテストするために設計されたベンチマークに特化したテストである SPECworkstation3 を実行しました。 30 を超えるワークロードを使用して、CPU、グラフィックス、I/O、メモリ帯域幅をテストします。ワークロードは、メディアとエンターテイメント、金融サービス、製品開発、エネルギー、ライフ サイエンス、一般業務などの幅広いカテゴリに分類されます。個々のワークロードではなく、それぞれの広範なカテゴリの結果をリストします。結果は、各カテゴリのすべての個別のワークロードの平均です。
SPECワークステーション3
カテゴリー | NVIDIA RTX A4000 レノボ ThinkStation P620 | NVIDIA RTX A4000 HP Zセントラル 4R |
NVIDIA RTX A6000 レノボ ThinkStation P620 | NVIDIA RTX A6000 HP ZCentral 4R |
M&E | 5.87 | 3.37 | 6.04 | 3.49 |
製品開発 | 5.01 | 3.35 | 5.49 | 3.63 |
生命科学 | 3.99 | 3.51 | 4.61 | 3.76 |
エネルギー | 4.68 | 2.58 | 5.58 | 2.79 |
FSI | 9.46 | 3.96 | 9.49 | 3.38 |
一般作戦 | 2.2 | 1.59 | 2.14 | 1.63 |
GPU計算 | 5.25 | 5.19 | 7.44 | 7.22 |
全体として、P4000 内にインストールされた A620 の方が優れたパフォーマンスを示し、場合によっては A6000 と比較して同等またはそれ以上の結果が得られることもありました (特に一般業務および金融サービス カテゴリ)。 HP ZCentral ワークステーション内に実装した場合、A4000 は、GPU コンピューティング カテゴリを除き、著しく低い数値を示しました。
環境システム研究所 (Esri)
次に、Environment Systems Research Institute (Esri) のベンチマークです。 Esri は地理情報システム (GIS) ソフトウェアのサプライヤーですが、同社のパフォーマンス チームは、ArcGIS Pro を自動的に起動する PerfTool アドイン スクリプトを設計しました。
このアプリケーションは、「ZoomToBookmarks」機能を使用して、さまざまな定義済みブックマークを参照し、ユーザー エクスペリエンスを予測するために必要なすべての主要なデータ ポイントを含むログ ファイルを作成します。スクリプトは、キャッシュ (メモリおよびディスク キャッシュ) を考慮して、ブックマークを自動的に 3 回ループします。言い換えれば、このベンチマークは、Esri の ArcGIS Pro ソフトウェアを通じて見られるような大量のグラフィックの使用をシミュレートします。
テストは 3 つの主要なデータセットで構成されます。 3 つは、ペンシルベニア州フィラデルフィアとケネディ州モントリオールの 2D 都市ビューです。これらの都市ビューには、地形モデル上にドレープされたテクスチャ付きの XNUMXD マルチパッチの建物と、ドレープされた航空画像が含まれています。 XNUMX 番目のデータセットは、オレゴン州ポートランド地域の XNUMXD マップ ビューです。このデータには、道路、土地利用区画、公園や学校、川、湖、丘陵の日陰の地形に関する詳細情報が含まれています。
まずはモントリオールです。ここで、RTX A4000 は、P471.31 内で平均 FPS 194.66、最小 FPS 620 を達成しました。 HP ZCentral 4R 構成では、平均 FPS が 349.32、最小 FPS が 167.86 でした。
ESRI ArcGIS Pro 2.3 モントリオール | |
平均FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 471.31 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 349.32 |
Nvidia RTX A6000 | 614.03 |
最小 FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 194.66 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 167.86 |
Nvidia RTX A6000 | 238.18 |
次はフィラデルフィアです。ここで、RTX A4000 は、P323.15 内で平均 FPS 164.68、最小 FPS 620 を達成しました。 HP ZCentral 4R 構成では、平均 FPS が 363.24、最小 FPS が 202.02 でした。
ESRI ArcGIS Pro 2.3 フィラデルフィア | |
平均FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 323.15 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 363.24 |
Nvidia RTX A6000 | 542.70 |
最小 FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 164.68 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 202.02 |
Nvidia RTX A6000 | 237.54 |
最後のモデルはポートランドのもので、RTX A4000 の平均 FPS は 2,305.81、P790.43 内での最小 FPS は 620 でした。 HP ZCentral 4R 構成では、平均 FPS が 1,694.04、最小 FPS が 637.65 でした。
ESRI ArcGIS Pro 2.3 ポートランド | |
平均FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 2,305.81 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 1,694.04 |
Nvidia RTX A6000 | 2,756.82 |
最小 FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 790.43 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 637.65 |
Nvidia RTX A6000 | 906.17 |
ブレンダー
次は、オープンソースの 3D モデリング アプリケーションである、ユビキタスな Blender です。このベンチマークは、Blender Benchmark ユーティリティを使用して実行されました。 A4000 (ハイエンド A6000 と同様) は RTX を利用できるため、CUDA ではなく NVIDIA OptiX がレンダリング方法として選択されました。秒単位で測定されるこのベンチマークでは、低いほど優れています。
A6000 は、P620 および HP ZCentral 4R 内にインストールされた場合はほぼ 4000 倍の速度でしたが、これは予想されていたことであり、AXNUMX は依然として同クラスの次世代の結果を示しました。
ラックスマーク
LuxMark は、オープンソースの 3D レンダリング エンジンである LuxRender を管理する人々が提供する OpenCL クロスプラットフォーム ベンチマーク ツールです。このツールは、3D モデリング、照明、ビデオ作業の分野における GPU パフォーマンスを調べます。このレビューでは、最新バージョンの v4alpha0 を使用しました。 LuxMark では、スコアに関しては高いほど優れています。
Lenovo P620 内では、フード レンダリング カテゴリで RTX A4000 のスコアが 4,627 であったのに対し、ホールベンチのスコアは 12,314 でした。これらはテストされたドライブのほとんどよりも劣っていましたが、他のテストされた GPU にはより高性能なコンポーネントが装備されているため、やはり結果は良好でした。
HP ZCentral 4R 内で、RTX A4000 は食品カテゴリとホールベンチ カテゴリでそれぞれ 12,117 と 4,540 のスコアを記録しました。
オクタンベンチ
最後に、OctaneBench について見ていきます。これは、OctaneRender および RTX をサポートする別の 3D レンダラー (V-Ray と同様) のベンチマーク ユーティリティです。
RTX A4000 合計スコア: 392.47 | |||||
Lenovo ThinkStation P620 | |||||
シーン | カーネル | さん | 比 | 重量 | スコア |
インテリア(ジュリア・リンネン作) | 情報チャンネル | 239.64 | 4.651 | 10 | 11.63 |
インテリア(ジュリア・リンネン作) | 直接照明 | 71.47 | 4.015 | 40 | 40.15 |
インテリア(ジュリア・リンネン作) | パストレース | 35.13 | 4.113 | 50 | 51.41 |
アイデア (フリオ・カエタノ著) | 情報チャンネル | 247.17 | 2.874 | 10 | 7.19 |
アイデア (フリオ・カエタノ著) | 直接照明 | 66.43 | 3.156 | 40 | 31.56 |
アイデア (フリオ・カエタノ著) | パストレース | 60.06 | 3.099 | 50 | 38.74 |
ATV (ユルゲン・アレクセーエフ著) | 情報チャンネル | 223.54 | 7.121 | 10 | 17.80 |
ATV (ユルゲン・アレクセーエフ著) | 直接照明 | 67.25 | 4.421 | 40 | 44.21 |
ATV (ユルゲン・アレクセーエフ著) | パストレース | 57.24 | 4.430 | 50 | 55.38 |
ボックス (エンリコ・セリカ作) | 情報チャンネル | 259.13 | 3.941 | 10 | 9.85 |
ボックス (エンリコ・セリカ作) | 直接照明 | 55.13 | 3.983 | 40 | 39.83 |
ボックス (エンリコ・セリカ作) | パストレース | 48.12 | 3.578 | 50 | 44.72 |
RTX A4000 合計スコア: 391.72 | |||||
HP Zセントラル 4R | |||||
シーン | カーネル | さん/秒 | 比 | 重量 | スコア |
インテリア(ジュリア・リンネン作) | 情報チャンネル | 238.19 | 4.623 | 10 | 11.56 |
インテリア(ジュリア・リンネン作) | 直接照明 | 71.49 | 4.017 | 40 | 40.17 |
インテリア(ジュリア・リンネン作) | パストレース | 35.14 | 4.114 | 50 | 51.43 |
アイデア (フリオ・カエタノ著) | 情報チャンネル | 244.42 | 2.842 | 10 | 7.11 |
アイデア (フリオ・カエタノ著) | 直接照明 | 66.26 | 3.148 | 40 | 31.48 |
アイデア (フリオ・カエタノ著) | パストレース | 59.98 | 3.095 | 50 | 38.68 |
ATV (ユルゲン・アレクセーエフ著) | 情報チャンネル | 222.32 | 7.083 | 10 | 17.71 |
ATV (ユルゲン・アレクセーエフ著) | 直接照明 | 67.12 | 4.413 | 40 | 44.13 |
ATV (ユルゲン・アレクセーエフ著) | パストレース | 57.19 | 4.426 | 50 | 55.33 |
ボックス (エンリコ・セリカ作) | 情報チャンネル | 257.61 | 3.918 | 10 | 9.80 |
ボックス (エンリコ・セリカ作) | 直接照明 | 54.97 | 3.971 | 40 | 39.71 |
ボックス (エンリコ・セリカ作) | パストレース | 48.02 | 3.570 | 50 | 44.63 |
ここでは、HP ワークステーションと Lenovo ワークステーション内に実装した場合の全体スコアがそれぞれ 392.47 と 391.72 であることがわかります。これは A8000 の能力のおよそ半分です。しかし、これはエントリーレベルのカードとしては印象的な結果であり、以前のカードを確実に飛び越えています。
ハイエンドの消費者グレードのカードと比較して、OctaneBench の公式 Web サイトでは、強力な RTX 3070 および 3060 TI と RTX 3080 (ラップトップ モデル) をそれぞれ 400 および 376 とスコア付けしました。 クアドロ RTX 4000 チャートではわずか228位を示しました。
まとめ
RTX A4000 は、第 6000 世代 RTX アーキテクチャに基づいたプロフェッショナル GPU のポートフォリオからの NVIDIA の最新ミッドレンジ リリースです。 A4000 はプレミアムな価格を備えた究極のパフォーマンスですが、新しい A6,144 は、48 個の CUDA プロセッシング コア、2.2 個の次世代 RT コア、HDCP 4.0 サポート、および PCI Express 16 x4096 インターフェイスを備え、このラインで最も手頃な価格のカードです。また、2160Hz で最大 120 台の XNUMX x XNUMX ディスプレイに接続できます。このカードは、リソースを大量に消費するプロフェッショナルなワークロードを幅広く処理できるものの、ニーズが控えめで予算が少ないプロフェッショナル向けです。
NVIDIA は、これが本質的に Quadro RTX 4000 の代替品であることを示しています。しかし、新しい A4000 はあらゆる点で優れているため、これは確かに控えめな表現です。パフォーマンスは、人気の高い強力な RTX 3070 のデスクトップ バージョンと同等です。とはいえ、新しい NVIDIA カードは、RTX 4000 の GPU メモリ サイズを 16 倍の 6 GB GDDR3 に増やし、より高いレベルでのパフォーマンスを可能にします。複雑な XNUMXD データセットを扱う場合。
前述したように、このパフォーマンスの大幅な向上は主に、Samsung の 8nm NVIDIA カスタム プロセスを使用する次世代アーキテクチャである NVIDIA Ampere によるものです。また、改善されたストリーミング マルチプロセッサ、第 2 世代レイ トレーシング コア、大幅に向上したレイ トレーシング ハードウェア アクセラレーションによっても強調されています。
さらに、Ampere は第 3 世代 Tensor コアを使用して AI 推論パフォーマンスを向上させ、DLSS により高解像度でのパフォーマンスが著しく向上します。 Ampere には他にもたくさんの機能がありますが、これらすべては単純に、RTX A4000 (A8000 と同様) が GPU テクノロジーにおいて大きな進歩を遂げており、このようなエントリー カードでも前世代と比較してパフォーマンスが大幅に向上していることを意味します。このリリースにより、NVIDIA はハイエンド ワークステーション GPU を購入できない人々に、この素晴らしいアーキテクチャにアクセスする機会を提供します。
では、RTX A4000 は誰に適しているのでしょうか?高度なプロフェッショナル アプリケーションを使用し、トップエンドのワークステーション GPU を必要としないエンジニアやアーキテクトは、A4000 がワークロードにとって理想的な選択肢であると確信するでしょう。ワークステーションに可能な限り最高のパフォーマンスを必要とする人 (起動にはるかに大きな予算が必要) は、NVIDIA のフラッグシップを選択するかもしれません。 RTX-A6000 そしてその5000台の間に位置するAXNUMX。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード