NVIDIA RTX A6000 は、第 10,752 世代 RTX アーキテクチャを活用した同社の最新リリースです。 84 個の CUDA プロセッシング コアと 6000 個の次世代 RT コアを組み合わせた新しい GPU は、リアルタイム レイ トレーシングとプロフェッショナルな最終フレーム レイ トレーシング出力の両方でトップクラスのパフォーマンスを提供します。 NVIDIA は RTX A6000 を RTX 8000 の後継機とみなしていますが、本質的には RTX XNUMX の直接の代替品です。
NVIDIA RTX A6000 は、第 10,752 世代 RTX アーキテクチャを活用した同社の最新リリースです。 84 個の CUDA プロセッシング コアと 6000 個の次世代 RT コアを組み合わせた新しい GPU は、リアルタイム レイ トレーシングとプロフェッショナルな最終フレーム レイ トレーシング出力の両方でトップクラスのパフォーマンスを提供します。 NVIDIA は RTX A6000 を RTX XNUMX の後継機とみなしていますが、本質的には RTX XNUMX の直接の代替品です。 RTX 8000.
RTX 8000 はこのレビューの時点でおよそ 3 年前のものであるため、NVIDIA のかつての最高クラスのワークステーション GPU に代わるものがついに登場したのは確かに喜ばしいことです。同社は最近、自社のプロフェッショナル ソリューションを識別するために Quadro の名前を使用することをやめました。ただし、RTX A6000 は、Quadro シリーズと同じプロフェッショナルな機能、ハードウェアおよびソフトウェア認定、認定ドライバーをすべて備えています。
NVIDIA RTX A6000 対 RTX 6000 対 RTX 8000
RTX A6000 は、どの前世代のカードと比較しても大幅なアップグレードであり、動くオブジェクトのよりリアルな出力と、ハードウェア アクセラレーションによるモーション ブラーのサポートを提供します (後者は、レンダリング時に最終画像の全体的なリアリズムを向上させるために使用されます)。動く物体)。また、高速化された AI ノイズ除去機能も備えているため、より少ないレンダリング パスを使用して高品質の出力が得られ、レンダリング時間が短縮されます。さらに、A6000 は、PCIe Gen4 規格をサポートする NVIDIA 初のプロフェッショナル グラフィックス カードです。
新しい NVIDIA カードは、RTX 6000 のメモリ サイズを 48 倍の 6 GB の GDDR8000 (RTX 3 と同じ) に増やし、より大きな 3D データセットを処理できるようにします。これは、クリエイティブな専門家がシーンの複雑さを軽減することなく、大規模な 48D シーンをレンダリングできることも意味します。 6000 GB を超えるメモリを必要とする大きな予算とワークロードを持つプロフェッショナルの場合、96 枚の AXNUMX カードを NVIDIA NVLink 経由で接続し、合計 XNUMX GB の GPU メモリを実現できます。
おそらく RTX A6000 の最も重要なアップグレードは次のとおりです。 NVIDIAアンペア、8億個のトランジスタを備えたサムスンの28nm NVIDIAカスタムプロセスを使用する新しいアーキテクチャ。以下のパフォーマンス チャートからわかるように、この新しいアーキテクチャは、ほとんどのテストで RTX 6000 を圧倒します。
Ampere のその他のハイライトは次のとおりです。
- 改良されたストリーミング マルチプロセッサ
- 第 2 世代レイ トレーシング コア。レイ トレーシング ハードウェア アクセラレーションが向上します。
- 第 3 世代 Tensor コアにより、AI 推論パフォーマンスと DLSS が向上し、高解像度でのパフォーマンスが向上します。
また、Ampere アーキテクチャでは、前世代モデルと比較して、CUDA コアが単精度浮動小数点で最大 3 倍増加しています。これは、XNUMXD モデル開発やコンピュータ支援エンジニアリングのデスクトップ シミュレーションなどのコンピューティング分野で顕著なパフォーマンスの向上を意味します。
NVIDIA RTX A6000 と RTX 3090 の比較
はい、RTX A6000 は RTX 8000 の直接の代替品であり、技術的には RTX 6000 の後継ですが、仕様と潜在的なパフォーマンス出力に関する限り、実際には多くの点で RTX 3090 と一致しています。どちらのカードも新しいアンペア (8nm) アーキテクチャを活用しており、同等の CUDA および RT コア数を備えています。
3090 つのカード間のパフォーマンスの違いは、RTX 3090 のドライバー最適化の改善と新しい RAM (6 の GDDR6000X と A6 の GDDR6000) によるものと考えられます。それにもかかわらず、RTX AXNUMX は NVIDIA による大規模なリリースであり、特定の分野では市場で入手可能な他のほとんどの製品よりも優れたパフォーマンスを発揮します。そのため、どのカードが最適であるかを決定するのは、実際には、当社のレビュー ベンチマークが示すように、特定のユースケースに依存します。
NVIDIA RTX A6000の仕様
GPU | RTX-A6000 |
アーキテクチャ | アンペア |
ファウンドリ | サムスン |
プロセスサイズ | 8nm |
トランジスタ | 28.3億 |
ダイサイズ | 628.4 mm2 |
CUDA並列処理コア | 10,752 |
NVIDIAテンソルコア | 336 |
NVIDIARTコア | 84 |
GPUメモリ | 48 GB GDDR6、ECC付き |
メモリインターフェイス | 384ビット |
メモリ帯域幅 | 768 GB / sの |
最大電力消費量 | 300W |
グラフィックバス | PCI Express 4.0 x16 |
ディスプレイコネクタ | DP 1.4(4) |
フォームファクター | 4.4” H x 10.5” Lデュアルスロット |
製品重量 | 1.179キロ |
熱ソリューション | 従軍中 |
vGPUソフトウェアサポート | NVIDIA GRID、NVIDIA Quadro 仮想データセンター ワークステーション、NVIDIA 仮想コンピューティング サーバー |
サポートされているvGPUプロファイル | 1GB、2GB、3GB、4GB、6GB、8GB、
12 GB、16 GB、24 GB、48 GB |
NVIDIA® 3D Vision® および 3D Vision Pro | 3ピンミニDIN経由でサポート |
フレームロック | 互換性(Quadro Sync IIと) |
NVLink | 2ウェイ ロー プロファイル (2 スロットおよび 3 スロット ブリッジ)
2x RTX A6000 を接続 |
NVLink相互接続 | 112.5 GB/秒 (双方向) |
電源コネクタ | 1x8ピンCPU |
NVENC | NVDEC | 1x | 2x (+AV1 デコード) |
性能
そのパフォーマンスを評価するために、RTX A6000 にリソースを大量に使用する一連のテストを実施し、RTX 8000 および RTX 3090 FE と比較しました。 RTX A6000 を両方にインストールしました。 HP Zセントラル 4R と P620 ワークステーション、RTX 8000 はいくつかのベンチマークでも使用しました。
HP ZCentral 4R:
- Intel Xeon 2295 (3.0 GHz の基本周波数、Intel vPro テクノロジーで最大 4.6 GHz)
- 64GB DDR4-2933 ECC SDRAM
- 1TB M.2 SSD
レノボ ThinkStation P620:
- AMD Ryzen Threadripper Pro 3995WX プロセッサー (2.70 GHz、最大ブースト 4.20 GHz、64 コア、128 スレッド、32 MB キャッシュ)
- DDR64 RAMの4GB
- 1TB PM981 SSD
Blender と LuxMark テスト用に、RTX 8000 と RTX 3090 をカスタム コンシューマー ビルドにインストールしました。
- AMD Ryzen 9 3900X
- 4x8GB (32GB) G.Skill TridentZ Neo 3600MHz CL16
- 2TB サムスン 970 プロ
- ASRock X570 Taichi (BIOS v4.00、PCIe Gen4)
SPECviewperf 2020
まず、SPECviewperf 2020 ベンチマークです。これは、OpenGL および Direct X アプリケーション プログラミング インターフェイスで実行されるプロフェッショナル アプリケーションのグラフィックス パフォーマンスを測定するための世界標準です。ビューセット (またはベンチマーク) は、アプリケーション自体をインストールすることなく、実際のアプリケーションのグラフィックス コンテンツと動作を表します。これらのビューセットには、3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX、Solidworks が含まれます。
注意: このテストでは 4K 解像度 (3800 x 2120) を使用し、両方とも HP ZCentral 4R にインストールされました。
ビューセット | Nvidia RTX A6000 Lenovo ThinkStation P620 |
Nvidia RTX A6000 HP Zセントラル 4R |
NVIDIA RTX 8000 Lenovo ThinkStation P620 |
3dsmax-07 | 131.96 | 127.89 | 110.01 |
カティア-06 | 90.99 | 75.32 | 69.37 |
クレオ-03 | 125.88 | 99.54 | 108.11 |
エネルギー-03 | 42.22 | 38.83 | 27.11 |
マヤ-06 | 314.82 | 273.01 | 238.84 |
医療-03 | 34.87 | 30.58 | 27.67 |
SNX-04 | 450.72 | 422.01 | 375.83 |
SW-05 | 161.4 | 152.19 | 136.5 |
このベンチマークでは、RTX A6000 は両方のワークステーション内で、特に Siemens NX カテゴリで前世代モデルと比べて劇的な改善を示しました。前に述べたように、Ampere アーキテクチャはパフォーマンスにおいて大きな進歩を遂げているため、これは確かに予想されており、このパフォーマンス傾向が残りのベンチマークでも継続していることがわかります。
次に、ワークステーションのパフォーマンスのすべての重要な側面をテストするために設計されたベンチマークに特化したテストである SPECworkstation3 を実行しました。 30 を超えるワークロードを使用して、CPU、グラフィックス、I/O、メモリ帯域幅をテストします。ワークロードは、メディアとエンターテイメント、金融サービス、製品開発、エネルギー、ライフ サイエンス、一般業務などの幅広いカテゴリに分類されます。個々のワークロードではなく、それぞれの広範なカテゴリの結果をリストします。結果は、各カテゴリのすべての個別のワークロードの平均です。
SPECワークステーション3
カテゴリー | Nvidia RTX A6000 Lenovo ThinkStation P620 |
Nvidia RTX A6000 HP Zセントラル 4R |
NVIDIA RTX 8000 Lenovo ThinkStation P620 |
M&E | 6.04 | 3.49 | 3.82 |
製品開発 | 5.49 | 3.63 | 3.97 |
生命科学 | 4.61 | 3.76 | 4.07 |
エネルギー | 5.58 | 2.79 | 完了しませんでした |
FSI | 9.49 | 3.38 | 4.08 |
一般作戦 | 2.14 | 1.63 | 2.1 |
GPU計算 | 7.44 | 7.22 | 5.88 |
全体として、P620 内にインストールした場合、ほとんどのカテゴリでパフォーマンスがさらに大幅に向上し、場合によっては RTX 8000 の XNUMX 倍以上の結果が得られました。HP ZCentral ワークステーション内に実装した場合、GPU コンピューティングを除いてより低い数値が示されました。 。
環境システム研究所 (Esri)
次に、Environment Systems Research Institute (Esri) のベンチマークです。 Esri は地理情報システム (GIS) ソフトウェアのサプライヤーですが、同社のパフォーマンス チームは、ArcGIS Pro を自動的に起動する PerfTool アドイン スクリプトを設計しました。
このアプリケーションは、「ZoomToBookmarks」機能を使用して、さまざまな定義済みブックマークを参照し、ユーザー エクスペリエンスを予測するために必要なすべての主要なデータ ポイントを含むログ ファイルを作成します。スクリプトは、キャッシュ (メモリおよびディスク キャッシュ) を考慮して、ブックマークを自動的に 3 回ループします。言い換えれば、このベンチマークは、Esri の ArcGIS Pro ソフトウェアを通じて見られるような大量のグラフィックの使用をシミュレートします。
テストは 3 つの主要なデータセットで構成されます。 3 つは、ペンシルベニア州フィラデルフィアとケネディ州モントリオールの 2D 都市ビューです。これらの都市ビューには、地形モデル上にドレープされたテクスチャ付きの XNUMXD マルチパッチの建物と、ドレープされた航空画像が含まれています。 XNUMX 番目のデータセットは、オレゴン州ポートランド地域の XNUMXD マップ ビューです。このデータには、道路、土地利用区画、公園や学校、川、湖、丘陵の日陰の地形に関する詳細情報が含まれています。
まずはモントリオールです。ここで、RTX A6000 は平均 FPS 614.03、最小 FPS 238.18 を達成しました。
ESRI ArcGIS Pro 2.3 モントリオール | |
平均FPS |
|
NVIDIA RTX 8000 | 471.58 |
Nvidia RTX A6000 | 614.03 |
最小 FPS | |
NVIDIA RTX 8000 | 220.36 |
Nvidia RTX A6000 | 238.18 |
次はフィラデルフィアで、RTX A6000 は平均 FPS 542.70、最小 FPS 237.54 を達成しました。
ESRI ArcGIS Pro 2.3 フィラデルフィア | |
平均FPS |
|
NVIDIA RTX 8000 | 509.31 |
Nvidia RTX A6000 | 542.70 |
最小 FPS |
|
NVIDIA RTX 8000 | 271.01 |
Nvidia RTX A6000 | 237.54 |
最後のモデルはポートランドです。ここで、RTX A6000 の平均 FPS は 2,756.82、最小 FPS は 906.17 でした。
ESRI ArcGIS Pro 2.3 ポートランド | |
平均FPS |
|
NVIDIA RTX 8000 | 2,270.52 |
Nvidia RTX A6000 | 2,756.82 |
最小 FPS |
|
NVIDIA RTX 8000 | 965.13 |
Nvidia RTX A6000 | 906.17 |
ブレンダー
次は、オープンソースの 3D モデリング アプリケーションである、ユビキタスな Blender です。このベンチマークは、Blender Benchmark ユーティリティを使用して実行されました。 A6000 とその同等機種では RTX を利用できるため、CUDA ではなく NVIDIA OptiX がレンダリング方式として選択されました。秒単位で測定されるこのベンチマークでは、低いほど優れています。
A6000 は、HP ワークステーションと Lenovo ワークステーションの両方で、すべてのカテゴリ (Koro を除く) で RTX 8000 に比べて大幅な向上を示しました。すべてのカテゴリで RTX 3090 には及ばなかったものの、RTX A6000 はゲーム界の巨大 GPU にその価格に見合ったパフォーマンスを与えました。
ラックスマーク
LuxMark は、オープンソースの 3D レンダリング エンジンである LuxRender を管理する人々が提供する OpenCL クロスプラットフォーム ベンチマーク ツールです。このツールは、3D モデリング、照明、ビデオ作業の分野における GPU パフォーマンスを調べます。このレビューでは、最新バージョンの v4alpha0 を使用しました。 LuxMark では、スコアに関しては高いほど優れています。
フード レンダリング カテゴリでは、RTX A6000 は Lenovo P8,088 内で 620 のスコアを獲得しました。これは、RTX 8000 (3,337 を記録) の 3090 倍以上であり、RTX 8,929 (20,983 を記録) にはわずかに及ばなかったのです。ホールベンチ レンダリング カテゴリでは、新しい NVIDIA カードは 9,794 (対 3090) で前世代カードの 23,555 倍以上を記録しましたが、RTX 4 の 6000 には及ばなかった。 HP ZCentral 7,123R 内で、RTX A20,246 は食品カテゴリとホールベンチ カテゴリでそれぞれ XNUMX と XNUMX のスコアを記録しました。
オクタンベンチ
最後に、OctaneBench について見ていきます。これは、OctaneRender および RTX をサポートする別の 3D レンダラー (V-Ray と同様) のベンチマーク ユーティリティです。
RTX A6000 合計スコア: 664.40 | |||||
Lenovo ThinkStation P620 | |||||
シーン | カーネル | さん/秒 | 比 | 重量 | スコア |
インテリア | 情報チャンネル | 386.4874 | 7.502 | 10 | 18.75424 |
インテリア | 直接照明 | 120.6423 | 6.778 | 40 | 67.77658 |
インテリア | パストレース | 60.07888 | 7.035 | 50 | 87.93748 |
アイデア | 情報チャンネル | 403.6568 | 4.694 | 10 | 11.73557 |
アイデア | 直接照明 | 112.0406 | 5.323 | 40 | 53.22593 |
アイデア | パストレース | 101.651 | 5.245 | 50 | 65.56436 |
ATV | 情報チャンネル | 369.6832 | 11.777 | 10 | 29.44275 |
ATV | 直接照明 | 114.5929 | 7.534 | 40 | 75.34053 |
ATV | パストレース | 97.79354 | 7.569 | 50 | 94.61449 |
ボックス | 情報チャンネル | 423.7369 | 6.445 | 10 | 16.11167 |
ボックス | 直接照明 | 93.5092 | 6.756 | 40 | 67.56445 |
ボックス | パストレース | 82.13356 | 6.107 | 50 | 76.33231 |
RTX A6000 合計スコア: 合計スコア: 651.2823 | |||||
HP Zセントラル 4R | |||||
シーン | カーネル | さん/秒 | 比 | 重量 | スコア |
インテリア | 情報チャンネル | 381.9805 | 7.414 | 10 | 18.53555 |
インテリア | 直接照明 | 119.4807 | 6.712 | 40 | 67.12399 |
インテリア | パストレース | 58.97741 | 6.906 | 50 | 86.32525 |
アイデア | 情報チャンネル | 393.9745 | 4.582 | 10 | 11.45408 |
アイデア | 直接照明 | 109.6025 | 5.207 | 40 | 52.06769 |
アイデア | パストレース | 99.80163 | 5.15 | 50 | 64.37154 |
ATV | 情報チャンネル | 363.1271 | 11.568 | 10 | 28.92061 |
ATV | 直接照明 | 112.0573 | 7.367 | 40 | 73.67342 |
ATV | パストレース | 95.76828 | 7.412 | 50 | 92.65507 |
ボックス | 情報チャンネル | 414.6209 | 6.306 | 10 | 15.76505 |
ボックス | 直接照明 | 91.09318 | 6.582 | 40 | 65.81877 |
ボックス | パストレース | 80.23866 | 5.966 | 50 | 74.57125 |
ここでは、HP ワークステーションと Lenovo ワークステーション内で使用した場合の全体スコアがそれぞれ 664.40 と 651.28 であることがわかり、これは RTX 3090 (全体スコア 671.02) と非常に似ていました。さらに、これは RTX 8000 (総合スコア 315.02) のスコアを XNUMX 倍以上上回りました。
まとめ
RTX A6000 は、控えめに言っても、NVIDIA による印象的なリリースです。この新しいプロフェッショナル グラフィックス カードは、10,752 個の CUDA 処理コア、84 個の次世代 RT コア、48GB の GDDR6 RAM を備え、PCI Express 4.0 x16 インターフェイスをサポートしています。新しい NVIDIA カードは、RTX 6000 の GPU メモリ サイズを 48 倍の 6 GB GDDR3 に増やし、より大規模で複雑な 48D データセットを処理できるようにします。ポケットが大きく、6000 GB 以上のメモリが必要なプロフェッショナルは、NVIDIA NVLink 経由で 96 枚の A6 カードをインストールし、合計 XNUMX GB の DDRXNUMX RAM を実現できます。
RTX A6000 は技術的には RTX 6000 の後継ですが、NVIDIA のかつてのトップ ワークステーション GPU である RTX 8000 を直接置き換えるものです。それでも、この前世代モデルと比較して単なる反復的なアップグレードではなく、飛躍的にパフォーマンスが飛躍的に向上しています。
では、どのようにして可能になるのでしょうか?最も重要な要素は NVIDIA Ampere です。このアーキテクチャは、Samsung の 8nm NVIDIA カスタム プロセス (28 億個のトランジスタを搭載)、改良されたストリーミング マルチプロセッサ、第 8000 世代レイ トレーシング コア、および大幅に改良されたレイ トレーシング ハードウェア アクセラレーションを使用しています。また、第 XNUMX 世代 Tensor コアも使用されており、AI 推論パフォーマンスと DLSS の向上に役立ち、結果として高解像度でのパフォーマンスが向上します。これらは、Ampere がもたらすハイライトのほんの一部であり、RTX AXNUMX が提供できるようになります。 巨大な 飛躍的な進歩は、パフォーマンステストでも明らかでした。
それを行う手段がある (そして必要な) 人にとってもう 6000 つの興味深い機能は、RTX A6000 の Quadro Sync II アドイン カードのサポートです。これにより、各 Quadro Sync II カードが最大 32 枚の RTX AXNUMX カードの出力を同期できるため、GPU は単一システム (またはシステムのクラスター) 内のさまざまな互換性のある GPU からのディスプレイと画像出力の両方を同期できるようになります。つまり、ユーザーは XNUMX つのシステムに最大 XNUMX 枚の Quadro Sync II カードをインストールできます。つまり、XNUMX つの GPU (それぞれに XNUMX つのアクティブな独立したディスプレイ出力がある) を搭載したワークステーションは、最大 XNUMX の同期ビデオ ディスプレイをサポートできることになります。
RTX A6000 は RTX 8000 の代替品ではありますが、実際には RTX 3090 に匹敵します。ベンチマーク テストではわずかに後れを取っています。前述したように、この小さなパフォーマンスの違いは、Quadro ドライバーの最適化と新しい RAM によるものと考えられます。
では、RTX A6000 は誰に向けたもので、代わりに RTX 3090 を購入する必要があるのでしょうか?まあ、それは状況によります。どの GPU を取得するかは、ワークフローの内容や短期的な将来の状況に基づいて決定する必要があります。最近では RTX カードを入手するのは非常に困難ですが、入手できる立場にある場合、RTX A6000 は主に CAD で作業する人 (より具体的には、Creo や CATIA などのアプリケーションを使用する科学分野) に最適です。 、RTX 3090 は、Quadro カード シリーズに付属する必要なドライバーの最適化を提供していないためです。ゲーム エクスペリエンスのベンチマークでは RTX A6000 をテストしませんでしたが、特にレイ トレーシングと DLSS 3090 を利用するゲームでは、RTX 2.0 がお金で購入できる最高のゲーム GPU であることは確かです。
以上のことを踏まえると、Ampere ベースの RTX A6000 は、特定の分野で市場で入手可能な他の製品よりも大幅に優れたパフォーマンスを発揮します。そのため、デスクトップ ワークステーションに強力なビジュアル コンピューティング GPU を必要とするプロフェッショナルにとって、RTX A6000 は最適です。現在入手可能な最強のカード。
StorageReview と連携する
ニュースレター | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSSフィード