NVIDIA の新しい Ampere ベースの GPU が登場しており、運が良ければ実際に購入できるかもしれません。この記事を書いている 2021 年 3 月の時点では、新しい GPU の在庫は依然として非常に不足しており、少なくとも今年の第 3090 四半期までは通常に戻ることはないと予想されています。しかし、ワークステーション用の新しい NVIDIA GeForce RTX XNUMX を入手できない場合、本当に多くのものを逃しているのでしょうか?もちろん、アップグレードが必要かどうかを知る必要がある要素はたくさんあります。
NVIDIA の新しい Ampere ベースの GPU が登場しており、運が良ければ実際に購入できるかもしれません。この記事を書いている 2021 年 3 月の時点では、新しい GPU の在庫は依然として非常に不足しており、少なくとも今年の第 3090 四半期までは通常に戻ることはないと予想されています。しかし、ワークステーション用の新しい NVIDIA GeForce RTX XNUMX を入手できない場合、本当に多くのものを逃しているのでしょうか?もちろん、アップグレードが必要かどうかを知る必要がある要素はたくさんあります。
今日は、待つだけの価値があるかどうかを明らかにするために、さまざまなユースケースを見ていきます。 Blender、Davinci Resolve、LuxMark などのクリエイティブなプロフェッショナルのユースケースを検討しますが、Python のオープンソース TensorFlow ライブラリに基づく機械学習ベンチマークや、ゲーム向けの少しのゲームについても検討します。良い対策だ。 NVIDIA GeForce RTX 3090 Founder’s Edition を、NVIDIA ワークステーション シリーズの (かつての) キングである NVIDIA Quadro RTX 8000 と比較します。 Quadro RTX 6000 との比較がより適切ですが、両方のカードに 24 GB の VRAM が搭載されているため、8000 と 6000 の実際のコンピューティング能力は同じであり、これらのベンチマークはいずれも 24 GB を超えるものを使用していないため、結果はほぼ同じになります。 VRAMの。比較用に、いくつかの OEM ワークステーションもあります。 以前レビューした Lenovo P920 デュアル RTX 8000 と新しい レノボP620 AMD の最新の Threadripper PRO が搭載されています。
ワークステーションの Quadro カードとコンシューマの GeForce カードを比較するのはなぜですか?なぜなら、NVIDIA がこれほど強力なコンシューマー カードを発売したことはこれまでになく、Quadro ラインと比較して 3 分の 1 の金額を費やすという価値提案が非常に魅力的になったからです。特に、この記事を書いている時点では、伝統的に仕事用および遊び用の GPU のニッチを埋めてきた真の TITAN RTX 後継機についての正式な発表はないからです。また、現在の世界情勢を無視することはできません。在宅勤務ソリューションが多くの人にとって最優先事項となっており、非常に強力な GPU を 1 つ備えて日中は CAD を、夜間はゲームを行うことがこれまでよりも快適に行えるようになっています。 「本物の」ワークステーション カードの違いについては、画面越しでもわかります。私たちはそこに到達します、私たちは約束します。読み続けます。
ドライバーと BIOS のバージョンを含む、主要なテスト システムと GPU の仕様は以下のとおりです。
OS | Windows 10 Professional (ver 20H2、2020 年 XNUMX 月) |
CPU | AMD Ryzen 9 3900X |
メモリ | 4x8GB (32GB) G.Skill TridentZ Neo 3600MHz CL16 |
試乗 | 2TB サムスン 970 プロ |
マザーボード | ASRock X570 Taichi (BIOS v4.00、PCIe Gen4) |
GPU1 | NVIDIA RTX 3090 ファウンダーズ エディション (スタジオ ドライバー 461.40) |
GPU2 | NVIDIA Quadro RTX 8000 (プロダクション ブランチ ドライバー R460 U3、461.40) |
クアドロ RTX 8000 | RTX 3090 FE | |
アーキテクチャ | チューリング (12nm) | アンペア (8nm) |
CUDAコア | 4,608 | 10,496 |
テンソルコア | 576 (第 2 世代) | 328(第3世代) |
RTコア | 72 (第一世代) | 82 (第 2 世代) |
GPUメモリ | ECC付き48GB GDDR6 | 24GB GDDR6X |
FP32のパフォーマンス | 16.3 TFLOPS | 35.6 TFLOPS |
消費電力 | 295W | 350W |
PCIeインターフェース | PCIe 3.0 x16 | PCIe 4.0 x16 |
クーラー | ブロワー式 | フロースルー |
NVLink マルチ GPU のサポート | はい | はい |
SR-IOVサポート | はい | いいえ |
GeForce RTX 3090 と Quadro RTX 8000 のベンチマーク
ゲームから始めましょう。これをワークステーション グラフィックスに関する記事に含めるのは奇妙に思えるかもしれませんが、最近では非常に多くの人が在宅勤務を行っているため、多くの専門家が仕事を終えて同じマシンでゲームに取りかかると期待するのは不合理ではありません。私たちは Cyberpunk 2077、Shadow of the Tomb Raider、および Borderlands 3 をテストしました。Borderlands と Tomb Raider にはベンチマーク ツールが組み込まれていますが、Cyberpunk にはそれがありませんが、1440 つのカード間で大量のデータを記録できたと感じました。平均値を出します。すべてのテストは 2077p で行われました。 Borderlands はモーション ブラーを除き、すべて最大設定に設定されました。 Tomb Raider はすべて最大、RTX Ultra、DLSS なしに設定されました。サイバーパンク 250 は RTX 中プリセットに設定され、DLSS は品質に設定されました。 League of Legends や CS:GO などの e スポーツ タイトルは、これらのカードのいずれかを使用すると簡単に 150 FPS 以上を維持できるため、徹底的にテストされていません。余談ですが、Call of Duty: Warzone では両方のカードで一貫して XNUMX FPS をはるかに超えていましたが、このチャートに含める真のベンチマークとみなすほど徹底的にテストしていませんでした。
誰も驚くべきことではありませんが、RTX 3090 は現時点で市場で最高のゲーム GPU であり、AMD Radeon 6900XT は特定のタイトルでは強力な性能を発揮しますが、レイ トレーシングに関しては 3090 に匹敵するものはありません。 。サイバーパンク 2077 は、好きか嫌いかは別として、現時点で入手可能な最も要求の厳しいタイトルであり、私たちのすべてのテストにおいて、RTX 3090 は非常に混雑したシーンでも少なくとも 65 FPS を維持し、ほとんどの時間で FPS は高かったです。 70 秒から 80 秒前半で、一貫してフレーム時間が短い。それほど要求の厳しいものであれば、最大設定で簡単に実行でき、高いフレームレートを維持できると言っても過言ではありません。また、これらのテストは、NVIDIA が GeForce カードのサイズ変更可能な BAR サポートをリリースする前の 2021 年 2 月に行われたことにも留意してください。この PCIe 規格は、AMD の新しいカードでスマート アクセス メモリとして販売されており、CPU が VRAM 全体に一度に直接アクセスできるようになり、ゲームのパフォーマンスが向上します。初期の結果では、ゲームに応じて FPS が 5% ~ XNUMX% 向上したことが示されています。サイズ変更可能な BAR はコンピューティング タスクのパフォーマンスを向上させない可能性が高いため、Quadro ラインにすぐには登場しない可能性があります。
ここでのさらに興味深い結果は、Quadro RTX 8000 がゲーム カードとしてどれほど有能であるかということです。そのパワーを考えれば驚くべきことではないように思えますが、その設計とドライバーはゲーム用にまったく最適化されていません。それでも、Cyberpunk 2077 を除くすべてのゲームでは 60 FPS をはるかに超えています。 Cyberpunk はせいぜい途切れ途切れでしたが、レイ トレーシングを元に戻し、DLSS をパフォーマンスに設定すると結果が大幅に改善され、最も要求の厳しいシーンを除くすべてのシーンで 60 FPS 以上を維持しました。注目に値するのは、Quadro で Cyberpunk を実行しているときに、レイ トレーシングに関連する多くのバグに遭遇したことです。特に、反射が完全に消えてシーンが暗くなるという問題が発生しました。これは RTX 3090 では起こらなかったため、Quadro ドライバーとサイバーパンクの悪名高いバグに関連する問題として説明します。
GeForce RTX 3090、1440p 上のシャドウ オブ ザ トゥームレイダー (RTX オン、DLSS オフ)。
次は良い点です。ワークステーションで期待される結果が得られます。この一連のベンチマークでは、3D モデリング、照明、ビデオ作品のパフォーマンスを調べます。まずは、OpenCL GPU ベンチマーク ユーティリティである LuxMark から始めます。最新バージョンの v4alpha0 と、クラシックな LuxBall の古い v3 を使用しました。
RTX 3090 が印象的なパフォーマンスを持っていると言っても過言ではありません。 GPU に大きく依存するアプリケーションでは、新しい Ampere アーキテクチャはその力を発揮し、Lenovo P920 とそのデュアル RTX 8000 をも上回ります。 LuxMark v3 では、パフォーマンスが 4 倍を超え、v150 ベンチマークのパフォーマンスは XNUMX% に近づきました。このようなグラフがさらに多く表示されることが予想されますが、(ネタバレ注意) すべてが見た目ほど明確であるわけではありません。
次に、Chaos Group の V-Ray を見てみましょう。このベンチマークは、Cinema 3D、Maya、Rhino、Unreal など、幅広い 3D モデリング アプリケーションのプラグインとして利用できる V-Ray 4D レンダリングおよびシミュレーション ツールセット用です。このベンチマークは、特に CUDA と RTX のパフォーマンスに焦点を当てています。比較のために、V-Ray ベンチマークの最新バージョン (v5) と古いバージョン (v4) を使用しました。
ここでのストーリーは LuxMark と非常に似ており、RTX 3090 は RTX 8000 を大幅に上回り、Lenovo P920 とそのデュアル GPU をも上回るパフォーマンスを発揮します。このベンチマークでは、特に NVIDIA が第 2 世代のレイ トレーシング コアに加えた大幅な改善を確認できます。 CUDA のパフォーマンスは約 150 倍になり、RTX のパフォーマンスはほぼ XNUMX% になります。
次は、オープンソースの 3D モデリング アプリケーションである、ユビキタスな Blender です。このベンチマークは、Blender Benchmark ユーティリティを使用して実行されました。これらすべてのシステムは RTX を利用できるため、CUDA ではなく NVIDIA OptiX がレンダリング方法として選択されました。
ストーリーは再びほぼ同じで、次世代 RTX コアは Blender レンダリングを迅速に処理し、BMW レンダリングを 10 秒未満で焼き切ることさえできます。この物語はまだ続きますが、心配しないでください。すぐに非常に面白くなります。ここでは、V-Ray と同様に、RTX をサポートする別の 3D レンダラである OctaneRender のベンチマーク ユーティリティである OctaneBench を見ていきます。
うん。次に、ビデオ編集アプリケーション、特に Davinci Resolve Studio 16.2.8 と Adobe Premiere Pro 2020 を見ていきます。PugetBench for Adobe CC と PugetBench for Resolve を使用します。どちらも開発者です。 ピュージェットシステムズ、特定のアプリケーション向けのプロフェッショナルなワークステーションを製造する PC メーカーです。このグラフは、全体的なベンチマークの GPU スコアを具体的に示し、GPU アクセラレーション効果のパフォーマンスをスコアリングしています。
最後に、価値提案が少し低下するいくつかのユースケースがあります。 Premiere Pro や Davinci Resolve などのアプリケーションは、プロジェクトやエフェクトに応じてパフォーマンスのニーズが大きく異なり、CPU ボトルネックになることがよくあります。特に GPU の最適化が大幅に向上した Resolve では改善が見られますが、Adobe Creative Cloud スイートのユーザーは、表向き 3080 秒間で 90% のパフォーマンスが得られる RTX 46 のようなローエンドの GeForce カードにより多くの価値を見出します。価格の % (Founder's Edition カードのメーカー希望小売価格に基づく)。ここでは報告されていませんが、After Effects と Photoshop のパフォーマンスは同様で、ほとんどのテストは CPU に制限がありました。また、Quadro カードと GeForce カードはどちらも第 7 世代バージョンの NVENC (NVIDIA エンコーダー) を使用しているため、H.264 と HEVC のレンダリング時間は同様であることにも注目してください。 GeForce カードでは同時エンコード タスク (ストリーミングや録画など) が 3 つに制限されていますが、Quadros にはそのような制限がないことに注意してください。この制限のバイパスについてはわかっていますが、これについては後で説明します。 RTX 3090 は新世代の NVDEC (NVIDIA デコーダー) を使用しているため、HEVC および H.264 フッテージを操作する場合のタイムライン スクラブがわずかに改善されます。
創造的なアプリケーションから何か新しいものに移りましょう。 AI-Benchmark という適切な名前のベンチマークを使用して、これらのカードの機械学習パフォーマンスを見ていきます。これは、TensorFlow 機械学習ライブラリを使用して一連の深層学習テストを実行するオープンソースの Python ライブラリです。さらに詳しく知ることができます こちら 使用する具体的なテスト方法も同様です。
皆さんのあえぎ声が聞こえてきました。ここでも、ほとんどのクリエイティブ ベンチマークと同じ話で、GeForce カードは表向き Quadro のパフォーマンスを 10 倍にします。このテストは Windows XNUMX で行われましたが、選択した Linux ディストリビューションでも同様の結果が期待できます。テスト時点では、TensorFlow は新しい Ampere カードをサポートするように更新されていませんでしたが、ちょっとしたハッキングにより、さまざまな CUDA 開発者キットのコンポーネントを組み合わせて一致させることで TensorFlow を実行できるようになりました。将来的に適切に更新されたバージョンによって結果が改善されることを期待しています。
最後に、重要なこととして、Standard Performance Evaluation Corporation による業界標準のベンチマーク ユーティリティの最新リビジョンである SPECviewperf 2020 について見ていきます。このベンチマークは、さまざまなプロフェッショナル アプリケーションにおけるグラフィックス パフォーマンスを調べます。比較のために、古い Quadro P620 を搭載した Lenovo P6000 も含めました。
ここからが興味深いことになります。 3D モデリングの結果はほぼ期待どおりであり、RTX 3090 は RTX 8000 を大幅に上回っていますが、CATIA や Creo などのアプリケーション、およびエネルギーおよび医療のテストでは、実際には 3090 のパフォーマンスがわずかながら大幅に下回っています。マージン。 Lenovo P6000 に搭載されているかなり古い Quadro P620 に対してもパフォーマンスが劣っていました。では、シーメンス NX についてはどうでしょうか?これが、ワークステーション対コンシューマー、Quadro 対 GeForce の苦境の核心です。あなたはそのチャートを正しく読んでいます。 3090 は Siemens NX で 25.37 を記録しました。このテストを 3090 回実行し、インターネット上の他のベンチマーク結果を参照しましたが、この結果は完全に正しいです。このテストでは、RTX 5 のパフォーマンスは、RTX 620 を搭載した Lenovo P8000 の XNUMX% 未満でした。次のセクションでこれについてさらに詳しく見てみましょう。
ワークステーション GPU とコンシューマー GPU の比較。ドライバーズ
GeForce RTX 3090 が非常に強力な GPU であることは否定できません。Quadro RTX 8000 も強力な GPU ですが、両者の違いは重要です。 RTX 3090 は、何よりもまずゲーム用ビデオ カードです。これは、ゲーム用の絶対的に最高の GPU および「世界初の 8K 対応」ゲーム カードとして設計され、販売されています。多くのタスクで RTX 8000 よりも優れたパフォーマンスを発揮できるという事実は、ほとんどの場合において極端なマージンを伴いますが、その生のパワーの証拠であり、本質的にこれらのテストを強引に突破します。 Quadro RTX 8000 は、何よりもまずワークステーション カードであり、ワークステーションに設置し、ラックマウント サーバーに詰め込み、NVLink 経由でリンクし、仮想化して、ハードに実行し、濡れた状態で (もちろん比喩的に) 保管しても生き残れるように設計されています。
そこで疑問が生じます。なぜ GeForce RTX 3090 は特定のタスクにおいて 3 年前の Quadro RTX 8000 を下回り、さらには 6 年近く前の Quadro P6000 をも下回ったのですか?具体的には、RTX 8000 のパフォーマンスが Siemens NX で 3090 桁以上向上しているのはなぜでしょうか?賢明な読者の皆さんはすでにご存じかと思います。それはドライバーの最適化に帰着します。どの GPU がワークステーションの最適化を実現するかに関して、NVIDIA は裁判官であり、陪審員であり、実行者でもあり、RTX 3090 があらゆるアプリケーションで以前の Quadro ラインの床を完全に消し去ることを望んでいなかったことは明らかです。多くの潜在的な購入者は、日中は最高レベルのワークステーションのパフォーマンスを期待し、夜間にハイエンドのゲームをプレイすることは、少なくとも RTX 1,499 のメーカー希望小売価格 3090 ドルでは不可能であることを知って非常に失望するでしょう。 「それが TITAN 製品ラインの目的です」という声が聞こえますが、現時点では TITAN RTX の代替品は入手できません。3090 の価格設定では、確かに TITAN の代替品として位置付けられています。 NVIDIA はマーケティング資料の最初の行で 3090 が「TITAN クラスのパフォーマンス」であるとさえ誇っていますが、Siemens NX の結果は「TITAN クラス」には程遠いです。 3080 は単に作りすぎて価格が高すぎる 3 なのでしょうか?まあ、完全ではありません。これは依然として 24D モデラーやビデオ作業に利用できる最高の GPU であり、特に 8 GB の VRAM を備えているため、クリエイターは大きなモデルや 3090K 映像を簡単に操作できますが、これは非常に小さなニッチ、つまり以前は TITAN が提供していたニッチに当てはまります。 -クラスカード。 Siemens NX、Creo、CATIA などの CAD アプリケーションを使用しない場合でも、RTX XNUMX は依然として魅力的ですが、これらのアプリケーションがワークフローにとって重要である場合には、RTX XNUMX はまったく役に立ちません。
他にも考慮すべき点があります。 Quadro カードと GeForce カードはどちらも NVLink 経由でマルチ GPU セットアップを提供しますが、3090 シリーズ カードの中でこの機能を備えているのは 3000 だけであることに注意してください。SR-IOV で仮想化できるのは Quadro だけです。ワークロードに 3090 つの GPU または XNUMX つの NVLinked GPU を複数の VM に分散することが含まれる場合、依然として Quadro が唯一の選択肢です。これを回避する方法はありますが、依然として重要なのは、この機能が NVIDIA の GeForce ドライバーによって人為的に制限されているということです。ちなみに、同じドライバが、Adobe スイートや Autodesk などの一部のクリエイティブ アプリケーションの認定を提供しているだけでなく、Studio バージョンの WHQL (Windows Hardware Quality Labs) 認定も提供しているため、論点はさらに混乱しています。私たちは将来、NVIDIA から真の Ampere ベースの TITAN の代替品が登場すると予想していますが、NVENC との同時エンコードの制限を含め、GeForce RTX XNUMX に課せられた人為的な制限は、プロフェッショナル ユーザーが現在求めているものとは乖離しているように感じられます。 。
この記事の執筆中に、NVIDIA は仮想通貨マイニング専用の GPU の新製品ラインと、次期 RTX 3060 のマイニング パフォーマンスを半分にする意向も発表しました。この仮想通貨マイニング パフォーマンスの低下は完全に人為的なものであり、完全にドライバーによって行われており、要点はさらに明確になっています。 NVIDIA が当社のカードに価値があると判断したものはすべて、私たちがなすがままにされているだけだということです。 3060 のこの「ハッキング不可能」制限は悪用されるのでしょうか?間違いなく、NVENC の制限と同様の方法で突破されました。しかし現時点では、NVIDIA がすべてのカードを保有しており、CUDA、RTX、TensorFlow、その他の NVIDIA 固有のコンピューティング プラットフォーム向けに高度に最適化された多くのプロフェッショナルなワークフローを実現するには、NVIDIA 以外に選択肢はありません。
まとめ:
少し分解してみましょう。 RTX 3090 の在庫アラートをオンにしておく必要がありますか?入手するチャンスを得るために、地元の MicroCenter の外の行列に勇気を出して挑戦してみませんか?ほとんどのことと同様、答えは「状況による」です。
- Blender や Cinema 3D などのアプリケーションで大規模な 4D モデルのみを操作しますか、それとも大規模な 6K および 8K ビデオ ファイルを定期的に編集しますか?それならそうです。 RTX 3090 は、CUDA および RTX 加速ワークフロー向けの市場で最高のクリエイティブなプロフェッショナル GPU です。
- 絶対に妥協のないゲーム機を作るのに十分な可処分所得はありますか?それもそうです。 RTX 3090 は、特にレイ トレーシングと DLSS 2.0 をサポートするゲームにおいて、お金で買える最高のゲーム GPU であり、そのリストは日々増えています。
- 主に CAD、特に Creo や CATIA などのアプリケーションを使用する科学分野で働いていますか?それなら、いいえ。 RTX 3090 は、Quadro カード シリーズに付属している必要なドライバーの最適化を提供していないため、どれほど強引な生のパワーを加えても、これを克服することはできません。新しいものを手に入れるために取り組んでいます RTX-A6000、RTX 8000 の実際の代替品、あなたのような人々に情報を提供するのに役立ちます。
- 機械学習とAIの分野で働いていますか? TensorFlow のパフォーマンスは優れているので、これは賛否両論ありますが、残念ながら、新しい Quadro カードと比較して最終的な結論を下すのに十分な標準化されたテストやデータ ポイントがありません。また、この記事の執筆時点では、TensorFlow は Ampere カードを適切にサポートするように更新されていません。私たちの現在の答えは「はい」です。見てみましょう MLコモンズ 将来的には、特に AI と機械学習のユースケース向けのフォローアップとして MLperf が追加される予定です。
- 現在 TITAN RTX を所有しており、アップグレードを検討していますか?最終的にリリースされると噂されている、Ampere ベースの TITAN に関する NVIDIA からの公式発表を待つことをお勧めします。 TITAN をうまく利用するユースケースの場合、ワークフローによっては RTX 3090 がダウングレードされる可能性があります。
- GPU 仮想化を頻繁に行っていますか?これは断固としてノーです。 RTX 3090 は SR-IOV をネイティブにサポートしません。
以上のことを考慮して、この記事がアップグレードするかどうか、そして GeForce と Quadro のどちらを選択するかの決定に役立つことを願っています。 RTX 1,499 のメーカー希望小売価格 3090 ドルが高すぎて、10 GB 以上の VRAM が必要ない場合は、RTX 3080 も優れた選択肢になります。ここでは明示的にテストしていませんが、ウェブ全体の結果に基づくと、結果は一般に RTX 20 よりも 30% ~ 3080% 優れていることがわかりました。そのため、同様のアプリケーションでは Quadro RTX 8000 よりも優れた (または劣った) パフォーマンスを発揮することが期待できます。また、噂の RTX 3080 Ti が登場する可能性がある場合は、その中間点として待つ価値があるかもしれません。今のところ、私たちは、Ampere ベースの TITAN が完全なワークステーション カードと完全なゲーム カードの間のギャップを真に埋めることに注目していきます。また、NVIDIA のドライバー パイプラインにも注目して、将来のリリースでカードの動作関連の欠点が解消されるかどうかを確認していきますが、私たちには疑問があります。これについてのご意見、また、特に AI と機械学習に関連するベンチマークやユースケースで見逃したものがあれば、ぜひお聞かせください。ソーシャル チャネルで私たちに連絡し、よりクリエイティブなプロフェッショナルやワークステーションのレビューをお待ちください。
続きを読む - NVIDIA RTX A6000 レビュー
NVIDIA Quadro RTX 8000 を Amazon で販売
NVIDIA GeForce RTX 3090 ファウンダーズ エディションを Amazon で販売
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード