AMD は、新しい EPYC 9004 第 4 世代 CPU の一般提供を発表しました。コードネーム AMD Genoa の新しい CPU ラインは、12 チャネルの DDR5-4800 (ソケットあたり最大 6TB のメモリ容量)、128 レーンの PCIe Gen5、AMD Infinity Fabric/Guard テクノロジー、および最大 96 コアをサポートします。そのため、クラウド、エンタープライズ、ハイパフォーマンス コンピューティングにわたる重要なワークロードに最適です。
AMD は、新しい EPYC 9004 第 4 世代 CPU の一般提供を発表しました。コードネーム AMD Genoa の新しい CPU ラインは、12 チャネルの DDR5-4800 (ソケットあたり最大 6TB のメモリ容量)、128 レーンの PCIe Gen5、AMD Infinity Fabric/Guard テクノロジー、および最大 96 コアをサポートします。そのため、クラウド、エンタープライズ、ハイパフォーマンス コンピューティングにわたる重要なワークロードに最適です。
ビジネス向け EPYC 9004 第 4 世代 CPU の利点
単一プロセッサーに 96 コアという膨大な数を備えた新しい AMD Genoa プロセッサーを使用すると、組織はより強力なサーバーを活用しながら、導入するサーバーの数を減らして物理的な設置面積を削減できます。これにより、データセンターのエコシステムにさらなる柔軟性がもたらされ、持続可能性と将来性のある目標の達成に役立ちます。
AMD は、セキュリティの強化、特に CPU に物理層と仮想層の両方の保護を提供する同社の機能セットである AMD Infinity Guard の拡張に重点を置いて、新しい EPYC プロセッサを構築しました。たとえば、前世代と比較して 2 倍の数の暗号化キーを備えているため、データがローカル、クラウド、またはストレージに保存されているかどうかに関係なく、顧客はデータを安全に保つことができます。
組織は、ニーズに最適なコア数と周波数 (以下の表を参照) のモデルを選択するオプションを備えた「オールイン」機能セットの恩恵を受けることができます。さらに、第 4 世代 AMD EPYC プロセッサは、AI および ML アプリケーションに不可欠な DDR5 メモリと PCIe Gen 5 をサポートするようになりました。もちろん、エンタープライズ SSD ベンダーは、自社のドライブをメインストリームに届けるために懸命に努力し、第 4 世代の XNUMX 倍の帯域幅の可能性を解き放ちます。
AMD Genoa 9004 シリーズ SKU
モデル | コア | デフォルトのTDP | cTDP | ベース (GHz) | ブースト (GHz) |
9654 | 96 | 360w | 320-400w | 2.4 | 3.7 |
9634 | 84 | 290w | 240-300w | 2.25 | 3.7 |
9554 | 64 | 360w | 320-400w | 3.1 | 3.75 |
9534 | 64 | 280w | 240-300w | 2.45 | 3.7 |
9454 | 48 | 290w | 240-300w | 2.75 | 3.8 |
9354 | 32 | 280w | 240-300w | 3.25 | 3.8 |
9334 | 32 | 210w | 200-240w | 2.7 | 3.9 |
9254 | 24 | 200w | 200-240w | 2.9 | 4.15 |
9224 | 24 | 200w | 200-240w | 2.5 | 3.7 |
9124 | 16 | 200w | 200-240w | 3.0 | 3.7 |
9474F | 48 | 360w | 320-400w | 3.6 | 4.1 |
9374F | 32 | 320w | 320-400w | 3.85 | 4.3 |
9274F | 24 | 320w | 320-400w | 4.05 | 4.3 |
9174F | 16 | 320w | 320-400w | 4.1 | 4.4 |
9654P | 96 | 360w | 320-400w | 2.4 | 3.7 |
9554P | 64 | 360w | 320-400w | 3.1 | 3.75 |
9454P | 48 | 290w | 240-300w | 2.75 | 3.8 |
9354P | 32 | 280w | 240-300w | 3.25 | 3.8 |
AMD ジェノア – Zen 4 アーキテクチャ
今年 4 月にリリースされた Zen 9004 は、AMD EPYC 9004 CPU の新しいマイクロアーキテクチャであり、AMD のこれまでで最高のパフォーマンスのコアを搭載しています。これにより、EPYC 4 CPU はパフォーマンスとエネルギー効率において新たなレベルのリーダーシップを実現し、お客様はデータセンターの最新化を加速してアプリケーションのスループットを向上させ、より実用的な洞察を得ることができます。 Zen 7000 は、新しいコンシューマ グレードの Ryzen XNUMX デスクトップ プロセッサも駆動します。
Zen 4 がもたらす大きな変更の 4 つは、DDR5 メモリがサポートされなくなり、DDR4 のみに移行したことです。さらに、Zen XNUMX は新しい AMD EXPO SPD プロファイルをサポートしており、RAM メーカーによるより包括的なメモリ チューニングとオーバークロックが可能になります。
その他の新機能には次のようなものがあります。
- 高速プライベート 1M L2 キャッシュ
- コアごとに L2 から L3 までのより多くの未解決ミスをサポート
- L3 からメモリまで、より多くの未解決のミスをサポート
- L3 および L2 ミス BW の改善
- より高い帯域幅により、プリフェッチの改善が可能になります
Zen 4 マイクロアーキテクチャの概要
Zen 4 対 Zen 3
AMD EPYC 9004 シリーズは前世代と比べて改善されています
新しい AMD Genoa は、CPU あたり最大コア数がなんと 96 個に増加するなど、さまざまな顕著な改善を提供します。これは、過去数世代と比較して重要です。
- 最大 64コア 7773X および 7763 では CPU ごとに (3rd EPYC世代)モデル
- 最大 40コア 8380 では CPU ごとに (3rd Gen Xeon Platinum) モデル
AMD は、解決までの時間の短縮に関して、これは競合製品と比較して約 2.3 倍のパフォーマンス (ワットあたりのパフォーマンスでは 1.6 倍) になると示しています。これは、次世代リリースで確認された全体的なパフォーマンスの最大の向上です。企業の 4 秒あたりのビジネス オペレーションの場合、XNUMXth Gen AMD は、自社の EPYC CPU が最大 2.6 倍のパフォーマンスを提供すると予想していますが、Arnold Autodesk を使用するとレンダリング速度が 2.4 倍向上することをほのめかしています。
また、Zen 4 アーキテクチャによりコア パフォーマンスが大幅にアップグレードされ、サーバー CPU の IPC 向上が最大 14 パーセント増加する可能性があります。
新しい EPYC 9004 シリーズには、スケーリングのためにプロビジョニングされたリーダーシップ プラットフォーム機能もあります。
- シングルランクのパフォーマンスが強化された 12 チャンネル DDR5-4800
- 128L 32Gps および 8L 8Gps マルチファンクション SERDES (シリアライザー/デシリアライザー)
さらに、CXL1.1+ メモリ サポート (CXL "Type3") も備えており、DDR および新興メモリ向けの高度なメモリ接続機能に加え、SEV-SNP、QoS、階層型メモリ管理拡張機能が含まれています。セキュリティを強化するために、SEV-SNP キー拡張と AES-256-XTS をサポートしています。
AMD EPYC 9004 シリーズ メモリ
AMD Genoa CPU は、CPU あたり 12 チャネル、ソケットあたり 6 TB の容量、最大 DDR4800 をサポートし、理論的にはピーク帯域幅で最大 460 GB/s に達することもできます。
ここでは、第 3 世代と第 4 世代のメモリ帯域幅パフォーマンスの比較を一目で確認できます。
AMD EPYC 9004 シリーズ CPU の配置
前世代と同様に、AMD は新しい CPU を 3 つの異なるグループに分類しました。
- コアパフォーマンス、キャッシュ/コア比の高い高周波数 CPU で構成されています。これに該当するモデルには、9474F (48 コア @ 360W)、9374F (32 コア @ 320W)、9274F (24 コア @ 320W)、および 9174F (16 コア @ 320W) が含まれます。
- コア密度、最高のコア数とスレッド数の CPU で構成されます。これに該当するモデルには、9654/P (96 コア @ 360W)、9634 (84 コア @ 290W)、9554/P (64 コア @ 360W)、9534 (64 コア @ 280W) および 9454/P (48 コア @ 290W) が含まれます。 )。
- バランスが取れて最適化されたパフォーマンス、パフォーマンスと TCO のバランスが取れた CPU で構成されています。これに該当するモデルには、9354/P (32 コア @ 280W)、9334 (32 コア @ 210W)、9254 (24 コア @ 200W)、9224 (24 コア @ 200W)、および 9124 (16 コア @ 200W) が含まれます。
AMD Genoa 9004 CPU パフォーマンス
ベンチマーク構成
初期テストでは、現在のトップエンドの Intel プラットフォームと AMD プラットフォームを、CPU 集中型のワークロードの初期バッチ内で相互に配置しました。 Intel プラットフォームについては、Quanta シャーシ内のデュアル CPU AMD EPYC 8380 プラットフォームに対して、Intel OEM サーバーを中心に構築された初期のデュアル CPU Intel 9654 プラットフォームを活用しました。
インテル プラットフォームの仕様:
2 x Intel Xeon Platinum 8380 40 コア CPU
16 x 32GB 3200MHz DDR4
Windows Server 2022 OS
AMD プラットフォームの仕様:
2 x AMD EPYC 9654 96 コア CPU
24 x 64GB 4800MHz DDR5
Windows Server 2022 OS
V線
V-Ray Benchmark は、さまざまな CPU と GPU をスコアリングして比較するための Chaos Group のアプリケーションです。 Chaos Group は、レイ トレーシング テクノロジに特化したビジュアライゼーションとレンダリングに関する取り組みで知られています。 V-Ray ベンチマークには、CPU と GPU の任意の組み合わせをテストし、システムのパフォーマンスを別のシステムと比較するためのカスタム ビルド テスト シーンが含まれています。
私たちのラボでは、CPU 専用モードで V-Ray ベンチマークを利用しました。潜在的なボトルネックを最小限に抑えるために、Solidigm P5520 7.68TB NVMe SSD と Windows Server 2022 のクリーン インストールを利用しました。V-Ray のリーダーボードのトップは、以前は 2x AMD EPYC 7K83 64 コア プロセッサ システムで、 100,844 回のテストの平均値は 6 という驚異的な結果でした。 2x AMD EPYC Genoa 96 コアを搭載したサンプル システムは、126,940 回のテストで平均 9 のスコアを獲得しました。インテルシステムとの比較
Firefox のソースからのビルド
Mozilla のブラウザである Firefox は、巨大なオープンソース プロジェクトです。 Mozilla は、ソース コードからプロジェクトを自分でコンパイルできる機能を提供したいと考えています。これは、パフォーマンスを比較するツールとしてますます普及しています。このためのダウンロードは、コンパイルする必要がある数千のファイルを含む数ギガバイトになります。
私たちのテストでは、Intel Xeon 6 リグの 57 分 8380 秒というタイムに感銘を受けました。それは、ジェノア リグで起動するまでのことであり、6 分 33 秒という非常に速いタイムでした。 10番目のコンパイル時間。比較のために、液体窒素を安定的に供給し、過剰な電圧を与えれば、最上位のワークステーションは XNUMX 分もかからずにこのタスクを完了できます。これは、私たちが最初からかなりの生の馬力を処理していることを意味します。このチップたち。
FF ソースからビルドする | |
2×AMD 9654 96コア | 6:33.85 |
2×インテル 8380 40コア | 6:57.85 |
Blender – CLI ベンチマーク
Blender Benchmark は、CPU および GPU のベンチマーク シーンで確立された標準です。 Blender は、オープンソースの 3D モデリングおよびアニメーション ツールであり、非常に先進的であり、この分野のリーダーとみなされています。 Genoa EPYC プロセッサのテーマと一致して、高密度ラック展開で CPU と潜在的な GPU の代替が可能なブレンド アーキテクチャの柔軟性を示すためにこれを利用しています。
Blender には、Monster、Junkshop、Classroom として知られる 3 つのベンチマークがあります。これら 3 つのシーンは順番にレンダリングされ、各セクションにスコアが与えられ、合計スコアが加算されます。
ブレンダーテスト | 2×AMD 9654 96コア | 2×インテル 8380 40コア |
モンスター | 1788.189128 | 671.145395 |
ジャンクショップ | 1062.533142 | 407.141514 |
教室 | 850.646333 | 320.507039 |
トータル | 3701.368603 | 1398.793948 |
Genoa リグは、Monster で 3701、Junkshop で 1788.2、Classroom ベンチマークで 1062.5 と、合計 850.6 という圧倒的なスコアを記録しました。 Intel のコア数が約 41% しかないことを考えると、Genoa と Intel Xeon Platinum を比較するのは、ある意味不公平に思えるかもしれませんが、データを見てコア数の違いを正規化すると、興味深い結果が得られます。 。 AMD Genoa チップは、新しいアーキテクチャ、命令セット、DDR5 の使用により、Intel リグよりも約 10% 高速です。
2×AMD 9654 96コア | 相対的なインテルコア数のパーセント | 2×インテル 8380 40コア |
192コア | 41.67パーセント | 80コア |
384スレッド | 41.67パーセント | 160スレッド |
2×AMD 9654 96コア | 2×インテル 8380 40コア | |
Blender 合計スコア | 3701 | 1399 |
コア/スレッド | 192/384 | 80/160 |
インテルコア数/AMD | 41.67パーセント | |
Intel/AMD の直接スコア比較 | 37.79パーセント | |
コア正規化AMDスコア | 1542 | |
相対的な Intel/AMD、正規化されたコア | 90.70パーセント |
Cinebench R23
Maxon の Cinebench は、標準化されたテスト方法論と、マルチコアおよびシングルコアのパフォーマンスをベンチマークするための現実世界のテストの使用のおかげで、しばらくの間ベンチマークの主流となってきました。 Cinebench の最新バージョンである R23 には、これまで回避する必要がなかった制限があります。ベンチマークできるのは 256 コア/スレッドのみです。私たちのテスト リグには 384 があります。興味深いことに、コア数が 256 に制限されている多くの「標準」ベンチマークとアプリケーションが実行されました。そのため、私たちが向かう超コア数の未来に向けてアップデートが必要なのは Cinebench だけではありません。に向かって。
この制限に対処するために、196 つのテストを同時に実行し、各インスタンスを 0 スレッドに制限して負荷を均等に分割しようとしました。通常、CPU アフィニティはタスク マネージャーで設定できますが、Cinebench でこの操作をブロックしているものがあり、CPU 優先度のために API が呼び出される根本的な方法で設定されたフラグであると考えられます。権限の低いユーザーとして実行し、コマンド ラインの「start /affinity NODE XNUMX」フラグを使用して起動して強制的に実行しようとしましたが、アプリケーションを単一の NUMA ノードにロックできませんでした。
プログラムに特定のアフィニティを割り当てることができなかったため、アプリケーションを 80 回実行して一緒に起動しました。結果では、アプリの 100 つのインスタンスからの XNUMX つの大幅に異なるスコアが示されましたが、CPU 使用率を監視すると、テスト中に XNUMX ~ XNUMX パーセントの使用率の間を行き来することが観察できました。
Cinebench 単一インスタンス | 2×AMD 9654 96コア | 2×インテル 8380 40コア |
マルチスレッド(256キャップ) | 85,160 | 70,540 |
単芯 | 972 | 985 |
MP比 | 87.65x | 71.63x |
2 つの Cinebench インスタンス | ||
AMD テスト実行 1 | AMD テスト実行 2 | |
スコア、第 1 インスタンス | 82,063 | 68,231 |
スコア、2 番目のインスタンス | 57,557 | 57,221 |
トータル | 139,620 | 125,452 |
最終的な考え
AMD EPYC 9004 CPU のベンチマーク プロセスは、控えめに言っても興味深い演習でした。初期のレビュープロセスで私たちが直面した課題は、CPU の状況が超高密度モデルに移行するにつれて、ソフトウェア開発者が対処しなければならない全体的な課題を示しています。これを利用できる既製のアプリケーションはいくつかありますが、スレッド数の一定のしきい値を超えて拡張できないソフトウェアの限界がますます見つかりました。
ラボでは、これらの新しい CPU を現実のシナリオでテストできるようにするために、いくつかの自社開発の Tensorflow Machine Learning ベンチマークに取り組んでいます。新しいアプリケーションの結果に自信があり、複数のプラットフォームと CPU 世代にわたって検証した場合には、結果をフォローアップします。
しかし今のところ、これまで Quanta サーバーで見てきたように、AMD Genoa の発売は非常にエキサイティングです。プラス、 HPE と デル は、それぞれ 1 つのシステム (2 CPU シャーシ XNUMX つと XNUMX CPU シャーシ XNUMX つ) を提供するサーバーを発表しました。これにより、AMD Genoa が直ちにエンタープライズに導入され、ハイパースケーラーだけを超えて Genoa のフットプリントが急速に拡大します。
大きな疑問は明らかです。AMD Genoa には投資する価値があるのでしょうか?これは支出を正当化するという観点からは作業負荷によって決まりますが、 VMware の DPU、これらの新しい CPU テクノロジーは、計算能力、セキュリティ、効率の点で多くのメリットをもたらします。第 3 世代 EPYC をこれらに置き換えるのはおそらく少し時期尚早ですが、ジャンプする理由を待っていた人は誰でも、ジェノアがテーブルにもたらしたものを見て非常に満足するはずです。
私たちにはまだ多くのテストと作業があり、間もなくインテル Sapphire Rapids が提供されるため、それぞれが提供する最高のものを比較したいと考えています。しかし今のところ、AMD Genoa は非常に魅力的であり、組織が AMD が提供するこれらすべてのコアと効率性の影響をよりよく理解できるように、インフラストラクチャ更新の PoC に含めるべきです。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード