6 月に AMD は、 第 4 世代 AMD EPYC ファミリ ビジネスの要件に対処するために必要な特殊なワークロード向けに設計されたプロセッサーの数。この発表は、AMDのデータセンターおよびAIテクノロジープレミアの開会中に行われ、以前はAMD Bergamoというコードネームで呼ばれていた第4世代AMD EPYC 97X4プロセッサーの発表が行われました。 AMD EPYC 97X4 プロセッサは、AI アプリケーションやクラウドで実行されているアプリケーションを対象とした、vCPU 密度の向上とパフォーマンスの向上を実現します。
6 月に AMD は、 第 4 世代 AMD EPYC ファミリ ビジネスの要件に対処するために必要な特殊なワークロード向けに設計されたプロセッサーの数。この発表は、AMDのデータセンターおよびAIテクノロジープレミアの開会中に行われ、以前はAMD Bergamoというコードネームで呼ばれていた第4世代AMD EPYC 97X4プロセッサーの発表が行われました。 AMD EPYC 97X4 プロセッサは、AI アプリケーションやクラウドで実行されているアプリケーションを対象とした、vCPU 密度の向上とパフォーマンスの向上を実現します。
AMD ベルガモ
4D V キャッシュを搭載した AMD EPYC Zen 3 プロセッサ (コード名 Genoa-X) は、最近のテクニカル コンピューティング向けの主要な x86 サーバー CPU として認められました。 SPEC.org 報告。これらのプロセッサは、3 コア Zen 96 チップに 4D V キャッシュをもたらし、要求の厳しい技術的なコンピューティング ワークロードに最適です。
AMD によると、製品ロードマップを顧客の環境に合わせることで、汎用、クラウドネイティブ、テクニカル コンピューティングのワークロードに必要なパフォーマンスを提供できるとのことです。 AMD は、1 つのサイズではすべてに適合しないという立場をとっています。これらの新しい AMD EPYC プロセッサは、特定のワークロードのパフォーマンスを向上させるというコンセプトに基づいて設計されました。
アプリケーションはますますクラウドネイティブのワークロード向けに設計されており、迅速な開発、展開、更新が可能になっています。 97 コアを備えた AMD EPYC 4X128 プロセッサは、Ampere と比較して優れたスループットを実現し、主要なクラウドネイティブ ワークロードで最大 3.7 倍のパフォーマンスを実現します。
モデル | コア | 最大スレッド数 | デフォルトの TDP (W) | 基本周波数 (GHz) | ブースト周波数1 (GHz) | L3 キャッシュ (MB) |
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.20 | 3.00 | 256 |
より高速な設計イテレーションと包括的なシミュレーションのニーズに応え、4D V キャッシュを備えた第 3 世代 AMD EPYC プロセッサーは、数値流体力学 (CFD)、有限要素解析 (FEA) などのテクニカル コンピューティング ワークロードにクラス最高の x86 CPU を提供します。 、電子設計自動化 (EDA)、構造解析。これらのプロセッサーは最大 96 個の「Zen 4」コアと 1GB 以上の L3 キャッシュを備えており、製品開発を大幅にスピードアップできます。
モデル | コア | 最大スレッド数 | デフォルトの TDP (W) | 基本周波数 (GHz) | ブースト周波数1 (GHz) | L3 キャッシュ (MB) |
9684X | 96 | 192 | 400W | 2.55 | 3.70 | 1,152 |
9384X | 32 | 64 | 320W | 3.10 | 3.90 | 768 |
9184X | 16 | 32 | 320W | 3.55 | 4.20 | 768 |
AMD Bergamo および Genoa-X ベンチマーク
9754 つの新しい CPU をテストし、SMT を無効にして 128 つ目の CPU をシミュレートしました。ラボには、256 コア 9684 スレッドの Bergamo チップである 96 と、大規模な 192 GB の 1.1D L3 キャッシュと Genoa よりも高いクロックを備えた 3 コア 9754 スレッドの Genoa-X チップである 9754X がありました。 XNUMX 番目をシミュレートするために、AMD が XNUMXS Bergamo チップもリリースしているため、XNUMX で SMT を無効にしました。これはマルチスレッドがなく純粋なコアだけです。 SMT が無効なチップのテストは、このレビューとは別に行われます。
新しくリリースされた AMD Bergamo および Genoa-X CPU のパフォーマンスを評価するために、広範なベンチマーク セットを実施しました。私たちは、マルチコア構成およびシングルコア構成での Cinebench R23 テストから開始しました。これにより、これらのプロセッサーのレンダリング機能に関する貴重な洞察が得られました。
アプリケーションである Cinebench R23 自体が、これほど多くのスレッドを処理できる方法に制限があるようです。 128 コアの上限については言及しましたが、96 コアの Genoa-X 3D キャッシュは、すべてのテストに共通するテーマであるパフォーマンスにおいて真に優れています。
次に、y-cruncher を 1 億桁と 10 億桁のレベルで実行して、特に高度な数値計算を伴うタスクの計算能力を評価しました。
ここでは低いほど良いです。2 プロセッサー 96 コア Genoa の結果は、広範なチューニングを行った結果であり、いくつかの良好な数値を出すことができました。また、Genoa-X と Bergamo チップの両方の標準構成は、チューニングと微調整で有望な可能性を示しています。さらに素晴らしい記録を樹立する数字をいくつか上げています。
次に、Blender ベンチマーク、具体的には Monster、Junkshop、Classroom テストを使用して、グラフィックを多用するレンダリング シナリオでこれらの CPU がどの程度パフォーマンスを発揮するかを測定しました。
Blender ベンチマークでは、512 スレッドの本来のパワーが真に発揮され、ストック構成のみで再びチャートのトップになりました。
最後に、シングルコアおよびマルチコア動作におけるプロセッサのパフォーマンスを幅広く検査することで知られる Geekbench 6 CPU テストを実行しました。この一連のテストにより、AMD Bergamo および Genoa-X プロセッサーの全体的な機能、強み、および段階的な改善についての包括的な見解が得られました。
パフォーマンスの概要
各ベンチマークの生のスコアは次のとおりです。 96 コアの Genoa システムでチューニングと構成を行うのに数か月かかり、新しい AMD Bergamo の標準構成を実行しただけであることに留意してください。
ベンチマーク | 2p/96c ジェノア | 1p/96c ジェノア-X | 1p/128c ベルガモ | 2p/128c ベルガモ | |
---|---|---|---|---|---|
Cinebench R23 Multi | 116744 | 93720 | 103876 | 102125 | |
Cinebench R23シングル | 1294 | 1301 | 1098 | 1089 | |
シネベンチ MP 比 | 90.22 | 72.04 | 94.65 | 93.75 | |
y-クランチャー 1b | 8.882 | 10.296 | 9.568 | 9.184 | |
y-クランチャー 10b | 51.071 | 72.377 | 80.171 | 55.683 | |
ブレンダーモンスター | 1700.647985 | 879.580323 | 1031.49474 | 2038.714424 | |
ブレンダージャンクショップ | 1101.839271 | 605.445705 | 704.167826 | 1382.575225 | |
ブレンダー教室 | 869.476693 | 421.318478 | 506.665693 | 1045.959162 | |
Geekbench 6 CPU シングル | 2048 | 2093 | 1738 | 1723 | |
Geekbench 6 CPU マルチ | 20217 | 21329 | 18683 | 17916 |
AI 向け AMD ベルガモ
一流ベンダーの一連の AI 推論エンジンを搭載し、 UL Procyon AI 推論ベンチマーク 幅広いハードウェアのセットアップと要件に対応します。ベンチマーク スコアは、オンデバイス推論パフォーマンスの便利で標準化された概要を提供します。これにより、社内ソリューションを必要とせずに、現実の状況でさまざまなハードウェア設定を比較対照することができます。
プロセッサ | モデル | 平均推論時間 | 推論時間の中央値 | 総推論数 |
---|---|---|---|---|
2p/96c ジェノア | モバイルネット V3 | 3.61ミリ秒 | 3.63ミリ秒 | 45,800 |
1p/96c ジェノア-X | モバイルネット V3 | 2.71ミリ秒 | 2.72ミリ秒 | 58,631 |
1p/128c ベルガモ | モバイルネット V3 | 3.90ミリ秒 | 3.91ミリ秒 | 41,538 |
2p/128c ベルガモ | モバイルネット V3 | 4.10ミリ秒 | 4.16ミリ秒 | 40,008 |
2p/96c ジェノア | レスネット 50 | 6.36ミリ秒 | 6.34ミリ秒 | 26,525 |
1p/96c ジェノア-X | レスネット 50 | 6.66ミリ秒 | 6.64ミリ秒 | 25,049 |
1p/128c ベルガモ | レスネット 50 | 10.14ミリ秒 | 10.08ミリ秒 | 16,919 |
2p/128c ベルガモ | レスネット 50 | 8.21ミリ秒 | 8.22ミリ秒 | 20,842 |
2p/96c ジェノア | インセプション V4 | 25.98ミリ秒 | 25.99ミリ秒 | 6,555 |
1p/96c ジェノア-X | インセプション V4 | 29.19ミリ秒 | 29.18ミリ秒 | 5,879 |
1p/128c ベルガモ | インセプション V4 | 33.17ミリ秒 | 33.04ミリ秒 | 5,158 |
2p/128c ベルガモ | インセプション V4 | 30.63ミリ秒 | 30.68ミリ秒 | 5,573 |
2p/96c ジェノア | ディープラボ V3 | 25.51ミリ秒 | 25.33ミリ秒 | 5,660 |
1p/96c ジェノア-X | ディープラボ V3 | 28.26ミリ秒 | 27.86ミリ秒 | 5,394 |
1p/128c ベルガモ | ディープラボ V3 | 32.16ミリ秒 | 32.09ミリ秒 | 4,708 |
2p/128c ベルガモ | ディープラボ V3 | 31.16ミリ秒 | 30.57ミリ秒 | 4,807 |
2p/96c ジェノア | ヨロV3 | 34.10ミリ秒 | 34.13ミリ秒 | 4,818 |
1p/96c ジェノア-X | ヨロV3 | 43.59ミリ秒 | 43.58ミリ秒 | 3,831 |
1p/128c ベルガモ | ヨロV3 | 44.50ミリ秒 | 44.39ミリ秒 | 3,739 |
2p/128c ベルガモ | ヨロV3 | 41.35ミリ秒 | 41.38ミリ秒 | 4,001 |
2p/96c ジェノア | レアル・エスガン | 2540.04ミリ秒 | 2524.03ミリ秒 | 71 |
1p/96c ジェノア-X | レアル・エスガン | 3725.07ミリ秒 | 3720.35ミリ秒 | 49 |
1p/128c ベルガモ | レアル・エスガン | 2734.77ミリ秒 | 2717.41ミリ秒 | 66 |
2p/128c ベルガモ | レアル・エスガン | 2291.66ミリ秒 | 2301.35ミリ秒 | 79 |
最終的な考え
新しい 128 コア AMD Bergamo CPU を使用したテストは、コア数の増加による予想される利益を反映しています。実際のパフォーマンスに関しては、新しい CPU はデータと計算集約型のタスクをほとんど楽に処理できるように見えました。特に 3D レンダリングと計算アプリケーションでのトライアルでは、これらの追加コアの真の能力が実証されました。
SMT を有効にした場合と有効にしない場合の両方で、96 コア Genoa よりも処理速度が大幅に向上していることに注目し、AMD のチップレット設計の効率性を強調しました。高度な超高コア数コンピューティングの時代をさらに深く掘り下げると、この 128 コア、256 スレッドのモンスターがラック密度の新たな基準を打ち立てます。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード