AMD EPYC 9754S は、SMT が無効になっている HPC ワークロード向けに設計されており、デフォルトの TDP 128 W で 128 コアと 360 スレッドを提供します。
昨年、AMD は第 4 世代 EPYC でサーバー CPU ラインを拡張しました。 128 コア、256 スレッドの EPYC 9754 が最高の料金を獲得しましたが、SKU マトリックスではそのすぐ下に AMD EPYC 9754S があります。 9754 つのチップの違いは単純ですが、劇的です。 9754S では、同時マルチスレッド (SMT) が無効になっています。これは、128S が 9754 と同じ 128 コアを提供することを意味しますが、SMT を無効にすると 256 スレッドと比較して、わずか XNUMX スレッドになります。この変更は、すでに SMT を無効にしているお客様に嬉しい割引をもたらします。
モデル | コア | 最大スレッド数 | デフォルトのTDP | ベース周波数(GHz) | ブースト周波数(GHz) | L3キャッシュ(MB) |
---|---|---|---|---|---|---|
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.2 | 3.0 | 256 |
AMD SMT とは何ですか? 9754S が存在する理由は何ですか?
SMT を使用すると、単一の EPYC CPU コアが 2 つのスレッドを同時に処理できるため、プロセッサのリソースをより効率的に使用できます。一方のスレッドがメモリからデータがロードされるのを待っているとき、またはアイドル状態のときに、もう一方のスレッドが命令を実行している可能性があります。これは、コアがアイドル状態で過ごす時間が減り、パフォーマンスが向上する可能性があることを意味します。これは、仮想化やレンダリングなどのユースケースに特に当てはまります。
SMT を無効にすると、メーカーはこれらのチップを下位層の製品として販売できるようになり、特定のパフォーマンスと安定性の基準を確実に満たすことができます。 SMT が無効になっている CPU は、ビニング プロセス、市場セグメンテーション戦略、特定のパフォーマンスや効率のニーズに応えたいという要望の影響を受ける可能性があり、メーカーが製品計画やポジショニングにおいて微妙なアプローチをとっていることがわかります。
とはいえ、すべてのワークロードが SMT の恩恵を受けるわけではなく、多くの場合、AMD サーバーでは BIOS で SMT が無効になっている可能性があります。これは効果的な調整ですが、別の重要な点が生じます。 SMT を無効にした 9754S チップは、9754 よりも若干安価です。いずれの場合でも、シングルスレッド アプリケーション、計算ワークロード、および CPU 遅延が非常に重要なユースケースでは、SMT を無効にすることでメリットが得られます。
AMD EPYC 9754S と EPYC 9754 のパフォーマンス
定期テストのうち 2024 つ、y-cruncher と Cinebench 9754 を実行して、SMT の有無でどのようなパフォーマンスの違いが得られるかを確認したいと考えています。 SMT をまったく使用しない 9754S にどのような利点があるかを確認するために、SMT をオンまたはオフにして 9754 を実行しながら、9754S と XNUMX を相互に実行しました。
テストプラットフォームと仕様:
- TYAN トランスポート HX TN85-B8261
- 512GB DDR5
- Windows Serverの2022
Cinebench 2024
まずは、非 S モデルで SMT が有効になっている Cinebench 2024 です。ここでは、実行ごとの変動の差の範囲内にあることがわかります。
Cinebench 2024 CPU | 2x EPYC 9754S | 2x EPYC 9754 |
---|---|---|
CPUマルチコア | 2,682 | 2,587 |
CPUシングルコア | 68 | 69 |
MP比 | 39.19x | 37.64x |
特に y-cruncher が選択されたのは、プログラムのアーキテクチャが総合的なシステム テストとして位置付けられているためです。システム メモリに収まる程度の大規模な Pi 計算を実行することで、SMT が CPU とメモリに制約されたワークロードに悪影響を与える可能性があるという長年の直感を証明することを目的としました。それが何を意味するのかを説明する前に、まず結果を見てみましょう。
y-クランチャー 0.8.3
y-cruncher 0.8.3 合計計算時間 (秒) (低いほど良い) |
2x EPYC 9754S | 2x EPYC 9754 (SMT オフ) | 2x EPYC 9754 (SMT オン) | 9754 SMT オフのパフォーマンス向上 |
---|---|---|---|---|
1億 | 13.481 | 13.546 | 14.139 | 4.65% |
2.5億 | 23.818 | 24.144 | 28.111 | 15.27% |
5億 | 40.760 | 40.797 | 49.271 | 17.27% |
10億 | 77.409 | 77.959 | 95.420 | 18.88% |
25億 | 203.303 | 202.124 | 233.629 | 12.98% |
50億 | 475.557 | 476.949 | 520.349 | 8.61% |
100億 | 1,248.458 | 1,251.36 | 1,242.419 | -0.49% |
y-クランチャー 0.8.4
y-cruncher 0.8.4 合計計算時間 (秒) (低いほど良い) |
2x EPYC 9754S | 2x EPYC 9754 (SMT オフ) | 2x EPYC 9754 (SMT オン) | 9754 SMT オフのパフォーマンス向上 |
---|---|---|---|---|
1億 | 13.480 | 13.56 | 14.573 | 7.50% |
2.5億 | 23.680 | 23.501 | 28.649 | 17.34% |
5億 | 40.819 | 40.547 | 50.082 | 18.50% |
10億 | 78.523 | 77.466 | 93.842 | 16.32% |
25億 | 206.399 | 206.078 | 236.070 | 12.57% |
50億 | 483.797 | 482.79 | 521.867 | 7.29% |
100億 | 1,269.484 | 1,266.83 | 1,253.446 | -1.28% |
結果分析
AMD SMT の複雑さを掘り下げると、システム パフォーマンスへの影響について技術コミュニティ内で説得力のある対話が行われます。 SMT は本質的に、パフォーマンスの向上を追求する人にとって簡単な選択肢であるように見えます。理論的には、SMT を有効にすることで理想的なスケーリングが実現できるのであれば、それを有益なアーキテクチャ上の選択肢として採用しないのはなぜでしょうか。
SMT の効率とコア アーキテクチャの関係は、白黒はっきり付けられるものではありません。精彩のない SMT スケーリングは、必ずしも実装の欠陥を示しているわけではありません。実際、これは、SMT が目立った違いを生む余地をほとんど残さない堅牢なコア設計を示唆している可能性があります。この矛盾は、業界における重要な洞察を強調しています。プロセッサ メーカーは、SMT または同様のテクノロジで画一的な利点を主張することはできません。彼らは、SMT は特定の使用例では追加のパフォーマンスを絞り出すことができますが、他のシナリオでは欠点がないわけではないことを認めています。
ハイパフォーマンス コンピューティングとスーパーコンピューティング タスクのレンズを通して、SMT の限界がより明らかになります。コアあたりのスレッド数を 2 倍にするというアイデアは有望に聞こえるかもしれませんが、現実にはコアが 2 倍になるわけではありません。極端な場合には、スレッドがキャッシュ リソースを獲得するために競合するため、パフォーマンスの低下につながる可能性があります。それにもかかわらず、大部分のマルチスレッド アプリケーション、特にキャッシュ競合がないアプリケーションでは、SMT はパフォーマンスを向上させ、主にその可能性を最大限に活用できるタスクで威力を発揮します。
閉じた思考
AMD SMT は、企業内で一般的なさまざまなワークロードに非常に役立ちます。ただし、すべてのワークロードが SMT を必要としたり、SMT から恩恵を受けるわけではありません。私たちのテストを通じて、AMD が製造におけるばらつきをどのように利用して、独自の価値提案を持つ堅実な製品を提供できるかを示しました。 SMT を使用しないピュアコアを必要とする特定の種類のワークロード向けのプラットフォームを設計している組織は、工場出荷時に SMT が永久に無効になっている AMD EPYC 9754S を購入することで、費用を少し節約できます。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード