AMD は 3 の一般提供を発表しました。rdAMD 3D V-Cache テクノロジー (以前のコードネーム「Milan-X」) を搭載した第 3 世代 AMD EPYC プロセッサーは、3D ダイスタッキングを活用した世界初のデータセンター CPU です。これらの新しいプロセッサは、Zen 3 コア アーキテクチャを備えており、すでに優れた第 3 世代 EPYC ポートフォリオを拡張します。非スタック XNUMX との比較rd-第 66 世代 EPYC プロセッサでは、AMD は、さまざまな技術的なコンピューティング ワークロードにわたってパフォーマンスが最大 XNUMX% 向上すると主張しています。
AMD は 3 の一般提供を発表しました。rdAMD 3D V-Cache テクノロジー (以前のコードネーム「Milan-X」) を搭載した第 3 世代 AMD EPYC プロセッサーは、3D ダイスタッキングを活用した世界初のデータセンター CPU です。これらの新しいプロセッサは、Zen 3 コア アーキテクチャを備えており、すでに優れた第 3 世代 EPYC ポートフォリオを拡張します。非スタック XNUMX との比較rd-第 66 世代 EPYC プロセッサでは、AMD は、さまざまな技術的なコンピューティング ワークロードにわたってパフォーマンスが最大 XNUMX% 向上すると主張しています。
新しい AMD EPYC プロセッサは、L3 キャッシュを 768 倍の 1.5MB または 2P サーバーあたり 3GB に増やし、これは業界最高値となります。非 XNUMXD V キャッシュ CPU と同じソケット、ソフトウェア互換性、最新のセキュリティ機能を提供しながら、特定の技術的なコンピューティング ワークロードのパフォーマンスに新たな基準を提供します。
技術的なコンピューティングのワークロードは、キャッシュ サイズの増加によって確かに恩恵を受けるでしょう。 AMD の 3D V-Cache テクノロジーは、AMD Zen 3 コアをキャッシュ モジュールに結合することで、この増加の背後にある物理的な課題も解決します。その結果、レイテンシーを最小限に抑えてスループットを向上させながら、L3 の量が増加します。
新しいプロセッサが特定の結果が得られるまでの時間のワークロードをどのように改善するかについて、AMD が示した例をいくつか紹介します。
- EDA – 16 コアの AMD EPYC 7373X CPU は、EPYC 66F73 CPU と比較して、Synopsys VCS 上で最大 3% 高速なシミュレーションを実現できます。
- FEA – 64 コアの AMD EPYC 7773X プロセッサは、競合他社の最上位スタック プロセッサと比較して、Altair Radioss シミュレーション アプリケーションで平均 44% 高いパフォーマンスを実現できます。
- CFD – 32 コア AMD EPYC 7573X プロセッサは、Ansys CFX を実行している場合、同等の競合他社の 88 コア数プロセッサよりも 32 日あたり平均 XNUMX% 多くの CFD 問題を解決できます。
TCO の削減と環境の持続可能性
この改善により、顧客は導入するサーバーの数が減り、データセンター全体の電力消費量が削減され、総所有コスト (TCO) が削減されます。もう 1 つの優れた利点は、二酸化炭素排出量の削減です。
組織は常にパフォーマンス、電力と冷却、ライセンスコストの間で最適なものを見つけようとしているため、ラックスペース管理は HPC ワークロードにとって非常に重要です。たとえば、Dell の 1 ソケット オプション (R6515 および R7515) は、AMD の新しい 32 および 64 コア プロセッサと組み合わせると、一部の組織にとって非常に魅力的になります。
これらすべてを組み合わせることで、AMD 3D V-Cache を備えた新しい第 3 世代 AMD EPYC プロセッサーは、環境の持続可能性にプラスの影響を与えます。
3D V キャッシュを備えた AMD EPYC プロセッサの仕様と価格
コア | モデル | #CCD | TDP(W) | cTDP範囲(W) | 周波数ベース(GHz) | 最大ブースト周波数 (最大 GHz) | L3キャッシュ(MB) | DDR チャネル | 価格(1区) |
64 | 7773X | 8 | 280 | 225-280 | 2.20 | 3.50 | 768 | 8 | $8,800 |
64 | 7763 (前) | 8 | 280 | 225-280 | 2.45 | 3.50 | 256 | 8 | $8,640 |
32 | 7573X | 8 | 280 | 225-280 | 2.80 | 3.60 | 768 | 8 | $5,590 |
24 | 7473X | 8 | 240 | 225-280 | 2.80 | 3.70 | 768 | 8 | $3,900 |
16 | 7373X | 8 | 240 | 225-280 | 3.05 | 3.80 | 768 | 8 | $4,185 |
すべての Milan-X モデルには 8 つのコア コンプレックス ダイ (CCD) があり、それぞれの L96 キャッシュに 3MB の合計 786MB があります (単一のコアは 96MB 全体にアクセスすることもできます)。
AMD 3D V-Cache を搭載した AMD EPYC プロセッサはあなたに適していますか?
AMDは、新しいCPUが特定の使用例に合わせて設計されているため、すべての組織にメリットをもたらすわけではないことについて、かなり透明性を保っています。
そのため、AMD は、Milan-X に適している可能性のある次のワークロードを示しています。
- L3 キャッシュ サイズの影響を受けるワークロード
- L3 キャッシュ容量が大きいワークロードはミスします (たとえば、データ セットが L3 キャッシュに対して大きすぎることがよくあります)。
- L3 キャッシュ競合ミスが多いワークロード (たとえば、キャッシュに取り込まれたデータの結合性が低い)
このような種類のワークロードが発生する可能性のある分野には、流体力学 (CFD)、有限要素解析 (FEA)、電子設計自動化 (EDA)、構造解析などがあります。
とはいえ、すでに L3 キャッシュ ミス率がゼロマークに近いワークロード、L3 キャッシュ コヒーレンシー ミスが高い (つまり、データがコア間で高度に共有されている)、または CPU に依存している可能性がある (ただし、データを反復的に操作するのではなくデータのみを使用する) ワークロードは、 )ここではあまりメリットがないと思われます。
パートナーが AMD 3D V-Cache による AMD EPYC プロセッサーのサポートを発表
AMD には、新しい 3 つのサポートを発表した Dell Technologies を含む数十のパートナーがいます。rd AMD 7003D V-Cache テクノロジーを搭載した第 3 世代 AMD EPYC 3 プロセッサ。これにより、PowerEdge サーバーは、HPC ワークロードにおけるノード数の増加 (およびノード間の通信の複雑さ) に対処できるようになります。 L768 キャッシュを XNUMX 倍の XNUMXMB に増やし、データ遅延を最適化すると、特に上で示した技術的なコンピューティング環境において、PowerEdge HPC の全体的なパフォーマンスが向上します。
デルは、AMD 7003D V-Cache テクノロジーを搭載した 3 プロセッサを実行する技術的なワークロードにより、従来のプロセッサと比較して、Ansys CFX (Turbomachinery CFD ソフトウェア) で最大 61%、Altair Radioss (構造解析ソルバー) での FEA で最大 56% パフォーマンスが向上すると示しています。 3rd3D V-Cache を持たない -gen AMD プロセッサ。
たとえば、EPYC 7525X CPU を搭載した PowerEdge R7773 は、SAP SD (販売および流通) ベンチマークで 86,000 ユーザーを実行して世界記録を樹立しました。これは、以前の記録を 14% 上回るものです。 SD ベンチマークは、組織が顧客および製品関連のデータをどの程度適切に保存および管理できるかを示す指標です。この種のデータに高速かつ低遅延でアクセスできることは、ビジネス アーキテクチャにおいて最も重要です。
L768 キャッシュが 3MB に増加したことにより、メモリの遅延と帯域幅が大幅に改善され、PowerEdge サーバーがデジタル製造ワークロードをサポートできるようになりました。ここで最も恩恵を受けるのは、数値流体力学や有限要素解析などのアプリケーションです。デルはまた、メモリ遅延が約 25 ~ 35% 削減されたと報告しており、これはレジスタ転送レベル (RTL) シミュレーションに利益をもたらすだけでなく、金融業界の HPC にとって重要な影響を与えるとデルは主張しています。
Supermicro は 3 つのサポートも発表しました。rd-先進的なサーバーに AMD 3D V-Cache テクノロジーを搭載した Gen AMD EPYC プロセッサー。 HPC 会社は、高密度でパフォーマンスが最適化されたことを示しています。 スーパーブレード、マルチノード最適化 ツインプロ 最適化されたデュアルプロセッサ 超 新しい Milan-X プロセッサをテクニカル コンピューティング環境で使用すると、システムのパフォーマンスが大幅に向上します。
たとえば、SuperBlade サーバーは、AMD 17D V-Cache テクノロジーを搭載していないモデルと比較して最大 3% の向上を達成し、SPECjbb 2015-Distributed Critical-jOPS および max-jOPS ベンチマークの世界記録を主張しています。
さらに、新しい AMD プロセッサを使用することで、Supermicro SuperBlade は 20U シャーシに最大 8 個の CPU (シャーシに組み込まれたネットワーク スイッチを含む) を搭載できるようになります。共有冷却システムと電源システムにより電力使用量が削減され、フル装備の 40U シャーシで最大メモリは最大 8TB に達します。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | TikTok | RSSフィード