AMD Instinct MI300 シリーズは、AI 用のアクセラレータ アーキテクチャに新しいアプローチを導入し、高度なテクノロジーを組み合わせてハイ パフォーマンス コンピューティングと人工知能の進歩を推進します。 MI300 シリーズは、その洗練された設計により、計算能力と効率の限界を再構築することを約束します。
AMD Instinct MI300 シリーズは、AI 用のアクセラレータ アーキテクチャに新しいアプローチを導入し、高度なテクノロジーを組み合わせてハイ パフォーマンス コンピューティングと人工知能の進歩を推進します。 MI300 シリーズは、その洗練された設計により、計算能力と効率の限界を再構築することを約束します。
MI300ファミリーの概要
ここでカバーすべき根拠はたくさんあり、この 2 つの間のニュアンスは微妙ですが重要です。
製品仕様 | MI300x | MI300a |
---|---|---|
CPUコア | 単一デバイスとして 12 個のチップレット • 4 つの IOD と 8 つの XCD • Infinity Fabric AP と 3D パッケージング |
単一 APU として 13 個のチップレット • 8c 16t x86 CPU x 3 CCD (合計 24 コア) • 4 つの IOD、3 つの CCD、および 6 つの XCD • Infinity Fabric AP と 3D パッケージング |
キャッシュ(L3) | 32 コアで共有される 3 MB LXNUMX キャッシュ | L1とL2のみ |
HBM3 の容量 | 196GB | 128GB |
インフィニティキャッシュ | • 256 TB/秒のピーク BW で 17 MB • XCD帯域幅増幅 • HBM の電力削減 • マルチ XCD および CCD キャッシュの一貫性 • CPU メモリ レイテンシのプリフェッチャー |
• 256 TB/秒のピーク BW で 17 MB • XCD帯域幅増幅 • HBM の電力削減 • マルチ XCD キャッシュの一貫性 |
統合アーキテクチャ | 無し | 統合された HBM と Infinity Cache • CCD および XCD データ共有 • データ移動の削減 • 簡素化されたプログラミング |
Zen 4 CPU コンプレックス ダイ (CCD) と機能強化
MI300A APU の中心には、4 つのマルチスレッド AMD 「Zen 4」 x86 コアを備えた「Zen 1」 CPU コンプレックス ダイ (CCD) があり、それぞれが 2MB の L32 キャッシュと 3 MB の共有 L16 キャッシュを誇ります。この堅牢なアーキテクチャは、同時マルチスレッド (SMT) をサポートし、512b データ パスを使用した BFLOAT256、VNNI、AVX-48 などの重要な ISA アップデートを組み込みます。メモリ システムも同様に優れており、48b/XNUMXb の仮想/物理アドレス指定機能を備えており、広範なメモリ サポートを保証します。
CDNA 3 計算ユニットとメモリ システム
MI3 シリーズの CDNA 300 コンピューティング ユニットには、注目すべき機能強化が導入されています。各 Accelerator Complex Die (XCD) には 38 個の CDNA 3 計算ユニットが収容され、4 MB の共有 L2 キャッシュとバイト/FLOP に最適化された L1 キャッシュによって支えられています。これらの単位は、TF32 や FP8 などのさまざまな数値形式をサポートし、OCP FP8 標準に準拠しています。このメモリ システムは、AMD の革新的な Infinity Cache と Infinity Fabric Interface のおかげで、データ共有効率を最大化し、遅延を短縮するように設計されています。
3.5D ハイブリッド ボンド パッケージング: 統合における飛躍
MI300 ファミリの主なハイライトは、パッケージ内のコンピューティングと HBM (高帯域幅メモリ) を大幅に増加させる 3.5D ハイブリッド ボンド パッケージングです。このパッケージング方法は、高密度で電力効率の高いチップレット相互接続を提供し、システムレベル全体の効率を高めます。 MI300 シリーズはモジュール構造アプローチを採用しており、柔軟な構成と拡張性が可能です。
高度な電源管理と熱設計
MI300 ファミリの電源管理システムは、電力効率と熱抽出に焦点を当てた設計で、集中的な計算ワークロードを処理できるように調整されています。独自の熱アーキテクチャは 550W を超える TDP (熱設計電力) をサポートし、厳しい条件下でも信頼性の高いパフォーマンスを保証します。電力供給システムは、さまざまな積層ダイや方向に対応できるよう独創的に設計されており、正確な位置合わせと効率を保証します。
AMD MI300のパフォーマンス
AMD は、Instinct MI300X プラットフォームで興味深い製品を市場に投入し、それを入手困難な Nvidia の H100 HGX に対する強力な競争相手として位置づけています。 MI300X プラットフォームには 1.5 TB の HBM3 メモリが搭載されており、H640 HGX の 100 GB メモリ容量を大幅に上回っていますが、これはすべての開発者にとって嬉しいことです。生の計算能力の面では、AMD が約 10.4 ペタ FLOPS の FP16/BF16 パフォーマンスでリードしており、これは H1.3 HGX の約 100 倍であり、複雑な計算の効率の向上が約束されています。
その他の主要な仕様に関しては、400 つのプラットフォームはほぼ同等であり、総双方向帯域幅とネットワーク インターフェイス機能の進歩が一致しており、それぞれ最大 5 GbE を提供し、128 GB/秒の PCIe Gen XNUMX インターフェイスと同等の性能を維持しています。 AMD と NVIDIA の間の対決は、より多くのメモリとより高速なコンピューティングに対する需要の高まりに応えるためにメーカーが新技術をリリースし続ける中、HPC/AI 分野で前例のない急速な革新を示しています。
閉じた思考
AMD Instinct MI300 シリーズは、高度なモジュラーおよびチップレット アーキテクチャ、強力な CPU および GPU コア、革新的なパッケージングと電源管理を備えており、ハイ パフォーマンス コンピューティングと人工知能において多くの機能を提供します。その設計は、電力、パフォーマンス、効率の考え抜かれた統合を反映しており、将来の計算テクノロジーの新たなベンチマークを設定します。
コンピューティングの世界が MI300 シリーズの完全展開を熱望している中、AMD が HPC および AI ドメインでのイノベーションを継続的に推進しながら、供給と技術の進歩に追いつくことができるかどうかは興味深いでしょう。 AMD は、MI300 シリーズと同等の魅力的なソリューションを提供しています。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード