Intel Xeon CPU Max シリーズと Intel Data Center GPU Max シリーズを発表

インテルは、HPC と AI に重点を置いたインテル Max シリーズ製品ファミリーを導入することで、SC 22 ラッシュを打ち破りました。 Intel Xeon CPU Max シリーズ (コード名 Sapphire Rapids HBM) と Intel Data Center GPU Max シリーズ (コード名 Ponte Vecchio) は、アルゴンヌ国立研究所の次期 Aurora スーパーコンピューターに搭載されます。

新しい Intel Max ファミリ製品は、競合製品と Intel の最高密度の GPU よりも 4.8 倍高速な CPU メモリ帯域幅を実現すると言われています。 Xeon Max CPU は、高帯域幅メモリを備えた唯一の x86 ベースのプロセッサであり、コードを変更することなく多くの HPC ワークロードを高速化します。 Max シリーズ GPU は、Intel の最高密度のプロセッサであり、100 億個を超えるトランジスタを 47 タイルパッケージに詰め込み、最大 128 ギガバイト (GB) の高帯域幅メモリを搭載します。

新しい製品ファミリーは、両方の新しいプロセッサーに単一のプログラミング環境を提供するオープンソフトウェアエコシステムであるインテルの oneAPI によってサポートされています。インテルの 2023 年の oneAPI および AI ツールは、インテル Max シリーズ製品の高度な機能を有効にする機能を提供します。

Intel コーポレートバイスプレジデント兼スーパーコンピューティンググループゼネラルマネージャーの Jeff McVeigh 氏は次のように述べています。

「HPC ワークロードが取り残されないようにするには、帯域幅を最大化するソリューションが必要です。
コンピューティングを強化し、開発者の生産性を最大化し、最終的には影響を最大化します。インテル Max シリーズ
この製品ファミリーは、oneAPI とともに高帯域幅メモリをより広範な市場に提供し、
CPU と GPU 間でコードを共有し、世界最大の課題をより迅速に解決します。」

GPU ブレードをアルゴンヌへ、CPU ブレードをロスアラモスへ

Max シリーズ製品は 2023 年 XNUMX 月に発売される予定ですが、すでに Aurora スーパーコンピューターに電力を供給するために Max シリーズ GPU を搭載したブレードをアルゴンヌ国立研究所に出荷しており、Xeon Max CPU をロスアラモス国立研究所、京都大学、その他のスーパーコンピューティング施設に納入する予定です。

Xeon Max CPU は、56 つのタイルで構成され、350 ワットのエンベロープ内でインテルの組み込みマルチダイ相互接続ブリッジ (EMIB) テクノロジーを使用して接続された最大 64 個のパフォーマンスコアを提供します。 Xeon Max CPU には、5.0 GB の高帯域幅のパッケージ内メモリと PCI Express 1.1 および CXL1 が含まれています。 Xeon Max CPU は、コアあたり XNUMXGB 以上の高帯域幅メモリ (HBM) 容量を提供し、ほとんどの一般的な HPC ワークロードに十分適合します。 Max シリーズ CPU のその他の利点は次のとおりです。

同じ HCPG パフォーマンスの場合、AMD Milan-X クラスターよりも消費電力が 68% 削減されます。
AMX 拡張機能は AI パフォーマンスを向上させ、INT8 累積演算を備えた INT512 に対して AVX-8 の 32 倍のピークスループットを実現します。
さまざまな HBM および DDR メモリ構成で実行できる柔軟性を提供します。
ワークロードのベンチマーク:
- 気候モデリング: HBM のみを使用した MPAS-A 上の AMD Milan-X よりも 2.4 倍高速。
- 分子動力学: DeePMD では、競合製品と比較して 2.8 倍のパフォーマンス向上
  DDRメモリを搭載した製品。

Max シリーズ GPU は、最も要求の厳しいコンピューティングワークロードを対象として、最大 128 個の Xe-HPC コアを提供します。さらに、Max シリーズ GPU には次のような特徴があります。

業界最高の 408MB の L2 キャッシュと、スループットを向上させる 64MB の L1 キャッシュ
とパフォーマンス。
科学的処理を高速化するように設計されたネイティブレイトレーシングアクセラレーションを備えた唯一の HPC/AI GPU
視覚化とアニメーション。
ワークロードのベンチマーク:
- 財務: Riskfuel クレジットオプション価格設定で、NVIDIA の A2.4 と比較して 100 倍のパフォーマンス向上。
- 物理学: NekRS 仮想原子炉シミュレーションの場合、A1.5 よりも 100 倍向上しました。

Max シリーズ GPU は、さまざまな顧客のニーズに対応するために、いくつかのフォームファクターで利用可能になります。

Max シリーズ 1100 GPU: 300 個の Xe コアと 56GB の HBM48e メモリを搭載した 2 ワットのダブルワイド PCIe カード。 Intel Xe Link ブリッジを介して複数のカードを接続できます。
Max シリーズ 1350 GPU: 450 個の Xe コアと 112GB の HBM を備えた 96 ワット OAM モジュール。
Max シリーズ 1550 GPU: 600 個の Xe コアと 128GB の HBM を備えたインテルの最大パフォーマンス 128 ワット OAM モジュール。

インテルは、個々のカードとモジュールに加えて、サブシステム内で高性能のマルチ GPU 通信を可能にする x4 GPU OAM キャリアボードとインテル Xe Link を備えたインテルデータセンター GPU Max シリーズサブシステムを提供します。

現在、アルゴンヌ国立研究所で建設中の Aurora スーパーコンピューターは、ピーク倍精度計算パフォーマンスの 2 エクサフロップスを超える最初のスーパーコンピューターになります。また、Aurora は、10,000 ブレードを超える単一システム内で Max シリーズ GPU と CPU の組み合わせを初めて紹介し、各ブレードには XNUMX つの Max シリーズ GPU と XNUMX つの Xeon Max CPU が含まれます。

アルゴンヌとインテルがSunspotを発表

SC22 前の別の発表で、Argonne と Intel は、128 個の量産ブレードで構成される Aurora のテスト開発システムである Sunspot を発表しました。オーロラ早期科学プログラムの研究者は、2022 年後半からこのシステムにアクセスできるようになります。

SC22 ではさらに見どころがあり、インテルとその顧客は、Max シリーズ製品を使用する 40 社の OEM からの 12 以上の今後のシステム設計を展示します。デモでは、さまざまな AI および HPC アプリケーションに対する Max シリーズ製品のパフォーマンスと機能を紹介します。インテルのアーキテクト、顧客、エンドユーザーは、インテルのブース #2428 でインテルのプラットフォームソリューションの能力についてプレゼンテーションを行います。

Max シリーズにはさらに多くの機能が登場します

Intel Data Center Max シリーズ GPU (コード名 Rialto Bridge) は、Max シリーズ GPU の後継であり、パフォーマンスが向上し、アップグレードへのシームレスなパスを備えて 2024 年に登場する予定です。その後、インテルは、HPC の将来を可能にする次の主要なアーキテクチャー革新をリリースすることを計画しています。 Intel の次期 XPU (開発コード名 Falcon Shores) は、Xe コアと x86 コアを XNUMX つのパッケージに統合します。この新しいアーキテクチャには、インテルや顧客の新しい IP を統合できる柔軟性もあります。

インテル HPC

StorageReview と連携する

Intel Xeon CPU Max シリーズおよび Intel Data Center GPU Max シリーズを発表

GPU ブレードをアルゴンヌへ、CPU ブレードをロス アラモスへ

アルゴンヌとインテルがSunspotを発表

Max シリーズにはさらに多くの機能が登場します

ハロルド・フリッツ

HPE GreenLake for VMware Cloud統合ソリューションを発表

Dell PowerEdge AMD Genoa サーバーが発表

信頼できるベンダー

GPU ブレードをアルゴンヌへ、CPU ブレードをロスアラモスへ