Home Enterprise 第 4 世代インテル Xeon スケーラブル プロセッサーが発売

第 4 世代インテル Xeon スケーラブル プロセッサーが発売

by ライル・スミス
HBM でスケーラブルな第 4 世代インテル Xeon

インテルは、第 4 世代インテル Xeon スケーラブル プロセッサー (Sapphire Rapids)、インテル Xeon CPU Max シリーズ (Sapphire Rapids HBM)、およびインテル データセンター GPU Max シリーズ (Ponte Vecchio) を発売しました。これらは、データセンターのパフォーマンス、効率、セキュリティ、および AI、クラウド コンピューティング、ネットワーク、エッジ コンピューティング、スーパーコンピューターの機能を向上させることを目的として構築されています。インテルは顧客と提携して、大規模なコンピューティングのニーズを満たすために、新製品を使用してカスタマイズされたソリューションとシステムを提供しています。

インテルは、第 4 世代インテル Xeon スケーラブル プロセッサー (Sapphire Rapids)、インテル Xeon CPU Max シリーズ (Sapphire Rapids HBM)、およびインテル データセンター GPU Max シリーズ (Ponte Vecchio) を発売しました。これらは、データセンターのパフォーマンス、効率、セキュリティ、および AI、クラウド コンピューティング、ネットワーク、エッジ コンピューティング、スーパーコンピューターの機能を向上させることを目的として構築されています。インテルは顧客と提携して、大規模なコンピューティングのニーズを満たすために、新製品を使用してカスタマイズされたソリューションとシステムを提供しています。

現在、世界中で 100 億個を超える個別の Xeon プロセッサが使用されています。なぜそんなに人気があるのでしょうか?これらはさまざまな構成で利用でき、拡張性があるように設計されているため、幅広いアプリケーションや環境で使用できます。また、特定のワークロードやアプリケーションに合わせてカスタマイズすることもでき、マルウェアやデータ侵害などの脅威から保護するためのさまざまなセキュリティ機能を提供し、エネルギー効率も高くなります。

Intel 第 4 世代 Xeon プロセッサーの前面と背面第 4 世代インテル Xeon スケーラブル CPU モデル

新しい Xeon モデルは、Max シリーズのほか、Max 9400、Platinum 8000、Gold 6000、Gold 5000、Silver 4000、Bronze 3000 の XNUMX つのカテゴリで利用できます。各シリーズには、ターゲットのユースケースにドリルダウンできるさまざまなモデルがあります。

  • 性能汎用
  • メインライン汎用
  • 水冷汎用
  • シングルソケット汎用(“Q”シリーズ)
  • ロングライフユース(IoT)汎用(“T”シリーズ)
  • IMDB/分析/仮想化に最適化 (「H」シリーズ)
  • 5G/ネットワークに最適化(「N」シリーズ)
  • クラウドに最適化された IaaS (「P」、「V」、「M」シリーズ)
  • 最適化されたストレージとハイパーコンバージド インフラストラクチャ(「S」シリーズ)
  • HPC 最適化 (つまり、Intel Xeon CPU Max シリーズ)

第 4 世代インテル Xeon スケーラブル シリコン

たとえば、強力なものは、 プラチナ8400 プロセッサは、高度なデータ分析、AI、ハイブリッド クラウド データ センター向けに設計されており、高いパフォーマンス、プラットフォーム機能、ワークロードの高速化に加え、強化されたハードウェア ベースのセキュリティとマルチソケット処理を提供します。これらのプロセッサは、プロセッサあたり最大 60 コアも提供します (上位プロセッサと比較して 20 コアの増加) 第3世代Xeonモデル)、8 つのメモリ チャネル、Intel AMX による AI アクセラレーション。

HBM でスケーラブルな第 4 世代インテル Xeon

Intel Xeon Gold 6400ゴールド5400 プロセッサーは、データセンターおよびマルチクラウドのワークロード向けに最適化されています。これらは、強化されたメモリ速度、容量、セキュリティ、およびワークロードの高速化を提供します。インテル Xeon Silver 4400 プロセッサは、エントリーレベルのデータセンター コンピューティング、ネットワーキング、ストレージに不可欠なパフォーマンス、向上したメモリ速度、電力効率を提供します。

各 Xeon CPU とその対象となるユースケースの詳細な概要は次のとおりです。

特徴 第 4 世代インテル Xeon スケーラブル プロセッサー インテル Xeon CPU Max シリーズ
エクストリームコア数 (XCC) 中コア数 (MCC) 高帯域幅メモリ(HBM)
 

金型の構造

Intel Embedded Multi-die Interconnect Bridge (EMIB) 上の MDF を使用して接続された 4 つのタイル  

1 つのモノリシック チップ

Intel Embedded Multi-die Interconnect Bridge (EMIB) 上の MDF を使用して接続された 4 つのタイル
コアカウント 最大 60 個のアクティブコア 最大 32 個のアクティブコア 最大 56 個のアクティブコア
TDP範囲 225〜350 W 125〜350 W 350W
 

メモリ

DDR5 @ 4800 (1 DPC)、4400 (2DPC)、16 Gb DRAM、8 チャネル

Intel Optane PMem 300 (Crow Pass) @4400 MT/秒

DDR5 @ 4800 (1 DPC)、4400 (2DPC)、8 チャネル

64 GB HBM2e メモリ (最大 1.14 GB/コア)

インテル UPI UPI 2.0 @ 16 GT/s、最大 4 つの Ultra Path インターコネクト UPI 2.0 @ 16 GT/s、最大 3 つの Ultra Path インターコネクト UPI 2.0 @ 16 GT/s、最大 4 つの Ultra Path インターコネクト
スケーラビリティ 1ソケット、2ソケット、4ソケット、8ソケット 1ソケット、2ソケット、4ソケット 1ソケット、2ソケット
PCIe/Compute Express リンク PCIe 5.0 (80 レーン)、

Compute Express Link (CXL) 4 経由で最大 1.1 台のデバイスをサポート

セキュリティ インテルSGX

最小エンクレーブ ページ キャッシュ (EPC) サイズ 256 MB

Intel SGX (フラットモードのみ)
統合された IP アクセラレータ Intel QAT、DLB、IAA、DSA (それぞれ最大 4 台のデバイス) インテル QAT、DLB (各デバイス最大 2 台)、インテル DSA、IAA (各デバイス 1 台) インテル DSA (4 デバイス)

第 4 世代インテル Xeon スケーラブル プロセッサーは、パフォーマンスを向上させ、AI、分析、ネットワーキング、セキュリティ、ストレージ、ハイ パフォーマンス コンピューティング (HPC) に関連するさまざまなコンピューティングの課題に取り組むことを目的としています。これらのプロセッサは、CPU の中で最も多くのアクセラレータを内蔵している点で注目に値します。

Intel によると、第 4 世代 Intel Xeon Scalable のお客様は、以下の点で平均パフォーマンスの向上が期待できます。

  • 内蔵アクセラレータを使用すると、ワットあたりの効率が 9 倍向上します。
  • 最適化された電力モードで CPU あたり 70 ワットの省電力を実現し、パフォーマンスの損失を最小限に抑えます。
  • 前世代と比較して、総所有コストと消費電力が 55% 削減されました。

第 4 世代 Intel Xeon スケーラブル – 電力効率の向上

新しい最適化電力モードは、特定のワークロードのパフォーマンスへの影響を 20% 未満にしながら、ソケットの電力を最大 5% 節約できます。空冷および液体冷却の革新により、データセンターの総エネルギー消費量をさらに削減できます。

第 4 世代インテル Xeon スケーラブル CPU には多数の内蔵アクセラレータが装備されており、プラットフォーム レベルでの電力を節約し、追加のアクセラレーションの必要性を軽減できます。これは、顧客が持続可能性の目標を達成するのに役立ちます。さらに、新たに導入された最適化電力モードは、特定のワークロードのパフォーマンスへの影響を最小限に抑えながら、ソケットの電力を最大 20% 節約することが期待されています。

第 4 世代インテル Xeon スケーラブルな持続可能性

空冷および液体冷却の革新により、データセンターの総エネルギー消費量をさらに削減できます。第 4 世代 Xeon プロセッサーも、高度な水再生施設を備えたインテルのサイトで 90% 以上の再生可能電力を使用して製造されています。

AI パフォーマンスの新たな進歩

前世代と比較して、第 4 世代 Xeon プロセッサは、Advanced Matrix Extension (Intel AMX) アクセラレータの使用により、最大 10 倍高い PyTorch リアルタイム推論およびトレーニング パフォーマンスを達成するといわれています。

PyTorch は、ニューラル ネットワークを構築およびトレーニングするための機械学習フレームワークです。リアルタイム推論には、トレーニングされたニューラル ネットワーク モデルを使用して、新しい入力データに基づいてリアルタイムの予測または決定を行うことが含まれます。 PyTorch のリアルタイム推論とトレーニングのパフォーマンスの向上は、リアルタイムの予測や意思決定を伴う機械学習ワークロードをより効率的に実行できるため、Intel プロセッサにとって不可欠です。

これは、迅速かつ正確な予測や決定が最重要であるアプリケーションで特に役立ちます。さらに、機械学習タスクのパフォーマンスが向上すると、モデルのトレーニングが高速化され、予測がより正確になるだけでなく、より大規模で複雑なモデルを使用できるようになります。

そのため、インテルは、新しい第 4 世代インテル Xeon スケーラブル プロセッサーが自然言語処理のさらなる機能を提供し、大規模な言語モデルで最大 20 倍の高速化を実現できると述べています。

インテルの AI ソフトウェア スイートは、さまざまな業界やアプリケーションにわたる 400 以上の機械学習およびディープラーニング AI モデルでテストされており、開発者の好みの AI ツールと併用して、生産性を向上させ、AI 開発を加速できます。このスイートはポータブルであるように設計されており、ワークステーションで使用したり、エッジやクラウドに展開したりできます。

ネットワーキング機能

第 4 世代インテル Xeon スケーラブル プロセッサーは、高性能、低遅延のネットワークおよびエッジ ワークロード向けに特別に最適化されたモデルも提供します。これらのプロセッサは、通信、小売、製造、スマートシティなどの業界において、よりソフトウェア定義の未来を推進する上で重要な役割を果たします。 5G コア ワークロードの場合、内蔵アクセラレータはスループットを向上させ、遅延を短縮するのに役立ち、電源管理の改善によりプラットフォームの応答性と効率が向上します。

また、仮想無線アクセス ネットワーク (vRAN) の容量を 3 つと比較して XNUMX 倍にすることもできます。rd-世代 Xeon プロセッサ (より多くの電力を消費することなく)。一般に、vRAN 容量が大きいプロセッサは、レイテンシの短縮や全体的なパフォーマンスの向上など、ネットワーク データ トラフィックをより効率的かつ効果的に処理できます。これは、リアルタイム通信を必要とするアプリケーションにとって特に重要です。

Intel は、これにより通信サービス プロバイダーはワットあたりのパフォーマンスを 2 倍にし、パフォーマンスとエネルギー効率のニーズを満たすことができると述べています。また、vRAN の増加により、組織は vRAN ワークロードの数の変化に応じてより簡単にスケールアップまたはスケールダウンできるようになります。これは、ネットワーク リソースの柔軟性が向上することを意味します (追加のハードウェア、電力、またはインフラストラクチャを必要としないなど)。

(HPC)

インテル研究所の第 4 世代インテル Xeon スケーラブル HPC システム

Intel HPC ラボのコンピューティング ブレード (オープン シャーシ)

第 4 世代インテル Xeon スケーラブルおよびインテル Max シリーズ製品は、HPC および AI における要求の厳しいコンピューティング ワークロードに対応するために、CPU と GPU を oneAPI のオープン ソフトウェア エコシステムと組み合わせた、スケーラブルでバランスの取れたアーキテクチャを提供します。 Intel は、このアーキテクチャは今日世界で最も困難な問題に取り組むために特別に設計されていると主張しています。

OneAPI オープン ソフトウェアは、開発者が単一セットのプログラミング インターフェイスを使用して、さまざまなハードウェア プラットフォーム (CPU、GPU、その他の特殊なプロセッサを含む) で実行できるコードを作成できるツールとライブラリのセットです。これにより、多様なコンピューティング環境向けのアプリケーションの開発と最適化が容易になります。

Intel HPC ラボのコンピューティング ブレード

Intel HPC ラボのコンピューティング ブレード

Intel の Jones Farm で、StorageReview は Borealis の舞台裏を取材しました。インテル、HPE、アルゴンヌ国立研究所は、本日発表された新しい第 4 世代 Xeon およびデータセンター GPU プラットフォームで実装される Aurora スーパーコンピューターの提供に向けて取り組んでいます。

Borealis は、オレゴン州の Jones Farm 研究所にある 2 ラックのミニシステムで、Aurora システムとその新技術を検証します。 Aurora と同じアーキテクチャと設計を備えており、システムがアルゴンヌ国立研究所に大規模に設置される前に、ソフトウェアと液体冷却システムのすべてのコンポーネントを検証するためにテストが行​​われています。

水冷システム: Jones Farm HPC Lab のラボマネージャー – Borealis は、ラックを冷たく保つための水冷システムの一部である赤と青のチューブを展示しています。

水冷システム: Jones Farm HPC Lab のラボマネージャー – Borealis は、ラックを冷たく保つための水冷システムの一部である赤と青のチューブを展示しています。

Intel Xeon CPU / GPU Maxシリーズ

Intel Xeon CPU Max シリーズは、市場に投入された最初の高帯域幅メモリを搭載した x86 プロセッサであり、コードを変更することなく多くの HPC ワークロードを高速化できます。同社はインテル データセンター GPU Max シリーズを最高密度のプロセッサーと呼んでおり、顧客の幅広いニーズに合わせてさまざまなフォーム ファクターで提供されます。

Xeon CPU Max シリーズは、パッケージ上に 64 GB の高帯域幅メモリを提供し、HPC および AI ワークロードのデータ スループットを大幅に向上させます。最上位の第 3 世代インテル Xeon スケーラブル プロセッサーと比較して、Xeon CPU Max シリーズは、エネルギーや地球システム モデリングなどのさまざまな現実世界のアプリケーションで最大 3.7 倍のパフォーマンスを提供します。 HPC および AI ワークロードでは、多くの場合、CPU とメモリ間で大量のデータを処理および移動する必要があるため、CPU 帯域幅は不可欠です。そうしないと、システムのパフォーマンスがボトルネックになり、処理時間が長くなる可能性があります。

Data Center GPU Max シリーズは、100 タイル パッケージに 47 億個を超えるトランジスタを搭載しており、物理学、金融サービス、ライフ サイエンスに関わるワークロードのスループットを向上させます。 Xeon CPU Max シリーズと組み合わせると、このプラットフォームは、オープンソース コード LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator) 分子動力学シミュレーターを実行するときに、前世代よりも最大 12.8 倍のパフォーマンスを達成できます。

インテル データセンター GPU

インテルが発売したのは、 データセンターGPU Flexシリーズ 2022 年 16 月に発売された、最大 8 (GPU あたり 16) X コア、16 TFLOPS、および XNUMX GB のメモリ容量を備えた Xe HPG ベースのカード。

インテル オンデマンド

インテル オンデマンドは、ほとんどの第 4 世代インテル Xeon スケーラブル プロセッサーで利用可能なアクセラレータおよびハードウェア強化機能を拡張またはアップグレードできるサービスです。このサービスはインテルとハードウェア プロバイダーによって管理され、ライセンス注文用の API とライセンスのプロビジョニングとアクティベーション用のソフトウェア エージェントで構成されます。

顧客は、購入時または購入後のアップグレードとしてオンデマンド機能を購入することを選択できます。また、インテルは、必要に応じて機能をオンまたはオフにでき、支払いがベースとなる従量制導入モデルにも取り組んでいます。使用法。第 4 世代 Xeon プロセッサーによるアクティベーション モデルの導入により、お客様はプロセッサーのライフサイクル全体を通じて、いつでもフル機能のプレミアム SKU を選択したり、機能を追加したりできるようになります。

オンデマンドの初期プロバイダーには、H3C、Inspur、Lenovo、Supermicro、Variscale が含まれており、インテルは追加のプロバイダーと連携して有効化計画を進めています。

チップレベルの DRM (デジタル著作権管理) とは、特定のコンピューター チップの機能へのアクセスを制御するテクノロジーを指します。インテル オンデマンドのコンテキストでは、オンデマンド サービスを通じて購入またはアクティブ化しない限り、チップ レベルの DRM を使用して、第 4 世代インテル Xeon スケーラブル プロセッサーの特定の機能へのアクセスを制限する可能性があります。これにより、個人や独立した修理店がインテル オンデマンドを搭載したシステムの特定の部分にアクセスして修理することがより困難になる可能性があるため、修理の権利に影響を与える可能性があります。

エンタープライズ CPU などのテクノロジー製品の使用と廃棄に関しては、環境の持続可能性を考慮することが重要です。インテル オンデマンドを使用すると、顧客はプロセッサーの機能を拡張またはアップグレードできる可能性がありますが、このサービスが製品の環境持続可能性にどのような影響を与えるかは不明です。パッケージの TDP はアクティベーションによって変化しないため、未使用の機能のエネルギー消費と、アップグレードまたは交換による電子廃棄物の増加の可能性を考慮する必要がある場合があります。インテルのような企業にとって、自社の製品やサービスが環境に与える影響を考慮し、より持続可能なソリューションに向けて取り組むことが重要です。

第 4 世代インテル Xeon のスケーラブルなパフォーマンス テスト

第 4 世代インテル Xeon スケーラブル プロセッサーが効率性の向上に重点を置いていることが、初期のベンチマークの一部で顕著に表れています。これらの新しいプロセッサーは、改良された製造改良により、第 53 世代 Xeon スケーラブル プロセッサーと比較して 3 パーセントの効率向上 (汎用コンピューティングの場合) を達成し、目標のワークロードにおいて、内蔵アクセラレータを利用してワットあたりの平均パフォーマンス 2.9 倍の効率向上を達成すると宣伝されています。

これらの改善に加えて、新世代の中間層チップは前世代の最上位モデルと同等の強力さを備えており、データセンター事業者にとってコスト効率の高いオプションとなっています。これらの中間層チップは、主力モデルと同等のパフォーマンスを低価格で提供することで、データセンターのコストを最適化し、全体的な効率の向上を実現するのに役立ちます。

Sapphire Rapids のパフォーマンスをテストするにはいくつかのオプションがありましたが、効率の向上を示すために、デュアル 4Y ($8454) Xeon を搭載したミッドレンジの第 3,995 世代プラットフォームをテストし、それを第 3 世代の最上位プラットフォームと比較しました。デュアル 8380 (9,400 ドル) CPU。第 4 世代の新たな改良により、当社のミッドレンジ システムは前世代のフラッグシップ モデルと同等のベンチマークを維持することができました。

CINEBENCH
2 x 第 4 世代 8452Y (2.0GHz x 36) 2 x 第 3 世代 8380 (2.3GHz x 40)
マルチコア 60075 70540
単芯 841 985
コアマルチプライヤー 71.40x 71.63x
Blender CLI レンダリング ベンチマーク
2 x 第 4 世代 8452Y (2.0GHz x 36) 2 x 第 3 世代 8380 (2.3GHz x 40)
モンスター 652.526942 671.145395
ジャンクショップ 401.119468 407.141514
教室 308.802541 320.507039
トータル 1362.448951 1398.793948

さらに、社内の AI モデル トレーニング テストでは、パフォーマンスが約 5% 向上し、第 95 世代 3 では 8380 分だったのに対し、第 90 世代 4Y では 8452 分であったことがわかりました。 

全体として、第 4 世代インテル Xeon スケーラブル プロセッサーによってもたらされる効率の向上により、消費電力とコストの削減を目指すデータセンター事業者にとって魅力的な選択肢となっています。汎用プロセッサは、パフォーマンスと効率の優れたバランスを提供し、幅広いワークロードにとって確実な選択肢となります。私たちは、データ ストレージ アクセラレーターを含む、データセンターのワークロードで特定のアクセラレーターをテストできることを楽しみにしています。

市場への影響

連絡先 第 4 世代インテル Xeon スケーラブル プロセッサーがついに企業に出荷され、クラウド プロバイダーは以前からこれらのプロセッサーを提供していました。 AMD ジェノア CPU データセンター内。高いレベルではありますが、ジェノアの膨大な PCI レーン数を見て、ジェノアが勝利者であると宣言するのは非常に簡単です。しかし、最近では適切な CPU を選択することはそれよりもはるかに複雑です。システム内の追加コンポーネントによるコスト、エネルギー、パフォーマンス、および認定の微妙なバランスが必要です。ああ、ワークロードを理解し、適切な CPU に合わせることの重要性を無視しないでください。 

したがって、今日では、ジェノアとサファイアラピッズのどちらが優れているかという質問に対する簡単な答えはありません。 Dell、HPE、Supermicro、Lenovo などがシステムを市場に投入するまでには時間がかかるでしょう。新型の採用により、 SSDのフォームファクタ 現在サーバーで行われている機能、Gen5 スループットのサポート、および新しい高速ネットワーキングとアクセラレータのオプション DPU, ゲームは進行中です。ただし、これはスペックシートの戦いではありません。企業の IT 組織には、アプリケーションのニーズを適切にサポートするシステムに投資していることを確認するために、できる限り熱心に情報を提供する義務があります。そしてそれがすべての中で最大の課題かもしれません。選択肢が非常に多いため、洗練された IT パートナーがこれまで以上に重要になる可能性があります。

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード