Dell PowerEdge XE9640 は、液体冷却により電力効率の高い方法で AI パワーを提供できる 4x GPU アクセラレーションのラックマウント サーバーです。 XE9640は、 SC22 XE8640 と私たちのお気に入りの 8 つである XNUMX ウェイとともに XE9680 GPUサーバー。現在、XE9640 が一般提供されており、基盤となるハードウェアを詳しく調査しています。
Dell PowerEdge XE9640 は、液体冷却により電力効率の高い方法で AI パワーを提供できる 4x GPU アクセラレーションのラックマウント サーバーです。 XE9640は、 SC22 XE8640 と私たちのお気に入りの 8 つである XNUMX ウェイとともに XE9680 GPUサーバー。現在、XE9640 が一般提供されており、基盤となるハードウェアを詳しく調査しています。
Dell GPU Accelerated サーバー ファミリ
PowerEdge XE ファミリのサーバーは、パフォーマンスと信頼性を必要とする複雑な AI および HPC ワークロード専用に構築されています。これらのサーバーは、高性能、洞察重視、インテリジェントになるように設計されています。現在、XE サーバー ファミリは次のもので構成されています。 XE9680 (ジョーダンのお気に入りだと言いましたか?)、XE9640、XE8640、XE8545。これらすべてのサーバーに共通するのは、顧客にとって合理的な冷却オプションを備えたさまざまな AI イニシアチブをサポートする設計です。
製品概要 |
目的 | 福利厚生 | ユースケース |
XE9680 | 最適なパフォーマンスと最速の価値実現を目指して設計された AI アクセラレーションにより洞察力を高めるように設計されています | 8x NVIDIA H100 または A100 Tensor コア SXM GPU で AI と HPC に優れたパフォーマンスを活用 | 大規模な言語モデル |
スマートな空冷動作 (最大 35℃) により、データ変換を最大限に成果に導きます。 | 自然言語処理 | ||
スマートな空冷動作 (最大 35℃) により、データ変換を最大限に成果に導きます。 | 大規模レコメンデーション エンジンのトレーニング | ||
モデリングとシミュレーション | |||
デジタルツインと製造 | |||
XE9640 | 高密度 2U スマート水冷サーバーで AI イニシアチブを推進する目的で設計 | 4x NVIDIA H100 Tensor コア GPU または 4x Intel Data Center Max OAM GPU で AI の成果を向上 | 自然言語処理 |
スマートな水冷 CPU と GPU がパフォーマンスを最大化します | 大規模レコメンデーション エンジンのトレーニング | ||
最適化された電力利用効率による TCO の削減 | モデリングとシミュレーション | ||
人工知能、物体認識のための ML/DL トレーニング | |||
XE8640 | 優れたパフォーマンスで AI、HPC、分析ワークロードを推進 | 幅広いアプリケーション向けに 4x NVIDIA H100 GPU を使用して分析を自動化して洞察を得る | 中型データセット言語モデル |
空冷(最大35℃)で動作させて電力効率を向上 | 自然言語処理 | ||
インテリジェントな拡張オプションで運用をスケールアップ | モデリングとシミュレーション | ||
人工知能、ML/DL トレーニングと推論、画像認識 | |||
XE8545 | 主流の AI およびグラフィックス アプリケーションのパフォーマンス | 4x NVIDIA A100 GPU によるトレーニングと推論のパフォーマンスの向上 | 地震解析を含むモデリングとシミュレーション |
空冷動作 (最大 35℃) により効率的な動作が可能 | 人工知能、ML/DL トレーニングと推論、画像認識、チャットボット | ||
バランスのとれたパフォーマンス/ワット ソリューションによる TCO の削減 |
Dell PowerEdge XE9640 – GPU の多様性と液体冷却
この パワーエッジ XE9640 パートナー CoolIT との緊密なパートナーシップにより、GPU と CPU に直接液体冷却 (DLC) を提供します。サーバーには、DRAM、ストレージ、および PCIe 拡張カードに十分なエアフローと冷却を確保するために、いくつかのファンが付属しています。とはいえ、これらのファンは最大 RPM で動作する必要がないため、大幅な電力の節約になります。
PowerEdge XE9640 は GPU の多様性をもたらし、4x からの選択肢を提供します。 NVIDIA NVリンク 相互接続 H100 SXM5 GPU 700W モジュールまたは 4x Intel XeLink 相互接続 Intel Data Center GPU Max 1550 600W オープン コンピューティング プラットフォーム (OCP) アクセラレータ モジュール (OAM)。
NVIDIA NVLink や Intel Xelink などのテクノロジーのおかげで、これらの GPU はシームレスに通信し、メモリとコアを効果的にプールします。これは、大規模言語モデル (LLM) のようなメモリ コヒーレントなワークロードを処理する場合に特に有益です。この汎用性により、幅広い AI ワークロードに適しています。もちろん、明らかな疑問は「AMD Instinct はどうですか?」ということです。デルは追加の GPU サポートを継続的に評価していますが、発売時にはこのサーバーで AMD ソリューションを提供していません。
この GPU の多様性により、ユーザーは生成 AI、産業用シミュレーション モデリング、最先端の科学研究などの増大する要求に対処できるようになります。たとえば、PowerEdge XE9640 の Intel Data Center GPU Max アクセラレータ機能は、テキサス アドバンスト コンピューティング センター (TACC) で使用されています。 Stampede3 スーパーコンピューター.
密度と冷却の点で、PowerEdge XE9640 は、パフォーマンスを向上させながらラック スペースを効率的に使用するように設計および設計されています。このサーバーはコンパクトな 2RU プロファイルにより、ラックあたりの優れた GPU 容量を提供し、貴重なデータセンターのスペースを最大限に活用します。 DLC を採用した PowerEdge XE9640 は、効率とコスト効率の点で従来の空冷システムを上回ります。
Dell PowerEdge XE9640 – 残りのハードウェア
GPU 「だけ」を超えて、XE シリーズの背後にあるエンジニアリングは一流です。ちょうど投稿しました XE9640 と XE8640 のビデオレビュー。このビデオでは、XE9640 のドライブ アクセスと DLC パイプの配線から、XE8640 のクローズド ループ GPU 液体冷却、およびすべての XE サーバーの将来の機能強化へのパスに至るまで、設計に関する優れた詳細が提供されています。参考までに以下に埋め込みます。
XE9640 に加えて、ベゼルを取り外すと NVMe ドライブに簡単にアクセスできます。シャーシの右側にある 1 つのスロットは、NVMe ブート最適化ストレージ サブシステム (BOSS) ドライブをサポートし、2 つの M.2 SSD を介した HWRAID 4 を含みます。現在、プライマリ ストレージは 2 台の U.4 Gen8 NVMe ドライブ経由で提供されています。 3x E5.S Gen2 NVMe ドライブをサポートする SSD トレイのオプションのおかげで、これは将来のリリースでは XNUMX 倍になります。このプラットフォームは、U.XNUMX NVMe ベイの HW RAID をサポートしていませんが、ほとんどの場合は必要ありません。これらの GPU ボックスの多くは、外部の大規模なデータセットを利用します。この場合、ローカル ストレージは、これらの大規模なデータセットの主要なソースにはなりません。
もちろん、大規模なストレージ アレイを利用する必要がある AI 専門家のために、サーバーの背面に優れた拡張オプションがあります。 XE9640 は、ハーフハイト 5 つとフルハイト 3 つの合計 XNUMX つの PCIe GenXNUMX スロットをサポートします。さらに、PCIe GenXNUMX OCP NIC スロットもあります。
液漏れの不安を和らげるために、水冷サーバーには iDRAC に液漏れ検出レポートが含まれています。シャーシのさまざまな部分に穴を開けて漏れを検出するデルの方法は、非常に信じられないほど優れています。たとえば、以下の CPU 冷却プレートのショットでは、ウォーター ブロック全体の周囲に、途切れたパターンで細かい銅の痕跡が確認できます。これらの接続に水が滴ると、開いた配線ループが小さなショートを検出し、システムは漏れが発生したことを認識します。編組ワイヤ ロープは、シャーシの他の部分でも同様の検出方法で使用されます。これは、シャーシの前面にある多数のホースを備えたメインの液体分配ブロックの写真で確認できます。さらに、CoolIT CDU と残りのループでは、途中の多くのポイントで漏れ検出レポートが作成されます。
ちなみに、空冷式の XE8640 および XE9680 には、iDRAC による同様のリーク検出を備えた閉ループ GPU 液体冷却も含まれています。
ラックあたりの電力の最適化
PowerEdge XE9640 は、ラックあたりの電力使用率を微調整する機会をお客様に提供します。ラックごとに 41 台のサーバーを搭載している場合、アクセラレーション コンピューティングのピーク負荷では、バランスのとれたパフォーマンスを実現するために三相配電を利用して、約 12kW の電力が必要になる可能性があります。スケールアップする場合、データセンターは 18、21、または 9640 台の PowerEdge XE54 サーバーを収容するラックを展開し、それぞれ約 81kW、95kW、および XNUMXkW の電力レベルを達成できます。この適応性により、データセンターは特定の要件に応じてラックの電力使用量を最適化できます。
デルは、PowerEdge XE9640 に関する包括的な洞察をお客様に提供するために、さまざまなリソースをまとめました。これには、開梱ビデオと詳細な製品レビューが含まれます。開封ビデオではサーバーの設計と機能を紹介し、顧客にその機能を視覚的に説明します。
PowerEdge XE9640 の利点をさらに強調するために、デルは、PowerEdge XEXNUMX を空冷式の同等品と比較するインフォグラフィックを作成しました。 パワーエッジ XE8640。このインフォグラフィックは、PowerEdge XE9640 の顕著な特徴、特に液体冷却の効率とラックあたりの優れた GPU 容量を強調しています。
最終的な考え
PowerEdge XE9640 は、AI ワークロードに革命を起こし、イノベーションを促進するように設計された、デルの拡大する Generative AI ソリューションに不可欠です。デルの Generative AI ソリューションは、最先端のテクノロジー、イノベーション、Dell Technologies が提供するサービスを組み合わせて、よりインテリジェントで迅速な結果を提供します。生成 AI の機能を活用することで、組織は新鮮な洞察を獲得し、変革の取り組みを促進し、従業員の効率を高めることができます。
XE9680 はデルの GPU サーバーの中で依然としてお気に入りかもしれませんが、XE9640 は純粋に効率と設計の観点から私たちの心に浸透しています。 2U シャーシには膨大な量のエンジニアリングが詰め込まれています。液体冷却を使用するデータセンターは、明らかにこれらの電力効率の高いボックスに引き寄せられるでしょう。 2800 つの NVIDIA モジュールはそれ自体で XNUMX W を消費するため、データセンターのラック効率と電力効率を高めるためにデルができることはすべて、大きな進歩となります。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード