Home EnterpriseAI Generative AI 用の Dell PowerEdge XE9680: 安定したプラットフォーム、安定した拡散、優れたパフォーマンス

Generative AI 用の Dell PowerEdge XE9680: 安定したプラットフォーム、安定した拡散、優れたパフォーマンス

by ジョーダン・ラナス

エンタープライズ AI という一か八かの分野で、テクノロジーの巨人たちはハードウェアにおける次の重要なイノベーションを発表するために絶え間ない競争を繰り広げています。 Dell Technologies は最近、Generative AI 用の Dell PowerEdge XE9680 を発表しました。 最近のホワイトペーパーでそれを修正。 PowerEdge XE9680 は、AI ワークロードに取り組むように明確に設計されており、このレースへの新規参入者であるだけでなく、潜在的な最有力候補です。

エンタープライズ AI という一か八かの分野で、テクノロジーの巨人たちはハードウェアにおける次の重要なイノベーションを発表するために絶え間ない競争を繰り広げています。 Dell Technologies は最近、Generative AI 用の Dell PowerEdge XE9680 を発表しました。 最近のホワイトペーパーでそれを修正。 PowerEdge XE9680 は、AI ワークロードに取り組むように明確に設計されており、このレースへの新規参入者であるだけでなく、潜在的な最有力候補です。

ホワイトペーパーを詳しく調べて、この強力な企業が AI の状況をどのように再定義するのか、そしてなぜそれが AI フロンティアを征服するためのビジネスの秘密兵器になるのかを考察しました。

生成 AI 用の Dell PowerEdge XE9680

この デル PowerEdge XE9680 は、人工知能の分野を対象とした高性能アプリケーション向けに設計された GPU 密度の高いラック サーバーです。それぞれ最大 4 コアの第 56 世代インテル Xeon スケーラブル プロセッサーを 100 基搭載しており、NVIDIA HGX H100 GPU を XNUMX 基または NVIDIA HGX AXNUMX GPU を XNUMX 基搭載できます。すべては NVIDIA NVLink テクノロジーで相互接続されています。

生成 AI 用の Dell PowerEdge XE9680

PowerEdge XE9680 は、最大 4800 MT/s の DIMM 速度をサポートし、最大 32 TB の RAM 容量を備えた 5 個の DDR4 DIMM スロットを備えています。ストレージとして最大 8 台の 2.5 インチ NVMe SSD ドライブを提供し、最大容量は 122.88 TB です。このサーバーには、暗号署名されたファームウェア、保存データ暗号化 (DRE)、セキュア ブートなどのさまざまなセキュリティ機能も含まれています。組み込みの iDRAC9 システムを通じて管理され、さまざまな管理ツールと統合をサポートします。サーバーは 6U ラック フォーム ファクタに収容されており、重量は 235.89 ポンドです。 (107kg)。

生成 AI GPU 用の Dell PowerEdge XE9680

Dell PowerEdge XE9680の仕様

PowerEdge XE9680 は、大量のメモリ フットプリントを伴う AI ワークロードを処理できるように設計されています。 NVLink のおかげで、GPU はシステム内の他の GPU から膨大な量のメモリにアクセスできるようになり、共有リソースへの高速アクセスが実現します。この優れたメモリ機能により、モデルのパフォーマンスが向上し、より複雑になり、より大規模で詳細なデータセットを操作できるようになり、より大きなパラメータ モデルを活用することで精度と実用性が向上します。

型:

  • デル PowerEdge XE9680

プロセッサーの機能:

  • 2ソケット対応
  • 最大 4 つの第 56 世代インテル Xeon スケーラブル プロセッサー (プロセッサーあたり最大 XNUMX コア)

物理的性質:

  • 6U 空冷、最大周囲温度 35C
  • 1200mmラック対応

メモリサポート:

  • 最大 32 個の DDR5 DIMM
  • 最大 4800 MT/s (1DPC) または 4400 MT/s (2DPC)
I/O 機能:

  • 10 x 16 PCIe Gen5 スロット
  • 3.0 つの OCP NIC XNUMX
  • 2x1GbELOM

GPUの最適化:

  • NVIDIA 8 x H100 SXM5 700W 80GB GPU または NVIDIA 8 x A100 SXM4 500W 80GB GPU
  • 完全な NVLINK 相互接続性

人工知能の機能:

  • AI大規模モデルトレーニング

ドライブのサポート:

  • 最大 16 台のドライブをサポート
  • 最大 8 x SAS/SATA/NVMe Gen4 または 16x E3.S
  • ブート用リアホットプラグ BOSS N -1 (2 x M.2 MVNe) (オプション)
  • SW RAID/PERC12のサポート

画像生成モデル: 芸術の科学

ゴッホのように絵を描いたり、ダ ヴィンチのようにスケッチしたりできたらと思ったことはありますが、最終的には幼稚園児ですら感動しないような棒人間になってしまいましたか?画像生成モデル (IGM) の世界に入りましょう。これは、奇行やベレー帽を除いた、天才アーティストと同等の機械学習です。

IGM は、新しいイメージの作成に取り組むために設計された機械学習モデルのサブセットです。 IGM は生成モデリングのより広い分野に分類され、データ パターンを理解して複製することがすべてです。それでも、これらのモデルは数値やテキストを生成するのではなく、ビジュアルを作成することを仕事としています。ここ数カ月間、IGM は新しい芸術作品から不気味なほどリアルな人間の顔に至るまで、あらゆるものを生み出してニュースを作りました。

これらのモデルは、芸術やエンターテイメントから広告や科学研究に至るまで、あらゆる分野に活用されています。彼らは医療診断用の細胞の画像を作成し、宇宙空間をシミュレートし、自分でナマズをすることができるほどリアルな自撮り写真を生成しています。これらのモデルが進化するにつれて、モデルを迅速に実行するための要件も高まっています。

生成 AI 用の Dell PowerEdge XE9680: 安定した普及のエッジに電力を供給

拡散方法は、推論中に新しい画像を生成する場合、通常、同期して動作する大規模な GPU クラスターに依存し、大量のハードウェア ランタイムを必要とします。ただし、デルのホワイトペーパーでは、Dell PowerEdge XE9680 サーバーを使用すると、これらの生成 AI 操作を大幅に高速化できることが明らかになりました。

これにより、わずか数秒で数十から数百の適度に解像度の高い画像を生成することができます。 Dell は、Dell PowerEdge XE9680 の Generative AI の機能を活用することで、単一のテキスト プロンプトから大規模な高解像度画像 (Dell では 2,096 x 2,096 を使用) を数秒で生成できると指摘しています。

PowerEdge XE9680 で生成された画像。テキスト プロンプト = 「幸せな犬の肖像画、クローズ アップ」

XE9680 はテキスト プロンプト = 「幸せな犬の肖像画、クローズ アップ」で生成されます。

この ホワイトペーパー バッチ サイズと画像解像度の変動を考慮して、PowerEdge XE9680 サーバー上の HuggingFace Diffusers のテキストから画像へのモデルの画像生成遅延を評価します。 XE9680 サーバーは、最大 2,048 x 2,048 の解像度の画像を生成できます。

バッチ サイズが増加するにつれて、インフラストラクチャのメモリ要求も増加しました。したがって、低解像度の画像 (256 x 256 など) を使用すると、巨大なバッチ サイズを実現できました。ただし、メモリの制限により、非常に高解像度の画像 (2,048 x 2,048 など) はバッチ サイズ XNUMX しか生成できませんでした。

PowerEdge XE9680 バッチ イメージの生成時間

PowerEdge XE9680 バッチ イメージの生成時間

256 x 256 および 512 x 512 解像度での画像のバッチ画像生成に焦点を当てると、数秒以内に複数の画像を生成する Generative AI 用の Dell PowerEdge XE9680 の強力な機能がわかります。この機能により、創造的な設計サイクルに必要な評価、迅速な調整、およびさらなる評価が加速されます。これらの結果は、Dell PowerEdge XE32 サーバー上の HuggingFace Diffusers パッケージを使用して、解像度 512 x 512 の 9680 個の画像のバッチを 10 秒以内に生成できることを示しています。さらに、解像度 64 x 256 の 256 枚の画像のバッチを同じプラットフォームで 5 秒以内に作成できるため、企業や専門家にとって迅速なプロトタイピングと創造的なデザイン サイクルが可能になります。

画像生成のベンチマーク

ホワイトペーパーの分析では、Dell PowerEdge XE9680 サーバーが、Lambda によって設定されたイメージ生成遅延ベンチマークに対して評価されました。この比較には、Dell PowerEdge XE100 サーバー上の 80 GB RAM を搭載した単一の NVIDIA H9680 GPU と、Lambda の ML Labs チームによってリリースされた NVIDIA H100 GPU の安定拡散ベンチマークが含まれます。

Dell PowerEdge XE9680 サーバー (青) と Lambda サーバー (オレンジ) の両方のバッチ イメージ生成の遅延値。どちらの調査でも、100 GB GPU RAM を備えた単一の NVIDIA® H80 GPU を使用しました。ここで、Dell サーバー GPU の GPU フォーム ファクターは HGX で、Lambda サーバー GPU は PCIe でした。すべての画像は同じ HuggingFace のテキストから画像へのディフューザー PyTorch コードを使用し、テキスト プロンプト = 「火星で馬に乗った宇宙飛行士の写真」、反復数 = 30、512 x 512 画像解像度、float16 精度、DDIM スケジューラー、安定版拡散 v1.4。

Dell PowerEdge XE9680 イメージ生成の遅延

この調査では、XE9680 が Lambda のベンチマークを上回り、約 100 倍のスループットを達成したことが実証されました。デルの調査結果は、同一のソフトウェア定義条件下での NVIDIA H100 GPU 調査のデータを使用し、Lambda の調査結果と同じ形式で表示されます。唯一の違いはハードウェアです。Lambda は PCIe フォーム ファクターの NVIDIA H9680 GPU を使用しましたが、Dell PowerEdge XEXNUMX サーバーは HGX フォーム ファクターを使用しており、これがパフォーマンスの違いを説明する可能性があります。

画像生成モデルのビジネスへの影響

Stable Diffusion による画像生成により、クリエイティブなプロフェッショナルは、マーケティングや広告戦略の効率を高め、市場投入までの時間を短縮するなど、作品を迅速にプロトタイプ化し、洗練させることができます。建築、広告、マーケティング、クリエイティブ、映画、特殊効果、写真、アートなどの分野の専門家がすでにこのテクノロジーを採用しています。

Stable Diffusion のような生成 AI テクノロジーは、特にスピードが重要な場合に、企業の業務に革新的な変化をもたらす可能性があります。製品の設計と開発において、これらのモデルは視覚的なプロトタイプを迅速に生成できるため、設計チームはリアルタイムでコンセプトを評価し、改良することができます。これにより、設計プロセスが加速され、市場投入までの時間が短縮されます。

最も興味深い概念の 1 つは小売業界から来ています。 AI は、「この椅子を見せてください。ただし赤色です」や「そのソファはヒョウ柄だとどうでしょうか」など、顧客の好みに基づいて、さまざまな製品構成や色のオプションのリアルな画像を迅速に生成できます。不動産や建設業の場合、生成 AI は新しい建物や改装プロジェクトの視覚化を迅速に作成し、計画や販売のプレゼンテーションに役立ちます。

企業内のトレーニングと教育の分野では、AI で生成された画像を使用して従業員トレーニング プログラムの現実的なシナリオを作成し、学習成果を向上させることができます。画像生成速度により企業の機敏性が大幅に向上し、市場の変化、顧客のニーズ、社内要件により効果的に対応できるようになります。

閉じた思考

Dell PowerEdge XE9680 は、要求の厳しい AI ワークロードを (少なくとも現時点では) 簡単に処理できる優れた機能を備えた高性能サーバーです。 XE9680 はトレンドの AI 市場をターゲットにしていますが、このような強力なボックスには、分析やデータ処理において他にも興味深い使用例がある可能性があります。 XE9680がサポートしていることに注意してください。 デルのプロジェクト Helixは、組織が AI プロジェクトをよりタイムリーにオンラインで実行できるように支援するサービスです。

XE9680 ホワイトペーパー

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード