首頁 EnterpriseAI 適用於生成式 AI 的 Dell PowerEdge XE9680:穩定的平台、穩定的擴散、卓越的性能

適用於生成式 AI 的 Dell PowerEdge XE9680:穩定的平台、穩定的擴散、卓越的性能

by 喬丹拉努斯

在企業人工智能的高風險領域,科技巨頭們正在進行一場不懈的競賽,以推出下一個重大的硬件創新。 戴爾科技集團最近推出了用於生成式 AI 的 Dell PowerEdge XE9680, 在最近的白皮書中展示了它。 PowerEdge XE9680 專為處理人工智能工作負載而設計,它不僅是這場競賽的新參與者,而且還是潛在的領跑者。

在企業人工智能的高風險領域,科技巨頭們正在進行一場不懈的競賽,以推出下一個重大的硬件創新。 戴爾科技集團最近推出了用於生成式 AI 的 Dell PowerEdge XE9680, 在最近的白皮書中展示了它。 PowerEdge XE9680 專為處理人工智能工作負載而設計,它不僅是這場競賽的新參與者,而且還是潛在的領跑者。

通過深入研究白皮書,我們了解了這家巨頭如何重新定義人工智能領域,以及為什麼它可能成為您的企業征服人工智能前沿的秘密武器。

適用於生成式 AI 的 Dell PowerEdge XE9680

戴爾 PowerEdge XE9680 是一款GPU密集型機架服務器,專為人工智能領域的高性能應用而設計。 它配備了兩個第四代英特爾至強可擴展處理器,每個處理器最多有4個核心,並且可以配備56個NVIDIA HGX H100或100個NVIDIA HGX AXNUMX GPU; 所有這些都通過 NVIDIA NVLink 技術互連。

適用於生成式 AI 的 Dell PowerEdge XE9680

PowerEdge XE9680 支持高達 4800 MT/s 的 DIMM 速度,並具有 32 個 DDR5 DIMM 插槽,最大 RAM 容量為 4 TB。 它提供多達 8 個 2.5 英寸 NVMe SSD 驅動器用於存儲,最大容量為 122.88 TB。 該服務器還包括一系列安全功能,例如加密簽名固件、靜態數據加密 (DRE)、安全啟動等。 它通過嵌入式 iDRAC9 系統進行管理,並支持各種管理工具和集成。 該服務器採用 6U 機架外形,重 235.89 磅。 (107 公斤)。

適用於生成式 AI GPU 的 Dell PowerEdge XE9680

戴爾 PowerEdge XE9680 規格

PowerEdge XE9680 旨在處理具有大量內存佔用的人工智能工作負載。 借助 NVLink,GPU 可以訪問系統中其他 GPU 的大量內存,從而提供對共享資源的高速訪問。 這種重要的內存能力應該會帶來更高的性能、更複雜的模型,以及處理更大、更詳細的數據集的能力,通過利用更大的參數模型來提高準確性和實用性。

模型:

  • 戴爾 PowerEdge XE9680

處理器能力:

  • 2 個插座功能
  • 最多兩個第 4 代英特爾至強可擴展處理器,每個處理器最多 56 個內核

物理特性:

  • 6U 風冷,環境溫度高達 35C
  • 1200mm 機架能力

內存支持:

  • 多達 32 個 DDR5 DIMM
  • 高達 4800 MT/秒 (1DPC) 或 4400 MT/秒 (2DPC)
輸入/輸出能力:

  • 10 x 16 PCIe Gen5 插槽
  • 3.0 個 OCP 網卡 XNUMX
  • 2x1GbELOM

GPU優化:

  • NVIDIA 8 個 H100 SXM5 700W 80GB GPU 或 NVIDIA 8 個 A100 SXM4 500W 80GB GPU
  • 完整的 NVLINK 互連性

人工智能能力:

  • AI大模型訓練

驅動支持:

  • 支持多達 16 個驅動器
  • 多達 8 個 SAS/SATA/NVMe Gen4 或 16 個 E3.S
  • 用於啟動的後部熱插拔 BOSS N -1 (2 x M.2 MVNe)(可選)
  • 軟件 RAID/PERC12 支持

圖像生成模型:藝術科學

您是否曾經希望自己能像梵高一樣繪畫或像達芬奇一樣素描,但最終卻畫出連幼兒園小朋友都無法打動的簡筆劃? 進入圖像生成模型 (IGM) 的世界,它相當於一位傑出藝術家的機器學習,但沒有任何怪癖和貝雷帽。

IGM 是機器學習模型的一個子集,旨在解決新圖像的創建問題。 IGM 屬於更廣泛的生成建模領域,即理解和復制數據模式。 不過,這些模型不是生成數字或文本,而是創建視覺效果。 近幾個月來,IGM 創造了各種新聞,從新的藝術品到異常逼真的人臉。

這些模型已經滲透到從藝術和娛樂到廣告和科學研究的各個領域。 他們正在創建用於醫學診斷的細胞圖像,模擬外太空,並生成逼真的自拍照,讓你自己都能釣到鯰魚。 隨著這些模型的發展,快速運行它們的要求也在不斷增長。

適用於生成式 AI 的 Dell PowerEdge XE9680:為穩定擴散的邊緣提供動力

擴散方法在推理過程中生成新圖像時,通常依賴於同步運行的大規模 GPU 集群,並且需要大量的硬件運行時間。 然而,戴爾的白皮書顯示,借助 Dell PowerEdge XE9680 服務器,這些生成式 AI 操作可以顯著加快。

這樣可以在短短幾秒鐘內生成數十到數百個合理分辨率的圖像。 戴爾指出,通過利用戴爾PowerEdge XE9680的生成式AI功能,可以在幾秒鐘內根據單個文本提示生成大型高分辨率圖像(戴爾使用2,096 x 2,096)。

PowerEdge XE9680 上生成的圖像,帶有文本提示 =“快樂狗的肖像,特寫”

XE9680 生成文本提示=“快樂狗的肖像,特寫”

白皮書 考慮批量大小和圖像分辨率變化,評估 PowerEdge XE9680 服務器上 HuggingFace Diffusers 文本到圖像模型的圖像生成延遲。 XE9680服務器可以生成分辨率高達2,048 x 2,048的圖像。

隨著批量大小的增加,對基礎設施的內存需求也隨之增加。 因此,使用較低分辨率的圖像(例如 256 x 256)可以實現巨大的批量大小。 然而,由於內存限制,非常高分辨率的圖像(如 2,048 x 2,048)只能生成批量大小為 XNUMX 的圖像。

PowerEdge XE9680 批量圖像生成時間

PowerEdge XE9680 批量圖像生成時間

重點關注 256 x 256 和 512 x 512 分辨率圖像的批量圖像生成,展示了 Dell PowerEdge XE9680 在幾秒鐘內生成多個圖像的生成式 AI 的強大功能。 此功能可加速創意設計週期所需的評估、及時調整和進一步評估。 這些結果展示瞭如何在 Dell PowerEdge XE32 服務器上使用 HuggingFace Diffusers 軟件包在不到 512 秒的時間內批量生成 512 個分辨率為 9680 x 10 的圖像。 此外,使用同一平台可以在不到 64 秒的時間內創建批量 256 張分辨率為 256 x 5 的圖像,從而為企業和專業人士實現快速原型設計和創意設計週期。

圖像生成基準

在白皮書的分析中,根據 Lambda 設置的映像生成延遲基準對 Dell PowerEdge XE9680 服務器進行了評估。 此比較涉及 Dell PowerEdge XE100 服務器上具有 80 GB RAM 的單個 NVIDIA H9680 GPU 以及 Lambda 的 ML Labs 團隊發布的 NVIDIA H100 GPU Stable Diffusion 基準測試。

Dell PowerEdge XE9680 服務器(藍色)和 Lambda 服務器(橙色)的批量映像生成延遲值。 兩項研究均使用具有 100 GB GPU RAM 的單個 NVIDIA® H80 GPU,其中戴爾服務器 GPU 的 GPU 外形尺寸為 HGX,Lambda 服務器 GPU 為 PCIe。 所有圖像都使用相同的 HuggingFace 文本到圖像 Diffusers PyTorch 代碼,並帶有文本提示 =“宇航員在火星上騎馬的照片”,迭代次數 = 30、512 x 512 圖像分辨率、float16 精度、DDIM Scheduler、穩定擴散 v1.4。

Dell PowerEdge XE9680 映像生成延遲

研究表明,XE9680 超越了 Lambda 的基準,實現了大約兩倍的吞吐量。 戴爾的研究結果以與 Lambda 相同的格式呈現,在相同的軟件定義條件下使用 NVIDIA H100 GPU 研究的數據。 唯一的區別是硬件:Lambda 使用 PCIe 外形規格 NVIDIA H100 GPU,而 Dell PowerEdge XE9680 服務器使用 HGX 外形規格,這可以解釋一些性能差異。

圖像生成模型的業務影響

通過穩定擴散生成圖像使創意專業人士能夠快速製作原型並完善他們的工作,例如提高營銷和廣告策略的效率並縮短上市時間。 建築、廣告、營銷、創意、電影、特效、攝影和藝術等領域的專業人士已經採用了這項技術。

穩定擴散等生成式人工智能技術可以為企業運營帶來變革,尤其是在速度至關重要的情況下。 在產品設計和開發中,這些模型可以快速生成視覺原型,使設計團隊能夠實時評估和完善概念。 這加快了設計過程並縮短了上市時間。

最有趣的概念之一來自零售行業。 人工智能可以根據客戶喜好快速生成各種產品配置或顏色選項的逼真圖像,例如“給我看看這把椅子,但是是紅色的”或“那張豹紋沙發看起來怎麼樣。” 對於房地產和建築業務,生成式人工智能可以快速創建新建​​築或改建項目的可視化,幫助規劃和銷售演示。

在企業內部的培訓和教育領域,人工智能生成的圖像可用於為員工培訓項目創建真實的場景,從而提高學習成果。 圖像生成速度可以顯著提高企業的敏捷性,使他們能夠更有效地響應市場變化、客戶需求和內部要求。

關閉的思考

Dell PowerEdge XE9680 是一款高性能服務器,具有令人印象深刻的功能,可以輕鬆處理要求苛刻的 AI 工作負載(至少目前如此)。 雖然 XE9680 的目標市場是流行的人工智能市場,但對於如此強大的盒子來說,在分析和數據處理方面可能還有其他有趣的用例。 值得注意的是,XE9680 支撐 戴爾的螺旋計劃,一項幫助組織​​更及時地將人工智能項目上線的服務。

XE9680白皮書

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱