首页 企业版AI 适用于生成式 AI 的 Dell PowerEdge XE9680:稳定的平台、稳定的扩散、卓越的性能

适用于生成式 AI 的 Dell PowerEdge XE9680:稳定的平台、稳定的扩散、卓越的性能

by 乔丹拉努斯

在企业人工智能的高风险领域,科技巨头们正在进行一场不懈的竞赛,以推出下一个重大的硬件创新。 戴尔科技集团最近推出了用于生成式 AI 的 Dell PowerEdge XE9680, 在最近的白皮书中展示了它。 PowerEdge XE9680 专为处理人工智能工作负载而设计,它不仅是这场竞赛的新参与者,而且还是潜在的领跑者。

在企业人工智能的高风险领域,科技巨头们正在进行一场不懈的竞赛,以推出下一个重大的硬件创新。 戴尔科技集团最近推出了用于生成式 AI 的 Dell PowerEdge XE9680, 在最近的白皮书中展示了它。 PowerEdge XE9680 专为处理人工智能工作负载而设计,它不仅是这场竞赛的新参与者,而且还是潜在的领跑者。

通过深入研究白皮书,我们了解了这家巨头如何重新定义人工智能领域,以及为什么它可能成为您的企业征服人工智能前沿的秘密武器。

适用于生成式 AI 的 Dell PowerEdge XE9680

- 戴尔 PowerEdge XE9680 是一款GPU密集型机架服务器,专为人工智能领域的高性能应用而设计。 它配备了两个第四代英特尔至强可扩展处理器,每个处理器最多有4个核心,并且可以配备56个NVIDIA HGX H100或100个NVIDIA HGX AXNUMX GPU; 所有这些都通过 NVIDIA NVLink 技术互连。

适用于生成式 AI 的 Dell PowerEdge XE9680

PowerEdge XE9680 支持高达 4800 MT/s 的 DIMM 速度,并具有 32 个 DDR5 DIMM 插槽,最大 RAM 容量为 4 TB。 它提供多达 8 个 2.5 英寸 NVMe SSD 驱动器用于存储,最大容量为 122.88 TB。 该服务器还包括一系列安全功能,例如加密签名固件、静态数据加密 (DRE)、安全启动等。 它通过嵌入式 iDRAC9 系统进行管理,并支持各种管理工具和集成。 该服务器采用 6U 机架外形,重 235.89 磅。 (107 公斤)。

适用于生成式 AI GPU 的 Dell PowerEdge XE9680

戴尔 PowerEdge XE9680 规格

PowerEdge XE9680 旨在处理具有大量内存占用的人工智能工作负载。 借助 NVLink,GPU 可以访问系统中其他 GPU 的大量内存,从而提供对共享资源的高速访问。 这种重要的内存能力应该会带来更高的性能、更复杂的模型,以及处理更大、更详细的数据集的能力,通过利用更大的参数模型来提高准确性和实用性。

型号:

  • 戴尔 PowerEdge XE9680

处理器能力:

  • 2 个插座功能
  • 最多两个第 4 代英特尔至强可扩展处理器,每个处理器最多 56 个内核

物理特性:

  • 6U 风冷,环境温度高达 35C
  • 1200mm 机架能力

内存支持:

  • 多达 32 个 DDR5 DIMM
  • 高达 4800 MT/秒 (1DPC) 或 4400 MT/秒 (2DPC)
输入/输出能力:

  • 10 x 16 PCIe Gen5 插槽
  • 3.0 个 OCP 网卡 XNUMX
  • 2x1GbELOM

GPU优化:

  • NVIDIA 8 个 H100 SXM5 700W 80GB GPU 或 NVIDIA 8 个 A100 SXM4 500W 80GB GPU
  • 完整的 NVLINK 互连性

人工智能能力:

  • AI大模型训练

驱动支持:

  • 支持多达 16 个驱动器
  • 多达 8 个 SAS/SATA/NVMe Gen4 或 16 个 E3.S
  • 用于启动的后部热插拔 BOSS N -1 (2 x M.2 MVNe)(可选)
  • 软件 RAID/PERC12 支持

图像生成模型:艺术科学

您是否曾经希望自己能像梵高一样绘画或像达芬奇一样素描,但最终却画出连幼儿园小朋友都无法打动的简笔画? 进入图像生成模型 (IGM) 的世界,它相当于一位杰出艺术家的机器学习,但没有任何怪癖和贝雷帽。

IGM 是机器学习模型的一个子集,旨在解决新图像的创建问题。 IGM 属于更广泛的生成建模领域,即理解和复制数据模式。 不过,这些模型不是生成数字或文本,而是创建视觉效果。 近几个月来,IGM 创造了各种新闻,从新的艺术品到异常逼真的人脸。

这些模型已经渗透到从艺术和娱乐到广告和科学研究的各个领域。 他们正在创建用于医学诊断的细胞图像,模拟外太空,并生成逼真的自拍照,让你自己都能钓到鲶鱼。 随着这些模型的发展,快速运行它们的要求也在不断增长。

适用于生成式 AI 的 Dell PowerEdge XE9680:为稳定扩散的边缘提供动力

扩散方法在推理过程中生成新图像时,通常依赖于同步运行的大规模 GPU 集群,并且需要大量的硬件运行时间。 然而,戴尔的白皮书显示,借助戴尔PowerEdge XE9680服务器,这些生成式AI操作可以显着加快。

这样可以在短短几秒钟内生成数十到数百个合理分辨率的图像。 戴尔指出,通过利用戴尔PowerEdge XE9680的生成式AI功能,可以在几秒钟内根据单个文本提示生成大型高分辨率图像(戴尔使用2,096 x 2,096)。

PowerEdge XE9680 上生成的图像,带有文本提示 =“快乐狗的肖像,特写”

XE9680 生成文本提示=“快乐狗的肖像,特写”

- 白皮书 考虑批量大小和图像分辨率变化,评估 PowerEdge XE9680 服务器上 HuggingFace Diffusers 文本到图像模型的图像生成延迟。 XE9680服务器可以生成分辨率高达2,048 x 2,048的图像。

随着批量大小的增加,对基础设施的内存需求也随之增加。 因此,使用较低分辨率的图像(例如 256 x 256)可以实现巨大的批量大小。 然而,由于内存限制,非常高分辨率的图像(如 2,048 x 2,048)只能生成批量大小为 XNUMX 的图像。

PowerEdge XE9680 批量图像生成时间

PowerEdge XE9680 批量图像生成时间

重点关注 256 x 256 和 512 x 512 分辨率图像的批量图像生成,展示了 Dell PowerEdge XE9680 在几秒钟内生成多个图像的生成式 AI 的强大功能。 此功能可加速创意设计周期所需的评估、及时调整和进一步评估。 这些结果展示了如何在 Dell PowerEdge XE32 服务器上使用 HuggingFace Diffusers 软件包在不到 512 秒的时间内批量生成 512 个分辨率为 9680 x 10 的图像。 此外,使用同一平台可以在不到 64 秒的时间内创建批量 256 张分辨率为 256 x 5 的图像,从而为企业和专业人士实现快速原型设计和创意设计周期。

图像生成基准

在白皮书的分析中,根据 Lambda 设置的映像生成延迟基准对 Dell PowerEdge XE9680 服务器进行了评估。 此比较涉及 Dell PowerEdge XE100 服务器上具有 80 GB RAM 的单个 NVIDIA H9680 GPU 以及 Lambda 的 ML Labs 团队发布的 NVIDIA H100 GPU Stable Diffusion 基准测试。

Dell PowerEdge XE9680 服务器(蓝色)和 Lambda 服务器(橙色)的批量映像生成延迟值。 两项研究均使用具有 100 GB GPU RAM 的单个 NVIDIA® H80 GPU,其中戴尔服务器 GPU 的 GPU 外形尺寸为 HGX,Lambda 服务器 GPU 为 PCIe。 所有图像都使用相同的 HuggingFace 文本到图像 Diffusers PyTorch 代码,并带有文本提示 =“宇航员在火星上骑马的照片”,迭代次数 = 30、512 x 512 图像分辨率、float16 精度、DDIM Scheduler、稳定扩散 v1.4。

Dell PowerEdge XE9680 映像生成延迟

研究表明,XE9680 超越了 Lambda 的基准,实现了大约两倍的吞吐量。 戴尔的研究结果以与 Lambda 相同的格式呈现,在相同的软件定义条件下使用 NVIDIA H100 GPU 研究的数据。 唯一的区别是硬件:Lambda 使用 PCIe 外形规格 NVIDIA H100 GPU,而 Dell PowerEdge XE9680 服务器使用 HGX 外形规格,这可以解释一些性能差异。

图像生成模型的业务影响

通过稳定扩散生成图像使创意专业人士能够快速制作原型并完善他们的工作,例如提高营销和广告策略的效率并缩短上市时间。 建筑、广告、营销、创意、电影、特效、摄影和艺术等领域的专业人士已经采用了这项技术。

稳定扩散等生成式人工智能技术可以为企业运营带来变革,尤其是在速度至关重要的情况下。 在产品设计和开发中,这些模型可以快速生成视觉原型,使设计团队能够实时评估和完善概念。 这加快了设计过程并缩短了上市时间。

最有趣的概念之一来自零售业。 人工智能可以根据客户喜好快速生成各种产品配置或颜色选项的逼真图像,例如“给我看看这把椅子,但是是红色的”或“那张豹纹沙发看起来怎么样。” 对于房地产和建筑业务,生成式人工智能可以快速创建新建筑或改建项目的可视化,帮助规划和销售演示。

在企业内部的培训和教育领域,人工智能生成的图像可用于为员工培训项目创建真实的场景,从而提高学习成果。 图像生成速度可以显着提高企业的敏捷性,使他们能够更有效地响应市场变化、客户需求和内部要求。

关闭的思考

Dell PowerEdge XE9680 是一款高性能服务器,具有令人印象深刻的功能,可以轻松处理要求苛刻的 AI 工作负载(至少目前如此)。 虽然 XE9680 的目标市场是流行的人工智能市场,但对于如此强大的盒子来说,在分析和数据处理方面可能还有其他有趣的用例。 值得注意的是,XE9680 支撑 戴尔的螺旋计划,一项帮助组织更及时地将人工智能项目上线的服务。

XE9680白皮书

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅