首页 电子消费品 Comino Grando H100 评测 – 188GB NVL GPU 内存

Comino Grando H100 评测 – 188GB NVL GPU 内存

by 莱尔·史密斯

Comino Grando H100 服务器提供 2 个 NVIDIA H100 GPU、液冷和 AMD Threadripper PRO 7995WX,专为 AI 和 HPC 工作负载而设计。

Comino Grando H100 服务器是该公司产品线中的最新产品。它迎合了需要精良、液冷精度电源的用户。这款 Grando 配置引入了不同的硬件和设计增强功能。然而,它仍然非常适合高需求应用,从人工智能和机器学习到复杂的数据分析和视觉渲染。

Comino Grando H100 正面

在我们新的 H100 配置中,Comino 选择了一款强大的 CPU:AMD Ryzen Threadripper PRO 7995WX,它在高核、高线程计算任务中表现出色。

Comino Grando H100 盖子已取下

这款 96 核 CPU 非常适合并行处理,用户可以在其中运行大量数据集或处理需要更多内核和线程的多线程应用程序。华硕 SAGE WRX90 主板与这款 CPU 相得益彰,并提供了支持 H100 增强内存和连接需求的架构。

Comino Grando H100:处理器和内存选项

它拥有 96 个核心/192 个线程、Zen 4 架构和先进的 5nm 技术,可轻松处理 3D 渲染、视频编辑和复杂模拟等任务。它的基本时钟频率为 2.5 GHz(最高可达 5.1 GHz),非常适合多线程和单线程任务。它支持八个通道中高达 2TB 的 DDR5 内存,为海量数据集提供大量带宽。此外,它与 WRX90 平台兼容,这意味着有足够的 PCIe Gen5 通道用于高速存储和 GPU 设置。

这款 Grando 型号的 GPU 设置配备两个 NVIDIA H100 NVL GPU,每个 GPU 拥有 94GB 内存。这种双 GPU 配置可提供令人印象深刻的 188GB GPU 内存,从而增强要求苛刻的应用程序的性能。它对人工智能、3D 渲染和科学模拟领域的专业人士尤其有益,因为 GPU 内存限制会影响生产力。对于那些需要强大的计算资源来高效处理大型数据集和复杂任务的人来说,Grando 型号是一个绝佳的选择。而且由于 Comino 的液体冷却,这些高功率 GPU 可以在单插槽外形尺寸下运行,实现传统风冷系统无法比拟的密度。

NVIDIA H100 NVL GPU 规格

FP64 30 万亿次浮点运算
FP64 张量核心 60 万亿次浮点运算
FP32 60 万亿次浮点运算
TF32 张量核心* 835 万亿次浮点运算
BFLOAT16 张量核心* 1,671 兆次浮点数
FP16 张量核心* 1,671 兆次浮点数
FP8 张量核心* 3,341 兆次浮点数
INT8 张量核心* 3,341 TOPS
GPU内存 94GB
GPU内存带宽 3.9TB/秒
解码器 7 NVDEC
7 格式
最大热设计功率 (TDP) 350-400W(可配置)
多实例 GPU 最多 7 MIGS @ 每个 12GB
外形 PCIe
双槽风冷
互联 NVIDIA NVLink:600GB/秒
PCIe Gen5:128GB/秒
服务器选项 具有 1-8 个 GPU 的合作伙伴和 NVIDIA 认证系统
NVIDIA 人工智能企业 包含

用户可以选择 Kingston Fury 高速桌面级内存(适用于低延迟任务)或 Kingston Server Premier 更大的 512GB 容量,以实现企业级可靠性和更高的内存密集型工作负载。

Comino Grando H100:冷却和电源

与之前的 Grando 迭代一样,这款产品的设计理念既注重实用性,也注重性能。其先进的内部冷却系统采用定制的水冷块设置,即使在繁重的工作负载下也能保持所有组件的冷却。

这种液体冷却系统可确保 GPU 保持最佳性能,不会出现热节流,同时降低噪音水平。与依赖大型嘈杂风扇的传统服务器不同,Grando 的液体冷却解决方案高效且设计精良。冷却架构包括一个带有防滴快速断开接头的集中式水分配块,可轻松维护,最大程度地降低泄漏或溢出的风险。

Comino Grando H100 后部

Grando H1600 配备四个独立的 100W PSU,即使电源发生故障也能保持正常运行,这对于需要不惜一切代价避免停机的企业环境来说至关重要。这些电源无缝协作,即使在 7995WX 和双 H100 GPU 的极端负载下也能确保持续供电。

Comino Grando H100:设计和建造

除了电源和冷却之外,Comino Grando H100 的布局也经过精心设计,可以轻松访问关键组件。我们在之前的 Comino Grando 评论,因此我们将介绍其中的亮点。

前面板具有全面的 I/O 阵列,包括音频插孔、多个 USB 端口和网络连接选项,使其适合机架安装环境和独立使用。内置 LED 显示屏不仅仅是一种装饰。它提供实时遥测数据,包括空气和冷却液温度、风扇速度和泵状态。

背光菜单按钮方便用户浏览这些信息。它们还允许访问更深层次的设置和诊断以进行监控和调整,从而提高可用性和定期维护的便利性。

在内部,每个组件都经过精心布置,以防止在运输过程中移动,并在 GPU 和 SSD 等敏感部件周围进行额外支撑。这体现了 Grando 致力于确保其服务器耐用且安全交付的决心。

Comino 服务器也易于维护和维修。电缆、管道和组件的布线非常合理,使内部看起来干净整洁,几乎是模块化的。这对气流和维护也起到了实际作用,使隔离和处理任何组件变得更容易,而不会破坏其余设置。

Comino Grando 服务器 H100 性能

现在,我们将深入研究这些构建选择如何影响实际性能。我们将此设置与我们今年早些时候评测过的两款 Comino Grando 型号进行比较,并讨论计算和图形任务中的具体基准。我们还将它与 超微 AS-2115HV-TNRT.

经过测试的系统

我们的 Grando 服务器 H100 该版本采用 AMD Threadripper PRO 7995WX 处理器,提供 96 个内核和 192 个线程,是该系列中内核密度最高的 CPU。该系统采用 512GB Kingston Server Premier DDR5 内存,专为高带宽工作负载和密集型多任务处理而设计。GPU 设置包括两个 NVIDIA H100 NVL GPU,每个 GPU 具有 94GB 内存。

Comino Grando H100 GPU

这款 超微 AS-2115HV-TNRT 系统使用相同的 AMD Threadripper PRO 7995WX,但包含 520GB DDR5-4800 ECC 内存和四个 NVIDIA RTX 6000 Ada GPU。这些 GPU 面向高端图形渲染和专业可视化任务。Supermicro 系统还配备了 Micron 7450 Max 3.2TB NVMe。

The Grando 服务器 我们今年早些时候评测的这款产品采用了 AMD Threadripper PRO 5995WX 处理器,这是一款 64 核 128 线程 CPU,配备 512GB RAM 和 4090 个 NVIDIA RTX 4090 GPU。此配置主要侧重于图形性能,RTX 4 可为渲染和通用 GPU 工作负载提供高吞吐量。该系统还包括 1600 个 2W PSU 和 XNUMXTB NVMe SSD。

另一款 Comino 系统是 3975W 供电的 格兰多工作站,提供 32 个内核和 64 个线程。其 GPU 配置由四个 NVIDIA A100 GPU 组成,强调以计算为中心的工作负载和可视化任务之间的平衡。它与 512GB RAM 和 2TB NVMe SSD 配对,使其计算密度低于较新的系统,但能够处理要求苛刻的工作流程。

值得注意的是,我们之前评测过的 Grando Server 很可能会在以 GPU 为中心的基准测试中表现出色,尤其是与渲染和可视化任务相关的基准测试。RTX 4090 GPU 专为高端图形工作负载而设计,可为此类应用程序提供强大的计算能力。

Nvidia H100 GPU 是专门设计的计算加速器,故意省略了显示输出和消费者功能,使其完全专注于数据中心工作负载。与消费者和工作站产品不同,H100 不包括显示端口或 Windows 图形驱动程序,因为它们是为无头服务器操作而设计的。没有 NVENC 编码硬件进一步强调了它们仅用于计算的性质,优化了芯片空间以用于 AI 和 HPC 任务,而不是媒体编码。

基准测试结果

搅拌机4.0

我们的第一个基准测试是 Blender,这是一款全面的开源 3D 创作套件,适用于建模、动画、模拟和渲染项目。Blender 基准测试评估系统渲染复杂场景的性能,这对于视觉效果、动画和游戏开发专业人士来说至关重要。此基准测试衡量 CPU 和 GPU 渲染能力,这些能力与专为高端图形处理和计算任务而设计的服务器和工作站相关。

在这里,由于 AMD Threadripper PRO 100WX 的核心数量较多,Grando H7995 Server 配置在基于 CPU 的测试中表现出色。它在渲染怪物、Junkshop 和课堂场景等任务方面始终领先于 Supermicro AS-2115HV-TNRT 等其他系统。然而,GPU 测试揭示了 H100 GPU 在图形渲染工作负载方面的局限性。虽然 H100 配置提供了不错的结果,但具有更多通用 GPU 的系统性能明显更好,例如 RTX 6000 Ada 或 RTX 4090。这凸显了 H100 在计算而非图形任务方面的专业化。

混合器
(每分钟采样数;越高越好)
Grando 服务器
(AMD 7995WX、2 个 H100)
Supermicro AS-2115HV-TNRT(AMD 7995WX、4x RTX 6000 Ada) Supermicro AS-2115HV-TNRT 超频(AMD 7995WX、4x RTX 6000 Ada)
Blender 4.2 CPU 测试
怪物  1,352.19 931 969
旧货店  969.44 682 640
课堂 683.30 451 472
Blender 4.2 GPU 测试
怪物 2,521 5,745
旧货店 1,888.28 2,698
课堂 1,401.96 2,824

之前评测过的 Grando 服务器在 Blender 4.0 版本下进行了测试。结果如下:

混合器
(每分钟采样数;越高越好)
格兰多服务器
(TR W5995WX,512GB,6x 4090)
格兰多工作站
(TR 3975WX,512GB,4x A100)
Blender 4.0 CPU 测试
怪物  568.02 334.40
旧货店  386.53 231.90
课堂 293.91 174.21
Blender 4.0 GPU 测试
怪物 5,880.71 1,656.34
旧货店 2,809.36 1,137.73
课堂 2,895.54 953.46

Blackmagic RAW 速度测试

Blackmagic RAW速度测试可测量高质量视频格式的处理速度,这是视频制作和编辑中服务器和工作站的一个重要方面。它评估系统如何管理 RAW 视频文件,影响媒体制作环境中的工作流程效率和生产力。

在 Blackmagic RAW 速度测试中,Grando Server H100 在 8K RAW 视频解码中表现出强大的 CPU 性能,但在基于 CUDA 的活动中表现不佳,因为较小的 T1000 在本系统中处理了该活动。配备 RTX 4090 和 RTX 6000 Ada 等 GPU 的系统在 Windows 中提供 DirectX 支持,而以企业为中心的 GPU 本身并不提供这种支持。

Blackmagic RAW 速度测试 Grando 服务器
(AMD 7995WX、2 个 H100)
格兰多服务器
(TR W5995WX,512GB,6x 4090)
格兰多工作站
(TR 3975WX,512GB,4x A100)
Supermicro AS-2115HV-TNRT(AMD 7995WX、4x RTX 6000 Ada)
8K 中央处理器 FPS 156 FPS 132 FPS 135 FPS 132
8K 图形处理器 FPS 144 FPS 345 FPS 309 FPS 664

7-zip 压缩

7-zip 压缩基准测试系统处理数据压缩和解压缩的效率,这对于管理大型数据集和优化存储至关重要。该基准测试反映了数据密集型操作中服务器和工作站的性能,其中数据操作的速度和效率至关重要。

在这里,Grando 服务器 在测试的系统中,压缩和解压结果最佳。不过,就整体效率而言,超频的 Supermicro AS-2115HV-TNRT 配置接近。

7-Zip 压缩基准(越高越好) Grando 服务器
(AMD 7995WX、2 个 H100)
格兰多服务器
(TR W5995WX,512GB,6x 4090)
格兰多工作站
(TR 3975WX,512GB,4x A100)
超微 AS-2115HV-TNRT
(AMD 7995WX、4 块 RTX 6000 Ada)
Supermicro AS-2115HV-TNRT – 超频
(AMD 7995WX、4 块 RTX 6000 Ada)
压缩
当前 CPU 使用率 5,582% 3,379% 3,439% 5,571% 6,456%
电流额定值/使用 8.627 吉普斯 7.630 吉普斯 7.094 吉普斯 7.835 吉普斯 9.373 吉普斯
额定电流 481.539 吉普斯 257.832 吉普斯 243.994 吉普斯 436.490 吉普斯 605.097 吉普斯
产生的 CPU 使用率 5,561% 3,362% 3,406% 5,599% 6,433%
结果评级/使用 8.631 吉普斯 7.697 吉普斯 7.264 吉普斯 7.863 吉普斯 9.420 吉普斯
结果评级 480.006 吉普斯 258.756 吉普斯 247.396 吉普斯 440.288 吉普斯 605.984 吉普斯
解压
当前 CPU 使用率 6,270% 6,015% 6,286% 6,223% 6,343%
电流额定值/使用 7.411 吉普斯 5.585 吉普斯 5.434 吉普斯 7.215 吉普斯 9.810 吉普斯
额定电流 464.701 吉普斯 335.958 吉普斯 341.599 吉普斯 449.012 吉普斯 622.250 吉普斯
产生的 CPU 使用率 6,238% 6,053% 6,269% 6,213% 6,312%
结果评级/使用 7.589 吉普斯 5.603 吉普斯 5.468 吉普斯 7.165 吉普斯 9.834 吉普斯
结果评级 473.375 吉普斯 339.171 吉普斯 342.766 吉普斯 445.130 吉普斯 620.749 吉普斯
总收视率
总 CPU 使用率 5,900% 4,708% 4,837% 5,906% 6,373%
总评分/使用情况 8.110 吉普斯 6.650 吉普斯 6.366 吉普斯 7.514 吉普斯 9.627 吉普斯
总评分 476.690 吉普斯 298.963 吉普斯 295.081 吉普斯 442.709 吉普斯 613.366 吉普斯

Y-粉碎机

Y-Cruncher 是一个计算基准测试,用于测试系统处理复杂数学运算的能力,将 Pi 精确计算到数万亿位数字。该基准测试表明服务器和工作站的计算能力,特别是用于需要密集数字运算的科学研究和模拟。

在 Y-Cruncher 中,Grando Server H100 配置在所有数字级别计算 Pi 的总计算时间方面表现出色。AMD Threadripper PRO 7995WX 的高核心数确保该系统在 CPU 密集型任务中处于领先地位。然而,超频的 Supermicro AS-2115HV-TNRT 配置显著缩小了差距,展示了针对这些工作负载优化性能调整的好处。

Y-Cruncher(总计算时间) Grando 服务器
(AMD 7995WX、2 个 H100)
格兰多服务器
(TR W5995WX,512GB,6x 4090)
Grando工作站
(TR 3975WX,512GB,4x A100)
Supermicro AS-2115HV-TNRT(AMD 7995WX、4x RTX 6000 Ada) Supermicro AS-2115HV-TNRT – 超频(AMD 7995WX、4x RTX 6000 Ada)
1亿位数字 7.523秒 11.023秒 11.759秒 8.547秒 6.009秒
2.5亿位数字 15.392秒 28.693秒 32.073秒 17.493秒 13.838秒
5亿位数字 29.420秒 61.786秒 69.869秒 33.584秒 27.184秒
10亿位数字 60.089秒 130.547秒 151.820秒 67.849秒 58.283秒
25亿位数字 214.246秒 353.858秒 425.824秒 182.880秒 161.913秒
50亿位数字 594.939秒 788.912秒 971.086秒 417.853秒

y-cruncher BBP

此 y-cruncher 基准测试利用 Bailey-Borwein-Plouffe (BBP) 公式来计算 Pi 的大量十六进制数字,从而测量 CPU 的总计算时间、利用率和多核效率。

y-cruncher BBP 基准测试凸显了 Grando Server H100 在处理大量计算任务时的效率。在所有测试中,Grando Server 表现良好,在 1 BBP 和 10 BBP 计算中实现了最快的总计算时间。其在 100 BBP 测试中的多核效率为 98.68%,略低于 Supermicro AS-2115HV-TNRT 系统,但仍然非常高效。超频的 Supermicro 配置在所有 BBP 级别的总时间上都超过了标准 Supermicro。尽管如此,Grando H100 在较小的 BBP 任务的实际计算速度方面始终处于领先地位,这可能是由于其优化的多线程功能和快速的上下文切换。

然而,就 CPU 利用率而言,Supermicro 系统的核心使用效率略好一些,这表明它们可以更有效地利用其架构来实现持续的并行工作负载。

基准 Grando 服务器
(AMD 7995WX、2 个 H100)
超微 AS-2115HV-TNRT
(AMD 7995WX、4 块 RTX 6000 Ada)
Supermicro AS-2115HV-TNRT – 锁边
(AMD 7995WX、4 块 RTX 6000 Ada)
1 BBP
  • 总时间:0.173 秒
  • CPU 利用率:6,140.43%
  • 多核效率:31.98%
  • 总时间:0.256 秒
  • CPU 利用率:7,061.79%
  • 多核效率:36.78%
  • 总时间:0.178 秒
  • CPU 利用率:3,968.01%
  • 多核效率:41.33%
10 BBP
  • 总时间:1.301 秒
  • CPU 利用率:16,590.73%
  • 多核效率:84.41%
  • 总时间:2.006 秒
  • CPU 利用率:17,317.36%
  • 多核效率:90.19%
  • 总时间:1.458 秒
  • CPU 利用率:8,574.02%
  • 多核效率:89.31%
100 BBP
  • 总时间:13.966 秒
  • CPU 利用率:18,846.58%
  • 多核效率:98.68%
  • 总时间:21.434 秒
  • CPU 利用率:18,989.11%
  • 多核效率:98.90%
  • 总时间:15.876 秒
  • CPU 利用率:9,488.48%
  • 多核效率:98.84%

Geekbench 6

Geekbench 6 衡量 CPU 和 GPU 的计算性能,涵盖单核和多核功能以及图形处理能力。该基准对于评估服务器和工作站在各种任务(包括模拟、数据分析和图形渲染)中的整体计算效率至关重要。

Geekbench 6 的结果表明,Grando Server H100 凭借其 96 核处理器在多核 CPU 任务中表现出色。然而,在 GPU 得分方面,H100 配置优于 Supermicro AS-2115HV-TNRT,后者利用 RTX 6000 Ada GPU 实现卓越的图形性能。

Geekbench 6(越高越好) Grando 服务器
(AMD 7995WX、2 个 H100)
Grando 服务器(TR W5995WX,512GB,6x 4090) Grando 工作站(TR 3975WX,512GB,4x A100) 超微 AS-2115HV-TNRT
(AMD 7995WX、4 块 RTX 6000 Ada)
CPU单核 2,893 2,127 2,131 2,875
CPU 多核 28,600 21,621 20,411 24,985
GPU 298,220 294,894 193,447 307,510

Cinebench R23

Cinebench R23衡量CPU的渲染能力,重点关注单核和多核性能。它是评估服务器或工作站在内容创建、3D 渲染和其他 CPU 密集型任务方面的执行情况的重要基准。 MP 比率(多核性能比)进一步深入了解系统如何有效地利用其多个核心。

H100 配置在多核性能方面处于领先地位,充分利用了 Threadripper PRO 7995WX 的大量核心数。但是,其单核性能与其他系统相当。MP Ratio 强调了 7995WX 在多线程应用程序中的可扩展性。不过,此基准测试与 GPU 无关的性质使 H100 配置不会出现任何与 GPU 相关的限制,从而使其在各方面都显得更具竞争力。

Cinebench R23
(越高越好)
Grando 服务器
(AMD 7995WX、2 个 H100)
Grando 服务器(TR W5995WX,512GB,6x 4090) Grando 工作站(TR 3975WX,512GB,4x A100) Supermicro AS-2115HV-TNRT(AMD 7995WX、4x RTX 6000 Ada) Supermicro AS-2115HV-TNRT – 超频(AMD 7995WX、4x RTX 6000 Ada)
CPU 多核  159,930点 73,556 分 49,534 分 111,792点 132,044点
CPU单核 1,876 分 1,484 分 1,468 分 1,864点 1,887点
MP比率 85.26点¯x 49.56x 33.75x 59.98x 69.99x

GPU 直接存储

我们在此服务器上进行的测试之一是 Magnum IO GPU 直接存储 (GDS) 测试。GDS 是 NVIDIA 开发的一项功能,允许 GPU 在访问存储在 NVMe 驱动器或其他高速存储设备上的数据时绕过 CPU。GDS 无需通过 CPU 和系统内存路由数据,而是实现 GPU 和存储设备之间的直接通信,从而显著降低延迟并提高数据吞吐量。

GPU 直接存储的工作原理

传统上,当 GPU 处理存储在 NVMe 驱动器上的数据时,数据必须先经过 CPU 和系统内存,然后才能到达 GPU。这个过程会造成瓶颈,因为 CPU 会成为中间人,增加延迟并消耗宝贵的系统资源。GPU 直接存储通过使 GPU 能够通过 PCIe 总线直接从存储设备访问数据,消除了这种低效率。这种直接路径减少了与数据移动相关的开销,从而实现了更快、更高效的数据传输。

AI 工作负载(尤其是涉及深度学习的工作负载)是高度数据密集型的。训练大型神经网络通常需要处理数 TB 的数据,数据传输的任何延迟都可能导致 GPU 利用率不足和训练时间延长。GPU Direct Storage 通过确保尽快将数据传送到 GPU、最大限度地减少空闲时间并最大限度地提高计算效率来解决这一挑战。

此外,GDS 对于涉及流式传输大型数据集的工作负载(例如视频处理、自然语言处理或实时推理)尤其有益。通过减少对 CPU 的依赖,GDS 可加速数据移动并释放 CPU 资源以用于其他任务,从而进一步提高整体系统性能。

我们通过对 Comino Grando 进行广泛的 GDSIO 评估来全面测试服务器,探索各种配置以评估其在不同场景下的性能。这种类型的测试对于这种级别的服务器至关重要,因为它模拟了类似工作站的环境,并在训练大型模型的烧蚀测试中提供了对其功能的洞察。对于存储,我们利用了 Solidigm D7-PS1010 Gen5 SSD.

测试配置矩阵

我们系统地测试了以下参数的每种组合:

  • 块大小:1M、128K、64K、16K、8K
  • 线程数:128、64、32、16、8、4、1
  • 作业数量:16、8、4、1
  • 批次大小:32、16、8、4、1

在本篇评测中,我们重点关注顺序读写吞吐量。我们以给定的块大小和线程数跨多个作业和批处理大小执行每个 GDSIO 工作负载。报告的数字是每个作业和批处理计数组合的平均值。

性能分析

AI 工作负载(尤其是在训练阶段)需要高效处理大量数据。这些工作负载通常受益于较大的块大小,可以在读取训练数据集或写入模型检查点时最大限度地提高吞吐量。在我们全面的 GPU Direct Storage 功能测试中,我们专注于各种 I/O 模式和配置,以了解系统的性能特征。

在我们的测试配置中,1M 块大小的顺序 I/O 性能表现出色。该系统实现了 8.56 GiB/s 的出色顺序读取吞吐量(1M 块大小、批处理大小 4、IO 深度 128 和 128 个作业中的 16 个线程)。这种级别的性能对于涉及加载大型预训练模型、在训练阶段处理大量数据集或处理顺序数据流(例如计算机视觉应用程序的视频处理)的工作负载尤其有益。

对于顺序写入操作,系统交付了 7.57 GiB/s(1M 块大小、批处理大小 8、IO 深度 16、16 个作业 8 个线程),这对于需要在分布式训练期间频繁进行模型检查点、保存中间结果或在批量操作中写入处理后的数据的场景非常有效。

总结

Comino Grando H100 服务器是该公司产品线中令人印象深刻的新成员,为其其他配置提供了独特的替代方案。Grando 系统采用 AMD Threadripper PRO 7995WX CPU 和 512GB DDR5 内存,可扩展至 1TB,其亮点是两个 NVIDIA H100 NVL GPU。虽然此设置为 AI 驱动的工作流程提供了出色的性能,但它确实以传统渲染基准测试(例如 Luxmark 和 OctaneBench)中的 GPU 性能为代价,而配备 RTX 4090 的 Grando Server 和配备 RTX 6000 Ada 的 Supermicro 配置等系统处于领先地位。尽管如此,H100 在 Blender 的多核渲染、7-Zip 压缩和 Y-Cruncher 等 CPU 密集型测试中的表现始终优于其他测试系统。

在设计方面,Comino Grando H100 服务器可以在紧凑的外形中容纳高性能组件,这对于标准机箱来说通常是一个挑战。得益于其定制的直接液体冷却 (DLC) 系统,该服务器可以轻松处理双 NVIDIA H100 GPU 等配置。这种先进的冷却解决方案可以控制热量并确保系统在要求苛刻的高性能任务中保持稳定。这款新 Comino 系统的独特之处在于它如何利用主要的消费级硬件来创建既高效又相对实惠的解决方案,使其成为希望在不花大钱的情况下最大限度地发挥 GPU 能力的专业人士和企业的有力选择。

总体而言,对于优先考虑 AI 优化、计算任务和苛刻环境中的可靠性的企业和专业人士来说,Comino Grando H100 是绝佳选择。其独特的设计和冷却创新为 AI 驱动的工作负载提供了灵活性和性能。然而,配备 RTX 4090 的 Grando 服务器或 RTX 6000 Ada 驱动的系统等替代配置可能更适合专注于传统 GPU 渲染的用户。

科米诺系统

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅