存储评论网

ZutaCore 瞄准高密度 Blackwell PCIe 服务器,采用无水两相冷却技术

企业版  ◇  服务器机架

ZutaCore 推出了 OmniTherm,这是一款冷板,可为配备 NVIDIA 6000 Blackwell Server Edition GPU 的服务器提供无水两相冷却方案,且采用单槽 PCIe 封装。该解决方案的目标客户是 OEM 厂商和大型运营商,他们希望在标准企业级和 AI 云服务器设计中以全功率运行这些加速器,而无需切换到专用服务器平台或浸没式系统。

Zutacore OmniTherm 冷板俯视图

PCIe GPU 服务器仍然是 AI 推理和混合工作负载的首选,因为它们更易于部署、扩展,并且能够轻松集成到现有的机架和电源基础设施中。随着 GPU 功率密度的提高,传统的风冷散热开始限制性能。运维人员通常需要提高风扇转速,这会增加功耗、提高噪音水平,并且仍然可能导致系统在处理高强度 AI 工作负载时容易过热。

OmniTherm ZutaCore旨在通过采用两相液冷技术来解决服务器机箱内不使用水的问题。其冷板采用密封的介电液体,该液体在热源处沸腾,然后在独立的回路中冷凝。ZutaCore保持了单槽PCIe规格,使系统构建商能够在标准服务器架构中保持或提高加速器密度,同时将大部分热量转移到液冷回路。这减少了对高转速风扇的需求,降低了功耗,并减轻了机架层面的热负荷和噪音。

ZutaCore首席技术官My D. Truong强调了PCIe GPU日益增长的重要性,随着数据中心面临不断上涨的机架级电力预算,PCIe GPU兼具灵活性和高密度优势。他提到,无水两相冷却和单槽外形设计的结合旨在帮助数据中心在保持稳定散热性能的同时,增加每台服务器的加速器数量,从而满足持续的AI工作负载需求,尤其是在部署规模不断扩大的情况下。

专为始终在线、可变的 AI 工作负载而设计

生产环境中的人工智能系统很少能保持稳定的工作负载。推理任务变化很大,其使用量和功耗会随着流量模式和模型行为而变化。这些波动会导致温度快速变化,给风冷设计带来压力,并影响性能可靠性。

OmniTherm 的两相散热设计能够快速响应这些变化。随着 GPU 负载增加,更多的介电液会在冷板上汽化,从而在不提高风扇转速的情况下提升散热效率。当负载降低时,随着蒸汽冷凝,系统温度会自然稳定下来。此功能有助于运维人员在各种工作负载下保持更稳定的温度。它能够确保性能稳定可靠,并降低高密度 PCIe GPU 服务器中出现临时降频的风险。

保护长期基础设施投资

对于运营商而言,长期可靠性和性能与峰值吞吐量同等重要。ZutaCore 声称,OmniTherm 不仅能冷却 GPU 芯片,还能冷却附近的高价值组件,例如 CPU 和下一代高带宽内存。该系统不仅覆盖主加速器 ASIC,还能有效冷却多芯片和 HBM 密集型设计中的关键热点区域。

更广泛的散热覆盖范围支持长时间运行、带宽密集型的人工智能任务,这些任务对计算和内存系统都是严峻的挑战。降低这些组件的热应力可以提高长期稳定性,减少性能衰减,并在GPU和内存技术不断进步的过程中保护对高功率PCIe平台的投资。

架秤操作注意事项

随着机架处理更高功率密度的需求日益增长,仅依靠空气冷却的成本和复杂性也迅速增加。更高的风扇功率、更大的噪音以及更严格的暖通空调要求都会增加运营成本,并可能影响数据中心的工作环境。

OmniTherm 的密封式非导电介电液体回路旨在吸收服务器的大部分热量,并将其传递到机房侧的液体回路,而无需将水引入机箱内部。这种结构可以减少对极高风扇转速的依赖,降低冷却能耗,并帮助运营商控制噪音水平。此外,该方案还能通过将更多冷却需求转移到液体系统而非仅仅依赖气流,从而支持在现有空间内扩展基于 PCIe 的 AI 部署。

HyperCool Cloud

除了 OmniTherm 之外,ZutaCore 还推出了 HyperCool Cloud,这是一个基于云的运维平台,用于管理分布式部署中的液冷系统。该平台设计安全可靠,并采用遥测技术,可提供近乎实时的冷却液分配单元 (CDU) 及相关冷却设备的运行状况信息。

HyperCool Cloud 为 CDU 提供遥测数据,支持全集群监控,并实现从报警到解决的完整工作流程。对于运营商而言,这意味着液冷系统可以像其他基础设施组件一样,作为一项可管理、可观测的服务运行。其目标是在液冷系统扩展到多个站点和更大规模的 PCIe GPU 服务器集群时,提升服务响应速度,简化事件管理,并确保正常运行时间。

OmniTherm 和 HyperCool Cloud 的结合使 ZutaCore 能够应对基于 PCIe 的 AI 平台在扩展过程中,通过无水两相液冷技术所面临的硬件和运营挑战。

参与 StorageReview

资讯订阅 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter(现为X) | TikTok | RSS订阅

哈罗德弗里茨

自 IBM 创建 Selectric 以来,我一直在科技行业工作。 不过,我的背景是写作。 因此,我决定退出售前业务,回归本源,从事一些写作工作,但仍从事技术工作。