AMD EPYC を搭載した Supermicro サーバー上の ZutaCore の 2 フェーズ冷却により、冷却、効率、記録破りのパフォーマンスが向上します。
高性能サーバー向けの高度な冷却技術の継続的な評価の一環として、デュアル AMD EPYC Bergamo CPU を搭載した Supermicro サーバーで ZutaCore® 2 相ダイレクト ツー チップ (DTC) 冷却ソリューションをテストしました。このテストは、インテグレーターの Boston Limited と共同で、英国バークシャー州レディングの Centersquare データセンターで実施されました。
効率的な冷却ソリューションの必要性
CPU のコア数と消費電力が増加し続けるにつれて、従来の空冷ソリューションでは最先端のプロセッサの熱需要に対応するのが難しくなっています。これは高密度コンピューティング ノードで特に顕著で、空冷方式では AMD の 128 コア EPYC Bergamo などの高性能マルチコア CPU が発する大量の熱を効果的に管理できません。
これらの強力なプロセッサは大量の熱出力を生成するため、空冷の限界がより顕著になります。最先端のヒートシンクでも、ノイズの増加や過剰な電力消費を伴わずに最適な熱性能を維持するのは困難です。
このプロジェクトは、デュアルソケット Supermicro シャーシを従来の空冷から ZutaCore の 2 相 DTC ソリューションにアップグレードすることに重点を置いています。変換前にシステムをテストし、冷却効率の大きな制限を確認し、DTC インストール後にサーバーのベンチマークを実施しました。
ハードウェアのセットアップ
テスト システムには、それぞれ 1 コアのデュアル AMD EPYC Bergamo CPU を搭載した 128U Supermicro シャーシが搭載されていました。256 コアと 768 GB の RAM を搭載したこのサーバーは、特に AI やデータ集約型の環境で、高密度のワークロードを処理できるように設計されています。ただし、従来の大型空冷ヒートシンクを使用しても、システムはストレス テスト中に温度を制御するのに苦労し、サーマル スロットリングが発生しました。
冷却を改善し、パフォーマンスを強化するために、ZutaCore の 2 相液体冷却システムを選択しました。この革新的なシステムは、CPU に直接取り付けられた冷却プレート内で液体から蒸気に変化する熱伝達流体を使用します。この相変化により、流体の蒸発による潜熱が CPU コアからより効率的に熱を逃がすため、従来の液体または空気冷却器よりもはるかに高い熱効率が実現します。
変換プロセス
サーバーの準備
変換プロセスは、標準の空冷コンポーネントを分解することから始まりました。従来のヒートシンクを取り外すと、Bergamo CPU の小型で高密度のヒート スプレッダーが明らかになりましたが、これは明らかに、電力を大量に消費するチップの熱負荷を管理するには小さすぎます。最初のテストでは、CPU が高温に達し、ストレス下でパフォーマンスを持続するのに苦労していることがわかりました。
ZutaCoreコールドプレートの取り付け
次のステップは、2 相冷却システムの心臓部である ZutaCore のカスタム設計のコールド プレートを導入することでした。これらのコールド プレートには内部蒸発器が取り付けられており、熱伝達流体がシステムを通過する際に熱を吸収して蒸発します。蒸発した流体はその後、凝縮器に戻され、冷却されてシステムに再導入され、サイクルが継続されます。
このシステムの最も魅力的な機能の 1 つは、機械的な自己調整機能です。各蒸発器のフロート機構は、CPU の熱負荷に基づいて熱伝達流体の流量を調整します。このような閉ループ システムにより、各 CPU は手動操作なしで必要な量の流体を受け取ることができます。
冷却プレートは CPU 上に慎重に設置され、一貫した圧力と最適な熱接触が確保されました。熱伝達流体を運ぶチューブは冷却プレートに接続され、完全な設置を進める前に一連の圧力テストを実行して漏れがないことを確認しました。
サーバーの電源および熱管理システムとの統合
次の課題は、冷却システムを広範なデータ センター インフラストラクチャに統合することでした。ZutaCore の DTC システムは、サーバーの既存の熱管理システムと統合され、ZutaCore の冷却管理ソフトウェアを通じて強化された制御を提供します。このソフトウェアにより、冷媒圧力、システム内のさまざまなポイントの温度、CPU 接合部温度などの主要な指標をリアルタイムで監視できます。
ソフトウェアはサーバーの IPMI (インテリジェント プラットフォーム管理インターフェイス) に接続し、冷却パラメータのシームレスな監視と制御を可能にします。ファン速度、蒸気温度、ポンプのデューティ サイクルなど、提供される詳細情報に特に感銘を受けました。冷却プロセスを詳細に可視化することで、ワークロードに合わせてシステム パフォーマンスを微調整できます。
クイック ディスコネクト フィッティングを使用してシステムを熱遮断ユニットに配管し、付属のサービス キットを使用してループから大気ガスを素早く除去すると、システムの電源を入れる準備が整いました。
業績ハイライト
変換前の結果
前述のとおり、ZutaCore の 256 フェーズ システムに切り替える前に、標準の空冷で一連のベンチマークを実行しました。85 個のコアすべてに負荷をかけるように設計されたワークロードを使用すると、システムはすぐに熱限界に達し、CPU は安全な動作温度内にとどまるようにパフォーマンスを調整しました。高負荷が持続すると、CPU の温度は XNUMX°C 近くまで上昇し、クロック速度が著しく低下しました。
変換後の結果
DTC ソリューションをインストールした後、これらのベンチマークを再実行したところ、劇的な結果が得られました。CPU の温度は、全負荷状態で大幅に低下し、ピーク温度は 65°C 未満に留まりました。さらに重要なのは、サーマル スロットリングが解消されたことです。XNUMX フェーズ システムにより、Bergamo CPU はテスト全体を通じて、より高い持続クロック速度で動作し続けました。
当然のことながら、高温を補うためにファンを最大回転数まで回転させる必要がなくなったため、システムの電力消費量は減少しました。騒がしいデータ センター環境でも、動作音が静かになったことはすぐにわかりました。
この演習は ZutaCore ソリューションの実践的な体験を目的としていたため、すべての測定は定性的なものでした。撮影と執筆時点で、ZutaCore 冷却 Bergamo システムは、y-cruncher BBP カテゴリーでいくつかの世界記録を達成し、HWBot.org で検証されたことは注目に値します。
電力と冷却効率
ZutaCore システムの際立った利点の 1 つは、エネルギーを節約できる可能性があることです。空冷への依存度が減ることで、高回転ファンや空調の必要性が減り、実際のエネルギー コストの節約につながります。さらに、このシステムにより、サーバーは過熱のリスクなしに、より高い周囲温度で動作できます。この機能は、施設の温度を上げて PUE (電力使用効率) を最適化したいと考えているデータ センターにとって非常に貴重です。
データセンターへの長期的な影響
ZutaCore の 2 相冷却ソリューションは、高い熱負荷を効果的に管理し、データ センターに長期的なメリットをもたらします。エネルギー効率の向上と冷却コストの削減により、高密度コンピューティング環境にとって不可欠なものとなります。
AMD の EPYC や NVIDIA の H100 などの次世代プロセッサと GPU を採用するデータ センターにとって、ZutaCore 冷却ソリューションは、既存のインフラストラクチャに大幅な変更を加えることなく、増加する熱出力を管理するためのスケーラブルなオプションを提供します。
さらに、2 相冷却方式は環境に優しい方法です。ZutaCore の熱伝達流体は無毒で、GWP (地球温暖化係数) が低くなっています。誘電流体を使用することで、漏れが発生した場合でも電気ショートや機器損傷のリスクがなくなります。
まとめ:
Supermicro デュアル AMD EPYC Bergamo サーバーを ZutaCore の 2 フェーズ直接チップ冷却ソリューションに変換した結果、熱性能、ノイズ低減、エネルギー効率が明らかに向上しました。データセンターが拡大し続け、サーバー性能の限界を押し上げる中、ZutaCore のような高度な冷却技術は、現代のコンピューティング環境の増大する熱需要を管理するための有望な道筋を提供します。
高密度のワークロードを運用し、ハードウェアを限界まで押し上げている場合は、ZutaCore のような高度な冷却ソリューションに投資することで、長期的にはパフォーマンスが向上し、運用コストを節約できます。
大きな叫び声 ボストンリミテッド ハードウェアを供給してくれたCentersquareとデータセンターを提供してくれたCentersquareに感謝します。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード