Auf dem aktuellen Computermarkt gibt es einen wachsenden Wettbewerb zwischen Unternehmen bei der Entwicklung KI-fähiger Maschinen. Die Herausforderung besteht nicht darin, wer die größte und schlechteste Maschine bauen kann; Es geht darum, wer die wärmeeffizienteste Maschine bauen kann.
Auf dem aktuellen Computermarkt gibt es einen wachsenden Wettbewerb zwischen Unternehmen bei der Entwicklung KI-fähiger Maschinen. Die Herausforderung besteht nicht darin, wer die größte und schlechteste Maschine bauen kann; Es geht darum, wer die wärmeeffizienteste Maschine bauen kann.
Wenn Server KI-Prozesse ausführen, Sie erzeugen außergewöhnliche Mengen an Wärme, mehr als die üblichen Server, auf denen Standardgeschäftsprozesse und -dienste ausgeführt werden. Aus diesem Grund müssen Ingenieure, die Systeme mit diesen Servern entwerfen, leistungsstärkere Kühl- und Wärmeaustauschkomponenten einkalkulieren.
Es besteht ein Zusammenhang zwischen der Menge an Strom, die ein CPU-Sockel verbraucht, und der Wärme, die ein System unter Volllast abführen soll. Dies wird als Thermal Design Point oder TDP bezeichnet. Unternehmen nutzen die TDP als Leitfaden, um sicherzustellen, dass sie die leistungsstärksten Chips in ihren Servern verwenden und gleichzeitig die physikalisch effizientesten Gehäuse und Platinen für die Dichte in einer großen Rechenzentrumsumgebung entwerfen. Je größer die Box, desto stärker können Sie die Wärmeableitung beeinflussen. Allerdings führt dies zu einem Verlust der Serverdichte in einem Rechenzentrum. Es ist ein empfindliches Gleichgewicht.
Cloudflare scheint mit der Einführung seines Compute-Servers der neuesten Generation an der Obergrenze dieser Beziehung angelangt zu sein. Als sie das Design ihres Servers der 12 ihre Arbeiter-KI Das Programm würde sie ganztägig mit 100 % Auslastung laufen lassen.
Mögliche zukünftige Wege
Obwohl Sie die physische Größe eines Servers erhöhen können, um größere Lüfter und Kühlrippen für die CPUs zur Wärmeableitung unterzubringen, wird dieser Ansatz schnell ineffizient.
Stellen Sie sich vor, Sie haben einen 40-kW-Schrank in einem Rechenzentrum im Einsatz. In einem luftgekühlten System würden möglicherweise bis zu 30 Prozent der Energie, die Sie in diesen Schrank einspeisen, für den Betrieb der Serverlüfter verwendet. Das bedeutet, dass die tatsächliche Rechenkapazität dieses Schranks nur etwa 28 kW betragen würde. Im Gegensatz dazu könnte derselbe Schrank, der von einem Flüssigkeitskühlsystem unterstützt wird, bis zu 39 kW seiner Leistung für Rechenaufgaben aufwenden. Kurz gesagt: Mit der Flüssigkeitskühlung können Sie mit der gleichen Leistung mehr erreichen.
Da Wasser außerdem viermal mehr Wärmekapazität speichern kann als Luft, können diese neuen flüssigkeitsgekühlten Server schnellere Prozessoren mit höherem Speicherkapazität, geringerem Strombedarf und höherer Zuverlässigkeit unterstützen. Durch den Ersatz oder die Ergänzung der herkömmlichen Luftkühlung durch eine effizientere Flüssigkeitskühlung wird die Gesamtbetriebseffizienz des Rechenzentrums verbessert.
Dell hat bewiesen, dass a 50-60-prozentige Verbesserung der Kühlung und Energieeffizienz mit Flüssigkeitskühlungstechnologie in ihren Rechenzentren. Wenn Cloudflare aufhören würde, seine physischen Boxen zu vergrößern, und sich der Revolution der Flüssigkeitskühlung zuwenden würde, würde es sich in die Riege der Systementwickler einreihen, die Speicher- und Rechenkapazitäten erfolgreich verdichten und gleichzeitig die Gesamtbetriebskosten senken.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed