Start Unternehmen ThinkSystem SR670 V2 baut Lenovos Führungsposition im HPC-Bereich aus

ThinkSystem SR670 V2 baut Lenovos Führungsposition im HPC-Bereich aus

by Brian Beeler

Lenovo ist seit langem führend bei der Bereitstellung von Lösungen für den High-Performance Computing (HPC)-Markt. Die Mainstream-Angebote von Lenovo sind bei Endbenutzern und Rechenzentrumsadministratoren gleichermaßen bekannt, aber die HPC-Fähigkeiten von Lenovo sind vielleicht ihr bestgehütetes Geheimnis. Nun, das Geheimnis liegt darin, dass wir der weltweit größte Anbieter von Supercomputern sind (32 % davon nach Angaben von Top 500).

Lenovo ist seit langem führend bei der Bereitstellung von Lösungen für den High-Performance Computing (HPC)-Markt. Die Mainstream-Angebote von Lenovo sind bei Endbenutzern und Rechenzentrumsadministratoren gleichermaßen bekannt, aber die HPC-Fähigkeiten von Lenovo sind vielleicht ihr bestgehütetes Geheimnis. Nun, das Geheimnis liegt darin, dass wir der weltweit größte Anbieter von Supercomputern sind (32 % davon nach Angaben von Top 500).

Diese massiven HPC-Erfolge sind im Wesentlichen auf Lenovos tiefes Verständnis des HPC-Bereichs und die Bereitschaft zurückzuführen, Risiken einzugehen, um die Bedürfnisse der Kunden zu erfüllen. Wie genau lässt sich diese Risikobereitschaft übersetzen? Nun, vor etwa einem Jahrzehnt, Lenovo lieferte einen flüssigkeitsgekühlten Supercomputer an das Leibniz-Rechenzentrum in München. Diese Veranstaltung hat dazu beigetragen, die Wirtschaftlichkeit des Supercomputings zu verändern, insbesondere in Ländern wie Europa, wo Rack-Platz, Kühlung und Strom knapp sind.

Lenovo ThinkSystem SR670 V2

Lenovo ThinkSystem SR670 V2

Während sich im Supercomputing seitdem viel verändert hat, setzt Lenovo weiterhin auf Innovationen. Im Sommer 2018 ging Lenovo offiziell an den Start Neptun, und stellt seine Vision für effizientere Rechenzentren dank Flüssigkeitskühlung vor. Mit der Markteinführung des ThinkSystem SD650 hat Lenovo HPC-Kunden gezeigt, wie einfach es sein kann, Komponenten in einem 1U-Tray mit Flüssigkeitskühlung zu versorgen, das 2x DWX-Knoten (Neptune Direct Water Cooling) pro Tray unterstützt. Bis zu sechs Fächer werden im NeXtScale n1200-Gehäuse (6U) unterstützt. Zwei Jahre später brachte Lenovo das SD650-N V2 mit Flüssigkeitskühlung, Ice-Lake-CPUs, gesockelten GPUs, DRAM, Speicher und I/O-Modulen auf den Markt. Die Implementierung des Liquid-to-Air-Wärmetauschers (L2A) im ThinkSystem SR670 V2 ist ein Beispiel für die zukunftsweisende Technik von Lenovo.

Innenraum des ThinkSystem SR670 V2

Lenovo ThinkSystem SD650 V2 mit Neptune™-Flüssigkeitskühlungstechnologie

Wer braucht schon HPC-Systeme?

Wer braucht schon all diese Leistung angesichts der schieren Leistungssteigerungen bei Rechenleistung, Speicherinnovationen und Arbeitsspeicher?

Unternehmen jeder Größe suchen nach effizienteren Möglichkeiten, Daten zu sammeln und zu analysieren, um Informationen aus mehreren verschiedenen Ressourcen im Netzwerk zu extrahieren. Insbesondere Unternehmen konzentrierten sich auf rechenintensive Programme wie Molekularbiologie, Finanzen, Verfolgung des globalen Klimawandels, schnelle Genanalyse und seismische Bildgebung. HPC erhält auch die Aufmerksamkeit eines breiteren Spektrums von Organisationen, beispielsweise von Unternehmen, die einen Marktvorteil anstreben und bereit sind, in Technologien zu investieren, die sich auf Produktivität und Wachstum auswirken. HPC und KI, die Basis für die zuvor genannten Anwendungen, werden immer enger aufeinander abgestimmt und bieten Unternehmen neue Möglichkeiten, diese Daten zu nutzen.

Der Bedarf an sofortigem Zugriff auf aggregierte Daten treibt weiterhin die Nachfrage nach diesen HPC-Systemen an. Für den Erfolg und die Langlebigkeit eines Unternehmens ist es unerlässlich, der Konkurrenz immer einen Schritt voraus zu sein. HPC ist von entscheidender Bedeutung für die Lösung komplexer Probleme in Wirtschaft, Wissenschaft und Technik und ist zur Grundlage für Innovationen in Wissenschaft, Forschung, Einzelhandel, AV und mehr geworden und treibt Fortschritte bei Technologien voran, die sich auf die Gesellschaft auswirken.

Das explosionsartige Wachstum der gesammelten Daten aus Technologien wie KI und M/L, IoT, Forschung und Live-Streaming-Diensten erfordert eine Echtzeitverarbeitung, die mehr ist, als ein typischer Server bewältigen kann.

Eine weitere treibende Kraft hinter der steigenden Nachfrage nach HPC ist, dass die Systeme am Edge, in der Cloud oder vor Ort bereitgestellt werden können. Der Schlüssel liegt darin, die Daten dort zu verarbeiten, wo sie erstellt werden, und sie nicht zur Verarbeitung an einen anderen Remote-Standort übertragen zu müssen.

Lenovo ThinkSystem SR670 v2 mit L2A-Wärmetauscher

Ein entscheidender Gesichtspunkt bei der Auswahl einer HPC-Plattform ist die Möglichkeit der Skalierung. Wenn es um enorme Rechenressourcen geht, ist mehr besser. Die Scale-out-Fähigkeiten dieser Systeme sind von entscheidender Bedeutung, und die Fähigkeit, große HPC-Cluster zu erstellen, kann je nach Skalierbarkeit über Erfolg oder Misserfolg entscheiden. Durch den Einsatz von Hochgeschwindigkeitsverbindungen mit geringer Latenz und neuerer Speichertechnologie wie NVMe werden die Rechenergebnisse beschleunigt. Cluster können in einem Rechenzentrum, einer Cloud oder einem Hybridmodell aufgebaut werden und ermöglichen so eine flexible und skalierbare Bereitstellung. Das Lenovo ThinkSystem SR670 V2 ist ein solches System.

Ein GPU-reicher Server, der die HPC-Anforderungen erfüllt

Der Lenovo ThinkSystem SR670 V2 ist ein GPU-reicher 3U-Rack-Server, der acht GPUs mit doppelter Breite unterstützt, darunter die NVIDIA A100- und A40 Tensor Core-GPUs sowie ein Modell mit NVIDIA HGX A100 4-GPU, angeboten mit NVLink und Lenovo Neptune Hybrid Liquid- Luftkühlung. Der Server basiert auf der neuen Intel Xeon Scalable-Prozessorfamilie der dritten Generation (ehemals „Ice Lake“) und der neuesten Intel Optane Persistent Memory 200-Serie.

Der SR670 V2 bietet optimale Leistung für künstliche Intelligenz (KI), Hochleistungsrechnen (HPC) und grafische Workloads in verschiedenen Branchen. Einzelhandel, Fertigung, Finanzdienstleistungen und Gesundheitswesen können die Rechenleistung der GPUs im SR670 V2 nutzen, um mithilfe von maschinellem Lernen (ML) und Deep Learning (DL) aussagekräftigere Erkenntnisse zu gewinnen und Innovationen voranzutreiben.

ThinkSystem SR670 V2 aus dem Rack erweitert

Herkömmliche Luftkühlungsmethoden stoßen an kritische Grenzen. Die Steigerung der Komponentenleistung, insbesondere für CPU und GPU, hat zu höheren Energie- und Infrastrukturkosten, lauten Systemen und einem hohen CO670-Fußabdruck geführt. Das Modell SR2 V2 nutzt die Liquid-to-Air-Hybridkühltechnologie (L100A) von Lenovo Neptune, um diesen Herausforderungen zu begegnen und die Wärme schnell abzuleiten. Die Wärme der NVIDIA HGX AXNUMX-GPUs wird durch einen einzigartigen geschlossenen Flüssigkeits-Luft-Wärmetauscher abgeführt, der die Vorteile der Flüssigkeitskühlung wie höhere Dichte, geringeren Stromverbrauch, leisen Betrieb und höhere Leistung ohne zusätzliche Rohrleitungen bietet.

Branchen nutzen GPU-Technologie

Der SR670 V2 basiert auf zwei skalierbaren Intel Xeon Prozessoren der 3. Generation, die die neuesten GPUs im NVIDIA Ampere-Rechenzentrumsportfolio unterstützen. Der SR670 V2 liefert arbeitslastoptimierte Leistung, unabhängig davon, ob Visualisierung, Rendering oder rechenintensives HPC und KI genutzt werden.

Einzelhandel, Fertigung, Finanzdienstleistungen und das Gesundheitswesen nutzen GPUs, um mithilfe von maschinellem Lernen (ML) und Deep Learning (DL) aussagekräftigere Erkenntnisse zu gewinnen und Innovationen voranzutreiben. Hier sind einige Möglichkeiten, wie beschleunigtes Computing GPUs in verschiedenen Organisationen nutzt:

  • Fernvisualisierung für Teams, die von zu Hause aus arbeiten
  • Raytracing-Rendering für fotorealistische Grafiken
  • Leistungsstarke Videokodierung und -dekodierung
  • In-silico-Studien und Immunologie in den Biowissenschaften
  • Natural Language Processing (NLP) für Call Center
  • Automatische optische Inspektion (AOI) zur Qualitätskontrolle
  • Computer Vision für das Kundenerlebnis im Einzelhandel

Da immer mehr Arbeitslasten die Fähigkeiten von Beschleunigern nutzen, steigt die Nachfrage nach GPUs. Der ThinkSystem SR670 V2 bietet eine optimierte Unternehmenslösung für die Bereitstellung beschleunigter HPC- und KI-Workloads in der Produktion und maximiert so die Systemleistung.

Flexible Konfigurationsoptionen

Das modulare Design bietet ultimative Flexibilität im SR670 V2. Zu den Konfigurationsoptionen gehören:

  • Bis zu acht GPUs doppelter Breite mit NVLink Bridge
  • NVIDIA HGX™ A100 4-GPU mit NVLink und Lenovo Neptune™ Hybrid-Flüssigkeitskühlung
  • Wahlweise Hochgeschwindigkeitsvernetzung vorne oder hinten
  • Auswahl an lokalem 2.5-Zoll-, 3.5-Zoll- und NVMe-Hochgeschwindigkeitsspeicher

Die Leistung des ThinkSystem SR670 V2 ist für Ihre Arbeitslast, Visualisierung, Rendering oder rechenintensives HPC und KI optimiert.

Die NVIDIA A100 Tensor Core-GPU bietet beispiellose Beschleunigung – in jeder Größenordnung – und versorgt damit die leistungsstärksten elastischen Rechenzentren der Welt für KI, Datenanalyse und HPC-Anwendungen. Der A100 kann effizient skaliert oder in sieben isolierte GPU-Instanzen aufgeteilt werden. Multi-Instance GPU (MIG) bietet eine einheitliche Plattform, die es elastischen Rechenzentren ermöglicht, sich dynamisch an wechselnde Arbeitslastanforderungen anzupassen. Ein Rack mit 13 ThinkSystem SR670 V2 kann bis zu zwei PFLOPS Rechenleistung erzeugen.

Das ThinkSystem SR100 V4 basiert auf den neuesten CPUs der Intel® Xeon® Scalable-Familie und ist für die Unterstützung von High-End-GPUs wie NVIDIA Tesla V670 und T2 konzipiert.

Skalierbare Lösungen

Unabhängig davon, ob Sie gerade mit KI beginnen oder in die Produktion übergehen, müssen Lösungen mit den Anforderungen des Unternehmens skaliert werden. Der ThinkSystem SR670 V2 kann in einer Cluster-Umgebung mit Hochgeschwindigkeits-Fabric verwendet werden, um bei steigenden Arbeitslastanforderungen zu skalieren.

Ausgestattet mit Lenovo Intelligent Computing Orchestration (LiCO) bietet es Unterstützung für mehrere Benutzer und lässt sich innerhalb einer einzelnen Clusterumgebung skalieren. LiCO ist eine leistungsstarke Plattform, die Clusterressourcen für HPC- und KI-Anwendungen verwaltet.

LiCO bietet sowohl KI- als auch HPC-Workflows und unterstützt mehrere KI-Frameworks, darunter TensorFlow, Caffe, Neon und MXNet, und nutzt einen einzigen Cluster für unterschiedliche Workload-Anforderungen.

Ebenso schnell schritt die Innovationsentwicklung im gesamten HPC-Portfolio voran. Für Unternehmen, die noch nicht ganz bereit sind, den Sprung auf eine umfassende Flüssigkeitskühlung zu wagen, bietet der ThinkSystem SR670 V2 beeindruckende Flexibilität.

Lenovo ThinkSystem SR670 V2 Konfigurierbarkeit und Spezifikationen

Die Konfigurierbarkeit ist der Kern der Attraktivität des ThinkSystem SR670 V2. Seine Flexibilität konzentriert sich auf GPU-dichtes Computing, und der größte Teil seines physischen Volumens ist modularen GPUs gewidmet, ob einfach oder doppelt breit oder NVIDIA SXM. Die drei Basiskonfigurationen sind wie folgt.

Konfiguration 1 Konfiguration 2 Konfiguration 3
Anzahl der GPUs 4x SXM 4x doppelt breit oder 8x einfach breit 8x doppelt breit
Laufwerksunterstützung 8 x 2.5 Zoll 8x 2.5 Zoll oder 4x 3.5 Zoll 6x E1.S

Die dargestellten Konfigurationen:

Lenovo ThinkSystem SR670 V2-Konfigurationen

Die folgende Tabelle zeigt die vollständigen Spezifikationen des SR670 V2.

Komponenten Normen
Maschinentypen 7Z22 – 1 Jahr Garantie
7Z23 – 3 Jahr Garantie
Formfaktor 3HE-Rack
Prozessor Zwei skalierbare Intel Xeon Prozessoren der dritten Generation (früher Codename „Ice Lake“). Unterstützt Prozessoren mit bis zu 40 Kernen, Kerngeschwindigkeiten von bis zu 3.6 GHz und TDP-Werten von bis zu 270 W.
Chipsatz Intel C621A „Lewisburg“-Chipsatz, Teil der Plattform mit dem Codenamen „Whitley“.
Memory 32 DIMM-Steckplätze mit zwei Prozessoren (16 DIMM-Steckplätze pro Prozessor). Jeder Prozessor verfügt über 8 Speicherkanäle mit 2 DIMMs pro Kanal (DPC). Lenovo TruDDR4 RDIMMs und 3DS RDIMMs werden unterstützt. DIMM-Steckplätze werden vom Standardsystemspeicher und vom persistenten Speicher gemeinsam genutzt. DIMMs arbeiten mit bis zu 3200 MHz bei 2 DPC.
Anhaltendes Gedächtnis Unterstützt bis zu 16x Intel Optane Persistent Memory 200 Series-Module (8 pro Prozessor), die in den DIMM-Steckplätzen installiert sind. Persistenter Speicher (Pmem) wird in Kombination mit Systemspeicher-DIMMs installiert.
Speicher maximal Mit RDIMMs: Bis zu 4 TB durch Verwendung von 32 x 128 GB 3DS RDIMMs
Mit persistentem Speicher: Bis zu 4 TB durch Verwendung von 16 x 128 GB 3DS RDIMMs und 16 x 128 GB Pmem-Modulen (1.5 TB pro Prozessor)
Speicherschutz ECC, SDDC (für x4-basierte Speicher-DIMMs), ADDDC (für x4-basierte Speicher-DIMMs, erfordert Platinum- oder Gold-Prozessoren) und Speicherspiegelung.
Laufwerksschächte Je nach Konfiguration entweder 2.5-Zoll-, 3.5-Zoll- oder EDSFF-Laufwerke:

  • Konfigurationen mit SXM-GPUs (SXM-Modell):
    • 4x oder 8x 2.5-Zoll-Hot-Swap-NVMe-Laufwerksschächte
  • Konfigurationen mit 4x GPUs mit doppelter Breite oder 8x GPUs mit einfacher Breite (4-DW-GPU-Modell):
    • 8x 2.5-Zoll-Hot-Swap-AnyBay-Laufwerksschächte, die SAS-, SATA- oder NVMe-SSDs oder SATA-Festplatten unterstützen
    • 4x 3.5-Zoll-Hot-Swap-Laufwerksschächte, die SATA-Festplatten oder SSDs unterstützen (NVMe mit Sonderangebot)
  • Konfigurationen mit 8x doppelt breiten GPUs (8-DW-GPU-Modell):
    • 6x EDSFF E1.S Hot-Swap-NVMe-Laufwerksschächte

Der Server unterstützt außerdem einen internen M.2-Adapter, der bis zu zwei M.2-Laufwerke unterstützt.

Maximaler interner Speicher
  • SXM-Modell:
    • 61.44 TB mit 8 x 7.68 TB 2.5-Zoll-NVMe-SSDs
  • 4-DW-GPU-Modell:
    • 122.88 TB mit 8 x 15.36 TB 2.5-Zoll-SAS-SSDs
    • 61.44 TB mit 8 x 7.68 TB 2.5-Zoll-NVMe-SSDs
    • 16 TB mit 8x 2 TB 2.5-Zoll-Festplatten
    • 72 TB mit 4x 18 TB 3.5-Zoll-Festplatten
    • 30.72 TB mit 4 x 7.68 TB 3.5-Zoll-SAS/SATA-SSDs
  • 8-DW-GPU-Modell:
    • 24 TB mit 6 x 4 TB EDSFF NVMe SSDs
Speichercontroller
  • 8x Onboard-SATA-Ports (Intel VROC SATA RAID, früher bekannt als Intel RSTe RAID)
  • Bis zu 8x Onboard-NVMe-Ports (einschließlich Intel VROC NVMe RAID, mit optionaler Lizenz für Nicht-Intel NVMe SSDs)
  • 12-GB-SAS/SATA-RAID-Adapter
  • 12-Gbit-SAS/SATA-HBAs ohne RAID
Optische Laufwerksschächte Kein internes optisches Laufwerk.
Bandlaufwerksschächte Kein internes Backup-Laufwerk.
Netzwerk Schnittstellen OCP 3.0 SFF-Steckplatz mit flexibler PCIe 4.0 x8- oder x16-Hostschnittstelle, verfügbar je nach Serverkonfiguration:

  • SXM-Modell: Unterstützt, abhängig von der Speicherkonfiguration
  • 4-DW-GPU-Modell: Unterstützt, abhängig von der Konfiguration der PCIe-Steckplätze
  • 8-DW-GPU-Modell: Unterstützt

Der OCP-Steckplatz unterstützt eine Vielzahl von 2-Port- und 4-Port-Adaptern mit 1GbE-, 10GbE- und 25GbE-Netzwerkkonnektivität. Ein Port kann optional mit dem XClarity Controller (XCC)-Verwaltungsprozessor für Wake-on-LAN- und NC-SI-Unterstützung geteilt werden.

PCI-Erweiterungssteckplätze Bis zu 4x PCIe 4.0-Steckplätze, abhängig von der gewählten GPU- und Laufwerksschachtkonfiguration. Die Slot-Auswahl erfolgt von:

  • 2x Frontsteckplätze, PCIe 4.0, Steckplätze voller Bauhöhe; Halbe Länge in SXM-Konfigurationen, volle Länge in 4-DW-GPU- und 8-DW-GPU-Konfigurationen
  • 4x hintere Steckplätze, aktiviert über Riser-Karten, PCIe 4.0, Steckplätze voller Höhe und halber Länge
GPU-Unterstützung Unterstützt je nach Konfiguration bis zu 8x PCIe-GPUs mit doppelter Breite oder 4x SXM-GPUs:

  • SXM-Modell:
    • 4x SXM-GPUs mit Lenovo Neptune-Flüssigkeits-Luft-Kühlung und 4x oder 8x 2.5-Zoll-Laufwerksschächten
  • 4-DW-GPU-Modell:
    • 4x doppelt breite GPUs mit 8x 2.5-Zoll- oder 4x 3.5-Zoll-Laufwerksschächten
    • Erhältlich per Sonderangebot: 8x Single-Wide-GPUs mit 8x 2.5-Zoll- oder 4x 3.5-Zoll-Laufwerksschächten
  • 8-DW-GPU-Modell:
    • 8x GPUs mit doppelter Breite und 6x EDSFF-Laufwerksschächten

Hinweis: Konfigurationen mit Single-Wide-GPUs wie der NVIDIA A10 sind möglicherweise über eine Sondergebotsanfrage möglich.

Ports Vorne:

  • SXM-Modell, 4-DW-GPU-Modell und 8-DW-GPU-Modell mit hinteren E/A-Steckplätzen: 1x USB 3.1 G1 (5 Gb/s)-Anschluss, 1x USB 2.0-Anschluss (auch für XCC lokale Verwaltung), externer Diagnoseanschluss, VGA-Anschluss.
  • 8-DW-GPU-Modell mit vorderen E/A-Steckplätzen: Keine vorderen Anschlüsse

Hinten:

  • Alle Modelle: 3x USB 3.1 G1 (5 Gb/s)-Anschlüsse, 1x VGA-Videoanschluss, 1x RJ-45 1GbE-Systemverwaltungsanschluss für XCC-Fernverwaltung.
  • Modelle mit hinteren E/A-Steckplätzen: Optionaler serieller DB-9 COM-Anschluss (wird in einem Steckplatz installiert).

Intern:

  • Alle Modelle: 1x USB 3.1 G1-Anschluss für Betriebssystem- oder Lizenzschlüsselzwecke
Kühlung: 5x Dual-Rotor-Simple-Swap-80-mm-Lüfter, konfigurationsabhängig. Die Lüfter sind N+1-rotorredundant und tolerieren den Ausfall eines einzelnen Rotors. In jedem Netzteil ist ein Lüfter integriert.
Energieversorgung Bis zu vier redundante Hot-Swap-Wechselstromnetzteile mit 80 PLUS Platinum-Zertifizierung. 1800-W- oder 2400-W-Wechselstromoptionen, unterstützt 220 V Wechselstrom. Nur in China unterstützen Netzteile auch 240 V DC.

  • SXM-Modell: 4x 2400W
  • 4-DW-GPU-Modell: 2x 2400W oder 4x 1800W oder 4x 2400W
  • 8-DW-GPU-Modell: 4x 2400 W
Video G200-Grafik mit 16 MB Speicher mit 2D-Hardwarebeschleuniger, integriert im XClarity Controller. Die maximale Auflösung beträgt 1920×1200 32bpp bei 60Hz.
Hot-Swap-Teile Antriebe und Netzteile.
Systemmanagement Bedienfeld mit Status-LEDs. Bei SXM- und 4-DW-GPU-Modellen externes Diagnosehandgerät mit LCD-Display (nicht verfügbar bei 8-DW-GPU-Modellen). Integriertes XClarity Controller (XCC)-Management, zentralisierte Infrastrukturbereitstellung mit XClarity Administrator, XClarity Integrator-Plugins und zentralisierte Server-Energieverwaltung mit XClarity Energy Manager. Optionaler XClarity Controller Advanced und Enterprise zur Aktivierung von Fernsteuerungsfunktionen.
Sicherheits-Features Gehäuseeingriffsschalter, Einschaltkennwort, Administratorkennwort, Trusted Platform Module (TPM), unterstützt TPM 2.0. Nur in China, optionales Nationz TPM 2.0.
Unterstützte Betriebssysteme Microsoft Windows Server, Red Hat Enterprise Linux, SUSE Linux Enterprise Server, VMware ESXi.
Eingeschränkte Garantie Dreijährige oder einjährige (modellabhängige) vom Kunden austauschbare Einheit und eingeschränkte Vor-Ort-Garantie mit 9×5 am nächsten Arbeitstag (NBD).
Service und Unterstützung Optionale Service-Upgrades sind über Lenovo Services verfügbar: 4 oder 2 Stunden Reaktionszeit, 6 Stunden Reparaturzeit, 1- oder 2-jährige Garantieverlängerung, Software-Support für Lenovo-Hardware und einige Anwendungen von Drittanbietern.
Abmessungen Breite: 448 mm (17.6 Zoll), Höhe: 131 mm (5.2 Zoll), Tiefe: 892 mm (35.1 Zoll).
Gewicht Ungefähres Gewicht, abhängig von der gewählten Konfiguration:

  • SXM-Modell: 39.5 kg (87 lb)
  • 4-DW-GPU-Modell: 36.7 kg (81 lb)
  • 8-DW-GPU-Modell: 39 kg (86 lb)

GPUs bieten erhebliche Konfigurationsleistungsoptionen

Die GPU-Unterstützung ist die wichtigste Variable zwischen den Konfigurationen. GPUs mit einfacher Breite verwenden PCIe x8-Lanes und skalieren auf NVIDIA A10, während GPUs mit doppelter Breite PCIe x16 verwenden und auf NVIDIA A100 skalieren. Die Flaggschiff-SXM-Konfiguration verwendet den NVIDIA HGX A100, der eine NVIDIA NVLink-Brücke (direkte GPU-zu-GPU-Kommunikation) verwendet, um seine vier integrierten GPUs zu verbinden. GPU-Konfigurationen mit doppelter Breite unterstützen NVLink, und der SR670 V2 unterstützt auch den AMD Instinct MI210 mit doppelter Breite.

Die HGX A100-Plattform ist die „Redstone“-Variante ohne NVSwitch, mit vier SXM A100-GPUs auf einem einzigen Board. Es sind sowohl die 40-GB-, 400-Watt- als auch die 80-GB-, 500-Watt-Variante verfügbar. Bemerkenswert ist, dass der SR670 V2 mit dieser Plattform die Neptune Liquid-to-Air (L2A)-Hybridkühlung von Lenovo für eine leisere, effizientere Kühlung und einen geringeren Stromverbrauch nutzt. Auf jeder GPU ist eine Kühlplatte montiert, durch die vier redundante Niederdruckpumpen Flüssigkeit zirkulieren lassen. Ein großer einzelner Heizkörper leitet die Wärme ab. Andere GPU-Konfigurationen sind nur luftgekühlt.

ThinkSystem SR670 V2-GPUs

Die einzelnen Kühlmittelpumpen über jeder GPU sind auf der Kühlplatte als Teil des Abschnitts mit der Marke Neptune sichtbar. Diese fließen alle durch den einzelnen Kühler zurück, um die Temperaturen auch bei Spitzenlast unter Kontrolle zu halten.

ThinkSystem SR670 V2 GPU 2

Während die Flüssigkeitskühlung offensichtliche Vorteile hat, die Temperaturen niedriger zu halten, ist vielen nicht bewusst, welche Auswirkungen dies auf die Leistung der GPU-Taktrate haben kann. Wenn GPUs mit Luftkühlung unter hoher Last stehen, können sie thermische Designspitzen erreichen, bei denen sie dann die Leistung drosseln und die Taktrate senken müssen, um die Temperaturen unter Kontrolle zu halten. Bei der Flüssigkeitskühlung tritt dieses Problem nicht auf, sodass die GPUs härter und schneller laufen und gleichzeitig über die Arbeitslast hinweg ein konsistentes Wärmeprofil aufrechterhalten wird.

Die folgende Tabelle zeigt den Unterschied zwischen einer luftgekühlten und einer flüssigkeitsgekühlten GPU unter Volllast. Wenn das luftgekühlte Modell Spitzentemperaturen erreicht, sinkt die GPU-Frequenz, während die flüssigkeitsgekühlte CPU über die gesamte Dauer auf der höchsten Taktfrequenz bleibt.

Was die Steckplätze angeht, verfügen die SR670 V2-Basiskonfigurationen über zwei vordere PCIe 2 x4.0-E/A-Steckplätze, obwohl der Rest der Vorderseite für die oben genannten Laufwerksoptionen konfigurierbar ist. Alle unterstützen Hot-Swapping.

  • SXM-Modell – Auswahl aus:
    • 4x 2.5-Zoll-Hot-Swap-NVMe-Laufwerksschächte
    • 8x 2.5-Zoll-Hot-Swap-NVMe-Laufwerksschächte
  • 4-DW-GPU-Modell – Auswahl aus:
    • 8x 2.5-Zoll-Hot-Swap-AnyBay-Laufwerksschächte, die SAS-, SATA- oder NVMe-Laufwerke unterstützen
    • 4x 3.5-Zoll-Hot-Swap-Laufwerksschächte, die SATA-Festplatten oder SSDs unterstützen (Unterstützung für NVMe nur über Sonderangebot)
  • 8-DW-GPU-Modell:
    • 6x EDSFF E1.S Hot-Swap-NVMe-Laufwerksschächte

Der SR670 V2 unterstützt außerdem ein oder zwei SATA- oder NVMe-Boot- oder Speicherlaufwerke im M.2-Format. RAID-Unterstützung wird über einen integrierten Hardware-Controller angeboten.

ThinkSystem SR670 V2-Mainboard

Mittlerweile ist die Rückwandplatine fest, mit vier PCIe 4.0 x16-Steckplätzen und einem OCP 3.0. Die vier redundanten Hot-Swap-Netzteile des SR670 V2 sind auch von der Rückseite sichtbar. Sie sind in den Optionen 1800 W oder 2400 W erhältlich und verfügen über die Bewertung 80 Plus Platinum.

Bei SR670 V2-Modellen mit der SXM-Konfiguration ist ein anderer Stromversorgungsanschluss enthalten, der den vorderen GPU-Bereich mit einem dedizierten Stromanschluss versorgt. Diese Modelle stehen im krassen Gegensatz zu den Slot-Load-GPU-Modellen, die nicht über diesen wichtigen Stromanschluss von der Rückseite des Gehäuses verfügen.

Die restliche Hardware des SR670 V2 ist ebenso beeindruckend und setzt sein Flexibilitätsthema fort. Es unterstützt bis zu zwei 40-Core/80-Thread-Intel-„Ice-Lake“-Xeon-Scalable-Prozessoren der dritten Generation mit einer TDP von bis zu 270 Watt. Jede CPU verfügt über 16 DDR4-3200 RDIMM-Steckplätze; Bei 128-GB-RDIMMs liegt die Speicherobergrenze bei 4 TB. Abhängig von der CPU unterstützt der SR670 V2 auch bis zu 16 Intel Persistent Memory 200-Serie, installiert mit regulärem Systemspeicher. Bei der gesamten Hardware, die das ThinkSystem SR670 V2 zu bieten hat, hat Lenovo beim Kühllayout sein Bestes gegeben, um die größtmögliche Leistung aus dem System herauszuholen. Nicht alle Systeme ermöglichen den Betrieb aller Komponenten mit 100 % Auslastung ohne Drosselung, während der SR670 V2 genau dies ermöglicht.

Abschließende Überlegungen

Lenovo engagiert sich für Flüssigkeitskühlung und hat dieses Know-how genutzt, um Dinge wie den L2A-Wärmetauscher zu entwickeln. Da die Leistungsdichte in Servern weiter zunimmt, müssen Anbieter kreative Methoden entwickeln, um die thermische Belastung von Komponenten zu entfernen und aus dem System abzuleiten. Nicht alle Kunden benötigen oder wollen vollständige Flüssigkeitskühlungslösungen. Lenovo kann jedoch mit luftgekühlten, teilweise wassergekühlten und vollständig wassergekühlten Servern in seinem Portfolio Lösungen liefern, um den Kühlanforderungen der Kunden gerecht zu werden.

Die erste Generation von Neptune™ lieferte Flüssigkeitskühlung nur für CPUs und Speicher. Zusätzlich zu CPUs und Speicher wurde das Neptune Liquid Cooling-System von Lenovo um Spannungsregelung, Speicher, PCIe und jetzt auch GPUs erweitert. Lenovo hat sogar ein flüssigkeitsgekühltes Netzteil herausgebracht, das ohne Lüfter auskommt. Mit Blick auf die Zukunft sieht Lenovo in der Flüssigkeitskühlung den Schlüssel zur Bewältigung der von künftigen Generationen von CPUs und GPUs erzeugten Wärme und als Möglichkeit, die Dichte und Stellfläche beizubehalten, an die sich Unternehmenskunden gewöhnt haben.

Lenovo HPC-Lösungen

Dieser Bericht wird von Lenovo gesponsert. Alle in diesem Bericht geäußerten Ansichten und Meinungen basieren auf unserer unvoreingenommenen Sicht auf die betrachteten Produkte.

Beteiligen Sie sich an StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | RSS Feed