Home Enterprise Lenovo ThinkSystem SR685a V3 en SR680a V3 GPU-servers

Lenovo ThinkSystem SR685a V3 en SR680a V3 GPU-servers

by Lyle Smit

De Lenovo ThinkSystem SR685a V3 en SR680a V3 GPU-servers zijn de nieuwste 8-weg GPU-servers van het bedrijf, afgestemd op diverse zakelijke AI-behoeften.

De Lenovo ThinkSystem SR685a V3 en SR680a V3 GPU-servers zijn de nieuwste 8-weg GPU-servers van het bedrijf, afgestemd op diverse zakelijke AI-behoeften. Ondanks dat ze verschillende modelnamen hebben, delen ze een modulaire basis, waardoor binnen elk systeem verwisselbare componenten mogelijk zijn.

In principe hebben deze servers drie of vier kerncomponenten, afhankelijk van hoe u telt. Ten eerste vormt een buitenbehuizing de chassisschaal met ingebouwde ventilatoren aan de achterkant. Er zijn interne rails waarop een 2U modulaire server bovenop kan worden geplaatst. De onderste 6U herbergt de GPU's, switches en PCIe-stof. De 2U-servers hebben I/O die varieert op basis van het AMD- of Intel-aanbod. Lenovo ondersteunt vandaag NVIDIA- en AMD GPU-kaarten, met toekomstige Intel Guadi 3-ondersteuning.

De Lenovo SR685a V3 (een beetje voor AI) maakt gebruik van dubbele 4e generatie AMD EPYC-processors en is specifiek geoptimaliseerd voor GPU-naar-GPU-communicatie met hoge bandbreedte, waardoor hij ideaal is voor generatieve AI-toepassingen. Omgekeerd ondersteunt de SR680a V3, uitgerust met 5e generatie Intel Xeon schaalbare processors, veelzijdige AI- en computationele toepassingen, waarbij NVIDIA- en AMD GPU's worden ondergebracht voor uiteenlopende industriële behoeften. Beide modellen hanteren een innovatieve benadering van modulariteit, waardoor gebruikers hun systemen kunnen aanpassen en schalen om precies aan te sluiten bij specifieke operationele eisen.

Deze servers zijn zeer gewild (hoewel ze momenteel erg moeilijk te bemachtigen zijn) en zorgden vorig jaar voor veel ophef tijdens de Lenovo-conferentie in Austin. Er bestaat grote opwinding rond deze GPU-servers en hun potentieel om AI-mogelijkheden te verbeteren.

Configureerbare modellen en maatwerk

De Lenovo ThinkSystem SR685a V3- en SR680a V3-systemen worden aangeboden in verschillende configure-to-order (CTO)-modellen die dienen als raamwerk voor maatwerk. De mogelijkheid om configuratiemodellen aan te passen strekt zich uit tot de gedetailleerde selectie van GPU's, waarbij modellen worden gedefinieerd op basis van de specifieke geselecteerde GPU's. De basisfunctiecodes in de Lenovo-configurator maken bijvoorbeeld keuze mogelijk tussen de AMD MI300X en de NVIDIA H100/H200, die elk aan verschillende prestatie- en computerbehoeften voldoen. Het platformontwerp geeft Lenovo meer flexibiliteit bij het integreren van nieuwe accelerators zodra deze op de markt komen.

Lenovo ThinkSystem SR685a V3-specificaties

Onderdelen Specificaties
Vormfactor 8U rek
Gegevensverwerker Twee AMD EPYC 9004-serie processors (voorheen codenaam “Genoa”). Ondersteunt processors tot 64 cores, core-snelheden tot 3.1 GHz en TDP-waarden tot 400 W. Ondersteunt PCIe 5.0 voor krachtige I/O.
GPU's Keuze van:

  • Acht AMD MI300X 750W OAM GPU's met 192GB HBM3 GPU-geheugen per GPU
  • Acht NVIDIA H100 700 W SXM5 GPU's met 80 GB HBM3 GPU-geheugen per GPU
  • Acht NVIDIA H200 700 W SXM5 GPU's met 141 GB HBM3 GPU-geheugen per GPU
Geheugen 24 DIMM-slots met twee processors (12 DIMM-slots per processor). Elke processor heeft 12 geheugenkanalen, met 1 DIMM per kanaal (DPC). Lenovo TruDDR5 RDIMM's worden ondersteund tot 4800 MHz.
Geheugen maximaal Tot 1.5 TB met 24x 64 GB RDIMM's
Tot 2.25 TB met 24x 96 GB RDIMM's
Geheugenbescherming ECC, SDDC, Patrol/Demand Scrubbing, Bounded Fault, DRAM-adresopdrachtpariteit met herhaling, DRAM ongecorrigeerde ECC-fout opnieuw proberen, On-die ECC, ECC Error Check and Scrub (ECS), Post Package Repair
Schijfstations Tot 16x 2.5-inch hot-swap schijfposities die PCIe 5.0 NVMe-schijven ondersteunen.
OS-opstartschijven Ondersteuning voor een M.2-adapter met geïntegreerde RAID-1; ondersteuning voor 2x NVMe M.2-schijven voor OS-opstart- en gegevensopslagfuncties
Maximale interne opslag 51.2 TB met 16 x 3.2 TB 2.5-inch NVMe SSD's
Opslagcontroller Ingebouwde NVMe (niet-RAID)
Netwerk interfaces Het ondersteunt 8x krachtige netwerkadapters tot 400 Gb/s connectiviteit met GPU Direct-ondersteuning. Het ondersteunt een NVIDIA BlueField-3 2-poorts 200Gb-adapter voor het gebruikers-/besturingsvlak en een keuze uit OCP-netwerkadapters voor beheer. Het OCP 3.0-slot heeft een PCIe 5.0 x16-hostinterface, waarbij één poort optioneel wordt gedeeld met de XClarity Controller 2 (XCC2)-beheerprocessor voor Wake-on-LAN en NC-SI-ondersteuning.
PCI-uitbreidingsslots 10x PCIe 5.0 x16-sleuven:

  • Voorkant: 8x PCIe 5.0 x16 FHHL-slots met GPU Direct-ondersteuning
  • Achterkant: 1x PCIe 5.0 x16 FHHL-slot + 1x OCP 3.0-slot met PCIe 5.0 x16-interface
poorten Voorzijde: 1x USB 3.2 G1 (5 Gb/s) poort, 1x USB 2.0 poort (ook voor XCC lokaal beheer), 1x VGA videopoort.
Achterkant: 3x USB 3.2 G1 (5 Gb/s)-poorten, 1x VGA-videopoort, 1x RJ-45 1GbE-systeembeheerpoort voor XCC-beheer op afstand.
Koeling 5x aan de voorzijde gemonteerde ventilatoren met dubbele rotor voor het CPU- en opslagsubsysteem, N+1 redundant. 10x aan de achterkant gemonteerde ventilatoren met dubbele rotor voor het GPU-subsysteem, N+1 redundant. In elke voeding is één ventilator geïntegreerd. Luchtstroom van voor naar achter.
Stroomvoorziening Acht hot-swap redundante AC-voedingen met maximaal N+N redundantie. 80 PLUS Titanium-certificering. 2600 W AC-voedingen vereisen een 220 V AC-voeding.
Video Embedded video graphics met 16 MB geheugen en een 2D hardware accelerator zijn geïntegreerd in de XClarity Controller. Twee videopoorten (VGA aan de voorkant en VGA aan de achterkant) kunnen niet tegelijkertijd worden gebruikt; Als u de VGA-poort aan de voorzijde gebruikt, wordt de VGA-poort aan de achterzijde uitgeschakeld. De maximale resolutie is 1920×1200 32 bpp bij 60 Hz.
Hot-swap onderdelen Schijven, voedingen en ventilatoren.
Systeembeheer Geïntegreerd diagnosepaneel met status-LED's en uitschuifbaar LCD-display. XClarity Controller 2 (XCC2) ingebed beheer gebaseerd op de ASPEED AST2600 baseboard management controller (BMC). Speciale Ethernet-poort aan de achterkant voor XCC2 externe toegang voor beheer. XClarity Administrator voor gecentraliseerd infrastructuurbeheer, XClarity Integrator-plug-ins en XClarity Energy Manager gecentraliseerd serverenergiebeheer. Optioneel XCC Platinum maakt afstandsbedieningsfuncties en andere functies mogelijk.
Veiligheidskenmerken Opstartwachtwoord, beheerderswachtwoord, Root of Trust-module die TPM 2.0 ondersteunt, en Platform Firmware Resiliency (PFR).
Ondersteunde besturingssystemen Ubuntu-server.
De garantievoorwaarden Drie jaar of een jaar (modelafhankelijk) door de klant vervangbare eenheid en onsite beperkte garantie met 9×5 volgende werkdag (NBD).
Service en ondersteuning Optionele service-upgrades zijn beschikbaar via Lenovo Services: responstijd van 4 uur of 2 uur, reparatietijd van 6 uur, garantieverlenging van 1 jaar of 2 jaar, softwareondersteuning voor Lenovo-hardware en sommige toepassingen van derden.
Afmetingen Breedte: 447 mm (17.6 inch), hoogte: 351 mm (13.8 inch), diepte: 924 mm (36.3 inch).
Gewicht Maximaal: 108.9 kg (240 lb)

Lenovo ThinkSystem SR680a V3-specificaties 

Onderdelen Specificaties
Vormfactor 8U rek
Gegevensverwerker Twee 5e generatie Intel Xeon schaalbare processors (voorheen codenaam “Emerald Rapids”). Ondersteunt een processor met 48 kernen, een kernsnelheid van 2.3 GHz en een TDP-waarde van 350 W. Ondersteunt PCIe 5.0 voor krachtige I/O.
chipset Intel C741 “Emmitsburg” chipset, onderdeel van het platform met de codenaam “Eagle Stream”
GPU's Keuze van:

  • Acht AMD MI300X 750W OAM GPU's met 192GB HBM3 GPU-geheugen per GPU
  • Acht NVIDIA H100 700 W SXM5 GPU's met 80 GB HBM3 GPU-geheugen per GPU
  • Acht NVIDIA H200 700 W SXM5 GPU's met 141 GB HBM3 GPU-geheugen per GPU
Geheugen 32 DIMM-slots met twee processors (16 DIMM-slots per processor). Elke processor heeft 8 geheugenkanalen, met 2 DIMM's per kanaal (DPC). Lenovo TruDDR5 RDIMM's worden ondersteund. DIMM's werken op maximaal 5600 MHz bij 1 DPC en tot 4400 MHz bij 2 DPC.
Geheugen maximaal Tot 2 TB met 32x 64 GB RDIMM's
Geheugenbescherming ECC, SDDC (voor x4-gebaseerde geheugen-DIMM's), ADDDC (voor x4-gebaseerde geheugen-DIMM's met uitzondering van 9×4 RDIMM's, vereist platina- of goudprocessors) en geheugenspiegeling.
Schijfstations Tot 16x 2.5-inch hot-swap schijfposities die PCIe 5.0 NVMe-schijven ondersteunen.
OS-opstartschijven Ondersteuning voor twee M.2-schijven met optionele Intel VROC NVMe RAID-ondersteuning voor OS-opstart- en gegevensopslagfuncties
Maximale interne opslag 51.2 TB met 16 x 3.2 TB 2.5-inch NVMe SSD's
Opslagcontroller Ingebouwde NVMe (niet-RAID)
Netwerk interfaces Ondersteunt 8x hoogwaardige netwerkadapters tot 400 Gb/s connectiviteit met GPU Direct-ondersteuning. Ondersteunt een NVIDIA BlueField-3 2-poorts 200Gb-adapter voor het gebruikers-/besturingsvlak en een Mellanox ConnectX-6 Lx 2-poorts 10/25GbE-adapter voor beheer.
PCI-uitbreidingsslots 10x PCIe 5.0 x16-sleuven:

  • Voorkant: 8x PCIe 5.0 x16 FHHL-slots met GPU Direct-ondersteuning
  • Achterkant: 2x PCIe 5.0 x16 FHHL-sleuven
poorten Voorzijde: 1x USB 3.2 G1 (5 Gb/s) poort, 1x USB 2.0 poort (ook voor XCC lokaal beheer), 1x Mini DisplayPort videopoort.
Achterkant: 2x USB 3.2 G1 (5 Gb/s)-poorten, 1x VGA-videopoort, 1x RJ-45 1GbE-systeembeheerpoort voor XCC-beheer op afstand.
Koeling 5x aan de voorzijde gemonteerde ventilatoren met dubbele rotor voor het CPU- en opslagsubsysteem, N+1 redundant. 10x aan de achterkant gemonteerde ventilatoren met dubbele rotor voor het GPU-subsysteem, N+1 redundant. In elke voeding is één ventilator geïntegreerd. Luchtstroom van voor naar achter.
Stroomvoorziening Acht hot-swap redundante AC-voedingen met maximaal N+N redundantie. 80 PLUS Titanium-certificering. 2600 W AC-voedingen vereisen een 220 V AC-voeding.
Video Ingebouwde graphics met 16 MB geheugen en een 2D-hardwareversneller zijn geïntegreerd in de XClarity Controller 2-beheercontroller. Twee videopoorten (Mini DisplayPort aan de voorkant en VGA aan de achterkant); indien gewenst kunnen beide tegelijkertijd worden gebruikt. De maximale resolutie van beide poorten is 1920×1200 bij 60 Hz.
Hot-swap onderdelen Schijven, voedingen en ventilatoren.
Systeembeheer Geïntegreerd diagnosepaneel met status-LED's en uitschuifbaar LCD-display. XClarity Controller 2 (XCC2) ingebed beheer gebaseerd op de ASPEED AST2600 baseboard management controller (BMC). Speciale Ethernet-poort aan de achterkant voor XCC2 externe toegang voor beheer. XClarity Administrator voor gecentraliseerd infrastructuurbeheer, XClarity Integrator-plug-ins en XClarity Energy Manager gecentraliseerd serverenergiebeheer. Optioneel XCC Platinum maakt afstandsbedieningsfuncties en andere functies mogelijk.
Veiligheidskenmerken Opstartwachtwoord, beheerderswachtwoord, Root of Trust-module die TPM 2.0 ondersteunt, en Platform Firmware Resiliency (PFR).
Ondersteunde besturingssystemen Ubuntu-server.
De garantievoorwaarden Drie jaar of een jaar (modelafhankelijk) door de klant vervangbare eenheid en onsite beperkte garantie met 9×5 volgende werkdag (NBD).
Service en ondersteuning Optionele service-upgrades zijn beschikbaar via Lenovo Services: responstijd van 4 uur of 2 uur, reparatietijd van 6 uur, garantieverlenging van 1 jaar of 2 jaar, softwareondersteuning voor Lenovo-hardware en sommige toepassingen van derden.
Afmetingen Breedte: 447 mm (17.6 inch), hoogte: 351 mm (13.8 inch), diepte: 924 mm (36.3 inch).
Gewicht Maximaal: 108.7 kg (239.8 lb)

Lenovo ThinkSystem SR685a V3 en SR680a V3 Ontwerp en bouw

De voorkant van het systeem ondersteunt maximaal 16 hot-swap PCIe Gen5 NVMe-schijfbays – een ongebruikelijk royale hoeveelheid voor GPU-centrische servers, die doorgaans minder bays en rijstroken bieden voor uitbreiding. Onder de schijfposities bevinden zich de acht aan de voorzijde toegankelijke PCIe Gen5 FHHL-sleuven (Full Height, Half Length) en het PCIe-schakelcomplex. Deze slots zijn uitgerust met GPU Direct-technologie (acht NDR 400Gb/s InfiniBand-adapters), waardoor snelle netwerk- en gegevensoverdrachten mogelijk zijn om de latentie te verminderen en de gegevensverwerkingssnelheid te verhogen.

Het systeem herbergt vijf hot-swappable ventilatoren aan de bovenkant van het chassis, ontworpen om de server te koelen, die de bovenste 2U in beslag neemt, inclusief de CPU, het geheugen en de slots aan de achterkant. Aan de achterkant van het chassis zijn nog eens tien ventilatoren gemonteerd om de schijfposities, adapters en GPU's te koelen.

Het voorpaneel herbergt ook essentiële connectiviteits- en beheerpoorten, waaronder drie USB 3.2 Gen1-poorten en een video-uitgang, waardoor direct beheer en lokale console-interacties worden vergemakkelijkt.

De achterkant is al even goed uitgerust, inclusief de 2U-serveruitbreidingsmogelijkheden. De AMD-variant biedt één PCIe Gen5 x16 FHHL-slot naast een OCP 3.0-slot uitgerust met een PCIe Gen5 x16-interface. Omgekeerd heeft het Intel-model twee PCIe Gen5 x16 FHHL-slots. Een OCP 3.0-slot biedt veelzijdigheid in netwerk- en versnellingsopties door plaats te bieden aan verschillende adapterkaarten die voldoen aan open standaarden. NVIDIA BlueField-3 DPU-adapters kunnen worden geïnstalleerd om een ​​softwaregedefinieerde, hardwareversnelde IT-infrastructuur mogelijk te maken, waardoor verschillende IT-activiteiten, zoals netwerken en beveiliging, worden geoptimaliseerd.

De achterkant van de GPU-eenheid herbergt acht voedingen van 2,600 W, elk gekoppeld aan een centraal verdeelbord. Deze opstelling omvat connectoren aan de achterkant van het bord, door Lenovo de 'blinde maat' genoemd, die een naadloze verbinding met de 2U-computershuttle mogelijk maken.

Bovendien laat het achteraanzicht, zoals hierboven vermeld, het uitgebreide koelsysteem van de server zien, inclusief tien hot-swap ventilatoren aan de achterkant die zijn ontworpen om optimale thermische omstandigheden over de GPU's, switches en PCIe-fabric te handhaven. Dit koelsysteem is van cruciaal belang voor het behoud van de stabiliteit en levensduur van de hardwareprestaties, vooral tijdens continu gebruik met hoge belasting.

Stroom, bekabeling en schakelen

De AMD- en Intel-versies van deze serverfamilie delen een gemeenschappelijke stroomindeling, waardoor een grotere modulariteit mogelijk is, wat het belangrijkste hoogtepunt van deze systemen is.

De PCIe-signalering loopt via lintkabels die de rekenslede verbinden met de PCIe-schakelslede. Aan de andere kant van de rekenslede bevindt zich een blinde verbinding. De rekenslede past op deze connectoren en geeft de PCIe-signalering door aan de rest van het chassis. Met de beugel aan de achterkant van de slede (gelabeld met de aangewezen PCIe-verbinding) kunt u tussen de compute-shuttles wisselen zonder de onderkant van de server te wijzigen.

Het PCIe-schakelbord bevat vier Broadcom-switches omringd door PCIe-slots, waardoor de server verbinding kan maken met een supersnel netwerknetwerk. Bovendien zijn er acht MCIO-kabelconnectoren die verbinding maken met het moederbord. De kleinere PCIe-connectoren aan de bovenkant zijn bedoeld voor de schijfbackplanes voor de aan de voorzijde gemonteerde NVMe SSD's.

Geheugen en interne opslag

De AMD-computer ondersteunt maximaal 24 DDR5-geheugen-DIMM's, waarbij elke processor communiceert met 12 DIMM's via 12 geheugenkanalen, waardoor configuratie van één DIMM per kanaal mogelijk is. Deze DIMM's werken met een snelheid van 4800 MHz, waardoor de algehele geheugendoorvoer en efficiëntie worden verbeterd. Afhankelijk van de configuratie kan de server 1.5 TB systeemgeheugen ondersteunen met 24 x 64 GB RDIMM's of 2.25 TB met 24 x 96 GB RDIMM's, waardoor er voldoende capaciteit is voor zelfs de meest geheugenintensieve taken.

De Intel-computer (SR680a V3) maakt gebruik van Lenovo TruDDR5-geheugen dat werkt met snelheden tot 5600 MHz. Het ondersteunt ook een hogere capaciteit dan de AMD met maximaal 32 DIMM's verdeeld over twee processors, waarbij gebruik wordt gemaakt van 8 geheugenkanalen ter ondersteuning van 2 DIMM's per kanaal (DPC). Afhankelijk van de geheugenconfiguratie kan de server tot 2TB systeemgeheugen ondersteunen met behulp van 32x 64GB RDIMM's.

De werksnelheden van de DIMM's variëren op basis van het aantal DIMM's per kanaal: met 1 DIMM per kanaal kan het geheugen snelheden tot 5600 MHz bereiken, terwijl configuraties met 2 DIMM's per kanaal tot 4400 MHz zullen werken. Deze flexibele snelheidsaanpassing helpt de prestaties te optimaliseren op basis van de specifieke geheugenbelasting en configuratie.

Bovendien biedt de server plaats aan twee M.2 NVMe-schijven op een M.2-adapter met geïntegreerde RAID-functionaliteit, wat ideaal is voor opstartprocessen van besturingssystemen en snelle gegevenstoegang.

AMD- en NVIDIA GPU-kaarten

Het NVIDIA H100/H200-bord is stevig verpakt met acht NVIDIA GPU's en beschikt over een intrekbare handgreep waardoor het dragen en installeren van het bord eenvoudiger wordt. Eenmaal geïnstalleerd, past de handgreep netjes naast de GPU's om obstructie te voorkomen. De connectoren tussen de AMD- en NVIDIA-kaarten zijn identiek. Het Intel Gaudi 3-bord zal een andere connector hebben.

Het AMD MI300-bord is vergelijkbaar met het NVIDIA-bord, maar heeft een standaardhandvat dat aanzienlijk uitsteekt. Hoewel het nog steeds nuttig is, is het niet zo elegant als de intrekbare handgreep op het NVIDIA-bord. Het maakt klanten hoe dan ook niets uit, dus hebben we de voetnoot toegevoegd omdat het ontwerpverschil onze aandacht trok.

Conclusie

De Lenovo ThinkSystem SR685a V3 en SR680a V3 GPU-servers bieden indrukwekkende modulariteit en ondersteunen krachtige NVIDIA H100/H200 en AMD MI300X GPU's, evenals zowel AMD EPYC 9004 als 5th Gen Xeon Intel CPU's. Deze flexibiliteit en een luchtgekoeld ontwerp maken ze eenvoudig te integreren in bestaande ecosystemen. De servers ondersteunen ook meer opslagruimte dan typische GPU-servers (via 16 hot-swap PCIe Gen5 NVMe-schijfbays), waardoor ze beter bruikbaar zijn voor data-intensieve taken. Bovendien zorgt de integratie van Lenovo's XClarity voor beheer voor gestroomlijnde activiteiten en monitoring, waardoor het beheer van complexe infrastructuren verder wordt vereenvoudigd.

Ondanks dat er geen prestatietests zijn uitgevoerd, is het ontwerp van deze servers opmerkelijk. Dankzij de modulaire architectuur kan Lenovo zijn klanten vandaag de dag gemakkelijk AMD- en NVIDIA-GPU's aanbieden, met Intel- of AMD-computerservers. Met meer GPU-ondersteuning, zoals Intel Guadi 3 en NVIDIA B200, kan Lenovo klanten de reken- en GPU-componenten laten mixen en matchen om de servers af te stemmen op specifieke toepassingen.

Over het algemeen zijn deze servers zeer goed doordacht, en we kijken ernaar uit om er hands-on mee te werken; Jordan heeft vol verwachting angstig over zijn baard gestreken. Terwijl we momenteel aan een project werken met de Lenovo SR675 v3 met vier NVIDIA L40S GPU's, zijn deze 8-weg servers een ander dier en hebben ze een breed scala aan AI-gebruiksscenario's. Dit is echter een goede herinnering dat Lenovo een AI-platform voor iedereen biedt.

Lenovo GPU-servers

Neem contact op met StorageReview

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed