Die schiere Leistung der flüssigkeitsgekühlten Systeme von Comino Grando sorgt dafür, dass die GPU-Leistung auch unter Volllast kompromisslos bleibt.
Für den Uneingeweihten: Comino ist ein Unternehmen, das sich eine Nische im Bereich flüssigkeitsgekühlter Server geschaffen hat und vielseitige und effiziente Workstations und Server entwickelt hat. In diesem Testbericht untersuchen wir den Comino Grando Server und die Workstation, ihre Flaggschiffsysteme. Diese Systeme sind so konzipiert, dass sie als 19-Zoll-Rack-montierbare Einheit und als eigenständiger Desktop fungieren und ein breites Spektrum an Hochleistungs-Computing-Anforderungen abdecken. Ob Datenanalyse, Grafikdesign, Spiele oder andere anspruchsvolle Aufgaben – diese Server sind auf Leistung, Zuverlässigkeit und Kühleffizienz ausgelegt.
Der „Coolness-Faktor“ dieser Grando-Systeme kann gar nicht genug betont werden. Sie strahlen Kraft und Leistung aus und integrieren nahtlos modernste Flüssigkeitskühlungstechnologien, um optimale Temperaturen aufrechtzuerhalten. Dies gewährleistet Spitzenleistungen auch bei hoher Arbeitsbelastung und macht Coolness zu einem wörtlichen und übertragenen Attribut. Das Design der Kühlplattform ermöglicht außerdem GPU-Dichten, die ohne Flüssigkeitskühlung sonst nicht möglich wären. Auf dem Grando-Server kann Comino beispielsweise sechs NVIDIA 4090-GPUs nebeneinander unterbringen, was mit einer Luftkühlung unmöglich wäre. Das flüssigkeitsgekühlte Design ist eine Schlitzbreite breit, während der serienmäßige luftgekühlte Teil doppelt so breit ist.
Die Server- und Workstation-Modelle sind hochgradig anpassbar und bieten Benutzern eine Reihe von Auswahlmöglichkeiten, darunter leistungsstarke Multi-Core-Prozessoren (AMD Threadripper PRO), Speicherkonfigurationen bis zu 1 TB und enorme Speicherkapazitäten. Benutzer haben außerdem die Möglichkeit, bis zu sechs professionelle GPUs der Spitzenklasse hinzuzufügen, darunter NVIDIA RTX A6000 (48 GB), NVIDIA RTX 6000 ADA (46 GB), NVIDIA H100 (80 GB), NVIDIA A100 (80 GB), NVIDIA L40s (48 GB) und die NVIDIA RTX 4090 (24GB). Dies macht den Comino Grando zu einer guten Wahl für Profis und Unternehmen, die nach robusten Computerlösungen suchen, die Leistung und Zuverlässigkeit versprechen.
Wir hatten die Gelegenheit, zwei der flüssigkeitsgekühlten Systeme von Comino zu testen. Beginnend mit dem Grando Server ist unsere Konfiguration mit sechs NVIDIA RTX 4090 ausgestattet. Es ist außerdem mit der Threadripper PRO 5995WX-CPU von AMD ausgestattet (ein 64-Kern-Prozessor, den wir im Inneren gesehen haben). Lenovo ThinkStation P620), 512 GB DDR5 DRAM, eine 2 TB NVMe SSD und vier 1600-W-Netzteile für Redundanz, um die Zuverlässigkeit bei Stromausfällen zu erhöhen.
Das zweite System, das wir von Comino erhalten haben, die Workstation-Iteration, zeichnet sich durch vier professionelle NVIDIA A100-GPUs, einen Threadripper Pro 3975WX-Prozessor (36 Kerne, 64 Threads, Turbogeschwindigkeit bis zu 4.2 GHz), 512 GB DDR5 DRAM und 2 TB NVMe SSD aus. Dieser ist für einen nahezu geräuschlosen Betrieb konzipiert; schockierend angesichts der GPUs im Inneren.
Wie oben angedeutet, liegt der Hauptunterschied zwischen den beiden Modellen in ihren GPU- und CPU-Fähigkeiten, wodurch sich auch ihre angestrebten Anwendungsszenarien unterscheiden. Die 5995WX-CPU im Servermodell verfügt über eine höhere Kernanzahl und eignet sich daher gut für parallele Verarbeitungsaufgaben. Es verbessert die Leistung in Serverumgebungen erheblich, in denen die gleichzeitige Bearbeitung mehrerer Aufgaben von entscheidender Bedeutung ist.
Im Gegensatz dazu ist der 3975WX der Workstation zwar immer noch leistungsstark, verfügt aber über weniger Kerne, was auf den Workstation-Einsatz abgestimmt ist, bei dem eine ausgewogene Leistung für verschiedene Anwendungen erforderlich ist. Die GPU-Auswahl unterscheidet die beiden weiter; Die RTX 4090 sind führend in der Grafikwiedergabe und ideal für Aufgaben, die intensive grafische Berechnungen erfordern, während die NVIDIA A100 (jeweils mit 40 GB Speicher ausgestattet) auf Deep Learning und wissenschaftliches Rechnen zugeschnitten sind.
Comino Grando Komponenten und Aufbau
Trotz eines anfänglichen Transportunglücks (bei dem der Server vom Lieferwagen fiel – nicht von uns, ich schwöre!), stellte die sorgfältige Verpackung von Comino sicher, dass die Integrität des Systems intakt blieb. Diese Widerstandsfähigkeit ist unter anderem auf die kompakte, wassergekühlte Bauweise zurückzuführen, die das Risiko von Beschädigungen beim Transport grundsätzlich verringert. Dieses System wurde auf Kongressen vorgestellt und von Technologieexperten in den gesamten USA analysiert, sodass ihm die Strapazen des Reisens nicht fremd sind.
Als wir das Grando Server-Modell auspackten, entdeckten wir einen gut organisierten Innenraum, komplett mit Stromkabeln, Schienen und einem Hinweis zum vorgefüllten Kühlsystem, einschließlich Werkzeugen und Ressourcen für die Wartung. Auf der Vorderseite des Servers befindet sich eine beeindruckende Reihe von sechs RTX 4090, die dank der Wasserblöcke für ein schlankes, effizientes Design jeweils auf einen Single-Slot-Formfaktor reduziert sind. Angesichts der Leistung dieser kompakten Geräte ist dieser Aufbau sicherlich interessant.
Beide Modelle verwenden nahezu identische Gehäuse; Im Inneren sehen sie abgesehen von der Kühlkonfiguration praktisch gleich aus. Sofern nicht anders angegeben, konzentrieren wir uns für den Layout-Teil auf die Server-Iteration. Die Konnektivität an der Vorderseite umfasst zusätzliche I/O-Optionen, darunter Audio-Ein-/Ausgangsbuchsen für die direkte Integration von Soundsystemen, mehrere USB-Anschlüsse für die Konnektivität von Peripheriegeräten und Netzwerkanschlüsse, um den Anschluss an eine Vielzahl von Geräten zu ermöglichen. Beide Modelle legen Wert auf einfachen Zugang für Wartung und Benutzerinteraktion, im Einklang mit Cominos Designphilosophie für Hochleistungs-Computing-Hardware.
Ganz links auf der Vorderseite des Servers befindet sich eine LED-Anzeige, die eine Reihe hilfreicher Telemetriedaten liefert, darunter Informationen zu Pumpen, Lufttemperatur, Kühlmitteltemperatur und Lüftergeschwindigkeit. Die Navigation durch das Menü wird durch beleuchtete Tasten am Kühlmodul erleichtert. Durch kurzes Drücken (weniger als 2 Sekunden) kann durch die Informationen geblättert werden. Ein langer Druck auf PB2 (über 2 Sekunden) öffnet den Zugriff auf zusätzliche Menüzweige, einschließlich Befehle, Dienst (Einstellungen) und Ereignisprotokoll, und bietet so weitere Kontrolle über Einstellungen und Systemdiagnosen. Insgesamt ist die Benutzeroberfläche intuitiv und verfügt über leicht navigierbare Menüs, die durch hintergrundbeleuchtete Tasten für eine einfache Bedienung ergänzt werden.
Als wir die obere Abdeckung öffneten, fielen uns als Erstes natürlich die Flüssigkeitsschläuche ins Auge, die ein Gefühl von Raffinesse und Einheitlichkeit erkennen ließen. Wir waren auch von der Stützleiste angezogen, die sich über die Bereiche erstreckt, in denen die GPUs und SSDs im Gehäuse untergebracht sind. Dadurch wird die Bewegung empfindlicher Komponenten während des Versands erheblich reduziert und sichergestellt, dass sie in gutem Zustand ankommen.
In der Mitte des Systems befindet sich ein großer Wasserverteilerblock, der sowohl kühle Flüssigkeit als auch einen Rücklaufweg bereitstellt. Diese sind alle mit tropffreien Schnellkupplungen verbunden und zeugen von der hohen Ingenieurskunst von Comino.
Die sechs NVIDIA RTX 4090-GPUs im Grando Server sind in proprietären Comino-Kühlplatten untergebracht und in einer sehr kompakten Anordnung angeordnet, um den Platz im Server zu maximieren und gleichzeitig sicherzustellen, dass jede Einheit effektiv gekühlt werden kann. Das Workstation-Modell nutzt vier NVIDIA A100-GPUs.
Beide werden mithilfe einer Halteklammer, die senkrecht über sie verläuft, sicher im Server befestigt. Dies trägt dazu bei, die GPUs zu stabilisieren und auszurichten und ihre strukturelle Integrität während Bewegungen aufrechtzuerhalten.
Für ein besseres Erscheinungsbild wurde eine GPU entfernt, bei jeder handelt es sich um eine handelsübliche Gigabyte NVIDIA RTX 4090 mit dem maßgeschneiderten Kühlplattendesign von Comino. Die Karten wiegen ein beträchtliches Gewicht, was zweifellos zum Teil an der massiven Kühlkörperbaugruppe liegt, die auf der GPU sitzt.
Die Anschlüsse an jeder Karte, die zurück zum Wasserverteilerblock führen, sind tropffreie Verbindungen, die es ermöglichen, die Karten zur Wartung zu entfernen, ohne dass überall Flüssigkeit ausläuft. Sie haben minimale Rückstände auf der Kontaktfläche, aber das ist alles, nachdem sie vom System getrennt wurden.
Die gleichen Armaturen befinden sich auch am Verteilerblock.
Die CPU und die Spannungsregler verfügen über eine Kühlplatte, die direkt mit den Kühlmittelschläuchen verbunden ist, um sie kühl zu halten und Engpässe bei hoher Arbeitsbelastung zu vermeiden. Die CPU wird auf beiden Seiten von vollständig bestückten DRAM-Steckplätzen mit insgesamt 512 GB flankiert.
Obwohl beide Systeme über einen riesigen Kühler auf der Rückseite verfügen, um die Wärme abzuleiten, besteht der größte Unterschied zwischen den beiden Plattformen in der Lüfterkonfiguration und der Gesamtgeräuschentwicklung. Während beide Systeme sehr leise sind, ist die Workstation-Konfiguration leiser und verfügt über eine weniger aggressive Lüfterkonfiguration.
Was das Design angeht, ist der einzige wirkliche Kritikpunkt, den wir haben, die Platzierung der I/O-Anschlüsse an der Vorderseite und der Stromeingänge an der Rückseite. In einer Rackmount-Rechenzentrumsumgebung stellt dieses Design eine Herausforderung dar. Durch die Verwendung eines handelsüblichen Motherboards stehen Comino nur begrenzte Optionen zur Verfügung. Das Endergebnis ist ein kleines Ärgernis, bei ansonsten äußerst durchdachtem Design.
Comino Grando Fernverwaltung
Grafana wird für die Verwaltung des Comino Grando Servers eingesetzt und dient als leistungsstarke Open-Source-Analyse- und Überwachungslösung, die eine Datenvisualisierung in Echtzeit über Dashboards ermöglicht. Es lässt sich in verschiedene Datenquellen integrieren und bietet Funktionen wie Alarmierung, mandantenfähige Unterstützung und API-Zugriff, was es praktisch für die Verfolgung und Diagnose der Systemleistung macht.
Auf dem Dashboard „Allgemeine Informationen“ zeigt Grafana Echtzeitmetriken zum Comino Grando an, z. B. Kühlmitteldurchflussraten für das Wärmemanagement, Umgebungsfeuchtigkeit, Temperaturen kritischer Komponenten wie System Management (STM), Spannungsreglermodul (VRM) usw Leiterplatten (PCB).
Es überwacht auch den Energieverbrauch und zeigt die Nutzung einzelner Komponenten wie CPU- und GPU-Stromverbrauch an, was für die Verwaltung eines Servers dieses Kalibers unerlässlich ist. Die Schnittstelle konsolidiert effizient alle wichtigen Informationen und zeigt sie auf leicht verständliche Weise an. Dadurch wird sichergestellt, dass die Leistung und Zuverlässigkeit des Servers auf optimalem Niveau gehalten wird, und den Administratoren werden umsetzbare Erkenntnisse geliefert, mit denen sie potenzielle Probleme präventiv angehen können.
Comino Grando-Spezifikationen
Grando Server | Grando-Workstation | |
---|---|---|
CPU | Threadripper Pro W5995WX | ThreadripperPro 3975WX |
Widder | 512GB RAM | 512GB RAM |
GPU | 6X NVIDIA RTX 4090 | 4X A100 |
PSU | 4x 1600-W-Netzteile | 3x 1000 SFX-L Netzteil |
Lagerung | 2 TB NVMe | 2 TB NVMe |
Comino Grando-Aufführung
Um die Leistung zwischen zwei Konfigurationen von Comino Grando-Systemen – einem Server und einer Workstation – zu vergleichen, verwendeten wir eine Reihe von Benchmarks, die verschiedene Aspekte der Rechenleistung bewerten, einschließlich Rendering-, Berechnungs- und Datenverarbeitungsfunktionen. Zu den Benchmarks gehören Blender 4.0, Luxmark, OctaneBench, Blackmagic RAW Speed Test, 7-zip Compression und Y-Cruncher, die jeweils aufgrund ihrer Relevanz für die Bewertung der spezifischen Stärken dieser Systeme in verschiedenen Computerumgebungen ausgewählt wurden.
Mixer 4.0
Blender ist eine umfassende Open-Source-3D-Erstellungssuite für Modellierungs-, Animations-, Simulations- und Rendering-Projekte. Blender-Benchmarks bewerten die Leistung eines Systems beim Rendern komplexer Szenen, ein entscheidender Aspekt für Profis in den Bereichen visuelle Effekte, Animation und Spieleentwicklung. Dieser Benchmark misst die Rendering-Fähigkeiten von CPU und GPU, die für Server und Workstations relevant sind, die für High-End-Grafikverarbeitung und Rechenaufgaben ausgelegt sind.
Blender 4.0 (Proben pro Minute, höher ist besser) | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
Monster (CPU) | 568.02 | 334.40 |
Junkshop (CPU) | 386.53 | 231.90 |
Klassenzimmer (CPU) | 293.91 | 174.21 |
Blender 4.0 GPU-Tests | ||
Monster (GPU) | 5,880.71 | 1,656.34 |
Junkshop (GPU) | 2,809.36 | 1,137.73 |
Klassenzimmer (GPU) | 2,895.54 | 953.46 |
Die Ergebnisse unterstreichen die robuste Leistung des Grando Servers beim Rendering, die auf seine leistungsstarke CPU und das überlegene GPU-Setup zurückzuführen ist. Während die Grando Workstation vor allem in professionellen Umgebungen, die detaillierte 3D-Modellierung und -Rendering erfordern, ebenfalls eine hervorragende Leistung erbringt, ist die Konfiguration des Servers für noch anspruchsvollere Grafikverarbeitungsaufgaben ausgelegt. Die Leistungsunterschiede spiegeln die Eignung des Servers für anspruchsvolle Rendering-Aufgaben wider und bieten ein wertvolles Werkzeug für Projekte mit engen Fristen oder komplexen Rendering-Anforderungen.
Luxmark
Luxmark ist ein GPU-Benchmark, der LuxRender, einen Open-Source-Raytracing-Renderer, verwendet, um die Leistung eines Systems bei der Verarbeitung hochdetaillierter 3D-Szenen zu bewerten. Dieser Benchmark ist für die Beurteilung der grafischen Darstellungsfähigkeit von Servern und Workstations relevant, insbesondere für visuelle Effekte und Architekturvisualisierungsanwendungen, bei denen eine genaue Lichtsimulation von entscheidender Bedeutung ist.
Luxmark (Höher ist besser) | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
Hallenbank | 240,303 | 92,156 |
Essen | 98,459 | 27,194 |
Die Leistung des Grando Servers unterstreicht seine außergewöhnlichen Raytracing-Fähigkeiten dank seines fortschrittlichen 6x RTX 4090 GPU-Setups. Obwohl die Grando Workstation umfangreiche Fähigkeiten aufweist, die besonders für Aufgaben nützlich sind, die eine detaillierte Architekturvisualisierung erfordern, ist das Servermodell auf intensivere Rendering-Aufgaben ausgerichtet. Diese Auszeichnung unterstreicht die Eignung des Servers für Projekte, bei denen die Maximierung der Raytracing-Leistung von entscheidender Bedeutung ist, um Effizienz und Realismus in gerenderten Szenen sicherzustellen.
OctaneBench
OctaneBench bewertet die Rendering-Leistung von GPUs mit OctaneRender, einem leistungsstarken und beliebten GPU-beschleunigten Raytracing-Renderer. Dieser Benchmark ist von entscheidender Bedeutung für die Bewertung der Leistungsfähigkeit von Servern und Workstations bei der Inhaltserstellung, Architekturvisualisierung und visuellen Effekten, bei denen sich die Rendering-Geschwindigkeit direkt auf die Produktivität und Projektzeitpläne auswirkt.
OctaneBench | Kernel | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|---|
Interieur | Infokanäle | 275.25 | 68.05 |
Interieur | Direkte Beleuchtung | 826.70 | 244.65 |
Interieur | Pfadverfolgung | 1,065.47 | 297.89 |
Die Idee | Infokanäle | 156.00 | 36.22 |
Die Idee | Direkte Beleuchtung | 642.48 | 191.03 |
Die Idee | Pfadverfolgung | 785.45 | 232.82 |
ATV | Infokanäle | 431.21 | 73.74 |
ATV | Direkte Beleuchtung | 896.54 | 220.35 |
ATV | Pfadverfolgung | 1,130.18 | 273.55 |
Verpackung | Infokanäle | 222.37 | 51.48 |
Verpackung | Direkte Beleuchtung | 789.55 | 224.08 |
Verpackung | Pfadverfolgung | 885.74 | 254.17 |
Gesamtwertung | 8,106.94 | 2,168.02 |
Der Grando Server glänzt in den OctaneBench-Tests und zeigt seine außergewöhnliche Eignung für anspruchsvolle Rendering-Workflows, die von der GPU-Beschleunigung profitieren. Die Grando Workstation bietet nicht nur umfangreiche Rendering-Funktionen, sondern ist auch darauf optimiert, Leistung und Vielseitigkeit in professionellen Umgebungen in Einklang zu bringen. Dieser Leistungsunterschied unterstreicht das Design des Servers für spezielle Aufgaben, die beispiellose Rendering-Geschwindigkeiten erfordern, und unterstützt effizientere Projektabschlüsse.
Blackmagic RAW-Geschwindigkeitstest
Der Blackmagic RAW Speed Test misst die Verarbeitungsgeschwindigkeit für hochwertige Videoformate, ein wesentlicher Aspekt für Server und Workstations bei der Videoproduktion und -bearbeitung. Es bewertet, wie Systeme RAW-Videodateien verwalten, was sich auf die Workflow-Effizienz und Produktivität in Medienproduktionsumgebungen auswirkt.
Blackmagic RAW-Geschwindigkeitstest | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
8K-CPU | 132 FPS | 135 FPS |
8K CUDA | 345 FPS | 309 FPS |
Der Grando Server und die Workstation zeigen im Blackmagic RAW Speed Test eine solide Leistung, wobei der Server bei CUDA-beschleunigten Aufgaben leicht abschneidet. Dies bedeutet, dass das Servermodell eine etwas bessere Leistung für Arbeitsabläufe mit umfangreicher Videobearbeitung und -verarbeitung bietet (insbesondere solche, die von der GPU-Beschleunigung profitieren). Allerdings bietet die Workstation immer noch umfangreiche Funktionen für Videoverarbeitungsaufgaben, was ihre vielseitige Konstruktion für die Medienproduktion verdeutlicht.
7-Reißverschluss-Komprimierung
Der 7-zip-Komprimierungs-Benchmark testet die Effizienz eines Systems bei der Handhabung der Datenkomprimierung und -dekomprimierung, was für die Verwaltung großer Datensätze und die Optimierung des Speichers von entscheidender Bedeutung ist. Dieser Benchmark spiegelt die Leistung von Servern und Workstations bei datenintensiven Vorgängen wider, bei denen Geschwindigkeit und Effizienz bei der Datenbearbeitung von entscheidender Bedeutung sind.
7-Zip-Komprimierungs-Benchmark (höher ist besser) | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
Aktuelle CPU-Auslastung | 3,379% | 3,439% |
Aktuelle Bewertung/Nutzung | 7.630 GIPS | 7.094 GIPS |
Aktuelle Bewertung | 257.832 GIPS | 243.994 GIPS |
Resultierende CPU-Auslastung | 3,362% | 3,406% |
Resultierende Bewertung/Nutzung | 7.697 GIPS | 7.264 GIPS |
Resultierende Bewertung | 258.756 GIPS | 247.396 GIPS |
Dekomprimieren | ||
Aktuelle CPU-Auslastung | 6,015% | 6,286% |
Aktuelle Bewertung/Nutzung | 5.585 GIPS | 5.434 GIPS |
Aktuelle Bewertung | 335.958 GIPS | 341.599 GIPS |
Resultierende CPU-Auslastung | 6,053% | 6,269% |
Resultierende Bewertung/Nutzung | 5.603 GIPS | 5.468 GIPS |
Resultierende Bewertung | 339.171 GIPS | 342.766 GIPS |
Gesamtbewertung | ||
Gesamt-CPU-Auslastung | 4,708% | 4,837% |
Gesamtbewertung/Nutzung | 6.650 GIPS | 6.366 GIPS |
Gesamtbewertung | 298.963 GIPS | 295.081 GIPS |
Die Ergebnisse des 7-zip-Komprimierungs-Benchmarks zeigen, dass der Grando-Server und die Grando-Workstation bei der Bewältigung von Datenkomprimierungs- und Dekomprimierungsaufgaben leistungsfähig sind. Ihre Leistung zeigt, dass die Systeme große Datenmengen effizient verwalten können, wobei geringfügige Unterschiede auf die jeweilige CPU-Konfiguration zurückzuführen sind. Diese Fähigkeiten unterstreichen die Eignung der Systeme für wichtige Datenverwaltungsaufgaben und gewährleisten effiziente Speicher- und Abrufprozesse.
Y-Cruncher
Y-Cruncher ist ein rechnerischer Benchmark, der die Fähigkeit eines Systems testet, komplexe mathematische Operationen durchzuführen und Pi auf Billionen von Ziffern genau zu berechnen. Dieser Benchmark gibt die Rechenleistung von Servern und Workstations an, insbesondere für den Einsatz in wissenschaftlichen Forschungen und Simulationen, die eine intensive Zahlenverarbeitung erfordern.
Y-Cruncher (Gesamtrechenzeit) | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
1 Milliarde Ziffern | 11.023 Sekunden | 11.759 Sekunden |
2.5 Milliarde Ziffern | 28.693 Sekunden | 32.073 Sekunden |
5 Milliarde Ziffern | 61.786 Sekunden | 69.869 Sekunden |
10 Milliarde Ziffern | 130.547 Sekunden | 151.820 Sekunden |
25 Milliarde Ziffern | 353.858 Sekunden | 425.824 Sekunden |
50 Milliarde Ziffern | 788.912 Sekunden | 971.086 Sekunden |
Der Y-Cruncher-Benchmark zeigt die leicht überlegenen Rechenfähigkeiten des Grando Servers, der auf äußerst anspruchsvolle Aufgaben zugeschnitten ist. Während die Grando Workstation über eine beträchtliche Rechenleistung verfügt, die für eine Vielzahl wissenschaftlicher und analytischer Anwendungen geeignet ist, ist der Server explizit für Szenarien optimiert, die maximale Rechenleistung erfordern. Dies unterstreicht die Rolle des Servers bei der Unterstützung komplexer Simulationen und Analysen und ermöglicht eine schnellere und effizientere Verarbeitung von Rechenaufgaben.
Geekbench 6
Geekbench 6 misst die Rechenleistung von CPUs und GPUs und umfasst Single-Core- und Multi-Core-Fähigkeiten sowie grafische Verarbeitungsleistung. Dieser Benchmark ist wichtig für die Bewertung der gesamten Recheneffizienz von Servern und Workstations für verschiedene Aufgaben, einschließlich Simulationen, Datenanalyse und Grafik-Rendering.
Geekbench 6 (Höher ist besser) | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
CPU Single-Core | 2,127 | 2,131 |
CPU-Mehrkern | 21,621 | 20,411 |
GPU | 294,894 | 193,447 |
Die Ergebnisse von Geekbench 6 veranschaulichen eine nahezu gleiche CPU-Single-Core-Leistung zwischen den Grando Server- und Workstation-Iterationen, was auf eine vergleichbare Effizienz bei Aufgaben hinweist, die auf Single-Thread-Verarbeitung basieren. Allerdings zeigt der Grando Server eine überlegene Leistung bei Multi-Core- und insbesondere GPU-Tests, was seine Fähigkeit widerspiegelt, komplexere, parallele Verarbeitungsaufgaben und intensivere grafische Berechnungen zu bewältigen. Dies deutet darauf hin, dass der Server für Umgebungen geeignet ist, die robuste Multithread-Anwendungen und High-End-Grafikverarbeitung erfordern, wodurch die Produktivität bei rechen- und grafikintensiven Arbeitsabläufen gesteigert wird.
Cinebench R23
Cinebench R23 misst die Rendering-Fähigkeit der CPU und konzentriert sich dabei auf die Single-Core- und Multi-Core-Leistung. Dies ist ein wesentlicher Maßstab für die Bewertung der Leistung eines Servers oder einer Workstation bei der Inhaltserstellung, dem 3D-Rendering und anderen CPU-intensiven Aufgaben. Das MP-Verhältnis (Multi-Core-Performance-Verhältnis) gibt darüber hinaus Aufschluss darüber, wie effektiv ein System seine mehreren Kerne nutzt.
Cinebench R23 (höher ist besser) | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
CPU-Mehrkern | 73,556 | 49,534 |
CPU Single-Core | 1,484 | 1,468 |
MP-Verhältnis | 49.56x | 33.75x |
Hier übertrifft der Grando Server die Workstation in Multi-Core-Tests und stellt seine überlegene Fähigkeit zur Bewältigung anspruchsvoller Rendering-Aufgaben unter Beweis, die von der Parallelverarbeitung profitieren. Der leichte Unterschied bei den Single-Core-Ergebnissen weist auf eine ähnliche Effizienz bei Aufgaben hin, die nicht mehrere Kerne erfordern. Das höhere MP-Verhältnis des Servermodells zeigt seine Kompetenz bei der Multi-Core-Nutzung und macht es zu einem Experten für die Handhabung komplexer Multithread-Anwendungen in Rendering- und Simulationsprojekten.
Cinebench 2024
Cinebench 2024 erweitert den Umfang seines Gegenstücks aus dem Jahr 2023, indem es neben herkömmlichen CPU-Benchmarks auch die GPU-Leistung einbezieht. Diese umfassende Strategie ist von entscheidender Bedeutung für die Bewertung der Leistungsfähigkeit eines Systems bei der Bewältigung der strengen Anforderungen aktueller Aktivitäten zur Erstellung und Darstellung von 3D-Inhalten. Es bietet einen umfassenden Überblick über seine rechnerischen und grafischen Rendering-Funktionen.
Cinebench 2024 (Höher ist besser) | Grando Server (TR W5995WX, 512 GB, 6x 4090) | Grando Workstation (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
GPU | 140,842 | 52,829 |
CPU-Mehrkern | 4,430 | 2,817 |
CPU Single-Core | 90 | 89 |
MP-Verhältnis | 49.49x | 31.73x |
Der Grando Server zeigt eine beeindruckende Leistung in GPU- und CPU-Multi-Core-Benchmarks, was seine Stärke bei der Bewältigung komplexer Rendering-Aufgaben zeigt, die umfangreiche Ressourcen beanspruchen. Im Gegensatz dazu zeigt die Grando Workstation eine lobenswerte Effizienz, insbesondere angesichts ihrer Architektur und Konfiguration im Vergleich zum Servermodell. Die nahe beieinander liegenden CPU-Single-Core-Werte zwischen den beiden Systemen deuten auf eine vergleichbare Effizienz für Aufgaben hin, die nicht stark auf Multi-Core-Verarbeitung angewiesen sind. Schließlich unterstreicht der MP-Ratio-Wert von 49.49x die Fähigkeit des Servermodells, seine Multi-Core-Konfiguration zu maximieren, was es ideal für anspruchsvolle Projekte macht, die einen hohen CPU- und GPU-Durchsatz erfordern, um optimale Leistung und Geschwindigkeit zu erreichen.
Virtualisierte Desktop-Leistung
Zusätzlich zu den Benchmarks zur Gesamtsystemleistung wollten wir das Grando Server-System virtualisieren, um sechs virtuelle Desktops mit jeweils einer dedizierten 4090-GPU zu teilen. Wir haben Windows Server 2022 Standard bereitgestellt und sechs virtuelle Maschinen (VMs) eingerichtet, eine für jede GPU, sodass wir Aufgaben effizient verteilen und die tatsächlichen Fähigkeiten des Systems testen können.
Durch die Einrichtung einer VM für jede RTX 4090-GPU schaffen wir eine isolierte Umgebung, die eine dedizierte Workstation nachahmt und eine gezielte Bewertung der Leistung jeder GPU ermöglicht. Nachfolgend finden Sie den Powershell-Prozess des Passthrough-Prozesses.
Dieses Setup ist auch praktisch, um die Stärken und potenziellen Engpässe in einem Multi-GPU-System zu identifizieren, da es sicherstellt, dass die Leistung jeder Karte unabhängig und ohne Beeinträchtigung durch gemeinsam genutzte Ressourcen bewertet werden kann.
LuxMark
Die LuxMark-Benchmark-Ergebnisse zeigen eine solide Spanne an Hallbench-Ergebnissen von 38,599 bis 40,797. Dies zeigt eine bemerkenswerte Leistungskonsistenz, wobei geringfügige Abweichungen wahrscheinlich auf Betriebsschwankungen oder VM-spezifische Konfigurationen zurückzuführen sind. Die höchsten Werte (VM1 und VM4) unterstreichen die Spitzenleistungsfähigkeit der RTX 4090-GPUs für anspruchsvolle Raytracing-Aufgaben, ebenfalls in der Kategorie „Lebensmittel“.
Insgesamt zeigen diese Ergebnisse die Leistungsfähigkeit des Comino-Servers für anspruchsvolle Rechenaufgaben mit einer einzigen GPU und bieten sowohl Leistung als auch Präzision für mehrere gleichzeitige Arbeitslasten. Wenn Sie die Gesamtpunktzahl mit der Leistung des eigenständigen Clientsystems vergleichen, schneiden die sechs einzelnen Systeme sehr gut ab. Wir haben insgesamt 6 im Hallbench-Test und 241,183 im Lebensmittel-Test ermittelt, verglichen mit dem Einzelergebnis von 103,399 bzw. 240,303.
Grando Server (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090) | Hallenbank | Essen |
Aggregat | 241,183 | 103,399 |
VM1 | 40,797 | 17,370 |
VM2 | 38,599 | 17,415 |
VM3 | 40,363 | 16,898 |
VM4 | 40,651 | 17,129 |
VM5 | 40,138 | 17,111 |
VM6 | 40,635 | 17,476 |
Cinebench 2024
Der Cinebench 2024-Benchmark ermöglicht eine Beurteilung, wie jede GPU komplexe Rendering-Aufgaben in einer virtualisierten Umgebung bewältigt. Der Schwerpunkt bei dieser Arbeitslast liegt wirklich auf der GPU, da wir die verfügbaren Host-CPU-Ressourcen nicht vollständig für jede VM bereitgestellt haben. Hier haben wir einen Gesamt-GPU-Score von 183,348 Punkten gemessen, während das Client-System 140,842 Punkte erreichte.
Grando Server (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090) | ||||
GPU | CPU (Mehrkern) | CPU (Einzelkern) | MP-Verhältnis | |
Aggregat | 183,348 pts | 2,333 pts | 487 pts | 4.78x |
VM1 | 31,178 pts | 394 pts | 82 pts | 4.83x |
VM2 | 30,925 pts | 392 pts | 81 pts | 4.81x |
VM3 | 29,406 pts | 384 pts | 81 pts | 4.74x |
VM4 | 30,816 pts | 391 pts | 81 pts | 4.81x |
VM5 | 30,440 pts | 386 pts | 81 pts | 4.76x |
VM6 | 30,583 pts | 386 pts | 81 pts | 4.75x |
Die GPU-Werte liegen zwischen 29,406 und 31,178 Punkten, was ein hohes Maß an Leistungskonstanz belegt. Die CPU-Multi-Core-Werte sind eng zwischen 384 und 394 Punkten gruppiert, wobei die entsprechenden Single-Core-Werte zwischen 81 und 82 Punkten liegen, was die Fähigkeit des Servers zeigt, intensive Aufgaben auf allen VMs effektiv zu bewältigen.
Das Multi-Core-zu-Single-Core-Leistungsverhältnis (MP-Verhältnis) variiert geringfügig zwischen 4.74x und 4.83x, was eine ausgewogene Verteilung der Rechenleistung widerspiegelt, die Multithread-Rendering-Aufgaben zugute kommt. Was die Ergebnisse selbst anbelangt, so zeigen diese Ergebnisse insgesamt die solide Leistung des Comino Grando Servers in einer virtualisierten Umgebung, wodurch er sich gut für anspruchsvolle 3D-Rendering- und Rechenaufgaben eignet, bei denen Effizienz und Geschwindigkeit im Vordergrund stehen.
Mixer 4.0
Während des Blender-Benchmarks zeigte jede VM in drei verschiedenen Szenen eine konstante Leistung: Monster, Junkshop und Classroom. VM6 sticht mit 5,949 mit der höchsten Punktzahl in der Monster-Szene hervor, was auf eine leichte Abweichung in der Leistung hinweist, die möglicherweise auf die VM-Ressourcenzuweisung oder geringfügige Unterschiede bei der Arbeitslastverarbeitung zurückzuführen ist. Die Werte der Junkshop-Szene liegen relativ nahe beieinander, wobei VM5 mit 2,656 den niedrigsten Wert aufweist. Die Ergebnisse für Unterrichtsszenen sind vielfältiger, wobei VM2 mit 2,868 die höchste Punktzahl erreicht, was auf Unterschiede bei der Handhabung geometriereicher Szenen hindeutet.
Wenn wir diese Ergebnisse mit dem nicht virtualisierten Server vergleichen, der die Arbeitslast in Blender nicht skalieren konnte, sehen wir eine viel höhere Leistung und Auslastung. Das Clientsystem erreichte die Höchstzahl bei 5,881 in Monster, 2,809 in Junkshop und 2,896 in Classroom, wohingegen wir in unserer Windows HyperV-Bereitstellung insgesamt 34,729 in Monster, 16,270 in Junkshop und 16,836 in Classroom gemessen haben.
Blender 4.0 – Grando Server (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090) |
||||
Monster | Trödelladen | Klassenzimmer | ||
Aggregat | 34,726 | 16,270 | 16,836 | |
VM1 | 5,773 | 2,764 | 2,791 | |
VM2 | 5,766 | 2,748 | 2,868 | |
VM3 | 5,741 | 2,716 | 2,750 | |
VM4 | 5,828 | 2,683 | 2,810 | |
VM5 | 5,669 | 2,656 | 2,837 | |
VM6 | 5,949 | 2,703 | 2,780 |
Schlussfolgerung
Der Comino Grando Server und die Workstation sind Paradebeispiele für die richtige Umsetzung GPU-gesteuerter Leistungssysteme, die den anspruchsvollen Bereichen Datenanalyse, KI-Forschung und grafikintensiven Aufgaben gerecht werden. Das mit sechs NVIDIA RTX 4090 konfigurierte Servermodell ist ein Kraftpaket für schwere Rechenarbeiten, ergänzt durch AMDs Threadripper PRO 5995WX-CPU und 512 GB DDR5-Speicher. Diese Konfiguration macht es zu einer fantastischen Wahl für Serverumgebungen, die parallele Verarbeitung und schnelle Datenbearbeitung erfordern.
Im Gegensatz dazu gleicht das Workstation-Modell, wenn auch etwas weniger kernreich, die Gleichung mit vier NVIDIA A100-GPUs aus und demonstriert seine Fähigkeiten bei detaillierter 3D-Modellierung und Deep-Learning-Aufgaben. Dieses Systemdesign ist etwas anders und ermöglicht einen leiseren Betrieb. Fairerweise muss man jedoch sagen, dass beide in unserem Labor im Vergleich zu jedem luftgekühlten Server extrem leise sind.
In Bezug auf die Leistung zeichnen die Benchmark-Ergebnisse ein klares Bild: Der Grando Server zeichnet sich durch GPU-intensive Tests wie OctaneBench und Blender 4.0 aus und unterstreicht seine Fähigkeit, anspruchsvolle Rendering-Aufgaben problemlos zu bewältigen. Mit ihrer maßgeschneiderten CPU-GPU-Balance bietet die Workstation-Version Vielseitigkeit für verschiedene professionelle Anwendungen. Die Geschwindigkeit und Effizienz beider Systeme bei der Verwaltung großer Datenmengen, wie die 7-zip-Komprimierungs- und Y-Cruncher-Benchmarks belegen, unterstreichen ihre Fähigkeit zur Bewältigung datenintensiver Vorgänge, ein entscheidender Vorteil in der heutigen datengesteuerten Landschaft.
Die Flexibilität der Systeme wurde noch weiter unterstrichen, als wir das 6x 4090-System in eine VDI-Box verwandelten. Auch hier haben wir eine konstante Leistung festgestellt, was bedeutet, dass ein Unternehmen jedes dieser Systeme effektiv aufteilen könnte, um mehrere Remote-Desktops mit dediziertem GPU-Zugriff zu unterstützen. Dieser Anwendungsfall wird vollständig durch die Flüssigkeitskühlplatten ermöglicht, was die einzige Möglichkeit ist, diese Art von GPU-Dichte in einem einzigen Gehäuse unterzubringen.
In ihrer Gesamtheit gehören diese Comino Grando-Systeme zu den beeindruckendsten, die wir je gesehen haben. Ja, es gibt viele Enterprise-Server-Alternativen mit Flüssigkeitskühlung, aber das ist hier nicht das Ziel. Bei diesen Comino-Systemen geht es um extreme Flexibilität in der Konfiguration (Client- und Unternehmens-GPU-Optionen) und Rack-Dichte/Effizienz. Die Gesamtleistung an diesen Fronten ist äußerst beeindruckend und macht die Comino Grando-Systeme zu einem unserer Best of 2024-Preisträger.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed