La pura potenza dei sistemi Comino Grando raffreddati a liquido garantisce che le prestazioni della GPU rimangano inalterate anche a pieno carico.
Comino, per chi non lo sapesse, è un'azienda che si è ritagliata una nicchia nei server raffreddati a liquido, creando workstation e server versatili ed efficienti. In questa recensione esamineremo il server e la workstation Comino Grando, i loro sistemi di punta. Questi sistemi sono progettati per funzionare come unità montabile su rack da 19 pollici e come desktop autonomo, soddisfacendo un'ampia gamma di esigenze di elaborazione ad alte prestazioni. Che si tratti di analisi dei dati, progettazione grafica, giochi o altre attività impegnative, questi server sono costruiti per offrire prestazioni, affidabilità ed efficienza di raffreddamento.
È impossibile sopravvalutare il “fattore interessante” di questi sistemi Grando. Trasmettono potenza e prestazioni, integrando perfettamente tecnologie di raffreddamento a liquido all'avanguardia per mantenere temperature ottimali. Ciò garantisce prestazioni di punta, anche con carichi di lavoro intensivi, rendendo la freddezza un attributo letterale e figurato. Il design della piattaforma di raffreddamento consente inoltre densità GPU che altrimenti non sarebbero possibili senza il raffreddamento a liquido. Sul Grando Server, ad esempio, Comino può ospitare sei GPU NVIDIA 4090 affiancate, il che sarebbe impossibile se raffreddato ad aria. Il design raffreddato a liquido è largo una fessura, mentre la parte originale raffreddata ad aria è larga il doppio.
I modelli Server e Workstation sono altamente personalizzabili e offrono agli utenti una vasta gamma di scelte, inclusi potenti processori multi-core (AMD Threadripper PRO), configurazioni di memoria fino a 1 TB e enormi capacità di archiviazione. Gli utenti hanno anche la possibilità di aggiungere fino a sei GPU professionali di alto livello, tra cui NVIDIA RTX A6000 (48 GB), NVIDIA RTX 6000 ADA (46 GB), NVIDIA H100 (80 GB), NVIDIA A100 (80 GB), NVIDIA L40s (48 GB) e la NVIDIA RTX 4090 (24 GB). Ciò rende Comino Grando una scelta solida per professionisti e aziende alla ricerca di soluzioni informatiche robuste che promettano potenza e affidabilità.
Abbiamo avuto l'opportunità di testare due dei sistemi raffreddati a liquido di Comino. A partire dal Grando Server, la nostra configurazione è dotata di sei NVIDIA RTX 4090. Inoltre è dotato della CPU AMD Threadripper PRO 5995WX (un processore a 64 core che abbiamo visto all'interno del Lenovo ThinkStation P620), DRAM DDR512 da 5 GB, un SSD NVMe da 2 TB e quattro alimentatori da 1600 W per la ridondanza per migliorare l'affidabilità in caso di interruzioni di corrente.
Il secondo sistema che abbiamo ricevuto da Comino, l'iterazione Workstation, è dotato di quattro GPU professionali NVIDIA A100, un processore Threadripper Pro 3975WX (36 core, 64 thread, velocità turbo fino a 4.2 GHz), DRAM DDR512 da 5 GB e SSD NVMe da 2 TB. Questo è progettato per operazioni quasi silenziose; scioccante considerando le GPU all'interno.
Come indicato sopra, la differenza principale tra i due modelli risiede nelle capacità di GPU e CPU, il che significa che differiscono anche gli scenari applicativi target. La CPU 5995WX nel modello Server vanta un numero di core più elevato, rendendola particolarmente adatta per attività di elaborazione parallela. Migliora significativamente le prestazioni negli ambienti server in cui la gestione di più attività contemporaneamente è fondamentale.
Al contrario, pur essendo potente, il 3975WX della workstation offre meno core, allineandosi all'uso della workstation dove sono necessarie prestazioni bilanciate tra le varie applicazioni. La selezione della GPU differenzia ulteriormente i due; Le RTX 4090 sono all'avanguardia nel rendering grafico e ideali per attività che richiedono calcoli grafici intensivi, mentre le NVIDIA A100 (ciascuna dotata di 40 GB di memoria) sono progettate su misura per il deep learning e il calcolo scientifico.
Componenti e costruzione di Comino Grando
Nonostante un incidente di spedizione iniziale (dove il Server è caduto dal camion della consegna – non da parte nostra, lo giuro!), l'accurato imballaggio di Comino ha garantito che l'integrità del sistema rimanesse intatta. Questa resistenza è in parte dovuta al suo design compatto e raffreddato ad acqua, che riduce intrinsecamente il rischio di danni durante il trasporto. Questo sistema è stato presentato in occasione di convegni e analizzato da esperti di tecnologia negli Stati Uniti, quindi non è estraneo all’usura dei viaggi.
Aprendo la confezione del modello Grando Server, abbiamo scoperto un interno ben organizzato, completo di cavi di alimentazione, guide e un avviso sul sistema di raffreddamento preriempito, inclusi strumenti e risorse per la manutenzione. La parte anteriore del server vanta un'impressionante gamma di sei RTX 4090, ciascuna ridotta a un fattore di forma a slot singolo grazie ai waterblock per un design elegante ed efficiente. Considerando la potenza posseduta da queste unità compatte, questa configurazione è sicuramente interessante.
Entrambi i modelli utilizzano custodie quasi identiche; internamente sembrano praticamente uguali a parte la configurazione di raffreddamento. Se non diversamente specificato, ci concentreremo sull'iterazione Server per la parte di layout. La connettività del pannello frontale comprende opzioni I/O aggiuntive, inclusi jack di ingresso/uscita audio per l'integrazione diretta del sistema audio, porte USB multiple per la connettività delle periferiche e porte di rete per consentire la connessione a un'ampia gamma di dispositivi. Entrambi i modelli enfatizzano la facilità di accesso per la manutenzione e l'interazione con l'utente, in linea con la filosofia di progettazione di Comino per l'hardware informatico ad alte prestazioni.
All'estrema sinistra del pannello frontale del server è presente un display LED che fornisce una serie di utili dati di telemetria, comprese informazioni sulle pompe, sulla temperatura dell'aria, sulla temperatura del liquido di raffreddamento e sulla velocità della ventola. La navigazione nel menu è facilitata dai pulsanti illuminati sul modulo di raffreddamento, con pressioni brevi (meno di 2 secondi) per scorrere le informazioni. Una pressione prolungata su PB2 (oltre 2 secondi) apre l'accesso a rami di menu aggiuntivi, inclusi Comandi, Servizio (Impostazioni) e Registro eventi, aggiungendo ulteriore controllo sulle impostazioni e sulla diagnostica del sistema. Nel complesso, l'interfaccia è intuitiva, con menu facilmente navigabili arricchiti da pulsanti retroilluminati per un facile utilizzo.
Aprendo il pannello superiore, la prima cosa che ha attirato la nostra attenzione è stata ovviamente il tubo del liquido, che mostra un senso di raffinatezza e uniformità. Siamo stati attratti anche dalla barra di supporto che attraversa le aree che ospitano le GPU e gli SSD all'interno dello chassis, che ridurrà significativamente qualsiasi movimento dei componenti sensibili durante la spedizione, garantendo che arrivino in buone condizioni.
Al centro del sistema c'è un grande blocco di distribuzione dell'acqua, che fornisce sia il liquido fresco che un percorso di ritorno. Tutti questi sono collegati con raccordi a sgancio rapido antigoccia, che trasudano l'abilità ingegneristica di alta qualità di Comino.
Racchiuse in piastre fredde Comino proprietarie, le sei GPU NVIDIA RTX 4090 all'interno del Grando Server sono disposte in una formazione molto compatta per massimizzare lo spazio all'interno del server garantendo al tempo stesso che ogni unità possa essere raffreddata in modo efficace. Il modello Workstation utilizza quattro GPU NVIDIA A100.
Entrambi sono fissati saldamente all'interno del server mediante un rinforzo di ritenzione, che corre perpendicolarmente su di essi. Ciò aiuta a stabilizzare e allineare le GPU e a mantenere la loro integrità strutturale durante gli spostamenti.
Rimuovendo una GPU per avere un aspetto migliore, ognuna è una Gigabyte NVIDIA RTX 4090 standard con il design della piastra fredda personalizzato di Comino. Le schede pesano notevolmente, senza dubbio in parte a causa dell'enorme gruppo dissipatore di calore inserito nella GPU.
I raccordi presenti su ogni scheda che risalgono al blocco di distribuzione dell'acqua sono del tipo antigoccia, che permettono di estrarre le schede per la manutenzione senza perdite di liquido ovunque. Hanno una quantità minima di residui sulla superficie di accoppiamento, ma questo è tutto dopo averlo scollegato dal sistema.
Gli stessi raccordi si trovano anche sul blocco di distribuzione.
La CPU e i regolatori di tensione dispongono di una piastra fredda collegata direttamente ai tubi del liquido di raffreddamento per mantenerli freschi ed evitare colli di bottiglia in caso di carichi di lavoro intensi. A fianco della CPU su entrambi i lati ci sono slot DRAM completamente popolati per un totale di 512 GB.
Sebbene entrambi i sistemi abbiano un enorme radiatore nella parte posteriore per scaricare il calore, la differenza più grande tra le due piattaforme è la configurazione della ventola e il rumore generale. Sebbene entrambi i sistemi siano molto silenziosi, la configurazione della workstation è più silenziosa e ha una configurazione della ventola meno aggressiva.
In termini di design, l'unica vera lamentela che abbiamo è il posizionamento delle porte I/O nella parte anteriore e degli ingressi di alimentazione nella parte posteriore. In un ambiente data center montato su rack, questo design rappresenta una sfida. Utilizzando una scheda madre standard, Comino ha solo così tante opzioni. Il risultato netto è un lieve fastidio, in un design altrimenti estremamente ben congegnato.
Gestione remota Comino Grando
Grafana viene sfruttato per la gestione del server Comino Grando, fungendo da potente soluzione di analisi e monitoraggio open source che fornisce visualizzazione dei dati in tempo reale tramite dashboard. Si integra con varie origini dati e offre funzionalità come avvisi, supporto multi-tenant e accesso API, rendendolo pratico per il monitoraggio e la diagnosi delle prestazioni del sistema.
Osservando il dashboard delle informazioni generali, Grafana visualizza parametri in tempo reale su Comino Grando, come le portate del liquido di raffreddamento per la gestione termica, i livelli di umidità ambientale, le temperature dei componenti critici come System Management (STM), Modulo regolatore di tensione (VRM) e Circuiti stampati (PCB).
Monitora inoltre il consumo energetico, visualizzando l'utilizzo dei singoli componenti come l'assorbimento di potenza della CPU e della GPU, che è essenziale per gestire un server di questo calibro. L'interfaccia consolida in modo efficiente tutte queste informazioni critiche visualizzate in modo facilmente fruibile. Ciò garantisce che le prestazioni e l'affidabilità del server siano mantenute a livelli ottimali, fornendo allo stesso tempo agli amministratori informazioni utili per affrontare preventivamente eventuali problemi.
Specifiche Comino Grando
Grande Server | Stazione di lavoro Grando | |
---|---|---|
CPU | Threadripper Pro W5995WX | Filettatore Pro 3975WX |
Ariete | RAM 512GB | RAM 512GB |
GPU | 6X NVIDIA RTX 4090 | 4XA100 |
PSU | 4 alimentatori da 1600 W | 3 alimentatori 1000 SFX-L |
Archiviazione | NVMe da 2 TB | NVMe da 2 TB |
Spettacolo Comino Grando
Per confrontare le prestazioni tra due configurazioni dei sistemi Comino Grando, un server e una workstation, abbiamo utilizzato una serie di benchmark che valutano diversi aspetti delle prestazioni di elaborazione, tra cui capacità di rendering, calcolo ed elaborazione dei dati. I benchmark includono Blender 4.0, Luxmark, OctaneBench, Blackmagic RAW Speed Test, 7-zip Compression e Y-Cruncher, ciascuno scelto per la sua rilevanza nella valutazione dei punti di forza specifici di questi sistemi in vari ambienti informatici.
Blender 4.0
Blender è una suite completa di creazione 3D open source per progetti di modellazione, animazione, simulazione e rendering. I benchmark di Blender valutano le prestazioni di un sistema nel rendering di scene complesse, un aspetto cruciale per i professionisti degli effetti visivi, dell'animazione e dello sviluppo di giochi. Questo benchmark misura le capacità di rendering di CPU e GPU, che sono rilevanti per server e workstation progettati per attività di elaborazione grafica e di calcolo di fascia alta.
Blender 4.0 (campioni al minuto, più alto è meglio) | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
Mostro (CPU) | 568.02 | 334.40 |
Negozio di spazzatura (CPU) | 386.53 | 231.90 |
Aula (CPU) | 293.91 | 174.21 |
Test GPU di Blender 4.0 | ||
Mostro (GPU) | 5,880.71 | 1,656.34 |
Negozio di spazzatura (GPU) | 2,809.36 | 1,137.73 |
Aula (GPU) | 2,895.54 | 953.46 |
I risultati evidenziano le robuste prestazioni del Grando Server nel rendering, che possono essere attribuite alla sua CPU ad alta potenza e alla configurazione superiore della GPU. Sebbene anche la Grando Workstation funzioni egregiamente, soprattutto in ambienti professionali che richiedono modellazione e rendering 3D dettagliati, la configurazione del server è progettata per attività di elaborazione grafica ancora più impegnative. Le differenze di prestazioni riflettono la disponibilità del server per lavori di rendering di fascia alta, offrendo uno strumento prezioso per progetti con scadenze strette o esigenze di rendering complesse.
Luxmark
Luxmark è un benchmark GPU che utilizza LuxRender, un renderer di ray tracing open source, per valutare le prestazioni di un sistema nella gestione di scene 3D altamente dettagliate. Questo benchmark è pertinente per valutare la capacità di rendering grafico di server e workstation, in particolare per effetti visivi e applicazioni di visualizzazione architettonica, dove la simulazione accurata della luce è fondamentale.
Luxmark (più alto è meglio) | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
Panchina | 240,303 | 92,156 |
Alimentare | 98,459 | 27,194 |
Le prestazioni del Grando Server mettono in mostra le sue eccezionali capacità di ray tracing, grazie alla configurazione avanzata della GPU 6x RTX 4090. Sebbene la Grando Workstation dimostri capacità sostanziali, particolarmente utili per attività che richiedono una visualizzazione architettonica dettagliata, il modello Server è orientato verso attività di rendering più intensive. Questa distinzione sottolinea l'idoneità del server per progetti in cui è essenziale massimizzare le prestazioni del ray tracing, garantendo efficienza e realismo nelle scene renderizzate.
Octane Bench
OctaneBench valuta le prestazioni di rendering delle GPU utilizzando OctaneRender, un potente e popolare renderer di ray tracing accelerato da GPU. Questo benchmark è fondamentale per valutare la capacità di server e workstation di funzionare nella creazione di contenuti, nella visualizzazione dell'architettura e negli effetti visivi, dove la velocità di rendering incide direttamente sulla produttività e sulle tempistiche del progetto.
Octane Bench | nocciolo | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|---|
Interno | Canali informativi | 275.25 | 68.05 |
Interno | Illuminazione diretta | 826.70 | 244.65 |
Interno | Tracciatura del percorso | 1,065.47 | 297.89 |
L'idea | Canali informativi | 156.00 | 36.22 |
L'idea | Illuminazione diretta | 642.48 | 191.03 |
L'idea | Tracciatura del percorso | 785.45 | 232.82 |
ATV | Canali informativi | 431.21 | 73.74 |
ATV | Illuminazione diretta | 896.54 | 220.35 |
ATV | Tracciatura del percorso | 1,130.18 | 273.55 |
Scatola | Canali informativi | 222.37 | 51.48 |
Scatola | Illuminazione diretta | 789.55 | 224.08 |
Scatola | Tracciatura del percorso | 885.74 | 254.17 |
Punteggio totale | 8,106.94 | 2,168.02 |
Il Grando Server brilla nei test OctaneBench, indicando la sua eccezionale idoneità per flussi di lavoro di rendering impegnativi che beneficiano dell'accelerazione GPU. Pur offrendo significative capacità di rendering, la Grando Workstation è ottimizzata per bilanciare prestazioni e versatilità in ambienti professionali. Questa distinzione prestazionale sottolinea la progettazione del server per attività specializzate che richiedono velocità di rendering senza precedenti, supportando un completamento dei progetti più efficiente.
Test di velocità RAW di Blackmagic
Il Blackmagic RAW Speed Test misura la velocità di elaborazione per formati video di alta qualità, un aspetto essenziale per server e workstation nella produzione e nell'editing video. Valuta il modo in cui i sistemi gestiscono i file video RAW, influenzando l'efficienza del flusso di lavoro e la produttività negli ambienti di produzione multimediale.
Test di velocità RAW di Blackmagic | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
CPU 8K | 132 FPS | 135 FPS |
8K CUDA | 345 FPS | 309 FPS |
Il server e la workstation Grando dimostrano solide prestazioni nel Blackmagic RAW Speed Test, con il server leggermente in vantaggio nelle attività accelerate da CUDA. Ciò significa che il modello Server offre prestazioni leggermente migliori per i flussi di lavoro che comportano editing ed elaborazione video pesanti (in particolare quelli che beneficiano dell'accelerazione GPU). Tuttavia, la workstation offre ancora funzionalità sostanziali per le attività di elaborazione video, illustrando la sua struttura a tutto tondo per la produzione multimediale.
Compressione a 7 zip
Il benchmark di compressione 7-zip mette alla prova l'efficienza di un sistema nella gestione della compressione e decompressione dei dati, che è fondamentale per la gestione di set di dati di grandi dimensioni e l'ottimizzazione dell'archiviazione. Questo benchmark riflette le prestazioni di server e workstation in operazioni ad alta intensità di dati, dove la velocità e l'efficienza nella manipolazione dei dati sono vitali.
Benchmark di compressione 7-Zip (più alto è meglio è) | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
Utilizzo attuale della CPU | 3,379% | 3,439% |
Valutazione/utilizzo corrente | 7.630 GIPS | 7.094 GIPS |
Corrente nominale | 257.832 GIPS | 243.994 GIPS |
Utilizzo della CPU risultante | 3,362% | 3,406% |
Valutazione/Utilizzo risultante | 7.697 GIPS | 7.264 GIPS |
Valutazione risultante | 258.756 GIPS | 247.396 GIPS |
decompressione | ||
Utilizzo attuale della CPU | 6,015% | 6,286% |
Valutazione/utilizzo corrente | 5.585 GIPS | 5.434 GIPS |
Corrente nominale | 335.958 GIPS | 341.599 GIPS |
Utilizzo della CPU risultante | 6,053% | 6,269% |
Valutazione/Utilizzo risultante | 5.603 GIPS | 5.468 GIPS |
Valutazione risultante | 339.171 GIPS | 342.766 GIPS |
Valutazione totale | ||
Utilizzo totale della CPU | 4,708% | 4,837% |
Valutazione/utilizzo totale | 6.650 GIPS | 6.366 GIPS |
Valutazione totale | 298.963 GIPS | 295.081 GIPS |
I risultati del benchmark di compressione 7-zip mostrano che il server e la workstation Grando sono capaci di gestire attività di compressione e decompressione dei dati. Le loro prestazioni indicano che i sistemi possono gestire in modo efficiente grandi volumi di dati, con lievi differenze che riflettono le rispettive configurazioni della CPU. Queste funzionalità evidenziano l'idoneità dei sistemi per compiti significativi di gestione dei dati, garantendo processi di archiviazione e recupero efficienti.
Y-Cruncher
Y-Cruncher è un benchmark computazionale che mette alla prova la capacità di un sistema di gestire operazioni matematiche complesse, calcolando con precisione Pi fino a trilioni di cifre. Questo benchmark indica la potenza di calcolo di server e workstation, in particolare per l'uso nella ricerca scientifica e nelle simulazioni che richiedono un'intensa elaborazione dei numeri.
Y-Cruncher (tempo di calcolo totale) | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
1 miliardo di cifre | secondi 11.023 | secondi 11.759 |
2.5 miliardo di cifre | secondi 28.693 | secondi 32.073 |
5 miliardo di cifre | secondi 61.786 | secondi 69.869 |
10 miliardo di cifre | secondi 130.547 | secondi 151.820 |
25 miliardo di cifre | secondi 353.858 | secondi 425.824 |
50 miliardo di cifre | secondi 788.912 | secondi 971.086 |
Il benchmark Y-Cruncher rivela le capacità computazionali leggermente superiori del Grando Server, su misura per compiti altamente impegnativi. Sebbene la Grando Workstation offra una notevole potenza di calcolo, adatta a un'ampia gamma di applicazioni scientifiche e analitiche, il server è esplicitamente ottimizzato per scenari che richiedono le massime prestazioni computazionali. Ciò enfatizza il ruolo del Server nel supportare simulazioni e analisi complesse, facilitando un'elaborazione più rapida ed efficiente delle attività computazionali.
Geekbench 6
Geekbench 6 misura le prestazioni computazionali di CPU e GPU, abbracciando funzionalità single-core e multi-core e la potenza di elaborazione grafica. Questo benchmark è essenziale per valutare l'efficienza complessiva di elaborazione di server e workstation in varie attività, tra cui simulazioni, analisi dei dati e rendering grafico.
Geekbench 6 (Più alto è meglio) | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
CPU single-core | 2,127 | 2,131 |
CPU multicore | 21,621 | 20,411 |
GPU | 294,894 | 193,447 |
I risultati di Geekbench 6 illustrano una quasi parità nelle prestazioni single-core della CPU tra le iterazioni Grando Server e Workstation, indicando un'efficienza comparabile nelle attività che si basano sull'elaborazione a thread singolo. Tuttavia, il Grando Server dimostra prestazioni superiori nei test multi-core e soprattutto GPU, riflettendo la sua capacità di gestire attività di elaborazione parallela più complesse e calcoli grafici più intensivi. Ciò suggerisce l'idoneità del server per ambienti che richiedono robuste applicazioni multi-thread ed elaborazione grafica di fascia alta, migliorando la produttività nei flussi di lavoro ad alta intensità di elaborazione e grafica.
Cinebench R23
Cinebench R23 misura la capacità di rendering della CPU, concentrandosi sulle prestazioni single-core e multi-core. È un punto di riferimento essenziale per valutare le prestazioni di un server o di una workstation nella creazione di contenuti, nel rendering 3D e in altre attività ad uso intensivo della CPU. L'MP Ratio (rapporto di prestazioni multi-core) fornisce inoltre informazioni sull'efficacia con cui un sistema utilizza i suoi core multipli.
Cinebench R23 (Più alto è meglio) | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
CPU multicore | 73,556 | 49,534 |
CPU single-core | 1,484 | 1,468 |
Rapporto MP | 49.56x | 33.75x |
In questo caso, il Grando Server supera la Workstation nei test multi-core, dimostrando la sua capacità superiore di gestire attività di rendering impegnative che traggono vantaggio dall'elaborazione parallela. La leggera differenza nei risultati single-core indica efficienze simili nelle attività che non richiedono più core. Il rapporto MP più elevato del modello Server dimostra la sua competenza nell'utilizzo multi-core, rendendolo abile nella gestione di applicazioni complesse e multi-thread nei progetti di rendering e simulazione.
Cinebench 2024
Cinebench 2024 estende la portata della sua controparte del 2023 incorporando le prestazioni della GPU insieme ai tradizionali benchmark della CPU. Questa strategia globale è essenziale per valutare la competenza di un sistema nella gestione delle rigorose esigenze delle attuali attività di creazione e rendering di contenuti 3D. Offre una prospettiva onnicomprensiva sulle sue capacità di rendering grafico e computazionale.
Cinebench 2024 (Più alto è meglio) | Server Grando (TR W5995WX, 512 GB, 6x 4090) | Stazione di lavoro Grando (TR 3975WX, 512 GB, 4x A100) |
---|---|---|
GPU | 140,842 | 52,829 |
CPU multicore | 4,430 | 2,817 |
CPU single-core | 90 | 89 |
Rapporto MP | 49.49x | 31.73x |
Il Grando Server mostra prestazioni impressionanti nei benchmark multi-core di GPU e CPU, indicando la sua forza nella gestione di attività di rendering complesse che utilizzano estese risorse. Al contrario, la Grando Workstation dimostra un'efficienza encomiabile, soprattutto considerando la sua architettura e configurazione rispetto al modello Server. I punteggi CPU single-core vicini tra i due sistemi suggeriscono un'efficienza comparabile per le attività che non si basano fortemente sull'elaborazione multi-core. Infine, il punteggio MP Ratio di 49.49x sottolinea l'abilità del modello Server nel massimizzare la sua configurazione multi-core, rendendolo ideale per progetti impegnativi che richiedono un elevato throughput di CPU e GPU per ottenere prestazioni e velocità ottimali.
Prestazioni del desktop virtualizzato
Oltre ai benchmark relativi alle prestazioni complessive del sistema, abbiamo voluto virtualizzare il sistema Grando Server per condividere sei desktop virtuali, ciascuno con una GPU 4090 dedicata. Abbiamo distribuito Windows Server 2022 Standard e configurato sei macchine virtuali (VM), una per ciascuna GPU, consentendoci di distribuire le attività in modo efficiente e testare le reali capacità del sistema.
Configurando una VM per ciascuna GPU RTX 4090, creiamo un ambiente isolato che imita una workstation dedicata, consentendo una valutazione mirata delle prestazioni di ciascuna GPU. Di seguito è riportato il processo PowerShell del processo passthrough.
Questa configurazione è utile anche per identificare i punti di forza e i potenziali colli di bottiglia in un sistema multi-GPU, poiché garantisce che le prestazioni di ciascuna scheda possano essere valutate in modo indipendente senza interferenze da risorse condivise.
LuxMark
I risultati del benchmark LuxMark mostrano una solida gamma di punteggi da 38,599 a 40,797 in Hallbench. Ciò dimostra una notevole coerenza nelle prestazioni, con lievi variazioni probabilmente dovute a fluttuazioni operative o configurazioni specifiche della VM. I punteggi più alti (VM1 e VM4) evidenziano le massime prestazioni delle GPU RTX 4090 per compiti di ray tracing impegnativi, anche per la categoria Food.
Nel complesso, questi risultati mostrano la capacità del server Comino per attività di elaborazione di fascia alta utilizzando una singola GPU, offrendo potenza e precisione su più carichi di lavoro simultanei. Quando si confronta il punteggio aggregato con le prestazioni del sistema client autonomo, i 6 sistemi individuali si sono comportati molto bene. Abbiamo misurato 241,183 in Hallbench e 103,399 in Food in totale contro il risultato individuale di 240,303 e 92,156 rispettivamente.
Server Grando (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090) | Panchina | Alimentare |
Aggregato | 241,183 | 103,399 |
VM1 | 40,797 | 17,370 |
VM2 | 38,599 | 17,415 |
VM3 | 40,363 | 16,898 |
VM4 | 40,651 | 17,129 |
VM5 | 40,138 | 17,111 |
VM6 | 40,635 | 17,476 |
Cinebench 2024
Il benchmark Cinebench 2024 consente una valutazione di come ciascuna GPU gestisce attività di rendering complesse in un ambiente virtualizzato. Il focus di questo carico di lavoro è in realtà la GPU, poiché non abbiamo fornito completamente le risorse della CPU host disponibili a ciascuna VM. Qui abbiamo misurato un punteggio GPU complessivo di 183,348 punti, contro il sistema client che ne misurava 140,842.
Server Grando (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090) | ||||
GPU | CPU (multicore) | CPU (nucleo singolo) | Rapporto MP | |
Aggregato | 183,348 Punti | 2,333 Punti | 487 Punti | 4.78x |
VM1 | 31,178 Punti | 394 Punti | 82 Punti | 4.83x |
VM2 | 30,925 Punti | 392 Punti | 81 Punti | 4.81x |
VM3 | 29,406 Punti | 384 Punti | 81 Punti | 4.74x |
VM4 | 30,816 Punti | 391 Punti | 81 Punti | 4.81x |
VM5 | 30,440 Punti | 386 Punti | 81 Punti | 4.76x |
VM6 | 30,583 Punti | 386 Punti | 81 Punti | 4.75x |
I punteggi della GPU vanno da 29,406 a 31,178 punti, il che dimostra un alto grado di costanza delle prestazioni. I punteggi multi-core della CPU sono strettamente raggruppati tra 384 e 394 punti, con corrispondenti punteggi single-core da 81 a 82 punti, dimostrando la capacità del server di gestire attività intensive in modo efficace su tutte le VM.
Il rapporto prestazioni multi-core/single-core (rapporto MP) varia leggermente da 4.74x a 4.83x, riflettendo una distribuzione equilibrata della potenza di elaborazione che avvantaggia le attività di rendering multi-thread. Per quanto riguarda i punteggi stessi, nel complesso, questi risultati mostrano le solide prestazioni del server Comino Grando in un ambiente virtualizzato, rendendolo adatto per compiti di rendering 3D e di calcolo impegnativi in cui efficienza e velocità sono fondamentali.
Blender 4.0
Durante il benchmark di Blender, ogni VM ha dimostrato prestazioni costanti in tre diverse scene: Monster, Junkshop e Classroom. VM6 si distingue con il punteggio più alto nella scena Monster pari a 5,949, indicando una leggera variazione nelle prestazioni probabilmente dovuta all'allocazione delle risorse VM o a lievi differenze nella gestione del carico di lavoro. I punteggi della scena Junkshop sono relativamente vicini, con VM5 che mostra il punteggio più basso con 2,656. I risultati delle scene in classe sono più vari, con VM2 che ottiene il punteggio più alto con 2,868, indicando differenze nella gestione delle scene ricche di geometrie.
Quando confrontiamo questi risultati con il server non virtualizzato, che non era in grado di scalare il carico di lavoro in Blender, vediamo prestazioni e utilizzo molto maggiori. Il sistema client ha raggiunto il massimo con 5,881 in Monster, 2,809 in Junkshop e 2,896 in Classroom, mentre in totale nella nostra distribuzione Windows HyperV abbiamo misurato 34,729 in Monster, 16,270 in Junkshop e 16,836 in Classroom.
Blender 4.0 – Grando Server (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090) |
||||
Mostro | Rigattiere | Aula | ||
Aggregato | 34,726 | 16,270 | 16,836 | |
VM1 | 5,773 | 2,764 | 2,791 | |
VM2 | 5,766 | 2,748 | 2,868 | |
VM3 | 5,741 | 2,716 | 2,750 | |
VM4 | 5,828 | 2,683 | 2,810 | |
VM5 | 5,669 | 2,656 | 2,837 | |
VM6 | 5,949 | 2,703 | 2,780 |
Conclusione
Il server e la workstation Comino Grando sono ottimi esempi di realizzazione corretta di sistemi prestazionali basati su GPU, in grado di soddisfare i settori ad alta richiesta dell'analisi dei dati, della ricerca sull'intelligenza artificiale e delle attività ad alta intensità grafica. Il modello Server, configurato con sei NVIDIA RTX 4090, è un concentrato di potenza progettato per lavori computazionali pesanti, completato dalla CPU Threadripper PRO 5995WX di AMD e 512 GB di memoria DDR5. Questa configurazione lo rende una scelta fantastica per gli ambienti server che richiedono elaborazione parallela e manipolazione dei dati ad alta velocità.
Al contrario, anche se leggermente meno ricco di core, il modello Workstation bilancia l'equazione con quattro GPU NVIDIA A100, dimostrando la sua abilità nella modellazione 3D dettagliata e nelle attività di deep learning. Il design di questo sistema è leggermente diverso e consente un funzionamento più silenzioso. Ad essere onesti, però, nel nostro laboratorio sono entrambi estremamente silenziosi rispetto a qualsiasi server raffreddato ad aria.
Dal punto di vista delle prestazioni, i risultati dei benchmark dipingono un quadro chiaro: il Grando Server eccelle nei test ad uso intensivo di GPU come OctaneBench e Blender 4.0, evidenziando la sua capacità di gestire rapidamente lavori di rendering di fascia alta. Con il suo bilanciamento CPU-GPU su misura, la versione workstation offre versatilità per varie applicazioni professionali. La velocità e l'efficienza di entrambi i sistemi nella gestione di set di dati di grandi dimensioni, come evidenziato dai benchmark 7-zip Compression e Y-Cruncher, sottolineano la loro capacità di gestire operazioni ad alta intensità di dati, un vantaggio fondamentale nell'odierno panorama basato sui dati.
La flessibilità dei sistemi è stata ulteriormente sottolineata quando abbiamo trasformato il sistema 6x 4090 in un box VDI. Anche in questo caso abbiamo riscontrato prestazioni costanti, il che significa che un'organizzazione potrebbe effettivamente suddividere uno qualsiasi di questi sistemi per supportare più desktop remoti con accesso GPU dedicato. Questo caso d'uso è interamente consentito dalle piastre di raffreddamento a liquido, che è l'unico modo per ottenere questo tipo di densità della GPU in un unico box.
Nel loro insieme, questi sistemi Comino Grando sono tra i più impressionanti che abbiamo mai visto. Sì, esistono numerose alternative ai server aziendali raffreddate a liquido, ma non è questo l'obiettivo. Questi sistemi Comino garantiscono un'estrema flessibilità nella configurazione (opzioni GPU client e aziendali) e nella densità/efficienza del rack. L'esecuzione complessiva su questi fronti è estremamente impressionante, rendendo i sistemi Comino Grando uno dei nostri vincitori del premio Best of 2024.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed