Ad agosto al SIGGRAPH, NVIDIA ha annunciato una nuovissima architettura grafica, Turing, oltre alle nuove GPU Quadro RTX. Tra le numerose nuove GPU annunciate allora, oggi esamineremo specificamente la GPU NVIDIA Quadro RTX 5000. Presentata come la prima GPU con ray-tracing che utilizza anche il deep learning e l'ombreggiatura avanzata. L'RTX 5000 è progettata per carichi di lavoro di prossima generazione con il potenziale di rendering di scene fotorealistiche in tempo reale, un vantaggio per gli editor video e per i progettisti automobilistici e architettonici.
Ad agosto al SIGGRAPH, NVIDIA ha annunciato una nuovissima architettura grafica, Turing, oltre alle nuove GPU Quadro RTX. Tra le numerose nuove GPU annunciate allora, oggi esamineremo specificamente la GPU NVIDIA Quadro RTX 5000. Presentata come la prima GPU con ray-tracing che utilizza anche il deep learning e l'ombreggiatura avanzata. L'RTX 5000 è progettata per carichi di lavoro di prossima generazione con il potenziale di rendering di scene fotorealistiche in tempo reale, un vantaggio per gli editor video e per i progettisti automobilistici e architettonici.
La forza trainante dietro la nuova ondata di GPU è la nuova architettura Turing NVIDIA. L'azienda è venerata per la sua leadership nel campo delle GPU e si è basata su questo con la sua nuova architettura GPU core. L'argomento dell'architettura è un po' troppo approfondito per essere approfondito qui, ma per riassumere: Turing utilizza diversi progressi hardware per ottenere nuovi risultati impressionanti. Per il ray-tracing, l’architettura sfrutta processori chiamati core RT che accelerano il calcolo di come la luce e il suono viaggiano negli ambienti 3D fino a 10 Giga Ray al secondo. Un multiprocessore di streaming migliora le prestazioni raster e aggiunge una pipeline grafica avanzata e nuove tecnologie di shading programmabili. Turing viene fornito con nuovi Tensor Core che forniscono 500 trilioni di operazioni tensoriali al secondo. Inoltre, Turing consente agli utenti di sfruttare più core CUDA per supportare fino a 16 trilioni di operazioni in virgola mobile in parallelo con 16 trilioni di operazioni con numeri interi al secondo.
NVIDIA Quadro RTX 5000 è pensata per i professionisti creativi che hanno bisogno di lavorare su progetti complessi in modo rapido ed efficace. La GPU ha 3,072 core CUDA, 384 core Tensor, 48 core RT e memoria GDDR16 da 6 GB. Questa impressionante quantità di hardware è in grado di eseguire il rendering di modelli e scene complessi con ombre, riflessi e rifrazioni fisicamente accurati. L'RTX 5000 supporta NVIDIA NVLink consentendo agli utenti di scalare la propria memoria e le prestazioni con più configurazioni GPU. Supponendo che ci sia spazio nella propria workstation, gli utenti possono collegare due GPU Quadro RTX 5000 per un massimo di 50 GB/s di larghezza di banda e 32 GB combinati di memoria GDDR6. La GPU è inoltre dotata di VirtualLink che fornisce connettività alla prossima generazione di display VR ad alta risoluzione montati sulla testa.
Specifiche NVIDIA Quadro RTX 5000
Architettura | Turing NVIDIA |
Memoria GPU | 16GB GDDR6 |
Interfaccia di memoria | 256-bit |
Banda di memoria | Fino a 448 GB/s |
ECC | Si |
Core NVIDIA CUDA | 3,072 |
Tensor core NVIDIA | 384 |
Core NVIDIA RT | 48 |
Prestazioni a precisione singola | 11.2 TFLOPS |
Prestazioni tensoriali | 89.2 TFLOPS |
Collegamento NV NVIDIA | Collega 2 GPU Quadro RTX 5000 |
Larghezza di banda NVIDIA NVLink | 50 GB/s (bidirezionale) |
system Interface | PCI Express 3.0x16 |
Consumo di energia | Potenza totale della scheda: 265 W Potenza grafica totale: 230 W Soluzione Termica Attiva |
Fattore di forma | 4.4" A x 10.5" L, doppio slot, altezza completa |
Connettori display | 4xDP 1.4, 1x USB-C |
Numero massimo di display simultanei | 4x4096×2160 a 120 Hz 4x5120×2880 a 60 Hz 2x 7680×4320 a 60 Hz |
Motori di codifica/decodifica | Codifica 1X, decodifica 2X |
VR pronto | Si |
API grafiche | DirectX 12.0 Shader Model 5.1 OpenGL 4.5 Vulkan 1.0 API di calcolo CUDA Calcolo diretto OpenCL |
Performance
Per testare le prestazioni della nuova architettura nella GPU NVIDIA Quadro RTX 5000, l'abbiamo installata sulla nostra workstation Lenovo ThinkSystem P920 con Windows 10. Per uno sguardo completo alle prestazioni di ciascuna scheda, abbiamo sfruttato diversi benchmark di settore e soluzioni con accelerazione GPU. software in grado di sfruttare appieno la scheda in prova. Non solo la confronteremo con la NVIDIA Quadro RTX 4000, che condivide l'architettura Turning, ma la confronteremo anche con la precedente linea Pascal Quadro inclusa la P6000, l' P5000, e il P4000. Questo è meno, ciò che è meglio, e più di cosa aspettarsi con la GPU scelta.
Per avere un'idea migliore di come queste GPU si sono adattate alle diverse architetture, abbiamo incluso la tabella seguente che riassume la famiglia RTX così com'è oggi. L'RTX 5000 si trova in uno slot centrale, un passo avanti rispetto all'RTX 4000 e sotto i due fratelli più potenti RTX 6000 e RTX 8000.
GPU NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Memoria GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Interfaccia di memoria | 256-bit | 256-bit | 384-bit | 384-bit |
Banda di memoria | FINO a 416 GB/s | Fino a 448 GB/s | Fino a 672 GB/s | Fino a 672 GB/s |
Core NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Tensor core NVIDIA | 288 | 384 | 576 | 576 |
Core NVIDIA RT | 36 | 48 | 72 | 72 |
Prestazioni a precisione singola | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Prestazioni tensoriali | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Il nostro primo benchmark è lo strumento di benchmark OpenCL multipiattaforma LuxMark. LuxMark è basato sull'API LuxCore e offerto come componente promozionale della suite LuxCoreRender. Utilizza un nuovo path tracer OpenCL basato su micro-kernel come rendering più per il suo benchmark, offrendo un modo unico per stressare la GPU installata in una determinata workstation.
LuxMark | |
---|---|
GPU | Risultati |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Anche se le GPU Pascal sono uscite dal LuxMark con buoni risultati, c'è un evidente salto di prestazioni quando si guardano le GPU Turning. L'RTX 5000 è stata la migliore, senza alcuna sorpresa, con un punteggio di 29,404.
Il prossimo è Arion, uno strumento di benchmarking CUDA, sviluppato da RandomControl che consente alle workstation di sottoporre a stress CPU o GPU in un'applicazione di rendering. ArionBench è uno strumento software basato sulla tecnologia Arion 2 che sottopone CPU/GPU a un forte stress simulando il flusso di luce in una scena 3D.
Arion | |
---|---|
GPU | Risultati |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Un altro grande balzo nei punteggi che passa da Pascal a Turing con l'RTX 5000 che balza davanti a tutti gli altri, significativamente più veloce del P6000.
Il nostro prossimo benchmark sfrutta SolidWorks 2019 e quattro modelli 3D che coprono un'Audi R8, una scavatrice da costruzione, un motore a reazione e un'auto da rally. Solidworks è un'applicazione di modellazione CAD 3D con accelerazione GPU leader del settore che funziona su sistemi basati su Windows. SolidWorks è sviluppato da Dassault Systèmes ed è utilizzato da oltre due milioni di ingegneri e più di 165,000 aziende in tutto il mondo. Per scopi di benchmarking sfruttiamo la nuova funzionalità "pipeline delle prestazioni" all'interno di SolidWorks 2019. Questa architettura fornisce una visualizzazione più reattiva e in tempo reale soprattutto per i modelli di grandi dimensioni. Sfrutta il moderno OpenGL (4.5) e il rendering con accelerazione hardware per mantenere un livello elevato di dettaglio e frequenza fotogrammi durante la panoramica, lo zoom o la rotazione di modelli di grandi dimensioni.
Dopo il rendering di ciascun modello, il nostro script ruota ciascun modello cinque volte e misura il tempo necessario per completare questa attività. Quindi lo divide per il numero di fotogrammi renderizzati e calcola il punteggio medio di fotogrammi per sezione (FPS).
SolidWorks | |
---|---|
SolidWorks R8 | FPS medio |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Scavatore SolidWorks | FPS medio |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Motore a reazione Solidworks | FPS medio |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Auto da rally Solidworks | FPS medio |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
È interessante vedere un leggero calo delle prestazioni per le GPU Turing in Solidworks R8 e Rally Car rispetto al Pascal, anche se questi file potrebbero non sfruttare appieno le GPU più recenti. L'RTX 5000 ha fornito prestazioni superiori in Digger e Jet Engine, superando le altre con un ampio margine. Con il nostro Solidworks utilizzavamo la modalità di visualizzazione beta che potrebbe essere la causa dell'insolito ridimensionamento osservato sugli assiemi Audi R8 e RallyCar.
Il prossimo è il benchmark dell’Environmental Systems Research Institute (Esri). Esri è un fornitore di software GIS (Geographic Information System). Il Performance Team di Esri ha progettato gli script aggiuntivi di PerfTool per avviare automaticamente ArcGIS Pro. Questa applicazione utilizza una funzione "ZoomToBookmarks" per sfogliare vari segnalibri predefiniti e creare un file di registro con tutti i punti dati chiave richiesti per prevedere l'esperienza dell'utente. Lo script esegue automaticamente il loop dei segnalibri tre volte per tenere conto della memorizzazione nella cache (memoria e cache del disco). In altre parole, questo benchmark simula un uso grafico intenso che si potrebbe vedere attraverso il software ArcGIS Pro 2.3 di Esri.
I test consistono in tre set di dati principali. Due sono viste della città in 3D di Filadelfia, PA e Montreal, QC. Queste viste della città contengono edifici multipatch 3D strutturati drappeggiati su un modello di terreno e immagini aeree drappeggiate. Il terzo set di dati è una vista cartografica 2D della regione di Portland, OR. Questi dati contengono informazioni dettagliate su strade, lotti di uso del territorio, parchi e scuole, fiumi, laghi e terreni collinari.
Osservando il tempo di assorbimento del modello Montreal, la NVIDIA Quadro RTX 5000 ha mostrato un tempo di assorbimento medio di 00:01:31.067, mentre gli FPS medi e minimi hanno mostrato rispettivamente 527.636 e 190.775.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Pareggio | Media |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX4000 | 00:01:31.284 |
Quadro RTX5000 | 00:01:31.067 |
FPS medio | Media |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX4000 | 502.395 |
Quadro RTX5000 | 527.636 |
FPS minimi | Media |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX4000 | 180.699 |
Quadro RTX5000 | 190.775 |
Il successivo è il nostro modello di Philadelphia, dove l'RTX 5000 ha mostrato un tempo di estrazione medio di 00:01:01.111, mentre gli FPS medi e minimi hanno mostrato rispettivamente 531.315 e 224.341.
ESRI ArcGIS Pro 2.3 Philadelphia | |
---|---|
Pareggio | Media |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX4000 | 00:01:00.231 |
Quadro RTX5000 | 00:01:01.111 |
FPS medio | Media |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX4000 | 434.170 |
Quadro RTX5000 | 531.315 |
FPS minimi | Media |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX4000 | 196.825 |
Quadro RTX5000 | 224.341 |
Il nostro ultimo modello è di Portland. In questo caso, l'RTX 5000 ha avuto un tempo di assorbimento medio di 00:00:32.541. Gli FPS medi sono stati 2,783.547 mentre gli FPS minimi sono stati 1,007.309.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Pareggio | Media |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX4000 | 00:00:32.646 |
Quadro RTX5000 | 00:00:32.541 |
FPS medio | Media |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX4000 | 2,821.928 |
Quadro RTX5000 | 2,783.547 |
FPS minimi | Media |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX4000 | 1,083.260 |
Quadro RTX5000 | 1,007.309 |
Conclusione
La NVIDIA Quadro RTX 5000 è una delle GPU più recenti dell'azienda basata sull'architettura Turing. Turing è destinato a rappresentare una visione completamente nuova dell'architettura GPU poiché NVIDIA sta cercando di cambiare le cose ora con un occhio agli sviluppi futuri. Rivolta ai professionisti creativi che hanno progetti complessi che richiedono un lavoro efficiente e rapido, l'RTX 5000 ha un hardware impressionante sotto il suo cofano, inclusi 3,072 core CUDA, 384 core Tensor, 48 core RT e memoria GDDR16 da 6 GB. Per coloro che necessitano di prestazioni GPU ancora maggiori, l'RTX può scalare con una seconda GPU tramite NVIDIA NVLink.
Per tutti i suoi componenti che dovrebbero portare a prestazioni superiori, lo abbiamo sottoposto a una serie di test, nuovi e vecchi, solo per vedere cosa può fare. Una sorpresa per nessuno, la NVIDIA Quadro RTX 5000 è stata la migliore nella maggior parte dei nostri test. In LuxMark e Arion l'RTX 5000 ha più che raddoppiato i punteggi del P5000. L'RTX 5000 ha ottenuto ottime prestazioni nei benchmark Solidworks Digger e Jet Engine. Va tenuto presente che l'RTX 5000, per quanto potente, non è il top di gamma delle GPU Turing.
Se un professionista creativo è alla ricerca di un salto di prestazioni più ampio nella maggior parte delle aree, la NVIDIA Quadro RTX 5000 farà al caso suo. I nostri risultati sulle prestazioni sopra evidenziati evidenziano le aree in cui l'RTX 5000 brilla e alcuni punti in cui una GPU basata su Pascal funziona abbastanza bene. Nel complesso, con la famiglia RTX NVIDIA ha svolto un ottimo lavoro continuando a espandere i confini di ciò che è disponibile per i creativi all'interno di un desktop. Da parte sua, l'RTX 5000 completa bene l'offerta di fascia media, offrendo un buon equilibrio tra prestazioni e prezzo.
Iscriviti alla newsletter di StorageReview