La Quadro RTX 4000, annunciata nel novembre dello scorso anno, fa parte della famiglia di GPU professionali di NVIDIA. L'RTX 4000 è progettato specificamente per i professionisti del software CAD, fornendo un realismo intenso e un'interazione coinvolgente con i loro progetti. Di conseguenza, ciò consente loro di eseguire simulazioni e analisi avanzate sulla propria workstation locale.
La Quadro RTX 4000, annunciata nel novembre dello scorso anno, fa parte della famiglia di GPU professionali di NVIDIA. L'RTX 4000 è progettato specificamente per i professionisti del software CAD, fornendo un realismo intenso e un'interazione coinvolgente con i loro progetti. Di conseguenza, ciò consente loro di eseguire simulazioni e analisi avanzate sulla propria workstation locale.
Non diversamente dalle altre GPU NVIDIA, l'RTX 4000 utilizza NVIDIA Quadro Scalable Visual Solutions (SVS). Di conseguenza, ogni singola scheda RTX 4000 può supportare fino a quattro monitor 5K a 60 Hz o due display 8K. Quando si utilizzano due schede Quadro Sync II, un sistema può supportare fino a otto GPU RTX 4000, sincronizzando 32 display separati. NVIDIA afferma inoltre un miglioramento del 40% nella larghezza di banda rispetto alla Quadro P4000 della generazione precedente, grazie in parte a 8 GB di memoria grafica GDDR6.
L'RTX 4000 presenta un fattore di forma a slot singolo da 4.4" H x 9.5" L, che consente alla GPU di adattarsi a una varietà di chassis per workstation. In questo fattore di forma sottile NVIDIA è stata in grado di ospitare 2304 core CUDA, 288 Tensor Core, 36 core RT e memoria GDDR8 da 6 GB. Questo hardware è progettato per carichi di lavoro intensi AEC, DCC, AI, VR e grafica. L'RTX 4000 è dotato di VirtualLink per semplificare la connettività ai display VR montati sulla testa ad alta risoluzione di nuova generazione.
Specifiche della Quadro RTX 4000
Architettura | Turing NVIDIA |
Memoria GPU | 8GB GDDR6 |
Interfaccia di memoria | 256-bit |
Banda di memoria | Fino a 416 GB/s |
Core NVIDIA CUDA | 2,304 |
Tensor core NVIDIA | 288 |
Core NVIDIA RT | 36 |
Prestazioni a precisione singola | 7.1 TFLOPS |
Prestazioni tensoriali | 57.0 TFLOPS |
system Interface | PCI Express 3.0x16 |
Consumo di energia | Potenza totale della scheda: 160 W Potenza grafica totale: 125 W Soluzione Termica Attiva |
Fattore di forma | 4.4" A x 9.5" L, slot singolo |
Numero massimo di display simultanei | 4x3840×2160 a 120 Hz 4x5120×2880 a 60 Hz 2x 7680×4320 a 60 Hz |
VR pronto | Si |
API grafiche | Shader Model 5.1 OpenGL 4.5 DirectX 12.0 Vulkan 1.0 |
API di calcolo | CUDA Calcolo diretto OpenCL |
Performance
Per testare le prestazioni della nuova architettura nella GPU NVIDIA Quadro RTX 4000, l'abbiamo installata sulla nostra workstation Lenovo ThinkSystem P920 con Windows 10. Per uno sguardo completo alle prestazioni di ciascuna scheda, abbiamo sfruttato diversi benchmark di settore e soluzioni con accelerazione GPU. software in grado di sfruttare appieno la scheda in prova. Non solo la confronteremo con la NVIDIA Quadro RTX 5000, che condivide l'architettura Turning, ma la confronteremo anche con la precedente linea Pascal Quadro inclusa la P6000, l' P5000, e il P4000. Questo è meno, ciò che è meglio, e più di cosa aspettarsi con la GPU scelta.
Per avere un'idea migliore di come queste GPU si sono adattate a diverse architetture, abbiamo incluso la seguente tabella per l'RTX così com'è oggi. L'RTX 4000 è chiaramente la scheda entry-level della famiglia, mentre le schede della serie P hanno iniziato con la P1000. Ovviamente la famiglia RTX arriva fino alla RTX 8000, portando con sé più memoria grafica, larghezza di banda e core.
GPU NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Memoria GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Interfaccia di memoria | 256-bit | 256-bit | 384-bit | 384-bit |
Banda di memoria | FINO a 416 GB/s | Fino a 448 GB/s | Fino a 672 GB/s | Fino a 672 GB/s |
Core NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Tensor core NVIDIA | 288 | 384 | 576 | 576 |
Core NVIDIA RT | 36 | 48 | 72 | 72 |
Prestazioni a precisione singola | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOP |
Prestazioni tensoriali | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOP |
Il nostro primo benchmark è lo strumento di benchmark OpenCL multipiattaforma LuxMark. LuxMark è basato sull'API LuxCore e offerto come componente promozionale della suite LuxCoreRender. Utilizza un nuovo path tracer OpenCL basato su micro-kernel come rendering più per il suo benchmark, offrendo un modo unico per stressare la GPU installata in una determinata workstation.
LuxMark | |
---|---|
GPU | Risultati |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Anche se le GPU Pascal sono uscite dal LuxMark con buoni risultati, c'è un evidente salto di prestazioni quando si guardano le GPU Turning. L'RTX 4000 è arrivata seconda dietro all'RTX 5000 con un punteggio di 28,338.
Il prossimo è Arion, uno strumento di benchmarking CUDA, sviluppato da RandomControl che consente alle workstation di sottoporre a stress CPU o GPU in un'applicazione di rendering. ArionBench è uno strumento software basato sulla tecnologia Arion 2 che sottopone CPU/GPU a un forte stress simulando il flusso di luce in una scena 3D.
Arion | |
---|---|
GPU | Risultati |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Un altro grande salto nei punteggi che va da Pascal a Turing con l'RTX 4000 che fa un salto abbastanza grande rispetto al P6000.
Il nostro prossimo benchmark sfrutta SolidWorks 2019 e quattro modelli 3D che coprono un'Audi R8, una scavatrice da costruzione, un motore a reazione e un'auto da rally. Solidworks è un'applicazione di modellazione CAD 3D con accelerazione GPU leader del settore che funziona su sistemi basati su Windows. SolidWorks è sviluppato da Dassault Systèmes ed è utilizzato da oltre due milioni di ingegneri e più di 165,000 aziende in tutto il mondo. Per scopi di benchmarking sfruttiamo la nuova funzionalità "pipeline delle prestazioni" all'interno di SolidWorks 2019. Questa architettura fornisce una visualizzazione più reattiva e in tempo reale soprattutto per i modelli di grandi dimensioni. Sfrutta il moderno OpenGL (4.5) e il rendering con accelerazione hardware per mantenere un livello elevato di dettaglio e frequenza fotogrammi durante la panoramica, lo zoom o la rotazione di modelli di grandi dimensioni.
Dopo il rendering di ciascun modello, il nostro script ruota ciascun modello cinque volte e misura il tempo necessario per completare questa attività. Quindi lo divide per il numero di fotogrammi renderizzati e calcola il punteggio medio di fotogrammi per sezione (FPS).
SolidWorks | |
---|---|
SolidWorks R8 | Media |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Scavatore SolidWorks | Media |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Motore a reazione Solidworks | Media |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Auto da rally Solidworks | Media |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Con Solidworks R8 e Rally Car si tratta di un leggero calo di prestazioni per i modelli Turing, tuttavia c'è un grande salto in Digger e Jet Engine. Con i nostri test Solidworks abbiamo utilizzato la modalità di visualizzazione beta che potrebbe essere la causa dell'insolito ridimensionamento riscontrato sugli assemblaggi Audi R8 e RallyCar.
Il prossimo è il benchmark dell’Environmental Systems Research Institute (Esri). Esri è un fornitore di software GIS (Geographic Information System). Il Performance Team di Esri ha progettato gli script aggiuntivi di PerfTool per avviare automaticamente ArcGIS Pro. Questa applicazione utilizza una funzione "ZoomToBookmarks" per sfogliare vari segnalibri predefiniti e creare un file di registro con tutti i punti dati chiave richiesti per prevedere l'esperienza dell'utente. Lo script esegue automaticamente il loop dei segnalibri tre volte per tenere conto della memorizzazione nella cache (memoria e cache del disco). In altre parole, questo benchmark simula un uso grafico intenso che si potrebbe vedere attraverso il software ArcGIS Pro 2.3 di Esri.
I test consistono in tre set di dati principali. Due sono viste della città in 3D di Filadelfia, PA e Montreal, QC. Queste viste della città contengono edifici multipatch 3D strutturati drappeggiati su un modello di terreno e immagini aeree drappeggiate. Il terzo set di dati è una vista cartografica 2D della regione di Portland, OR. Questi dati contengono informazioni dettagliate su strade, lotti di uso del territorio, parchi e scuole, fiumi, laghi e terreni collinari.
Osservando il tempo di estrazione del modello Montreal, la NVIDIA Quadro RTX 4000 ha mostrato un tempo di estrazione medio di 00:01:31.284, mentre gli FPS medi e minimi hanno mostrato rispettivamente 502.395 e 180.699.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Pareggio | Media |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX4000 | 00:01:31.284 |
Quadro RTX5000 | 00:01:31.067 |
FPS medio | Media |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX4000 | 502.395 |
Quadro RTX5000 | 527.636 |
FPS minimi | Media |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX4000 | 180.699 |
Quadro RTX5000 | 190.775 |
Il successivo è il nostro modello di Philadelphia, dove l'RTX 4000 ha mostrato un tempo di estrazione medio di 00:01:00.231, mentre gli FPS medi e minimi hanno mostrato rispettivamente 434.170 e 196.825.
ESRI ArcGIS Pro 2.3 Philadelphia | |
---|---|
Pareggio | Media |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX4000 | 00:01:00.231 |
Quadro RTX5000 | 00:01:01.111 |
FPS medio | Media |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX4000 | 434.170 |
Quadro RTX5000 | 531.315 |
FPS minimi | Media |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX4000 | 196.825 |
Quadro RTX5000 | 224.341 |
Il nostro ultimo modello è di Portland. In questo caso, l'RTX 4000 ha avuto un tempo di assorbimento medio di 00:00:32.646. Gli FPS medi sono stati 2,821.928 mentre gli FPS minimi sono stati 1,083.260.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Pareggio | Media |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX4000 | 00:00:32.646 |
Quadro RTX5000 | 00:00:32.541 |
FPS medio | Media |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX4000 | 2,821.928 |
Quadro RTX5000 | 2,783.547 |
FPS minimi | Media |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX4000 | 1,083.260 |
Quadro RTX5000 | 1,007.309 |
Conclusione
La NVIDIA Quadro RTX 4000 è la GPU con architettura Turing di livello inferiore ma ciò non significa che non sia potente. L'RTX 4000 è dotato di 2304 core CUDA e GPU GDDR8 da 6 GB. Come tutte le Quadro RTX, la 4000 è in grado di fornire ray tracing accelerato, deep learning e shading avanzato nel suo accessibile fattore di forma a slot singolo. Ciò può dare ai professionisti creativi tempi più rapidi per acquisire informazioni, consentendo loro di accelerare i loro sforzi creativi. L'RTX 4000 è inoltre dotato di VirtualLink che semplifica la connettività ai display VR montati sulla testa ad alta risoluzione di nuova generazione.
In termini di prestazioni, l'RTX 4000 si è comportata molto bene, soprattutto considerando che si trova nella fascia bassa delle nuove GPU. Nel nostro benchmark LuxMark ha quasi raddoppiato la sua controparte Pascal e ha addirittura superato il P6000. Nell'Arion l'RTX 4000 ha più che raddoppiato la P4000 e ha nuovamente superato facilmente la P6000. Nei nostri benchmark Solidworks l'RTX 4000 ha superato facilmente il P4000 e ha brillato di più nei benchmark Digger e Jet Engine. In ESRi l'RTX 4000 ha avuto prestazioni molto migliori rispetto al P4000 (e al P5000 in alcuni casi), ma ci sono carichi di lavoro in cui il P6000 ha ottenuto le prestazioni migliori. Va tenuto presente che l'RTX 4000 si trova nella fascia bassa dell'architettura Turing e il P6000 è nella fascia più alta dell'architettura Pascal.
Tutto sommato, la Quadro RTX 4000 è un'aggiunta molto gradita alla vasta linea di GPU impressionanti di NVIDIA e offre numeri di prestazioni davvero impressionanti per la scheda entry-level pur avendo un prezzo di soli circa $ 900.
Pagina del prodotto Quadro RTX 4000
Iscriviti alla newsletter di StorageReview