Inicio ConsumidoresAccesorios para clientes Revisión de NVIDIA Quadro RTX 4000

Revisión de NVIDIA Quadro RTX 4000

La Quadro RTX 4000, anunciada en noviembre del año pasado, forma parte de la familia de GPU profesionales de NVIDIA. El RTX 4000 está diseñado específicamente para el profesional de software CAD, proporcionando un realismo intenso y una interacción inmersiva con sus diseños. En consecuencia, esto les permite ejecutar simulaciones y análisis avanzados en su estación de trabajo local.


La Quadro RTX 4000, anunciada en noviembre del año pasado, forma parte de la familia de GPU profesionales de NVIDIA. El RTX 4000 está diseñado específicamente para el profesional de software CAD, proporcionando un realismo intenso y una interacción inmersiva con sus diseños. En consecuencia, esto les permite ejecutar simulaciones y análisis avanzados en su estación de trabajo local.

Al igual que otras GPU de NVIDIA, la RTX 4000 utiliza NVIDIA Quadro Scalable Visual Solutions (SVS). Como resultado, cada tarjeta RTX 4000 individual puede admitir hasta cuatro monitores 5K a 60 Hz o dos pantallas 8K. Cuando se utilizan dos placas Quadro Sync II, un sistema puede admitir hasta ocho GPU RTX 4000, sincronizando 32 pantallas separadas. NVIDIA también reclama una mejora del 40 % en el ancho de banda con respecto a la generación anterior de Quadro P4000, gracias en parte a los 8 GB de memoria gráfica GDDR6.

El RTX 4000 tiene un factor de forma de ranura única de 4.4" H x 9.5" L, lo que permite que la GPU se adapte a una variedad de chasis de estaciones de trabajo. En este factor de forma delgado, NVIDIA pudo instalar 2304 núcleos CUDA, 288 núcleos Tensor, 36 núcleos RT y 8 GB de memoria GDDR6. Este hardware está diseñado para cargas de trabajo intensas de AEC, DCC, AI, VR y gráficos. El RTX 4000 viene con VirtualLink para simplificar la conectividad con pantallas montadas en la cabeza VR de alta resolución y próxima generación.

Quadro RTX 4000 Especificaciones

Arquitectura Nvidia Turing
Memoria de la GPU 8GB GDDR6
interfaz de memoria 256 bits
ancho de banda de memoria Hasta 416 GB/s
Núcleos NVIDIA CUDA 2,304
Núcleos tensores NVIDIA 288
Núcleos NVIDIA RT 36
Rendimiento de precisión simple 7.1 TFLOPS
Rendimiento del tensor 57.0 TFLOPS
System Interface PCI Express 3.0x16
Consumo de energía Potencia total de la placa: 160W
Potencia gráfica total: 125W
​Solución Térmica Activa
Factor de forma 4.4 "de alto x 9.5" de largo, ranura única
Max pantallas simultáneas 4x 3840 × 2160 a 120 Hz
4x 5120 × 2880 a 60 Hz
​2x 7680×4320 a 60 Hz
VR Ready
API de gráficos Shader Model 5.1
OpenGL 4.5
DirectX 12.0
Vulkan 1.0
Compute API CUDA
DirectCompute
​OpenCL

Performance

Con el fin de probar el rendimiento de la nueva arquitectura en la GPU NVIDIA Quadro RTX 4000, la instalamos en nuestra estación de trabajo Lenovo ThinkSystem P920 con Windows 10. Para obtener una visión integral del rendimiento de cada tarjeta, aprovechamos múltiples puntos de referencia de la industria y aceleración por GPU. software que puede aprovechar al máximo la tarjeta bajo prueba. No solo lo compararemos con NVIDIA Quadro RTX 5000, que comparte la arquitectura Turning, sino que también lo compararemos con la línea Pascal Quadro anterior, incluida la P6000, la P5000, y el P4000. Esto es menos de lo que es mejor y más de lo que se puede esperar con la GPU elegida.

Para tener una mejor idea de cómo se han escalado estas GPU desde diferentes arquitecturas, hemos incluido la siguiente tabla para el RTX tal como es hoy. La RTX 4000 es claramente la tarjeta de nivel de entrada en la familia, donde las tarjetas de la serie P comenzaron con la P1000. Por supuesto, la familia RTX escala hasta la RTX 8000, trayendo más memoria gráfica, ancho de banda y núcleos en el camino.

GPU NVIDIA Quadro
RTX 4000 RTX 5000 RTX 6000 RTX 8000
Memoria de la GPU 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
interfaz de memoria 256 bits 256 bits 384 bits 384 bits
ancho de banda de memoria HASTA 416 GB/s Hasta 448 GB/s Hasta 672 GB/s Hasta 672 GB/s
Núcleos NVIDIA CUDA 2,304 3,072 4,608 4,608
Núcleos tensores NVIDIA 288 384 576 576
Núcleos NVIDIA RT 36 48 72 72
Rendimiento de precisión simple 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Rendimiento del tensor 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Nuestro primer punto de referencia es la herramienta de punto de referencia OpenCL multiplataforma de LuxMark. LuxMark se basa en la API LuxCore y se ofrece como un componente promocional de la suite LuxCoreRender. Utiliza un nuevo trazador de ruta OpenCL basado en micro-kernel como representación más para su punto de referencia, ofreciendo una forma única de estresar la GPU instalada en una estación de trabajo determinada.

marcalux
GPU Resultados
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Si bien las GPU Pascal salieron de LuxMark con buenos resultados, hay un salto obvio en el rendimiento cuando se observan las GPU Turning. El RTX 4000 quedó en segundo lugar después del RTX 5000 con una puntuación de 28,338.

El siguiente es Arion, una herramienta de evaluación comparativa de CUDA, desarrollada por RandomControl que permite que las estaciones de trabajo hagan hincapié en las CPU o GPU en una aplicación de renderizado. ArionBench es una herramienta de software basada en la tecnología Arion 2 que somete a las CPU/GPU a un gran estrés a través de la tarea de simular el flujo de luz en una escena 3D.

Arion
GPU Resultados
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Otro gran salto en las puntuaciones que van de Pascal a Turing con el RTX 4000 dando un salto bastante grande sobre el P6000.

Nuestro próximo punto de referencia aprovecha SolidWorks 2019 y cuatro modelos 3D que cubren un Audi R8, una excavadora de construcción, un motor a reacción y un automóvil de carreras. Solidworks es una aplicación de modelado CAD en 3D acelerada por GPU líder en la industria que funciona en sistemas basados ​​en Windows. SolidWorks está desarrollado por Dassault Systèmes y lo utilizan más de dos millones de ingenieros y más de 165,000 2019 empresas en todo el mundo. Para fines de evaluación comparativa, aprovechamos la nueva función de "canalización de rendimiento" dentro de SolidWorks 4.5. Esta arquitectura proporciona una visualización en tiempo real con mayor capacidad de respuesta, especialmente para modelos grandes. Aprovecha el moderno OpenGL (XNUMX) y el renderizado acelerado por hardware para mantener un alto nivel de detalle y velocidad de fotogramas cuando desplaza, acerca o gira modelos grandes.

Después de renderizar cada modelo, nuestro script rota cada modelo cinco veces y mide el tiempo requerido para completar esta tarea. Luego lo divide por la cantidad de cuadros renderizados y calcula el puntaje promedio de cuadros por sección (FPS).

SolidWorks
trabajo solido r8 Normal
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Excavadora de Solidworks Normal
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Motor a reacción de Solidworks Normal
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
Coche de rally de Solidworks Normal
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Con Solidworks R8 y Rally Car, el rendimiento de los modelos Turing es un poco menor, sin embargo, hay un gran salto en Digger y Jet Engine. Con nuestras pruebas de Solidworks, estábamos usando el modo de visualización beta que puede ser la causa de la escala inusual que se ve en los ensamblajes Audi R8 y RallyCar.

El siguiente es el punto de referencia del Instituto de Investigación de Sistemas Ambientales (Esri). Esri es un proveedor de software de Sistema de Información Geográfica (GIS). El equipo de rendimiento de Esri diseñó sus secuencias de comandos complementarias de PerfTool para iniciar automáticamente ArcGIS Pro. Esta aplicación utiliza una función "ZoomToBookmarks" para explorar varios marcadores predefinidos y crear un archivo de registro con todos los puntos de datos clave necesarios para predecir la experiencia del usuario. El script repite automáticamente los marcadores tres veces para tener en cuenta el almacenamiento en caché (memoria y caché de disco). En otras palabras, este punto de referencia simula un uso intensivo de gráficos que se podría ver a través del software ArcGIS Pro 2.3 de Esri.

Las pruebas constan de tres conjuntos de datos principales. Dos son vistas tridimensionales de la ciudad de Filadelfia, Pensilvania y Montreal, QC. Estas vistas de la ciudad contienen edificios multiparche tridimensionales texturizados colocados sobre un modelo de terreno e imágenes aéreas cubiertas. El tercer conjunto de datos es una vista de mapa en 3D de la región de Portland, Oregón. Estos datos contienen información detallada sobre carreteras, parcelas de uso de la tierra, parques y escuelas, ríos, lagos y terrenos sombreados.

En cuanto al tiempo de dibujo del modelo de Montreal, NVIDIA Quadro RTX 4000 mostró un tiempo de dibujo promedio de 00:01:31.284, mientras que el FPS promedio y mínimo mostraron 502.395 y 180.699, respectivamente.

ESRI ArcGIS Pro 2.3 Montreal
sorteo Normal
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX 4000 00:01:31.284
Quadro RTX 5000 00:01:31.067
FPS promedio Normal
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX 4000 502.395
Quadro RTX 5000 527.636
FPS mínimo Normal
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX 4000 180.699
Quadro RTX 5000 190.775

El siguiente es nuestro modelo Philly, donde el RTX 4000 mostró un tiempo de dibujo promedio de 00:01:00.231, mientras que los FPS promedio y mínimo mostraron 434.170 y 196.825, respectivamente.

ESRI ArcGIS Pro 2.3 Filadelfia
sorteo Normal
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX 4000 00:01:00.231
Quadro RTX 5000 00:01:01.111
FPS promedio Normal
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX 4000 434.170
Quadro RTX 5000 531.315
FPS mínimo Normal
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX 4000 196.825
Quadro RTX 5000 224.341

Nuestro último modelo es de Portland. Aquí, el RTX 4000 tuvo un tiempo de dibujo promedio de 00:00:32.646. El FPS promedio mostró 2,821.928 mientras que el FPS mínimo mostró 1,083.260.

ESRI ArcGIS Pro 2.3 Portland
sorteo Normal
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX 4000 00:00:32.646
Quadro RTX 5000 00:00:32.541
FPS promedio Normal
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX 4000 2,821.928
Quadro RTX 5000 2,783.547
FPS mínimo Normal
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX 4000 1,083.260
Quadro RTX 5000 1,007.309

Conclusión

NVIDIA Quadro RTX 4000 es la GPU de arquitectura Turing de nivel inferior, pero eso no significa que no sea potente. El RTX 4000 viene equipado con 2304 núcleos CUDA y GPU GDDR8 de 6 GB. Al igual que todos los Quadro RTX, el 4000 puede ofrecer trazado de rayos acelerado, aprendizaje profundo y sombreado avanzado en su factor de forma de ranura única accesible. Esto puede dar a los profesionales creativos un tiempo más rápido para obtener información al tiempo que les permite acelerar sus esfuerzos creativos. El RTX 4000 también viene con VirtualLink que simplifica la conectividad a pantallas montadas en la cabeza VR de alta resolución y próxima generación.

En términos de rendimiento, la RTX 4000 se desempeñó muy bien, especialmente considerando que se encuentra en el extremo inferior de las nuevas GPU. En nuestro punto de referencia LuxMark, casi duplicó su contraparte Pascal e incluso superó al P6000. En Arion, el RTX 4000 superó con creces al P4000 y nuevamente superó fácilmente al P6000. En nuestros puntos de referencia de Solidworks, el RTX 4000 superó fácilmente al P4000 y brilló más en el punto de referencia Digger and Jet Engine. En ESRi, la RTX 4000 tuvo un rendimiento mucho mejor que la P4000 (y la P5000 en algunos casos), pero hay cargas de trabajo en las que la P6000 tuvo un mejor desempeño. Debe tenerse en cuenta que el RTX 4000 está en el extremo inferior de la arquitectura Turing y el P6000 está en el extremo superior de la arquitectura Pascal.

En general, la Quadro RTX 4000 es una adición muy bienvenida a la gran línea de GPU impresionantes de NVIDIA y ofrece números de rendimiento muy impresionantes para la tarjeta de nivel de entrada a un precio de solo alrededor de $ 900.

Quadro RTX 4000 en Amazon

Quadro RTX 4000 Página del producto

Discutir esta revisión

Suscríbase al boletín de StorageReview