La Quadro RTX 4000, anunciada en noviembre del año pasado, forma parte de la familia de GPU profesionales de NVIDIA. El RTX 4000 está diseñado específicamente para el profesional de software CAD, proporcionando un realismo intenso y una interacción inmersiva con sus diseños. En consecuencia, esto les permite ejecutar simulaciones y análisis avanzados en su estación de trabajo local.
La Quadro RTX 4000, anunciada en noviembre del año pasado, forma parte de la familia de GPU profesionales de NVIDIA. El RTX 4000 está diseñado específicamente para el profesional de software CAD, proporcionando un realismo intenso y una interacción inmersiva con sus diseños. En consecuencia, esto les permite ejecutar simulaciones y análisis avanzados en su estación de trabajo local.
Al igual que otras GPU de NVIDIA, la RTX 4000 utiliza NVIDIA Quadro Scalable Visual Solutions (SVS). Como resultado, cada tarjeta RTX 4000 individual puede admitir hasta cuatro monitores 5K a 60 Hz o dos pantallas 8K. Cuando se utilizan dos placas Quadro Sync II, un sistema puede admitir hasta ocho GPU RTX 4000, sincronizando 32 pantallas separadas. NVIDIA también reclama una mejora del 40 % en el ancho de banda con respecto a la generación anterior de Quadro P4000, gracias en parte a los 8 GB de memoria gráfica GDDR6.
El RTX 4000 tiene un factor de forma de ranura única de 4.4" H x 9.5" L, lo que permite que la GPU se adapte a una variedad de chasis de estaciones de trabajo. En este factor de forma delgado, NVIDIA pudo instalar 2304 núcleos CUDA, 288 núcleos Tensor, 36 núcleos RT y 8 GB de memoria GDDR6. Este hardware está diseñado para cargas de trabajo intensas de AEC, DCC, AI, VR y gráficos. El RTX 4000 viene con VirtualLink para simplificar la conectividad con pantallas montadas en la cabeza VR de alta resolución y próxima generación.
Quadro RTX 4000 Especificaciones
Arquitectura | Nvidia Turing |
Memoria de la GPU | 8GB GDDR6 |
interfaz de memoria | 256 bits |
ancho de banda de memoria | Hasta 416 GB/s |
Núcleos NVIDIA CUDA | 2,304 |
Núcleos tensores NVIDIA | 288 |
Núcleos NVIDIA RT | 36 |
Rendimiento de precisión simple | 7.1 TFLOPS |
Rendimiento del tensor | 57.0 TFLOPS |
System Interface | PCI Express 3.0x16 |
Consumo de energía | Potencia total de la placa: 160W Potencia gráfica total: 125W Solución Térmica Activa |
Factor de forma | 4.4 "de alto x 9.5" de largo, ranura única |
Max pantallas simultáneas | 4x 3840 × 2160 a 120 Hz 4x 5120 × 2880 a 60 Hz 2x 7680×4320 a 60 Hz |
VR Ready | Sí |
API de gráficos | Shader Model 5.1 OpenGL 4.5 DirectX 12.0 Vulkan 1.0 |
Compute API | CUDA DirectCompute OpenCL |
Performance
Con el fin de probar el rendimiento de la nueva arquitectura en la GPU NVIDIA Quadro RTX 4000, la instalamos en nuestra estación de trabajo Lenovo ThinkSystem P920 con Windows 10. Para obtener una visión integral del rendimiento de cada tarjeta, aprovechamos múltiples puntos de referencia de la industria y aceleración por GPU. software que puede aprovechar al máximo la tarjeta bajo prueba. No solo lo compararemos con NVIDIA Quadro RTX 5000, que comparte la arquitectura Turning, sino que también lo compararemos con la línea Pascal Quadro anterior, incluida la P6000, la P5000, y el P4000. Esto es menos de lo que es mejor y más de lo que se puede esperar con la GPU elegida.
Para tener una mejor idea de cómo se han escalado estas GPU desde diferentes arquitecturas, hemos incluido la siguiente tabla para el RTX tal como es hoy. La RTX 4000 es claramente la tarjeta de nivel de entrada en la familia, donde las tarjetas de la serie P comenzaron con la P1000. Por supuesto, la familia RTX escala hasta la RTX 8000, trayendo más memoria gráfica, ancho de banda y núcleos en el camino.
GPU NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Memoria de la GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
interfaz de memoria | 256 bits | 256 bits | 384 bits | 384 bits |
ancho de banda de memoria | HASTA 416 GB/s | Hasta 448 GB/s | Hasta 672 GB/s | Hasta 672 GB/s |
Núcleos NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Núcleos tensores NVIDIA | 288 | 384 | 576 | 576 |
Núcleos NVIDIA RT | 36 | 48 | 72 | 72 |
Rendimiento de precisión simple | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Rendimiento del tensor | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Nuestro primer punto de referencia es la herramienta de punto de referencia OpenCL multiplataforma de LuxMark. LuxMark se basa en la API LuxCore y se ofrece como un componente promocional de la suite LuxCoreRender. Utiliza un nuevo trazador de ruta OpenCL basado en micro-kernel como representación más para su punto de referencia, ofreciendo una forma única de estresar la GPU instalada en una estación de trabajo determinada.
marcalux | |
---|---|
GPU | Resultados |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Si bien las GPU Pascal salieron de LuxMark con buenos resultados, hay un salto obvio en el rendimiento cuando se observan las GPU Turning. El RTX 4000 quedó en segundo lugar después del RTX 5000 con una puntuación de 28,338.
El siguiente es Arion, una herramienta de evaluación comparativa de CUDA, desarrollada por RandomControl que permite que las estaciones de trabajo hagan hincapié en las CPU o GPU en una aplicación de renderizado. ArionBench es una herramienta de software basada en la tecnología Arion 2 que somete a las CPU/GPU a un gran estrés a través de la tarea de simular el flujo de luz en una escena 3D.
Arion | |
---|---|
GPU | Resultados |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Otro gran salto en las puntuaciones que van de Pascal a Turing con el RTX 4000 dando un salto bastante grande sobre el P6000.
Nuestro próximo punto de referencia aprovecha SolidWorks 2019 y cuatro modelos 3D que cubren un Audi R8, una excavadora de construcción, un motor a reacción y un automóvil de carreras. Solidworks es una aplicación de modelado CAD en 3D acelerada por GPU líder en la industria que funciona en sistemas basados en Windows. SolidWorks está desarrollado por Dassault Systèmes y lo utilizan más de dos millones de ingenieros y más de 165,000 2019 empresas en todo el mundo. Para fines de evaluación comparativa, aprovechamos la nueva función de "canalización de rendimiento" dentro de SolidWorks 4.5. Esta arquitectura proporciona una visualización en tiempo real con mayor capacidad de respuesta, especialmente para modelos grandes. Aprovecha el moderno OpenGL (XNUMX) y el renderizado acelerado por hardware para mantener un alto nivel de detalle y velocidad de fotogramas cuando desplaza, acerca o gira modelos grandes.
Después de renderizar cada modelo, nuestro script rota cada modelo cinco veces y mide el tiempo requerido para completar esta tarea. Luego lo divide por la cantidad de cuadros renderizados y calcula el puntaje promedio de cuadros por sección (FPS).
SolidWorks | |
---|---|
trabajo solido r8 | Normal |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Excavadora de Solidworks | Normal |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Motor a reacción de Solidworks | Normal |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Coche de rally de Solidworks | Normal |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Con Solidworks R8 y Rally Car, el rendimiento de los modelos Turing es un poco menor, sin embargo, hay un gran salto en Digger y Jet Engine. Con nuestras pruebas de Solidworks, estábamos usando el modo de visualización beta que puede ser la causa de la escala inusual que se ve en los ensamblajes Audi R8 y RallyCar.
El siguiente es el punto de referencia del Instituto de Investigación de Sistemas Ambientales (Esri). Esri es un proveedor de software de Sistema de Información Geográfica (GIS). El equipo de rendimiento de Esri diseñó sus secuencias de comandos complementarias de PerfTool para iniciar automáticamente ArcGIS Pro. Esta aplicación utiliza una función "ZoomToBookmarks" para explorar varios marcadores predefinidos y crear un archivo de registro con todos los puntos de datos clave necesarios para predecir la experiencia del usuario. El script repite automáticamente los marcadores tres veces para tener en cuenta el almacenamiento en caché (memoria y caché de disco). En otras palabras, este punto de referencia simula un uso intensivo de gráficos que se podría ver a través del software ArcGIS Pro 2.3 de Esri.
Las pruebas constan de tres conjuntos de datos principales. Dos son vistas tridimensionales de la ciudad de Filadelfia, Pensilvania y Montreal, QC. Estas vistas de la ciudad contienen edificios multiparche tridimensionales texturizados colocados sobre un modelo de terreno e imágenes aéreas cubiertas. El tercer conjunto de datos es una vista de mapa en 3D de la región de Portland, Oregón. Estos datos contienen información detallada sobre carreteras, parcelas de uso de la tierra, parques y escuelas, ríos, lagos y terrenos sombreados.
En cuanto al tiempo de dibujo del modelo de Montreal, NVIDIA Quadro RTX 4000 mostró un tiempo de dibujo promedio de 00:01:31.284, mientras que el FPS promedio y mínimo mostraron 502.395 y 180.699, respectivamente.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
sorteo | Normal |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
FPS promedio | Normal |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
FPS mínimo | Normal |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
El siguiente es nuestro modelo Philly, donde el RTX 4000 mostró un tiempo de dibujo promedio de 00:01:00.231, mientras que los FPS promedio y mínimo mostraron 434.170 y 196.825, respectivamente.
ESRI ArcGIS Pro 2.3 Filadelfia | |
---|---|
sorteo | Normal |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
FPS promedio | Normal |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
FPS mínimo | Normal |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Nuestro último modelo es de Portland. Aquí, el RTX 4000 tuvo un tiempo de dibujo promedio de 00:00:32.646. El FPS promedio mostró 2,821.928 mientras que el FPS mínimo mostró 1,083.260.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
sorteo | Normal |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
FPS promedio | Normal |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
FPS mínimo | Normal |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Conclusión
NVIDIA Quadro RTX 4000 es la GPU de arquitectura Turing de nivel inferior, pero eso no significa que no sea potente. El RTX 4000 viene equipado con 2304 núcleos CUDA y GPU GDDR8 de 6 GB. Al igual que todos los Quadro RTX, el 4000 puede ofrecer trazado de rayos acelerado, aprendizaje profundo y sombreado avanzado en su factor de forma de ranura única accesible. Esto puede dar a los profesionales creativos un tiempo más rápido para obtener información al tiempo que les permite acelerar sus esfuerzos creativos. El RTX 4000 también viene con VirtualLink que simplifica la conectividad a pantallas montadas en la cabeza VR de alta resolución y próxima generación.
En términos de rendimiento, la RTX 4000 se desempeñó muy bien, especialmente considerando que se encuentra en el extremo inferior de las nuevas GPU. En nuestro punto de referencia LuxMark, casi duplicó su contraparte Pascal e incluso superó al P6000. En Arion, el RTX 4000 superó con creces al P4000 y nuevamente superó fácilmente al P6000. En nuestros puntos de referencia de Solidworks, el RTX 4000 superó fácilmente al P4000 y brilló más en el punto de referencia Digger and Jet Engine. En ESRi, la RTX 4000 tuvo un rendimiento mucho mejor que la P4000 (y la P5000 en algunos casos), pero hay cargas de trabajo en las que la P6000 tuvo un mejor desempeño. Debe tenerse en cuenta que el RTX 4000 está en el extremo inferior de la arquitectura Turing y el P6000 está en el extremo superior de la arquitectura Pascal.
En general, la Quadro RTX 4000 es una adición muy bienvenida a la gran línea de GPU impresionantes de NVIDIA y ofrece números de rendimiento muy impresionantes para la tarjeta de nivel de entrada a un precio de solo alrededor de $ 900.
Quadro RTX 4000 Página del producto
Suscríbase al boletín de StorageReview