Inicio ConsumidoresAccesorios para clientes Revisión de NVIDIA Quadro RTX 5000

Revisión de NVIDIA Quadro RTX 5000

by Adam Armstrong

En agosto en SIGGRAPH, NVIDIA anunció una arquitectura de gráficos completamente nueva, Turing, así como nuevas GPU Quadro RTX. De las varias GPU nuevas anunciadas entonces, hoy analizaremos específicamente la GPU NVIDIA Quadro RTX 5000. Anunciada como la primera GPU con trazado de rayos que también utiliza aprendizaje profundo y sombreado avanzado. El RTX 5000 está diseñado para cargas de trabajo de próxima generación con el potencial de renderizar escenas fotorrealistas en tiempo real, una gran ayuda para los editores de video, así como para los diseñadores de automóviles y arquitectura.


En agosto en SIGGRAPH, NVIDIA anunció una arquitectura de gráficos completamente nueva, Turing, así como nuevas GPU Quadro RTX. De las varias GPU nuevas anunciadas entonces, hoy analizaremos específicamente la GPU NVIDIA Quadro RTX 5000. Anunciada como la primera GPU con trazado de rayos que también utiliza aprendizaje profundo y sombreado avanzado. El RTX 5000 está diseñado para cargas de trabajo de próxima generación con el potencial de renderizar escenas fotorrealistas en tiempo real, una gran ayuda para los editores de video, así como para los diseñadores de automóviles y arquitectura.

La fuerza impulsora detrás de la nueva ola de GPU es la nueva arquitectura Turing de NVIDIA. La empresa es venerada por su liderazgo en GPU y se ha basado en esto con su nueva arquitectura central de GPU. El tema de la arquitectura es un poco demasiado profundo para entrar aquí, pero para resumirlo: Turing utiliza varios avances de hardware para lograr nuevos resultados impresionantes. Para el trazado de rayos, la arquitectura aprovecha los procesadores llamados núcleos RT que aceleran el cálculo de cómo viajan la luz y el sonido en entornos 3D hasta en 10 Giga Rays por segundo. Un multiprocesador de transmisión mejora el rendimiento de la trama y agrega una canalización de gráficos mejorada y nuevas tecnologías de sombreado programable. Turing viene con nuevos Tensor Cores que proporcionan 500 billones de operaciones de tensor por segundo. Y Turing permite a los usuarios aprovechar más núcleos CUDA para admitir hasta 16 billones de operaciones de punto flotante en paralelo con 16 billones de operaciones enteras por segundo.

La NVIDIA Quadro RTX 5000 está diseñada para profesionales creativos que necesitan trabajar en proyectos complejos de forma rápida y eficaz. La GPU tiene 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT y 16 GB de memoria GDDR6. Esta impresionante cantidad de hardware es capaz de renderizar modelos y escenas complejos con sombras, reflejos y refracciones físicamente precisos. El RTX 5000 es compatible con NVIDIA NVLink, lo que permite a los usuarios escalar su memoria y rendimiento con múltiples configuraciones de GPU. Suponiendo que haya espacio en su estación de trabajo, los usuarios pueden conectar dos GPU Quadro RTX 5000 para obtener hasta 50 GB/s de ancho de banda y una memoria GDDR32 combinada de 6 GB. La GPU también viene con VirtualLink que brinda conectividad a la próxima generación de pantallas montadas en la cabeza VR de alta resolución.

Especificaciones de NVIDIA Quadro RTX 5000

Arquitectura Nvidia Turing
Memoria de la GPU 16GB GDDR6
interfaz de memoria 256 bits
ancho de banda de memoria Hasta 448 GB/s
ECC
Núcleos NVIDIA CUDA 3,072
Núcleos tensores NVIDIA 384
Núcleos NVIDIA RT 48
Rendimiento de precisión simple 11.2 TFLOPS
Rendimiento del tensor 89.2 TFLOPS
NVIDIA NVLink Conecta 2 GPU Quadro RTX 5000
Ancho de banda NVIDIA NVLink 50 GB/s (bidireccional)
System Interface PCI Express 3.0x16
Consumo de energía Potencia total de la placa: 265W
Potencia gráfica total: 230W
​Solución Térmica Activa
Factor de forma 4.4 "de alto x 10.5" de largo, ranura doble, altura completa
Conectores de pantalla 4x DP 1.4, 1x USB-C
Max pantallas simultáneas 4x 4096 × 2160 a 120 Hz
4x 5120 × 2880 a 60 Hz
​2x 7680×4320 a 60 Hz
Motores de codificación/decodificación Codificación 1X, decodificación 2X
VR Ready
API de gráficos DirectX 12.0
Shader Model 5.1
OpenGL 4.5
Vulkan 1.0
Compute API
CUDA
DirectCompute
​OpenCL

Performance

Con el fin de probar el rendimiento de la nueva arquitectura en la GPU NVIDIA Quadro RTX 5000, la instalamos en nuestra estación de trabajo Lenovo ThinkSystem P920 con Windows 10. Para obtener una visión integral del rendimiento de cada tarjeta, aprovechamos múltiples puntos de referencia de la industria y aceleración por GPU. software que puede aprovechar al máximo la tarjeta bajo prueba. No solo lo compararemos con NVIDIA Quadro RTX 4000, que comparte la arquitectura Turning, sino que también lo compararemos con la línea Pascal Quadro anterior, incluida la P6000, el P5000, y el P4000. Esto es menos de lo que es mejor y más de lo que se puede esperar con la GPU elegida.

Para tener una mejor idea de cómo se han escalado estas GPU desde diferentes arquitecturas, hemos incluido la siguiente tabla que resume la familia RTX tal como se encuentra hoy. El RTX 5000 se encuentra en una ranura intermedia, un paso por encima del RTX 4000 de entrada y por debajo de los dos hermanos RTX 6000 y RTX 8000 más potentes.

GPU NVIDIA Quadro
RTX 4000 RTX 5000 RTX 6000 RTX 8000
Memoria de la GPU 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
interfaz de memoria 256 bits 256 bits 384 bits 384 bits
ancho de banda de memoria HASTA 416 GB/s Hasta 448 GB/s Hasta 672 GB/s Hasta 672 GB/s
Núcleos NVIDIA CUDA 2,304 3,072 4,608 4,608
Núcleos tensores NVIDIA 288 384  576 576
Núcleos NVIDIA RT 36 48 72 72
Rendimiento de precisión simple 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Rendimiento del tensor 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Nuestro primer punto de referencia es la herramienta de punto de referencia OpenCL multiplataforma de LuxMark. LuxMark se basa en la API LuxCore y se ofrece como un componente promocional de la suite LuxCoreRender. Utiliza un nuevo trazador de ruta OpenCL basado en micro-kernel como representación más para su punto de referencia, ofreciendo una forma única de estresar la GPU instalada en una estación de trabajo determinada.

marcalux
GPU Resultados
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Si bien las GPU Pascal salieron de LuxMark con buenos resultados, hay un salto obvio en el rendimiento cuando se observan las GPU Turning. El RTX 5000 fue el de mejor desempeño sin sorpresa con una puntuación de 29,404.

El siguiente es Arion, una herramienta de evaluación comparativa de CUDA, desarrollada por RandomControl que permite que las estaciones de trabajo hagan hincapié en las CPU o GPU en una aplicación de renderizado. ArionBench es una herramienta de software basada en la tecnología Arion 2 que somete a las CPU/GPU a un gran estrés a través de la tarea de simular el flujo de luz en una escena 3D.

Arion
GPU Resultados
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Otro gran salto en los puntajes que van de Pascal a Turing con el RTX 5000 saltando por delante del resto, significativamente más rápido que el P6000.

Nuestro próximo punto de referencia aprovecha SolidWorks 2019 y cuatro modelos 3D que cubren un Audi R8, una excavadora de construcción, un motor a reacción y un automóvil de carreras. Solidworks es una aplicación de modelado CAD en 3D acelerada por GPU líder en la industria que funciona en sistemas basados ​​en Windows. SolidWorks está desarrollado por Dassault Systèmes y lo utilizan más de dos millones de ingenieros y más de 165,000 2019 empresas en todo el mundo. Para fines de evaluación comparativa, aprovechamos la nueva función de "canalización de rendimiento" dentro de SolidWorks 4.5. Esta arquitectura proporciona una visualización en tiempo real con mayor capacidad de respuesta, especialmente para modelos grandes. Aprovecha el moderno OpenGL (XNUMX) y el renderizado acelerado por hardware para mantener un alto nivel de detalle y velocidad de fotogramas cuando desplaza, acerca o gira modelos grandes.

Después de renderizar cada modelo, nuestro script rota cada modelo cinco veces y mide el tiempo requerido para completar esta tarea. Luego lo divide por la cantidad de cuadros renderizados y calcula el puntaje promedio de cuadros por sección (FPS).

SolidWorks
trabajo solido r8 FPS promedio
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Excavadora de Solidworks FPS promedio
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Motor a reacción de Solidworks FPS promedio
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
Coche de rally de Solidworks FPS promedio
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Es interesante ver una ligera disminución en el rendimiento de las GPU de Turing en Solidworks R8 y Rally Car en comparación con Pascal, aunque es posible que esos archivos no aprovechen por completo las GPU más nuevas. El RTX 5000 proporcionó un rendimiento superior en Digger y Jet Engine, superando a los demás por un amplio margen. Con nuestro Solidworks estábamos usando el modo de visualización beta que puede ser la causa de la escala inusual que se ve en los ensamblajes Audi R8 y RallyCar.

El siguiente es el punto de referencia del Instituto de Investigación de Sistemas Ambientales (Esri). Esri es un proveedor de software de Sistema de Información Geográfica (GIS). El equipo de rendimiento de Esri diseñó sus secuencias de comandos complementarias de PerfTool para iniciar automáticamente ArcGIS Pro. Esta aplicación utiliza una función "ZoomToBookmarks" para explorar varios marcadores predefinidos y crear un archivo de registro con todos los puntos de datos clave necesarios para predecir la experiencia del usuario. El script repite automáticamente los marcadores tres veces para tener en cuenta el almacenamiento en caché (memoria y caché de disco). En otras palabras, este punto de referencia simula un uso intensivo de gráficos que se podría ver a través del software ArcGIS Pro 2.3 de Esri.

Las pruebas constan de tres conjuntos de datos principales. Dos son vistas tridimensionales de la ciudad de Filadelfia, Pensilvania y Montreal, QC. Estas vistas de la ciudad contienen edificios multiparche tridimensionales texturizados colocados sobre un modelo de terreno e imágenes aéreas cubiertas. El tercer conjunto de datos es una vista de mapa en 3D de la región de Portland, Oregón. Estos datos contienen información detallada sobre carreteras, parcelas de uso de la tierra, parques y escuelas, ríos, lagos y terrenos sombreados.

En cuanto al tiempo de dibujo del modelo de Montreal, NVIDIA Quadro RTX 5000 mostró un tiempo de dibujo promedio de 00:01:31.067, mientras que los FPS promedio y mínimo mostraron 527.636 y 190.775, respectivamente.

ESRI ArcGIS Pro 2.3 Montreal
sorteo Normal
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX 4000 00:01:31.284
Quadro RTX 5000 00:01:31.067
FPS promedio Normal
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX 4000 502.395
Quadro RTX 5000 527.636
FPS mínimo Normal
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX 4000 180.699
Quadro RTX 5000 190.775

El siguiente es nuestro modelo Philly, donde el RTX 5000 mostró un tiempo de dibujo promedio de 00:01:01.111, mientras que los FPS promedio y mínimo mostraron 531.315 y 224.341, respectivamente.

ESRI ArcGIS Pro 2.3 Filadelfia
sorteo Normal
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX 4000 00:01:00.231
Quadro RTX 5000 00:01:01.111
FPS promedio Normal
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX 4000 434.170
Quadro RTX 5000 531.315
FPS mínimo Normal
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX 4000 196.825
Quadro RTX 5000 224.341

Nuestro último modelo es de Portland. Aquí, el RTX 5000 tuvo un tiempo de dibujo promedio de 00:00:32.541. El FPS promedio mostró 2,783.547 mientras que el FPS mínimo mostró 1,007.309.

ESRI ArcGIS Pro 2.3 Portland
sorteo Normal
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX 4000 00:00:32.646
Quadro RTX 5000 00:00:32.541
FPS promedio Normal
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX 4000 2,821.928
Quadro RTX 5000 2,783.547
FPS mínimo Normal
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX 4000 1,083.260
Quadro RTX 5000 1,007.309

Conclusión

NVIDIA Quadro RTX 5000 es una de las GPU más nuevas de la compañía basada en su arquitectura Turing. Turing está configurado para ser una versión completamente nueva de la arquitectura de GPU, ya que NVIDIA está buscando cambiar las cosas ahora con miras a los desarrollos futuros. Dirigida a profesionales creativos que tienen proyectos complejos que necesitan un trabajo rápido y eficiente, la RTX 5000 tiene un hardware impresionante bajo su capó que incluye 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT y 16 GB de memoria GDDR6. Para aquellos que necesitan aún más rendimiento de GPU, el RTX puede escalar con una segunda GPU a través de NVIDIA NVLink.

Para todos sus componentes que deberían conducir a un rendimiento superior, lo sometemos a un aluvión de pruebas, nuevas y antiguas, solo para ver qué puede hacer. Una sorpresa para nadie, NVIDIA Quadro RTX 5000 fue la de mejor rendimiento en la mayoría de nuestras pruebas. En LuxMark y Arion, la RTX 5000 duplicó con creces las puntuaciones de la P5000. El RTX 5000 tuvo un gran rendimiento en las pruebas de rendimiento de Solidworks Digger y Jet Engine. Debe tenerse en cuenta que la RTX 5000, por poderosa que sea, no es la mejor de las GPU de Turing.

Si un profesional creativo está buscando un salto de rendimiento más grande en la mayoría de las áreas, NVIDIA Quadro RTX 5000 se ajustará a esta factura. Nuestros resultados de rendimiento anteriores destacan las áreas donde brilla el RTX 5000 y algunos puntos donde una GPU basada en Pascal funciona lo suficientemente bien. En general, con la familia RTX, NVIDIA ha hecho un excelente trabajo al continuar ampliando los límites de lo que está disponible para los creativos dentro de una computadora de escritorio. Por su parte, la RTX 5000 completa bien la oferta de gama media, ofreciendo un buen equilibrio entre rendimiento y precio.

NVIDIA RTX 5000 en Amazon

Discutir esta revisión

Suscríbase al boletín de StorageReview