En agosto en SIGGRAPH, NVIDIA anunció una arquitectura de gráficos completamente nueva, Turing, así como nuevas GPU Quadro RTX. De las varias GPU nuevas anunciadas entonces, hoy analizaremos específicamente la GPU NVIDIA Quadro RTX 5000. Anunciada como la primera GPU con trazado de rayos que también utiliza aprendizaje profundo y sombreado avanzado. El RTX 5000 está diseñado para cargas de trabajo de próxima generación con el potencial de renderizar escenas fotorrealistas en tiempo real, una gran ayuda para los editores de video, así como para los diseñadores de automóviles y arquitectura.
En agosto en SIGGRAPH, NVIDIA anunció una arquitectura de gráficos completamente nueva, Turing, así como nuevas GPU Quadro RTX. De las varias GPU nuevas anunciadas entonces, hoy analizaremos específicamente la GPU NVIDIA Quadro RTX 5000. Anunciada como la primera GPU con trazado de rayos que también utiliza aprendizaje profundo y sombreado avanzado. El RTX 5000 está diseñado para cargas de trabajo de próxima generación con el potencial de renderizar escenas fotorrealistas en tiempo real, una gran ayuda para los editores de video, así como para los diseñadores de automóviles y arquitectura.
La fuerza impulsora detrás de la nueva ola de GPU es la nueva arquitectura Turing de NVIDIA. La empresa es venerada por su liderazgo en GPU y se ha basado en esto con su nueva arquitectura central de GPU. El tema de la arquitectura es un poco demasiado profundo para entrar aquí, pero para resumirlo: Turing utiliza varios avances de hardware para lograr nuevos resultados impresionantes. Para el trazado de rayos, la arquitectura aprovecha los procesadores llamados núcleos RT que aceleran el cálculo de cómo viajan la luz y el sonido en entornos 3D hasta en 10 Giga Rays por segundo. Un multiprocesador de transmisión mejora el rendimiento de la trama y agrega una canalización de gráficos mejorada y nuevas tecnologías de sombreado programable. Turing viene con nuevos Tensor Cores que proporcionan 500 billones de operaciones de tensor por segundo. Y Turing permite a los usuarios aprovechar más núcleos CUDA para admitir hasta 16 billones de operaciones de punto flotante en paralelo con 16 billones de operaciones enteras por segundo.
La NVIDIA Quadro RTX 5000 está diseñada para profesionales creativos que necesitan trabajar en proyectos complejos de forma rápida y eficaz. La GPU tiene 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT y 16 GB de memoria GDDR6. Esta impresionante cantidad de hardware es capaz de renderizar modelos y escenas complejos con sombras, reflejos y refracciones físicamente precisos. El RTX 5000 es compatible con NVIDIA NVLink, lo que permite a los usuarios escalar su memoria y rendimiento con múltiples configuraciones de GPU. Suponiendo que haya espacio en su estación de trabajo, los usuarios pueden conectar dos GPU Quadro RTX 5000 para obtener hasta 50 GB/s de ancho de banda y una memoria GDDR32 combinada de 6 GB. La GPU también viene con VirtualLink que brinda conectividad a la próxima generación de pantallas montadas en la cabeza VR de alta resolución.
Especificaciones de NVIDIA Quadro RTX 5000
Arquitectura | Nvidia Turing |
Memoria de la GPU | 16GB GDDR6 |
interfaz de memoria | 256 bits |
ancho de banda de memoria | Hasta 448 GB/s |
ECC | Sí |
Núcleos NVIDIA CUDA | 3,072 |
Núcleos tensores NVIDIA | 384 |
Núcleos NVIDIA RT | 48 |
Rendimiento de precisión simple | 11.2 TFLOPS |
Rendimiento del tensor | 89.2 TFLOPS |
NVIDIA NVLink | Conecta 2 GPU Quadro RTX 5000 |
Ancho de banda NVIDIA NVLink | 50 GB/s (bidireccional) |
System Interface | PCI Express 3.0x16 |
Consumo de energía | Potencia total de la placa: 265W Potencia gráfica total: 230W Solución Térmica Activa |
Factor de forma | 4.4 "de alto x 10.5" de largo, ranura doble, altura completa |
Conectores de pantalla | 4x DP 1.4, 1x USB-C |
Max pantallas simultáneas | 4x 4096 × 2160 a 120 Hz 4x 5120 × 2880 a 60 Hz 2x 7680×4320 a 60 Hz |
Motores de codificación/decodificación | Codificación 1X, decodificación 2X |
VR Ready | Sí |
API de gráficos | DirectX 12.0 Shader Model 5.1 OpenGL 4.5 Vulkan 1.0 Compute API CUDA DirectCompute OpenCL |
Performance
Con el fin de probar el rendimiento de la nueva arquitectura en la GPU NVIDIA Quadro RTX 5000, la instalamos en nuestra estación de trabajo Lenovo ThinkSystem P920 con Windows 10. Para obtener una visión integral del rendimiento de cada tarjeta, aprovechamos múltiples puntos de referencia de la industria y aceleración por GPU. software que puede aprovechar al máximo la tarjeta bajo prueba. No solo lo compararemos con NVIDIA Quadro RTX 4000, que comparte la arquitectura Turning, sino que también lo compararemos con la línea Pascal Quadro anterior, incluida la P6000, el P5000, y el P4000. Esto es menos de lo que es mejor y más de lo que se puede esperar con la GPU elegida.
Para tener una mejor idea de cómo se han escalado estas GPU desde diferentes arquitecturas, hemos incluido la siguiente tabla que resume la familia RTX tal como se encuentra hoy. El RTX 5000 se encuentra en una ranura intermedia, un paso por encima del RTX 4000 de entrada y por debajo de los dos hermanos RTX 6000 y RTX 8000 más potentes.
GPU NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Memoria de la GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
interfaz de memoria | 256 bits | 256 bits | 384 bits | 384 bits |
ancho de banda de memoria | HASTA 416 GB/s | Hasta 448 GB/s | Hasta 672 GB/s | Hasta 672 GB/s |
Núcleos NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Núcleos tensores NVIDIA | 288 | 384 | 576 | 576 |
Núcleos NVIDIA RT | 36 | 48 | 72 | 72 |
Rendimiento de precisión simple | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Rendimiento del tensor | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Nuestro primer punto de referencia es la herramienta de punto de referencia OpenCL multiplataforma de LuxMark. LuxMark se basa en la API LuxCore y se ofrece como un componente promocional de la suite LuxCoreRender. Utiliza un nuevo trazador de ruta OpenCL basado en micro-kernel como representación más para su punto de referencia, ofreciendo una forma única de estresar la GPU instalada en una estación de trabajo determinada.
marcalux | |
---|---|
GPU | Resultados |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Si bien las GPU Pascal salieron de LuxMark con buenos resultados, hay un salto obvio en el rendimiento cuando se observan las GPU Turning. El RTX 5000 fue el de mejor desempeño sin sorpresa con una puntuación de 29,404.
El siguiente es Arion, una herramienta de evaluación comparativa de CUDA, desarrollada por RandomControl que permite que las estaciones de trabajo hagan hincapié en las CPU o GPU en una aplicación de renderizado. ArionBench es una herramienta de software basada en la tecnología Arion 2 que somete a las CPU/GPU a un gran estrés a través de la tarea de simular el flujo de luz en una escena 3D.
Arion | |
---|---|
GPU | Resultados |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Otro gran salto en los puntajes que van de Pascal a Turing con el RTX 5000 saltando por delante del resto, significativamente más rápido que el P6000.
Nuestro próximo punto de referencia aprovecha SolidWorks 2019 y cuatro modelos 3D que cubren un Audi R8, una excavadora de construcción, un motor a reacción y un automóvil de carreras. Solidworks es una aplicación de modelado CAD en 3D acelerada por GPU líder en la industria que funciona en sistemas basados en Windows. SolidWorks está desarrollado por Dassault Systèmes y lo utilizan más de dos millones de ingenieros y más de 165,000 2019 empresas en todo el mundo. Para fines de evaluación comparativa, aprovechamos la nueva función de "canalización de rendimiento" dentro de SolidWorks 4.5. Esta arquitectura proporciona una visualización en tiempo real con mayor capacidad de respuesta, especialmente para modelos grandes. Aprovecha el moderno OpenGL (XNUMX) y el renderizado acelerado por hardware para mantener un alto nivel de detalle y velocidad de fotogramas cuando desplaza, acerca o gira modelos grandes.
Después de renderizar cada modelo, nuestro script rota cada modelo cinco veces y mide el tiempo requerido para completar esta tarea. Luego lo divide por la cantidad de cuadros renderizados y calcula el puntaje promedio de cuadros por sección (FPS).
SolidWorks | |
---|---|
trabajo solido r8 | FPS promedio |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Excavadora de Solidworks | FPS promedio |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Motor a reacción de Solidworks | FPS promedio |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Coche de rally de Solidworks | FPS promedio |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Es interesante ver una ligera disminución en el rendimiento de las GPU de Turing en Solidworks R8 y Rally Car en comparación con Pascal, aunque es posible que esos archivos no aprovechen por completo las GPU más nuevas. El RTX 5000 proporcionó un rendimiento superior en Digger y Jet Engine, superando a los demás por un amplio margen. Con nuestro Solidworks estábamos usando el modo de visualización beta que puede ser la causa de la escala inusual que se ve en los ensamblajes Audi R8 y RallyCar.
El siguiente es el punto de referencia del Instituto de Investigación de Sistemas Ambientales (Esri). Esri es un proveedor de software de Sistema de Información Geográfica (GIS). El equipo de rendimiento de Esri diseñó sus secuencias de comandos complementarias de PerfTool para iniciar automáticamente ArcGIS Pro. Esta aplicación utiliza una función "ZoomToBookmarks" para explorar varios marcadores predefinidos y crear un archivo de registro con todos los puntos de datos clave necesarios para predecir la experiencia del usuario. El script repite automáticamente los marcadores tres veces para tener en cuenta el almacenamiento en caché (memoria y caché de disco). En otras palabras, este punto de referencia simula un uso intensivo de gráficos que se podría ver a través del software ArcGIS Pro 2.3 de Esri.
Las pruebas constan de tres conjuntos de datos principales. Dos son vistas tridimensionales de la ciudad de Filadelfia, Pensilvania y Montreal, QC. Estas vistas de la ciudad contienen edificios multiparche tridimensionales texturizados colocados sobre un modelo de terreno e imágenes aéreas cubiertas. El tercer conjunto de datos es una vista de mapa en 3D de la región de Portland, Oregón. Estos datos contienen información detallada sobre carreteras, parcelas de uso de la tierra, parques y escuelas, ríos, lagos y terrenos sombreados.
En cuanto al tiempo de dibujo del modelo de Montreal, NVIDIA Quadro RTX 5000 mostró un tiempo de dibujo promedio de 00:01:31.067, mientras que los FPS promedio y mínimo mostraron 527.636 y 190.775, respectivamente.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
sorteo | Normal |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
FPS promedio | Normal |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
FPS mínimo | Normal |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
El siguiente es nuestro modelo Philly, donde el RTX 5000 mostró un tiempo de dibujo promedio de 00:01:01.111, mientras que los FPS promedio y mínimo mostraron 531.315 y 224.341, respectivamente.
ESRI ArcGIS Pro 2.3 Filadelfia | |
---|---|
sorteo | Normal |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
FPS promedio | Normal |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
FPS mínimo | Normal |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Nuestro último modelo es de Portland. Aquí, el RTX 5000 tuvo un tiempo de dibujo promedio de 00:00:32.541. El FPS promedio mostró 2,783.547 mientras que el FPS mínimo mostró 1,007.309.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
sorteo | Normal |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
FPS promedio | Normal |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
FPS mínimo | Normal |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Conclusión
NVIDIA Quadro RTX 5000 es una de las GPU más nuevas de la compañía basada en su arquitectura Turing. Turing está configurado para ser una versión completamente nueva de la arquitectura de GPU, ya que NVIDIA está buscando cambiar las cosas ahora con miras a los desarrollos futuros. Dirigida a profesionales creativos que tienen proyectos complejos que necesitan un trabajo rápido y eficiente, la RTX 5000 tiene un hardware impresionante bajo su capó que incluye 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT y 16 GB de memoria GDDR6. Para aquellos que necesitan aún más rendimiento de GPU, el RTX puede escalar con una segunda GPU a través de NVIDIA NVLink.
Para todos sus componentes que deberían conducir a un rendimiento superior, lo sometemos a un aluvión de pruebas, nuevas y antiguas, solo para ver qué puede hacer. Una sorpresa para nadie, NVIDIA Quadro RTX 5000 fue la de mejor rendimiento en la mayoría de nuestras pruebas. En LuxMark y Arion, la RTX 5000 duplicó con creces las puntuaciones de la P5000. El RTX 5000 tuvo un gran rendimiento en las pruebas de rendimiento de Solidworks Digger y Jet Engine. Debe tenerse en cuenta que la RTX 5000, por poderosa que sea, no es la mejor de las GPU de Turing.
Si un profesional creativo está buscando un salto de rendimiento más grande en la mayoría de las áreas, NVIDIA Quadro RTX 5000 se ajustará a esta factura. Nuestros resultados de rendimiento anteriores destacan las áreas donde brilla el RTX 5000 y algunos puntos donde una GPU basada en Pascal funciona lo suficientemente bien. En general, con la familia RTX, NVIDIA ha hecho un excelente trabajo al continuar ampliando los límites de lo que está disponible para los creativos dentro de una computadora de escritorio. Por su parte, la RTX 5000 completa bien la oferta de gama media, ofreciendo un buen equilibrio entre rendimiento y precio.
Suscríbase al boletín de StorageReview