Home Consumidores Acessórios do cliente Análise NVIDIA Quadro RTX 5000

Análise NVIDIA Quadro RTX 5000

by Adam Armstrong

Em agosto, na SIGGRAPH, a NVIDIA anunciou uma arquitetura gráfica totalmente nova, Turing, bem como novas GPUs Quadro RTX. Das várias novas GPUs anunciadas, hoje veremos especificamente a GPU NVIDIA Quadro RTX 5000. Anunciados como os primeiros GPUs de rastreamento de raios que também usam aprendizado profundo e sombreamento avançado. O RTX 5000 foi projetado para cargas de trabalho de próxima geração com o potencial de renderizar cenas fotorrealistas em tempo real, uma vantagem para editores de vídeo, bem como para designers automotivos e arquitetônicos.


Em agosto, na SIGGRAPH, a NVIDIA anunciou uma arquitetura gráfica totalmente nova, Turing, bem como novas GPUs Quadro RTX. Das várias novas GPUs anunciadas, hoje veremos especificamente a GPU NVIDIA Quadro RTX 5000. Anunciados como os primeiros GPUs de rastreamento de raios que também usam aprendizado profundo e sombreamento avançado. O RTX 5000 foi projetado para cargas de trabalho de próxima geração com o potencial de renderizar cenas fotorrealistas em tempo real, uma vantagem para editores de vídeo, bem como para designers automotivos e arquitetônicos.

A força motriz por trás da nova onda de GPUs é a nova arquitetura Turing da NVIDIA. A empresa é reverenciada por sua liderança em GPU e se baseou nisso com sua nova arquitetura de núcleo de GPU. O assunto da arquitetura é um pouco profundo demais para entrar aqui, mas para resumir: Turing usa vários avanços de hardware para alcançar novos resultados impressionantes. Para rastreamento de raios, a arquitetura utiliza processadores chamados núcleos RT que aceleram a computação de como a luz e o som viajam em ambientes 3D em até 10 Giga Rays por segundo. Um multiprocessador de streaming melhora o desempenho do raster e adiciona um pipeline gráfico aprimorado e novas tecnologias de sombreamento programáveis. Turing vem com novos Tensor Cores que fornecem 500 trilhões de operações de tensor por segundo. E o Turing permite que os usuários aproveitem mais núcleos CUDA para suportar até 16 trilhões de operações de ponto flutuante em paralelo com 16 trilhões de operações inteiras por segundo.

A NVIDIA Quadro RTX 5000 é voltada para profissionais criativos que precisam trabalhar em projetos complexos de forma rápida e eficaz. A GPU possui 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT e 16 GB de memória GDDR6. Essa quantidade impressionante de hardware é capaz de renderizar modelos e cenas complexos com sombras, reflexos e refrações fisicamente precisos. O RTX 5000 oferece suporte a NVIDIA NVLink, permitindo que os usuários dimensionem sua memória e desempenho com várias configurações de GPU. Supondo que haja espaço em sua estação de trabalho, os usuários podem conectar duas GPUs Quadro RTX 5000 para até 50 GB/s de largura de banda e 32 GB combinados de memória GDDR6. A GPU também vem com VirtualLink, fornecendo conectividade para a próxima geração de monitores VR de alta resolução montados na cabeça.

Especificações da NVIDIA Quadro RTX 5000

Arquitetura NVIDIA Turing
Memória GPU 16GB GDDR6
Interface de Memória 256-bit
Largura de banda de memória Até 448 GB/s
ECC Sim
Núcleos NVIDIA CUDA 3,072
Núcleos tensores NVIDIA 384
Núcleos NVIDIA RT 48
Desempenho de precisão única 11.2 TFLOPS
Desempenho do tensor 89.2 TFLOPS
NVIDIA NV Link Conecta 2 GPUs Quadro RTX 5000
Largura de banda NVIDIA NVLink 50 GB/s (bidirecional)
Interface do Sistema PCI Express 3.0x16
Consumo de energia Potência total da placa: 265W
Potência gráfica total: 230W
​Solução Térmica Ativa
Fator de Forma 4.4 "H x 10.5" L, slot duplo, altura total
Conectores de tela 4xDP 1.4, 1x USB-C
Exibições simultâneas máximas 4x 4096 × 2160 a 120 Hz
4x 5120 × 2880 a 60 Hz
2x 7680 × 4320 a 60 Hz
Motores de codificação/decodificação 1X Codificação, 2X Decodificação
VR pronto Sim
APIs gráficas DirectX 12.0
Shader Model 5.1
OpenGL 4.5
Vulkan 1.0
APIs de computação
CUDA
Computação direta
OpenCL

Desempenho

Para testar o desempenho da nova arquitetura na GPU NVIDIA Quadro RTX 5000, nós a instalamos em nossa estação de trabalho Lenovo ThinkSystem P920 executando o Windows 10. software que pode tirar o máximo proveito do cartão em teste. Não apenas a compararemos com a NVIDIA Quadro RTX 4000, que compartilha a arquitetura Turning, como também a compararemos com a linha Pascal Quadro anterior, incluindo o P6000P5000, e o P4000. Isso é menos, o que é melhor e mais do que esperar com a GPU escolhida.

Para ter uma ideia melhor de como essas GPUs foram dimensionadas em diferentes arquiteturas, incluímos a tabela a seguir que resume a família RTX como ela se encontra hoje. O RTX 5000 fica em um slot intermediário, um passo acima do RTX 4000 de entrada e abaixo dos dois irmãos RTX 6000 e RTX 8000 mais poderosos.

GPUs NVIDIA Quadro
RTX 4000 RTX 5000 RTX 6000 RTX 8000
Memória GPU 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
Interface de Memória 256-bit 256-bit 384-bit 384-bit
Largura de banda de memória ATÉ 416GB/s Até 448 GB/s Até 672 GB/s Até 672 GB/s
Núcleos NVIDIA CUDA 2,304 3,072 4,608 4,608
Núcleos tensores NVIDIA 288 384  576 576
Núcleos NVIDIA RT 36 48 72 72
Desempenho de precisão única 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Desempenho do tensor 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Nosso primeiro benchmark é a ferramenta de benchmark OpenCL de plataforma cruzada LuxMark. O LuxMark é baseado na API LuxCore e oferecido como um componente promocional do pacote LuxCoreRender. Ele usa um novo rastreador de caminho OpenCL baseado em microkernel como a melhor renderização para seu benchmark, oferecendo uma maneira única de estressar a GPU instalada em uma determinada estação de trabalho.

Lux Mark
GPUs Mensuráveis
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Enquanto as GPUs Pascal saíram do LuxMark com bons resultados, há um salto óbvio no desempenho ao olhar para as GPUs Turning. O RTX 5000 foi o melhor desempenho, sem surpresa, com uma pontuação de 29,404.

O próximo é o Arion, uma ferramenta de benchmarking CUDA, desenvolvida pela RandomControl que permite que as estações de trabalho estressem CPUs ou GPUs em um aplicativo de renderização. ArionBench é uma ferramenta de software baseada na tecnologia Arion 2 que coloca as CPUs/GPUs sob forte estresse por meio da tarefa de simular o fluxo de luz em uma cena 3D.

Arion
GPUs Mensuráveis
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Outro grande salto nas pontuações indo de Pascal para Turing com o RTX 5000 saltando à frente do resto, significativamente mais rápido que o P6000.

Nosso próximo benchmark utiliza o SolidWorks 2019 e quatro modelos 3D que abrangem um Audi R8, uma escavadeira de construção, um motor a jato e um carro de rali. O Solidworks é um aplicativo de modelagem CAD 3D acelerado por GPU líder do setor que opera em sistemas baseados em Windows. O SolidWorks é desenvolvido pela Dassault Systèmes e é usado por mais de dois milhões de engenheiros e mais de 165,000 empresas em todo o mundo. Para fins de benchmarking, aproveitamos o novo recurso de “pipeline de desempenho” dentro do SolidWorks 2019. Essa arquitetura fornece uma exibição em tempo real mais responsiva, especialmente para modelos grandes. Ele aproveita o OpenGL (4.5) moderno e a renderização acelerada por hardware para manter um alto nível de detalhes e taxa de quadros ao aplicar panorâmica, zoom ou girar modelos grandes.

Depois que cada modelo é renderizado, nosso script gira cada modelo cinco vezes e mede o tempo necessário para concluir essa tarefa. Em seguida, ele divide isso pelo número de quadros renderizados e calcula a pontuação média de quadros por seção (FPS).

SolidWorks
solidworks r8 FPS médio
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Escavador SolidWorks FPS médio
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Motor a Jato Solidworks FPS médio
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
carro de rali solidworks FPS médio
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

É interessante ver uma ligeira queda no desempenho das GPUs Turing no Solidworks R8 e Rally Car em comparação com o Pascal, embora esses arquivos possam não aproveitar totalmente as GPUs mais recentes. O RTX 5000 forneceu desempenho superior em Digger e Jet Engine, superando os outros por uma ampla margem. Com o nosso Solidworks, estávamos usando o modo de exibição beta que pode ser a causa do dimensionamento incomum visto nos conjuntos Audi R8 e RallyCar.

O próximo é o benchmark do Instituto de Pesquisa de Sistemas Ambientais (Esri). A Esri é fornecedora de software de Sistema de Informação Geográfica (GIS). A equipe de desempenho da Esri projetou seus scripts de suplemento PerfTool para iniciar automaticamente o ArcGIS Pro. Este aplicativo usa uma função “ZoomToBookmarks” para navegar em vários marcadores predefinidos e criar um arquivo de log com todos os principais pontos de dados necessários para prever a experiência do usuário. O script repete automaticamente os marcadores três vezes para contabilizar o cache (memória e cache de disco). Em outras palavras, este benchmark simula o uso gráfico pesado que pode ser visto através do software ArcGIS Pro 2.3 da Esri.

Os testes consistem em três conjuntos de dados principais. Duas são vistas 3-D da cidade de Filadélfia, PA e Montreal, QC. Essas vistas da cidade contêm edifícios multipatch 3-D texturizados dispostos em um modelo de terreno e imagens aéreas cobertas. O terceiro conjunto de dados é uma visualização de mapa 2-D da região de Portland, OR. Esses dados contêm informações detalhadas sobre estradas, parcelas de uso do solo, parques e escolas, rios, lagos e terrenos sombreados.

Olhando para o drawtime do modelo Montreal, a NVIDIA Quadro RTX 5000 mostrou um drawtime médio de 00:01:31.067, enquanto o FPS médio e mínimo mostraram 527.636 e 190.775, respectivamente.

ESRI ArcGIS Pro 2.3 Montreal
Hora do sorteio Média
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX 4000 00:01:31.284
Quadro RTX 5000 00:01:31.067
FPS médio Média
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX 4000 502.395
Quadro RTX 5000 527.636
FPS mínimo Média
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX 4000 180.699
Quadro RTX 5000 190.775

Em seguida, temos nosso modelo Philly, onde o RTX 5000 apresentou um drawtime médio de 00:01:01.111, enquanto o FPS médio e mínimo mostraram 531.315 e 224.341, respectivamente.

ESRI ArcGIS Pro 2.3 Filadélfia
Hora do sorteio Média
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX 4000 00:01:00.231
Quadro RTX 5000 00:01:01.111
FPS médio Média
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX 4000 434.170
Quadro RTX 5000 531.315
FPS mínimo Média
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX 4000 196.825
Quadro RTX 5000 224.341

Nosso último modelo é de Portland. Aqui, o RTX 5000 teve um drawtime médio de 00:00:32.541. O FPS médio mostrou 2,783.547 enquanto o FPS mínimo mostrou 1,007.309.

ESRI ArcGIS Pro 2.3 Portland
Hora do sorteio Média
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX 4000 00:00:32.646
Quadro RTX 5000 00:00:32.541
FPS médio Média
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX 4000 2,821.928
Quadro RTX 5000 2,783.547
FPS mínimo Média
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX 4000 1,083.260
Quadro RTX 5000 1,007.309

Conclusão

A NVIDIA Quadro RTX 5000 é uma das mais novas GPUs da empresa baseadas em sua arquitetura Turing. Turing está definido para ser uma visão completamente nova da arquitetura de GPU, já que a NVIDIA está procurando mudar as coisas agora, de olho nos desenvolvimentos futuros. Destinado a profissionais criativos que têm projetos complexos que precisam de trabalho eficiente e rápido, o RTX 5000 possui hardware impressionante, incluindo 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT e 16 GB de memória GDDR6. Para aqueles que precisam de ainda mais desempenho de GPU, o RTX pode ser dimensionado com uma segunda GPU por meio do NVIDIA NVLink.

Para todos os seus componentes que devem levar a um desempenho superior, nós o submetemos a uma enxurrada de testes, novos e antigos, apenas para ver o que ele pode fazer. Uma surpresa para ninguém, a NVIDIA Quadro RTX 5000 foi o melhor desempenho na maioria dos nossos testes. Na LuxMark e na Arion, a RTX 5000 mais que dobrou as pontuações da P5000. O RTX 5000 teve forte desempenho nos benchmarks Solidworks Digger e Jet Engine. Vale lembrar que o RTX 5000, por mais potente que seja, não é o top de linha em GPUs Turing.

Se um profissional criativo estiver procurando por um salto de desempenho maior na maioria das áreas, a NVIDIA Quadro RTX 5000 se encaixará nessa conta. Nossos resultados de desempenho acima destacam as áreas em que o RTX 5000 se destaca e alguns pontos em que uma GPU baseada em Pascal funciona bem o suficiente. No geral, com a família RTX, a NVIDIA fez um excelente trabalho, continuando a expandir os limites do que está disponível para criativos em um desktop. Por seu lado, o RTX 5000 preenche bem a oferta de médio porte, oferecendo um bom equilíbrio entre desempenho e preço.

NVIDIA RTX 5000 na Amazon

Discuta esta avaliação

Inscreva-se no boletim informativo StorageReview