Em agosto, na SIGGRAPH, a NVIDIA anunciou uma arquitetura gráfica totalmente nova, Turing, bem como novas GPUs Quadro RTX. Das várias novas GPUs anunciadas, hoje veremos especificamente a GPU NVIDIA Quadro RTX 5000. Anunciados como os primeiros GPUs de rastreamento de raios que também usam aprendizado profundo e sombreamento avançado. O RTX 5000 foi projetado para cargas de trabalho de próxima geração com o potencial de renderizar cenas fotorrealistas em tempo real, uma vantagem para editores de vídeo, bem como para designers automotivos e arquitetônicos.
Em agosto, na SIGGRAPH, a NVIDIA anunciou uma arquitetura gráfica totalmente nova, Turing, bem como novas GPUs Quadro RTX. Das várias novas GPUs anunciadas, hoje veremos especificamente a GPU NVIDIA Quadro RTX 5000. Anunciados como os primeiros GPUs de rastreamento de raios que também usam aprendizado profundo e sombreamento avançado. O RTX 5000 foi projetado para cargas de trabalho de próxima geração com o potencial de renderizar cenas fotorrealistas em tempo real, uma vantagem para editores de vídeo, bem como para designers automotivos e arquitetônicos.
A força motriz por trás da nova onda de GPUs é a nova arquitetura Turing da NVIDIA. A empresa é reverenciada por sua liderança em GPU e se baseou nisso com sua nova arquitetura de núcleo de GPU. O assunto da arquitetura é um pouco profundo demais para entrar aqui, mas para resumir: Turing usa vários avanços de hardware para alcançar novos resultados impressionantes. Para rastreamento de raios, a arquitetura utiliza processadores chamados núcleos RT que aceleram a computação de como a luz e o som viajam em ambientes 3D em até 10 Giga Rays por segundo. Um multiprocessador de streaming melhora o desempenho do raster e adiciona um pipeline gráfico aprimorado e novas tecnologias de sombreamento programáveis. Turing vem com novos Tensor Cores que fornecem 500 trilhões de operações de tensor por segundo. E o Turing permite que os usuários aproveitem mais núcleos CUDA para suportar até 16 trilhões de operações de ponto flutuante em paralelo com 16 trilhões de operações inteiras por segundo.
A NVIDIA Quadro RTX 5000 é voltada para profissionais criativos que precisam trabalhar em projetos complexos de forma rápida e eficaz. A GPU possui 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT e 16 GB de memória GDDR6. Essa quantidade impressionante de hardware é capaz de renderizar modelos e cenas complexos com sombras, reflexos e refrações fisicamente precisos. O RTX 5000 oferece suporte a NVIDIA NVLink, permitindo que os usuários dimensionem sua memória e desempenho com várias configurações de GPU. Supondo que haja espaço em sua estação de trabalho, os usuários podem conectar duas GPUs Quadro RTX 5000 para até 50 GB/s de largura de banda e 32 GB combinados de memória GDDR6. A GPU também vem com VirtualLink, fornecendo conectividade para a próxima geração de monitores VR de alta resolução montados na cabeça.
Especificações da NVIDIA Quadro RTX 5000
Arquitetura | NVIDIA Turing |
Memória GPU | 16GB GDDR6 |
Interface de Memória | 256-bit |
Largura de banda de memória | Até 448 GB/s |
ECC | Sim |
Núcleos NVIDIA CUDA | 3,072 |
Núcleos tensores NVIDIA | 384 |
Núcleos NVIDIA RT | 48 |
Desempenho de precisão única | 11.2 TFLOPS |
Desempenho do tensor | 89.2 TFLOPS |
NVIDIA NV Link | Conecta 2 GPUs Quadro RTX 5000 |
Largura de banda NVIDIA NVLink | 50 GB/s (bidirecional) |
Interface do Sistema | PCI Express 3.0x16 |
Consumo de energia | Potência total da placa: 265W Potência gráfica total: 230W Solução Térmica Ativa |
Fator de Forma | 4.4 "H x 10.5" L, slot duplo, altura total |
Conectores de tela | 4xDP 1.4, 1x USB-C |
Exibições simultâneas máximas | 4x 4096 × 2160 a 120 Hz 4x 5120 × 2880 a 60 Hz 2x 7680 × 4320 a 60 Hz |
Motores de codificação/decodificação | 1X Codificação, 2X Decodificação |
VR pronto | Sim |
APIs gráficas | DirectX 12.0 Shader Model 5.1 OpenGL 4.5 Vulkan 1.0 APIs de computação CUDA Computação direta OpenCL |
Desempenho
Para testar o desempenho da nova arquitetura na GPU NVIDIA Quadro RTX 5000, nós a instalamos em nossa estação de trabalho Lenovo ThinkSystem P920 executando o Windows 10. software que pode tirar o máximo proveito do cartão em teste. Não apenas a compararemos com a NVIDIA Quadro RTX 4000, que compartilha a arquitetura Turning, como também a compararemos com a linha Pascal Quadro anterior, incluindo o P6000, P5000, e o P4000. Isso é menos, o que é melhor e mais do que esperar com a GPU escolhida.
Para ter uma ideia melhor de como essas GPUs foram dimensionadas em diferentes arquiteturas, incluímos a tabela a seguir que resume a família RTX como ela se encontra hoje. O RTX 5000 fica em um slot intermediário, um passo acima do RTX 4000 de entrada e abaixo dos dois irmãos RTX 6000 e RTX 8000 mais poderosos.
GPUs NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Memória GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Interface de Memória | 256-bit | 256-bit | 384-bit | 384-bit |
Largura de banda de memória | ATÉ 416GB/s | Até 448 GB/s | Até 672 GB/s | Até 672 GB/s |
Núcleos NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Núcleos tensores NVIDIA | 288 | 384 | 576 | 576 |
Núcleos NVIDIA RT | 36 | 48 | 72 | 72 |
Desempenho de precisão única | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Desempenho do tensor | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Nosso primeiro benchmark é a ferramenta de benchmark OpenCL de plataforma cruzada LuxMark. O LuxMark é baseado na API LuxCore e oferecido como um componente promocional do pacote LuxCoreRender. Ele usa um novo rastreador de caminho OpenCL baseado em microkernel como a melhor renderização para seu benchmark, oferecendo uma maneira única de estressar a GPU instalada em uma determinada estação de trabalho.
Lux Mark | |
---|---|
GPUs | Mensuráveis |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Enquanto as GPUs Pascal saíram do LuxMark com bons resultados, há um salto óbvio no desempenho ao olhar para as GPUs Turning. O RTX 5000 foi o melhor desempenho, sem surpresa, com uma pontuação de 29,404.
O próximo é o Arion, uma ferramenta de benchmarking CUDA, desenvolvida pela RandomControl que permite que as estações de trabalho estressem CPUs ou GPUs em um aplicativo de renderização. ArionBench é uma ferramenta de software baseada na tecnologia Arion 2 que coloca as CPUs/GPUs sob forte estresse por meio da tarefa de simular o fluxo de luz em uma cena 3D.
Arion | |
---|---|
GPUs | Mensuráveis |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Outro grande salto nas pontuações indo de Pascal para Turing com o RTX 5000 saltando à frente do resto, significativamente mais rápido que o P6000.
Nosso próximo benchmark utiliza o SolidWorks 2019 e quatro modelos 3D que abrangem um Audi R8, uma escavadeira de construção, um motor a jato e um carro de rali. O Solidworks é um aplicativo de modelagem CAD 3D acelerado por GPU líder do setor que opera em sistemas baseados em Windows. O SolidWorks é desenvolvido pela Dassault Systèmes e é usado por mais de dois milhões de engenheiros e mais de 165,000 empresas em todo o mundo. Para fins de benchmarking, aproveitamos o novo recurso de “pipeline de desempenho” dentro do SolidWorks 2019. Essa arquitetura fornece uma exibição em tempo real mais responsiva, especialmente para modelos grandes. Ele aproveita o OpenGL (4.5) moderno e a renderização acelerada por hardware para manter um alto nível de detalhes e taxa de quadros ao aplicar panorâmica, zoom ou girar modelos grandes.
Depois que cada modelo é renderizado, nosso script gira cada modelo cinco vezes e mede o tempo necessário para concluir essa tarefa. Em seguida, ele divide isso pelo número de quadros renderizados e calcula a pontuação média de quadros por seção (FPS).
SolidWorks | |
---|---|
solidworks r8 | FPS médio |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Escavador SolidWorks | FPS médio |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Motor a Jato Solidworks | FPS médio |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
carro de rali solidworks | FPS médio |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
É interessante ver uma ligeira queda no desempenho das GPUs Turing no Solidworks R8 e Rally Car em comparação com o Pascal, embora esses arquivos possam não aproveitar totalmente as GPUs mais recentes. O RTX 5000 forneceu desempenho superior em Digger e Jet Engine, superando os outros por uma ampla margem. Com o nosso Solidworks, estávamos usando o modo de exibição beta que pode ser a causa do dimensionamento incomum visto nos conjuntos Audi R8 e RallyCar.
O próximo é o benchmark do Instituto de Pesquisa de Sistemas Ambientais (Esri). A Esri é fornecedora de software de Sistema de Informação Geográfica (GIS). A equipe de desempenho da Esri projetou seus scripts de suplemento PerfTool para iniciar automaticamente o ArcGIS Pro. Este aplicativo usa uma função “ZoomToBookmarks” para navegar em vários marcadores predefinidos e criar um arquivo de log com todos os principais pontos de dados necessários para prever a experiência do usuário. O script repete automaticamente os marcadores três vezes para contabilizar o cache (memória e cache de disco). Em outras palavras, este benchmark simula o uso gráfico pesado que pode ser visto através do software ArcGIS Pro 2.3 da Esri.
Os testes consistem em três conjuntos de dados principais. Duas são vistas 3-D da cidade de Filadélfia, PA e Montreal, QC. Essas vistas da cidade contêm edifícios multipatch 3-D texturizados dispostos em um modelo de terreno e imagens aéreas cobertas. O terceiro conjunto de dados é uma visualização de mapa 2-D da região de Portland, OR. Esses dados contêm informações detalhadas sobre estradas, parcelas de uso do solo, parques e escolas, rios, lagos e terrenos sombreados.
Olhando para o drawtime do modelo Montreal, a NVIDIA Quadro RTX 5000 mostrou um drawtime médio de 00:01:31.067, enquanto o FPS médio e mínimo mostraram 527.636 e 190.775, respectivamente.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Hora do sorteio | Média |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
FPS médio | Média |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
FPS mínimo | Média |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
Em seguida, temos nosso modelo Philly, onde o RTX 5000 apresentou um drawtime médio de 00:01:01.111, enquanto o FPS médio e mínimo mostraram 531.315 e 224.341, respectivamente.
ESRI ArcGIS Pro 2.3 Filadélfia | |
---|---|
Hora do sorteio | Média |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
FPS médio | Média |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
FPS mínimo | Média |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Nosso último modelo é de Portland. Aqui, o RTX 5000 teve um drawtime médio de 00:00:32.541. O FPS médio mostrou 2,783.547 enquanto o FPS mínimo mostrou 1,007.309.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Hora do sorteio | Média |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
FPS médio | Média |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
FPS mínimo | Média |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Conclusão
A NVIDIA Quadro RTX 5000 é uma das mais novas GPUs da empresa baseadas em sua arquitetura Turing. Turing está definido para ser uma visão completamente nova da arquitetura de GPU, já que a NVIDIA está procurando mudar as coisas agora, de olho nos desenvolvimentos futuros. Destinado a profissionais criativos que têm projetos complexos que precisam de trabalho eficiente e rápido, o RTX 5000 possui hardware impressionante, incluindo 3,072 núcleos CUDA, 384 núcleos Tensor, 48 núcleos RT e 16 GB de memória GDDR6. Para aqueles que precisam de ainda mais desempenho de GPU, o RTX pode ser dimensionado com uma segunda GPU por meio do NVIDIA NVLink.
Para todos os seus componentes que devem levar a um desempenho superior, nós o submetemos a uma enxurrada de testes, novos e antigos, apenas para ver o que ele pode fazer. Uma surpresa para ninguém, a NVIDIA Quadro RTX 5000 foi o melhor desempenho na maioria dos nossos testes. Na LuxMark e na Arion, a RTX 5000 mais que dobrou as pontuações da P5000. O RTX 5000 teve forte desempenho nos benchmarks Solidworks Digger e Jet Engine. Vale lembrar que o RTX 5000, por mais potente que seja, não é o top de linha em GPUs Turing.
Se um profissional criativo estiver procurando por um salto de desempenho maior na maioria das áreas, a NVIDIA Quadro RTX 5000 se encaixará nessa conta. Nossos resultados de desempenho acima destacam as áreas em que o RTX 5000 se destaca e alguns pontos em que uma GPU baseada em Pascal funciona bem o suficiente. No geral, com a família RTX, a NVIDIA fez um excelente trabalho, continuando a expandir os limites do que está disponível para criativos em um desktop. Por seu lado, o RTX 5000 preenche bem a oferta de médio porte, oferecendo um bom equilíbrio entre desempenho e preço.
Inscreva-se no boletim informativo StorageReview