Home Consumidores Acessórios do cliente Análise NVIDIA Quadro RTX 4000

Análise NVIDIA Quadro RTX 4000

by Balcão do consumidor StorageReview

A Quadro RTX 4000, anunciada em novembro do ano passado, faz parte da família de GPUs profissionais da NVIDIA. O RTX 4000 foi projetado especificamente para o profissional de software CAD, proporcionando intenso realismo e interação imersiva com seus projetos. Consequentemente, isso permite que eles executem simulações e análises avançadas em sua estação de trabalho local.


A Quadro RTX 4000, anunciada em novembro do ano passado, faz parte da família de GPUs profissionais da NVIDIA. O RTX 4000 foi projetado especificamente para o profissional de software CAD, proporcionando intenso realismo e interação imersiva com seus projetos. Consequentemente, isso permite que eles executem simulações e análises avançadas em sua estação de trabalho local.

Não muito diferente de outras GPUs NVIDIA, a RTX 4000 utiliza NVIDIA Quadro Scalable Visual Solutions (SVS). Como resultado, cada placa RTX 4000 individual pode suportar até quatro monitores 5K a 60 Hz ou monitores duplos de 8K. Ao utilizar duas placas Quadro Sync II, um sistema pode suportar até oito GPUs RTX 4000, sincronizando 32 monitores separados. A NVIDIA também reivindica uma melhoria de 40% na largura de banda em relação à geração anterior Quadro P4000, graças em parte aos 8 GB de memória gráfica GDDR6.

O RTX 4000 possui um fator de forma de slot único de 4.4" A x 9.5" L, permitindo que a GPU se encaixe em uma variedade de chassis de estações de trabalho. Neste fator de forma fino, a NVIDIA foi capaz de acomodar 2304 núcleos CUDA, 288 núcleos Tensor, 36 núcleos RT e 8 GB de memória GDDR6. Este hardware foi projetado para cargas de trabalho intensas de AEC, DCC, AI, VR e gráficos. O RTX 4000 vem com VirtualLink para simplificar a conectividade com monitores VR de alta resolução de última geração montados na cabeça.

Especificações da Quadro RTX 4000

Arquitetura NVIDIA Turing
Memória GPU 8GB GDDR6
Interface de Memória 256-bit
Largura de banda de memória Até 416 GB/s
Núcleos NVIDIA CUDA 2,304
Núcleos tensores NVIDIA 288
Núcleos NVIDIA RT 36
Desempenho de precisão única 7.1 TFLOPS
Desempenho do tensor 57.0 TFLOPS
Interface do Sistema PCI Express 3.0x16
Consumo de energia Potência total da placa: 160W
Potência gráfica total: 125W
​Solução Térmica Ativa
Fator de Forma 4.4 ”H x 9.5” L, Slot Único
Exibições simultâneas máximas 4x 3840 × 2160 a 120 Hz
4x 5120 × 2880 a 60 Hz
2x 7680 × 4320 a 60 Hz
VR pronto Sim
APIs gráficas Shader Model 5.1
OpenGL 4.5
DirectX 12.0
Vulkan 1.0
APIs de computação CUDA
Computação direta
OpenCL

Desempenho

Para testar o desempenho da nova arquitetura na GPU NVIDIA Quadro RTX 4000, nós a instalamos em nossa estação de trabalho Lenovo ThinkSystem P920 executando o Windows 10. software que pode tirar o máximo proveito do cartão em teste. Não apenas a compararemos com a NVIDIA Quadro RTX 5000, que compartilha a arquitetura Turning, como também a compararemos com a linha Pascal Quadro anterior, incluindo o P6000P5000, e o P4000. Isso é menos, o que é melhor e mais do que esperar com a GPU escolhida.

Para ter uma ideia melhor de como essas GPUs foram dimensionadas em diferentes arquiteturas, incluímos a tabela a seguir para o RTX como ele é hoje. O RTX 4000 é claramente o cartão básico da família, onde os cartões da série P começaram com o P1000. É claro que a família RTX escala até o RTX 8000, trazendo mais memória gráfica, largura de banda e núcleos ao longo do caminho.

GPUs NVIDIA Quadro
RTX 4000 RTX 5000 RTX 6000 RTX 8000
Memória GPU 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
Interface de Memória 256-bit 256-bit 384-bit 384-bit
Largura de banda de memória ATÉ 416GB/s Até 448 GB/s Até 672 GB/s Até 672 GB/s
Núcleos NVIDIA CUDA 2,304 3,072 4,608 4,608
Núcleos tensores NVIDIA 288 384 576 576
Núcleos NVIDIA RT 36 48 72 72
Desempenho de precisão única 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Desempenho do tensor 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Nosso primeiro benchmark é a ferramenta de benchmark OpenCL de plataforma cruzada LuxMark. O LuxMark é baseado na API LuxCore e oferecido como um componente promocional do pacote LuxCoreRender. Ele usa um novo rastreador de caminho OpenCL baseado em microkernel como a melhor renderização para seu benchmark, oferecendo uma maneira única de estressar a GPU instalada em uma determinada estação de trabalho.

Lux Mark
GPUs Mensuráveis
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Enquanto as GPUs Pascal saíram do LuxMark com bons resultados, há um salto óbvio no desempenho ao olhar para as GPUs Turning. O RTX 4000 ficou em segundo lugar para o RTX 5000 com uma pontuação de 28,338.

O próximo é o Arion, uma ferramenta de benchmarking CUDA, desenvolvida pela RandomControl que permite que as estações de trabalho estressem CPUs ou GPUs em um aplicativo de renderização. ArionBench é uma ferramenta de software baseada na tecnologia Arion 2 que coloca as CPUs/GPUs sob forte estresse por meio da tarefa de simular o fluxo de luz em uma cena 3D.

Arion
GPUs Mensuráveis
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Outro grande salto nas pontuações indo de Pascal para Turing com o RTX 4000 dando um salto bastante grande sobre o P6000.

Nosso próximo benchmark utiliza o SolidWorks 2019 e quatro modelos 3D que abrangem um Audi R8, uma escavadeira de construção, um motor a jato e um carro de rali. O Solidworks é um aplicativo de modelagem CAD 3D acelerado por GPU líder do setor que opera em sistemas baseados em Windows. O SolidWorks é desenvolvido pela Dassault Systèmes e é usado por mais de dois milhões de engenheiros e mais de 165,000 empresas em todo o mundo. Para fins de benchmarking, aproveitamos o novo recurso de “pipeline de desempenho” dentro do SolidWorks 2019. Essa arquitetura fornece uma exibição em tempo real mais responsiva, especialmente para modelos grandes. Ele aproveita o OpenGL (4.5) moderno e a renderização acelerada por hardware para manter um alto nível de detalhes e taxa de quadros ao aplicar panorâmica, zoom ou girar modelos grandes.

Depois que cada modelo é renderizado, nosso script gira cada modelo cinco vezes e mede o tempo necessário para concluir essa tarefa. Em seguida, ele divide isso pelo número de quadros renderizados e calcula a pontuação média de quadros por seção (FPS).

SolidWorks
solidworks r8 Média
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Escavador SolidWorks Média
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Motor a Jato Solidworks Média
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
carro de rali solidworks Média
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Com Solidworks R8 e Rally Car, há uma ligeira queda no desempenho dos modelos Turing, porém há um grande salto em Digger e Jet Engine. Com nossos testes do Solidworks, estávamos usando o modo de exibição beta que pode ser a causa do dimensionamento incomum visto nos conjuntos Audi R8 e RallyCar.

O próximo é o benchmark do Instituto de Pesquisa de Sistemas Ambientais (Esri). A Esri é fornecedora de software de Sistema de Informação Geográfica (GIS). A equipe de desempenho da Esri projetou seus scripts de suplemento PerfTool para iniciar automaticamente o ArcGIS Pro. Este aplicativo usa uma função “ZoomToBookmarks” para navegar em vários marcadores predefinidos e criar um arquivo de log com todos os principais pontos de dados necessários para prever a experiência do usuário. O script repete automaticamente os marcadores três vezes para contabilizar o cache (memória e cache de disco). Em outras palavras, este benchmark simula o uso gráfico pesado que pode ser visto através do software ArcGIS Pro 2.3 da Esri.

Os testes consistem em três conjuntos de dados principais. Duas são vistas 3-D da cidade de Filadélfia, PA e Montreal, QC. Essas vistas da cidade contêm edifícios multipatch 3-D texturizados dispostos em um modelo de terreno e imagens aéreas cobertas. O terceiro conjunto de dados é uma visualização de mapa 2-D da região de Portland, OR. Esses dados contêm informações detalhadas sobre estradas, parcelas de uso do solo, parques e escolas, rios, lagos e terrenos sombreados.

Olhando para o drawtime do modelo Montreal, a NVIDIA Quadro RTX 4000 mostrou um drawtime médio de 00:01:31.284, enquanto o FPS médio e mínimo mostraram 502.395 e 180.699, respectivamente.

ESRI ArcGIS Pro 2.3 Montreal
Hora do sorteio Média
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX 4000 00:01:31.284
Quadro RTX 5000 00:01:31.067
FPS médio Média
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX 4000 502.395
Quadro RTX 5000 527.636
FPS mínimo Média
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX 4000 180.699
Quadro RTX 5000 190.775

Em seguida, temos nosso modelo Philly, onde o RTX 4000 apresentou um drawtime médio de 00:01:00.231, enquanto o FPS médio e mínimo mostraram 434.170 e 196.825, respectivamente.

ESRI ArcGIS Pro 2.3 Filadélfia
Hora do sorteio Média
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX 4000 00:01:00.231
Quadro RTX 5000 00:01:01.111
FPS médio Média
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX 4000 434.170
Quadro RTX 5000 531.315
FPS mínimo Média
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX 4000 196.825
Quadro RTX 5000 224.341

Nosso último modelo é de Portland. Aqui, o RTX 4000 teve um drawtime médio de 00:00:32.646. O FPS médio mostrou 2,821.928 enquanto o FPS mínimo mostrou 1,083.260.

ESRI ArcGIS Pro 2.3 Portland
Hora do sorteio Média
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX 4000 00:00:32.646
Quadro RTX 5000 00:00:32.541
FPS médio Média
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX 4000 2,821.928
Quadro RTX 5000 2,783.547
FPS mínimo Média
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX 4000 1,083.260
Quadro RTX 5000 1,007.309

Conclusão

A NVIDIA Quadro RTX 4000 é a GPU de arquitetura Turing de nível inferior, mas isso não significa que não seja poderosa. O RTX 4000 vem equipado com 2304 núcleos CUDA e GPU GDDR8 de 6 GB. Como todos os Quadro RTX, o 4000 é capaz de fornecer traçado de raio acelerado, aprendizado profundo e sombreamento avançado em seu fator de forma de slot único acessível. Isso pode dar aos profissionais criativos um tempo mais rápido para obter insights, permitindo que eles acelerem seus esforços criativos. O RTX 4000 também vem com o VirtualLink, que simplifica a conectividade com monitores VR de alta resolução e de última geração montados na cabeça.

Em termos de desempenho, o RTX 4000 teve um desempenho muito bom, especialmente considerando que está na extremidade inferior das novas GPUs. Em nosso benchmark LuxMark, quase dobrou sua contraparte Pascal e até superou o P6000. No Arion, o RTX 4000 mais que dobrou o P4000 e novamente superou facilmente o P6000. Em nossos benchmarks Solidworks, o RTX 4000 superou facilmente o P4000 e brilhou mais no benchmark Digger e Jet Engine. No ESRi, o RTX 4000 teve desempenho muito melhor do que o P4000 (e P5000 em alguns casos), mas há cargas de trabalho em que o P6000 teve o melhor desempenho. Deve-se ter em mente que o RTX 4000 está na extremidade inferior da arquitetura Turing e o P6000 está na extremidade superior da arquitetura Pascal.

Em suma, a Quadro RTX 4000 é uma adição muito bem-vinda à grande linha de GPUs impressionantes da NVIDIA e oferece números de desempenho impressionantes para a placa básica, com um preço de apenas cerca de US $ 900.

Quadro RTX 4000 na Amazon

Página do produto Quadro RTX 4000

Discuta esta avaliação

Inscreva-se no boletim informativo StorageReview