A Quadro RTX 4000, anunciada em novembro do ano passado, faz parte da família de GPUs profissionais da NVIDIA. O RTX 4000 foi projetado especificamente para o profissional de software CAD, proporcionando intenso realismo e interação imersiva com seus projetos. Consequentemente, isso permite que eles executem simulações e análises avançadas em sua estação de trabalho local.
A Quadro RTX 4000, anunciada em novembro do ano passado, faz parte da família de GPUs profissionais da NVIDIA. O RTX 4000 foi projetado especificamente para o profissional de software CAD, proporcionando intenso realismo e interação imersiva com seus projetos. Consequentemente, isso permite que eles executem simulações e análises avançadas em sua estação de trabalho local.
Não muito diferente de outras GPUs NVIDIA, a RTX 4000 utiliza NVIDIA Quadro Scalable Visual Solutions (SVS). Como resultado, cada placa RTX 4000 individual pode suportar até quatro monitores 5K a 60 Hz ou monitores duplos de 8K. Ao utilizar duas placas Quadro Sync II, um sistema pode suportar até oito GPUs RTX 4000, sincronizando 32 monitores separados. A NVIDIA também reivindica uma melhoria de 40% na largura de banda em relação à geração anterior Quadro P4000, graças em parte aos 8 GB de memória gráfica GDDR6.
O RTX 4000 possui um fator de forma de slot único de 4.4" A x 9.5" L, permitindo que a GPU se encaixe em uma variedade de chassis de estações de trabalho. Neste fator de forma fino, a NVIDIA foi capaz de acomodar 2304 núcleos CUDA, 288 núcleos Tensor, 36 núcleos RT e 8 GB de memória GDDR6. Este hardware foi projetado para cargas de trabalho intensas de AEC, DCC, AI, VR e gráficos. O RTX 4000 vem com VirtualLink para simplificar a conectividade com monitores VR de alta resolução de última geração montados na cabeça.
Especificações da Quadro RTX 4000
Arquitetura | NVIDIA Turing |
Memória GPU | 8GB GDDR6 |
Interface de Memória | 256-bit |
Largura de banda de memória | Até 416 GB/s |
Núcleos NVIDIA CUDA | 2,304 |
Núcleos tensores NVIDIA | 288 |
Núcleos NVIDIA RT | 36 |
Desempenho de precisão única | 7.1 TFLOPS |
Desempenho do tensor | 57.0 TFLOPS |
Interface do Sistema | PCI Express 3.0x16 |
Consumo de energia | Potência total da placa: 160W Potência gráfica total: 125W Solução Térmica Ativa |
Fator de Forma | 4.4 ”H x 9.5” L, Slot Único |
Exibições simultâneas máximas | 4x 3840 × 2160 a 120 Hz 4x 5120 × 2880 a 60 Hz 2x 7680 × 4320 a 60 Hz |
VR pronto | Sim |
APIs gráficas | Shader Model 5.1 OpenGL 4.5 DirectX 12.0 Vulkan 1.0 |
APIs de computação | CUDA Computação direta OpenCL |
Desempenho
Para testar o desempenho da nova arquitetura na GPU NVIDIA Quadro RTX 4000, nós a instalamos em nossa estação de trabalho Lenovo ThinkSystem P920 executando o Windows 10. software que pode tirar o máximo proveito do cartão em teste. Não apenas a compararemos com a NVIDIA Quadro RTX 5000, que compartilha a arquitetura Turning, como também a compararemos com a linha Pascal Quadro anterior, incluindo o P6000, P5000, e o P4000. Isso é menos, o que é melhor e mais do que esperar com a GPU escolhida.
Para ter uma ideia melhor de como essas GPUs foram dimensionadas em diferentes arquiteturas, incluímos a tabela a seguir para o RTX como ele é hoje. O RTX 4000 é claramente o cartão básico da família, onde os cartões da série P começaram com o P1000. É claro que a família RTX escala até o RTX 8000, trazendo mais memória gráfica, largura de banda e núcleos ao longo do caminho.
GPUs NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Memória GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Interface de Memória | 256-bit | 256-bit | 384-bit | 384-bit |
Largura de banda de memória | ATÉ 416GB/s | Até 448 GB/s | Até 672 GB/s | Até 672 GB/s |
Núcleos NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Núcleos tensores NVIDIA | 288 | 384 | 576 | 576 |
Núcleos NVIDIA RT | 36 | 48 | 72 | 72 |
Desempenho de precisão única | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Desempenho do tensor | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Nosso primeiro benchmark é a ferramenta de benchmark OpenCL de plataforma cruzada LuxMark. O LuxMark é baseado na API LuxCore e oferecido como um componente promocional do pacote LuxCoreRender. Ele usa um novo rastreador de caminho OpenCL baseado em microkernel como a melhor renderização para seu benchmark, oferecendo uma maneira única de estressar a GPU instalada em uma determinada estação de trabalho.
Lux Mark | |
---|---|
GPUs | Mensuráveis |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Enquanto as GPUs Pascal saíram do LuxMark com bons resultados, há um salto óbvio no desempenho ao olhar para as GPUs Turning. O RTX 4000 ficou em segundo lugar para o RTX 5000 com uma pontuação de 28,338.
O próximo é o Arion, uma ferramenta de benchmarking CUDA, desenvolvida pela RandomControl que permite que as estações de trabalho estressem CPUs ou GPUs em um aplicativo de renderização. ArionBench é uma ferramenta de software baseada na tecnologia Arion 2 que coloca as CPUs/GPUs sob forte estresse por meio da tarefa de simular o fluxo de luz em uma cena 3D.
Arion | |
---|---|
GPUs | Mensuráveis |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Outro grande salto nas pontuações indo de Pascal para Turing com o RTX 4000 dando um salto bastante grande sobre o P6000.
Nosso próximo benchmark utiliza o SolidWorks 2019 e quatro modelos 3D que abrangem um Audi R8, uma escavadeira de construção, um motor a jato e um carro de rali. O Solidworks é um aplicativo de modelagem CAD 3D acelerado por GPU líder do setor que opera em sistemas baseados em Windows. O SolidWorks é desenvolvido pela Dassault Systèmes e é usado por mais de dois milhões de engenheiros e mais de 165,000 empresas em todo o mundo. Para fins de benchmarking, aproveitamos o novo recurso de “pipeline de desempenho” dentro do SolidWorks 2019. Essa arquitetura fornece uma exibição em tempo real mais responsiva, especialmente para modelos grandes. Ele aproveita o OpenGL (4.5) moderno e a renderização acelerada por hardware para manter um alto nível de detalhes e taxa de quadros ao aplicar panorâmica, zoom ou girar modelos grandes.
Depois que cada modelo é renderizado, nosso script gira cada modelo cinco vezes e mede o tempo necessário para concluir essa tarefa. Em seguida, ele divide isso pelo número de quadros renderizados e calcula a pontuação média de quadros por seção (FPS).
SolidWorks | |
---|---|
solidworks r8 | Média |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Escavador SolidWorks | Média |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Motor a Jato Solidworks | Média |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
carro de rali solidworks | Média |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Com Solidworks R8 e Rally Car, há uma ligeira queda no desempenho dos modelos Turing, porém há um grande salto em Digger e Jet Engine. Com nossos testes do Solidworks, estávamos usando o modo de exibição beta que pode ser a causa do dimensionamento incomum visto nos conjuntos Audi R8 e RallyCar.
O próximo é o benchmark do Instituto de Pesquisa de Sistemas Ambientais (Esri). A Esri é fornecedora de software de Sistema de Informação Geográfica (GIS). A equipe de desempenho da Esri projetou seus scripts de suplemento PerfTool para iniciar automaticamente o ArcGIS Pro. Este aplicativo usa uma função “ZoomToBookmarks” para navegar em vários marcadores predefinidos e criar um arquivo de log com todos os principais pontos de dados necessários para prever a experiência do usuário. O script repete automaticamente os marcadores três vezes para contabilizar o cache (memória e cache de disco). Em outras palavras, este benchmark simula o uso gráfico pesado que pode ser visto através do software ArcGIS Pro 2.3 da Esri.
Os testes consistem em três conjuntos de dados principais. Duas são vistas 3-D da cidade de Filadélfia, PA e Montreal, QC. Essas vistas da cidade contêm edifícios multipatch 3-D texturizados dispostos em um modelo de terreno e imagens aéreas cobertas. O terceiro conjunto de dados é uma visualização de mapa 2-D da região de Portland, OR. Esses dados contêm informações detalhadas sobre estradas, parcelas de uso do solo, parques e escolas, rios, lagos e terrenos sombreados.
Olhando para o drawtime do modelo Montreal, a NVIDIA Quadro RTX 4000 mostrou um drawtime médio de 00:01:31.284, enquanto o FPS médio e mínimo mostraram 502.395 e 180.699, respectivamente.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Hora do sorteio | Média |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
FPS médio | Média |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
FPS mínimo | Média |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
Em seguida, temos nosso modelo Philly, onde o RTX 4000 apresentou um drawtime médio de 00:01:00.231, enquanto o FPS médio e mínimo mostraram 434.170 e 196.825, respectivamente.
ESRI ArcGIS Pro 2.3 Filadélfia | |
---|---|
Hora do sorteio | Média |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
FPS médio | Média |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
FPS mínimo | Média |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Nosso último modelo é de Portland. Aqui, o RTX 4000 teve um drawtime médio de 00:00:32.646. O FPS médio mostrou 2,821.928 enquanto o FPS mínimo mostrou 1,083.260.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Hora do sorteio | Média |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
FPS médio | Média |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
FPS mínimo | Média |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Conclusão
A NVIDIA Quadro RTX 4000 é a GPU de arquitetura Turing de nível inferior, mas isso não significa que não seja poderosa. O RTX 4000 vem equipado com 2304 núcleos CUDA e GPU GDDR8 de 6 GB. Como todos os Quadro RTX, o 4000 é capaz de fornecer traçado de raio acelerado, aprendizado profundo e sombreamento avançado em seu fator de forma de slot único acessível. Isso pode dar aos profissionais criativos um tempo mais rápido para obter insights, permitindo que eles acelerem seus esforços criativos. O RTX 4000 também vem com o VirtualLink, que simplifica a conectividade com monitores VR de alta resolução e de última geração montados na cabeça.
Em termos de desempenho, o RTX 4000 teve um desempenho muito bom, especialmente considerando que está na extremidade inferior das novas GPUs. Em nosso benchmark LuxMark, quase dobrou sua contraparte Pascal e até superou o P6000. No Arion, o RTX 4000 mais que dobrou o P4000 e novamente superou facilmente o P6000. Em nossos benchmarks Solidworks, o RTX 4000 superou facilmente o P4000 e brilhou mais no benchmark Digger e Jet Engine. No ESRi, o RTX 4000 teve desempenho muito melhor do que o P4000 (e P5000 em alguns casos), mas há cargas de trabalho em que o P6000 teve o melhor desempenho. Deve-se ter em mente que o RTX 4000 está na extremidade inferior da arquitetura Turing e o P6000 está na extremidade superior da arquitetura Pascal.
Em suma, a Quadro RTX 4000 é uma adição muito bem-vinda à grande linha de GPUs impressionantes da NVIDIA e oferece números de desempenho impressionantes para a placa básica, com um preço de apenas cerca de US $ 900.
Página do produto Quadro RTX 4000
Inscreva-se no boletim informativo StorageReview