In augustus kondigde NVIDIA op SIGGRAPH een geheel nieuwe grafische architectuur aan, Turing, evenals nieuwe Quadro RTX GPU's. Van de verschillende nieuwe GPU's die toen werden aangekondigd, zullen we vandaag specifiek kijken naar de NVIDIA Quadro RTX 5000 GPU. Aangekondigd als de eerste ray-tracing GPU's die ook gebruik maken van deep learning en geavanceerde shading. De RTX 5000 is ontworpen voor werklasten van de volgende generatie met het potentieel om fotorealistische scènes in realtime weer te geven, een zegen voor zowel video-editors als auto- en architectuurontwerpers.
In augustus kondigde NVIDIA op SIGGRAPH een geheel nieuwe grafische architectuur aan, Turing, evenals nieuwe Quadro RTX GPU's. Van de verschillende nieuwe GPU's die toen werden aangekondigd, zullen we vandaag specifiek kijken naar de NVIDIA Quadro RTX 5000 GPU. Aangekondigd als de eerste ray-tracing GPU's die ook gebruik maken van deep learning en geavanceerde shading. De RTX 5000 is ontworpen voor werklasten van de volgende generatie met het potentieel om fotorealistische scènes in realtime weer te geven, een zegen voor zowel video-editors als auto- en architectuurontwerpers.
De drijvende kracht achter de nieuwe golf van GPU's is de nieuwe Turing-architectuur van NVIDIA. Het bedrijf wordt vereerd vanwege zijn GPU-leiderschap en heeft hierop voortgebouwd met zijn nieuwe kern-GPU-architectuur. Het onderwerp van de architectuur is een beetje te diep om hier op in te gaan, maar om het samen te vatten: Turing gebruikt verschillende hardware-verbeteringen om indrukwekkende nieuwe resultaten te bereiken. Voor ray-tracing maakt de architectuur gebruik van processors, RT-cores genaamd, die de berekening versnellen van hoe licht en geluid zich verplaatsen in 3D-omgevingen met maximaal 10 Giga Rays per seconde. Een streaming multiprocessor verbetert de rasterprestaties en voegt een verbeterde grafische pijplijn en nieuwe programmeerbare schaduwtechnologieën toe. Turing komt met nieuwe Tensor Cores die 500 biljoen tensorbewerkingen per seconde leveren. En met Turing kunnen gebruikers profiteren van meer CUDA-kernen om tot 16 biljoen drijvende-kommabewerkingen parallel met 16 biljoen integer-bewerkingen per seconde te ondersteunen.
De NVIDIA Quadro RTX 5000 is afgestemd op creatieve professionals die snel en effectief aan complexe projecten moeten werken. De GPU heeft 3,072 CUDA-kernen, 384 Tensor-kernen, 48 RT-kernen en 16 GB GDDR6-geheugen. Deze indrukwekkende hoeveelheid hardware is in staat om complexe modellen en scènes weer te geven met fysiek nauwkeurige schaduwen, reflecties en brekingen. De RTX 5000 ondersteunt NVIDIA NVLink waardoor gebruikers hun geheugen en prestaties kunnen schalen met meerdere GPU-configuraties. Ervan uitgaande dat er ruimte is in hun werkstation, kunnen gebruikers twee Quadro RTX 5000 GPU's aansluiten voor maximaal 50 GB/s bandbreedte en een gecombineerd 32 GB GDDR6-geheugen. De GPU wordt ook geleverd met VirtualLink die connectiviteit biedt met de volgende generatie VR-displays met hoge resolutie op het hoofd.
NVIDIA Quadro RTX 5000-specificaties
Architectuur | NVIDIA Turing |
GPU-geheugen | 16GB GDDR6 |
Geheugeninterface | 256-bit |
Geheugenbandbreedte | Tot 448 GB/s |
ECC | Ja |
NVIDIA CUDA-kernen | 3,072 |
NVIDIA Tensor-kernen | 384 |
NVIDIA RT-kernen | 48 |
Prestaties met enkele precisie | 11.2 TFLOPS |
Tensorprestaties | 89.2 TFLOPS |
NVIDIA NVLink | Verbindt 2 Quadro RTX 5000 GPU's |
NVIDIA NVLink-bandbreedte | 50 GB/s (bidirectioneel) |
Systeeminterface | PCI Express 3.0 x 16 |
Energieverbruik | Totaal bordvermogen: 265W Totaal grafisch vermogen: 230 W Thermische oplossing Actief |
Form Factor | 4.4 "H x 10.5" L, dubbele sleuf, volledige hoogte |
Display-connectoren | 4xDP 1.4, 1x USB-C |
Maximale gelijktijdige weergaven | 4x 4096 × 2160 bij 120 Hz 4x 5120 × 2880 bij 60 Hz 2x 7680×4320 bij 60 Hz |
Codeer/decodeer motoren | 1x coderen, 2x decoderen |
VR Ready | Ja |
Grafische API's | DirectX 12.0 Shader Model 5.1 OpenGL 4.5 Vulkan 1.0 Compute-API's CUDA DirectCompute OpenCL |
Prestatie
Om de prestaties van de nieuwe architectuur in de NVIDIA Quadro RTX 5000 GPU te testen, hebben we deze geïnstalleerd in ons Lenovo ThinkSystem P920-werkstation met Windows 10. Voor een uitgebreid overzicht van hoe elke kaart presteert, hebben we gebruik gemaakt van meerdere branchebenchmarks en GPU-versnelde software die volledig kan profiteren van de kaart die wordt getest. We zullen het niet alleen vergelijken met de NVIDIA Quadro RTX 4000, die de Turning-architectuur deelt, we zullen het ook vergelijken met de vorige Pascal Quadro-lijn inclusief de P6000 P5000En P4000. Dit is minder van, wat beter is, en meer van wat u kunt verwachten met de gekozen GPU.
Om een beter idee te krijgen van hoe deze GPU's zijn geschaald vanuit verschillende architecturen, hebben we de volgende tabel toegevoegd met een samenvatting van de RTX-familie zoals die er nu uitziet. De RTX 5000 zit in een middelste slot, een stap hoger dan de instap RTX 4000 en onder de twee krachtigere RTX 6000- en RTX 8000-broers en zussen.
NVIDIA Quadro GPU's | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPU-geheugen | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Geheugeninterface | 256-bit | 256-bit | 384-bit | 384-bit |
Geheugenbandbreedte | Tot 416 GB/sec | Tot 448 GB/s | Tot 672 GB/s | Tot 672 GB/s |
NVIDIA CUDA-kernen | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIA Tensor-kernen | 288 | 384 | 576 | 576 |
NVIDIA RT-kernen | 36 | 48 | 72 | 72 |
Prestaties met enkele precisie | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Tensorprestaties | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Onze eerste benchmark is de platformonafhankelijke OpenCL-benchmarktool van LuxMark. LuxMark is gebaseerd op de LuxCore API en wordt aangeboden als een promotioneel onderdeel van de LuxCoreRender-suite. Het gebruikt een nieuwe op micro-kernel gebaseerde OpenCL-padtracer als weergave voor zijn benchmark, en biedt een unieke manier om de GPU die in een bepaald werkstation is geïnstalleerd, te benadrukken.
LuxMark | |
---|---|
GPU's | Resultaten |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Terwijl de Pascal GPU's met goede resultaten van de LuxMark kwamen, is er een duidelijke prestatiesprong als we naar de Turning GPU's kijken. De RTX 5000 was niet verrassend de best presterende met een score van 29,404.
De volgende is Arion, een CUDA-benchmarktool, ontwikkeld door RandomControl waarmee werkstations CPU's of GPU's in een rendering-applicatie kunnen belasten. ArionBench is een softwaretool gebaseerd op Arion 2-technologie die de CPU/GPU's zwaar belast door de taak van het simuleren van de lichtstroom in een 3D-scène.
Arion | |
---|---|
GPU's | Resultaten |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Weer een grote sprong in scores van Pascal naar Turing, waarbij de RTX 5000 ver voor de rest uitspringt, aanzienlijk sneller dan de P6000.
Onze volgende benchmark maakt gebruik van SolidWorks 2019 en vier 3D-modellen van een Audi R8, een bouwgraafmachine, een straalmotor en een rallyauto. Solidworks is een toonaangevende GPU-versnelde 3D CAD-modelleringstoepassing die werkt op Windows-gebaseerde systemen. SolidWorks is ontwikkeld door Dassault Systèmes en wordt gebruikt door meer dan twee miljoen ingenieurs en meer dan 165,000 bedrijven wereldwijd. Voor benchmarkdoeleinden maken we gebruik van de nieuwe "performance pipeline"-functie in SolidWorks 2019. Deze architectuur zorgt voor een meer responsieve, real-time weergave, vooral voor grote modellen. Het maakt gebruik van moderne OpenGL (4.5) en hardwareversnelde weergave om een hoog detailniveau en framesnelheid te behouden bij het pannen, zoomen of roteren van grote modellen.
Nadat elk model is gerenderd, roteert ons script elk model vijf keer en meet het de tijd die nodig is om deze taak te voltooien. Vervolgens wordt dat gedeeld door het aantal weergegeven frames en wordt de gemiddelde score voor frames per sectie (FPS) berekend.
SolidWorks | |
---|---|
Solidworks R8 | Gemiddelde FPS |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Solidworks graafmachine | Gemiddelde FPS |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Solidworks straalmotor | Gemiddelde FPS |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Solidworks rallyauto | Gemiddelde FPS |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Het is interessant om een lichte achteruitgang te zien in de prestaties van de Turing GPU's in Solidworks R8 en Rally Car in vergelijking met de Pascal, hoewel die bestanden mogelijk niet volledig gebruikmaken van de nieuwere GPU's. De RTX 5000 leverde superieure prestaties in Digger en Jet Engine en presteerde ruimschoots beter dan de andere. Met onze Solidworks gebruikten we de bètaweergavemodus die mogelijk de oorzaak is van de ongebruikelijke schaalvergroting die te zien is op de Audi R8- en RallyCar-assemblages.
De volgende is de benchmark van het Environmental Systems Research Institute (Esri). Esri is een leverancier van Geografisch Informatie Systeem (GIS) software. Esri's Performance Team heeft hun PerfTool add-in scripts ontworpen om ArcGIS Pro automatisch te starten. Deze applicatie gebruikt een functie "ZoomToBookmarks" om door verschillende vooraf gedefinieerde bladwijzers te bladeren en een logbestand aan te maken met alle belangrijke gegevenspunten die nodig zijn om de gebruikerservaring te voorspellen. Het script herhaalt de bladwijzers automatisch drie keer om rekening te houden met caching (geheugen en schijfcache). Met andere woorden, deze benchmark simuleert zwaar grafisch gebruik dat men zou kunnen tegenkomen bij Esri's ArcGIS Pro 2.3-software.
De tests bestaan uit drie hoofddatasets. Twee zijn 3D-stadsgezichten van Philadelphia, PA en Montreal, QC. Deze stadsgezichten bevatten getextureerde 3D multipatch-gebouwen gedrapeerd op een terreinmodel en gedrapeerde luchtfoto's. De derde dataset is een 2D-kaartweergave van de regio Portland, OR. Deze gegevens bevatten gedetailleerde informatie over wegen, landgebruikspercelen, parken en scholen, rivieren, meren en schaduwrijk terrein.
Kijkend naar de tekentijd van het Montreal-model, vertoonde de NVIDIA Quadro RTX 5000 een gemiddelde tekentijd van 00:01:31.067, terwijl de gemiddelde en minimale FPS respectievelijk 527.636 en 190.775 lieten zien.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Trektijd | Gemiddelde |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
Gemiddelde FPS | Gemiddelde |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
Minimale FPS | Gemiddelde |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
Het volgende is ons Philly-model, waar de RTX 5000 een gemiddelde tekentijd van 00:01:01.111 liet zien, terwijl de gemiddelde en minimale FPS respectievelijk 531.315 en 224.341 lieten zien.
ESRI ArcGIS Pro 2.3 Philly | |
---|---|
Trektijd | Gemiddelde |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
Gemiddelde FPS | Gemiddelde |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
Minimale FPS | Gemiddelde |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Ons laatste model is van Portland. Hier had de RTX 5000 een gemiddelde tekentijd van 00:00:32.541. De gemiddelde FPS toonde 2,783.547 terwijl de minimale FPS 1,007.309 liet zien.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Trektijd | Gemiddelde |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
Gemiddelde FPS | Gemiddelde |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
Minimale FPS | Gemiddelde |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Conclusie
De NVIDIA Quadro RTX 5000 is een van de nieuwere GPU's van het bedrijf, gebaseerd op de Turing-architectuur. Turing wordt een compleet nieuwe kijk op de GPU-architectuur, aangezien NVIDIA beide dingen nu wil veranderen met het oog op toekomstige ontwikkelingen. Gericht op creatieve professionals die complexe projecten hebben die efficiënt en snel moeten werken, heeft de RTX 5000 indrukwekkende hardware onder zijn motorkap, waaronder 3,072 CUDA-kernen, 384 Tensor-kernen, 48 RT-kernen en 16 GB GDDR6-geheugen. Voor degenen die nog meer GPU-prestaties nodig hebben, kan de RTX worden geschaald met een tweede GPU via NVIDIA NVLink.
Voor al zijn componenten die zouden moeten leiden tot superieure prestaties, hebben we hem onderworpen aan een spervuur van tests, nieuwe en oude, gewoon om te zien wat hij kan doen. Een verrassing voor niemand, de NVIDIA Quadro RTX 5000 presteerde het best in de meeste van onze tests. In LuxMark en Arion heeft de RTX 5000 de scores van de P5000 meer dan verdubbeld. De RTX 5000 presteerde sterk in de Solidworks Digger- en Jet Engine-benchmarks. Houd er rekening mee dat de RTX 5000, hoe krachtig hij ook is, niet de beste is op het gebied van Turing GPU's.
Als een creatieve professional op de meeste gebieden op zoek is naar een grotere prestatiesprong, dan is de NVIDIA Quadro RTX 5000 de juiste keuze. Onze bovenstaande prestatieresultaten benadrukken de gebieden waar de RTX 5000 schittert en een paar plekken waar een op Pascal gebaseerde GPU goed genoeg presteert. Over het algemeen heeft NVIDIA met de RTX-familie uitstekend werk geleverd door de grenzen te blijven verleggen van wat beschikbaar is voor creatievelingen binnen een desktop. De RTX 5000 van zijn kant vult het midrange-aanbod goed aan en biedt een goede balans tussen prestaties en prijs.
Meld u aan voor de StorageReview-nieuwsbrief