Tillbaka i augusti på SIGGRAPH tillkännagav NVIDIA en helt ny grafikarkitektur, Turing, såväl som nya Quadro RTX GPU:er. Av de flera nya GPU:er som tillkännagavs då kommer vi idag att titta specifikt på NVIDIA Quadro RTX 5000 GPU. Faktureras som de första strålspårande GPU:erna som också använder djupinlärning och avancerad skuggning. RTX 5000 är designad för nästa generations arbetsbelastningar med potential att rendera fotorealistiska scener i realtid, en välsignelse för videoredigerare såväl som bil- och arkitektdesigners.
Tillbaka i augusti på SIGGRAPH tillkännagav NVIDIA en helt ny grafikarkitektur, Turing, såväl som nya Quadro RTX GPU:er. Av de flera nya GPU:er som tillkännagavs då kommer vi idag att titta specifikt på NVIDIA Quadro RTX 5000 GPU. Faktureras som de första strålspårande GPU:erna som också använder djupinlärning och avancerad skuggning. RTX 5000 är designad för nästa generations arbetsbelastningar med potential att rendera fotorealistiska scener i realtid, en välsignelse för videoredigerare såväl som bil- och arkitektdesigners.
Drivkraften bakom den nya vågen av grafikprocessorer är NVIDIAs nya Turing-arkitektur. Företaget är vördat för sitt GPU-ledarskap och har byggt vidare på detta med sin nya kärn-GPU-arkitektur. Ämnet för arkitekturen är lite för djupt för att komma in här, men för att sammanfatta det: Turing använder flera hårdvaruframsteg för att uppnå imponerande nya resultat. För ray-tracing utnyttjar arkitekturen processorer som kallas RT-kärnor som accelererar beräkningen av hur ljus och ljud färdas i 3D-miljöer med upp till 10 Giga-strålar per sekund. En strömmande multiprocessor förbättrar rasterprestandan och lägger till en förbättrad grafikpipeline och nya programmerbara skuggningsteknologier. Turing kommer med nya Tensor Cores som ger 500 biljoner tensoroperationer per sekund. Och Turing tillåter användare att dra nytta av fler CUDA-kärnor för att stödja upp till 16 biljoner flyttalsoperationer parallellt med 16 biljoner heltalsoperationer per sekund.
NVIDIA Quadro RTX 5000 är anpassad för kreativa proffs som behöver arbeta med komplexa projekt snabbt och effektivt. GPU:n har 3,072 384 CUDA-kärnor, 48 Tensor-kärnor, 16 RT-kärnor och 6 GB GDDR5000-minne. Denna imponerande mängd hårdvara kan återge komplexa modeller och scener med fysiskt exakta skuggor, reflektioner och brytningar. RTX 5000 stöder NVIDIA NVLink så att användare kan skala sitt minne och prestanda med flera GPU-konfigurationer. Förutsatt att det finns plats i deras arbetsstation kan användare ansluta två Quadro RTX 50 GPU: er för upp till 32 GB/s bandbredd och ett kombinerat 6 GB GDDRXNUMX-minne. GPU:n kommer också med VirtualLink som ger anslutning till nästa generations högupplösta VR-huvudmonterade skärmar.
Specifikationer för NVIDIA Quadro RTX 5000
arkitektur | NVIDIA Turing |
GPU-minne | 16GB GDDR6 |
Minnesgränssnitt | 256-bitars |
minnesbandbredd | Upp till 448 GB/s |
ECC | Ja |
NVIDIA CUDA-kärnor | 3,072 |
NVIDIA Tensor Cores | 384 |
NVIDIA RT-kärnor | 48 |
Enkelprecisionsprestanda | 11.2 TFLOPS |
Tensorprestanda | 89.2 TFLOPS |
NVIDIA NVLink | Ansluter 2 Quadro RTX 5000 GPU:er |
NVIDIA NVLink-bandbredd | 50 GB/s (dubbelriktad) |
Systemgränssnitt | PCI Express 3.0 x 16 |
Energiförbrukning | Total korteffekt: 265W Total grafikeffekt: 230W Termisk lösning aktiv |
Formfaktor | 4.4" H x 10.5" L, Dual Slot, Full Höjd |
Skärmanslutningar | 4xDP 1.4, 1x USB-C |
Max samtidiga visningar | 4x 4096×2160 @ 120 Hz 4x 5120×2880 @ 60 Hz 2x 7680×4320 @ 60 Hz |
Koda/avkoda motorer | 1X koda, 2X avkoda |
VR Ready | Ja |
Grafik API:er | DirectX 12.0 Shader Model 5.1 OpenGL 4.5 Vulkan 1.0 Beräkna API:er CUDA DirectCompute OpenCL |
Prestation
För att testa prestandan hos den nya arkitekturen i NVIDIA Quadro RTX 5000 GPU installerade vi den i vår Lenovo ThinkSystem P920-arbetsstation som kör Windows 10. För en heltäckande titt på hur varje kort presterar utnyttjade vi flera industririktmärken och GPU-accelererad programvara som kan dra full nytta av kortet som testas. Vi kommer inte bara att jämföra den med NVIDIA Quadro RTX 4000, som delar Turning-arkitekturen, vi kommer också att jämföra den med den tidigare Pascal Quadro-linjen inklusive P6000, den P5000, Och den P4000. Detta är mindre av, vilket är bättre, och mer av vad man kan förvänta sig med den valda GPU:n.
För att få en bättre uppfattning om hur dessa GPU:er har skalat från olika arkitekturer, har vi inkluderat följande tabell som sammanfattar RTX-familjen som den ser ut idag. RTX 5000 sitter i en mittfack, ett steg upp från ingången RTX 4000 och under de två kraftfullare RTX 6000 och RTX 8000 syskonen.
NVIDIA Quadro GPU:er | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPU-minne | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Minnesgränssnitt | 256-bitars | 256-bitars | 384-bitars | 384-bitars |
minnesbandbredd | UPP till 416 GB/s | Upp till 448 GB/s | Upp till 672 GB/s | Upp till 672 GB/s |
NVIDIA CUDA-kärnor | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIA Tensor Cores | 288 | 384 | 576 | 576 |
NVIDIA RT-kärnor | 36 | 48 | 72 | 72 |
Enkelprecisionsprestanda | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Tensorprestanda | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Vårt första benchmark är LuxMarks plattformsoberoende OpenCL benchmark-verktyg. LuxMark är baserat på LuxCore API och erbjuds som en reklamkomponent i LuxCoreRender-sviten. Den använder en ny mikrokärnbaserad OpenCL-sökvägsspårare som rendering mer för sitt riktmärke, och erbjuder ett unikt sätt att betona den GPU som är installerad i en given arbetsstation.
LuxMark | |
---|---|
GPUs | Resultat |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Medan Pascal GPU:erna kom från LuxMark med bra resultat finns det ett uppenbart hopp i prestanda när man tittar på Turning GPU:erna. RTX 5000 var den bästa presterande utan någon överraskning med en poäng på 29,404 XNUMX.
Nästa upp är Arion, ett CUDA-benchmarking-verktyg, utvecklat av RandomControl som gör att arbetsstationer kan stressa CPU:er eller GPU:er i en renderingapplikation. ArionBench är ett mjukvaruverktyg baserat på Arion 2-teknik som sätter CPU/GPU:er under stor påfrestning genom uppgiften att simulera ljusflödet i en 3D-scen.
Arion | |
---|---|
GPUs | Resultat |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Ytterligare ett stort hopp i poäng från Pascal till Turing med RTX 5000 som hoppar långt före resten, betydligt snabbare än P6000.
Vårt nästa riktmärke utnyttjar SolidWorks 2019 och fyra 3D-modeller som täcker en Audi R8, en bygggrävare, en jetmotor samt en ralleybil. Solidworks är en branschledande GPU-accelererad 3D CAD-modelleringsprogram som fungerar på Windows-baserade system. SolidWorks är utvecklat av Dassault Systèmes och används av över två miljoner ingenjörer och mer än 165,000 2019 företag världen över. För benchmarkingsändamål använder vi den nya "performance pipeline"-funktionen i SolidWorks 4.5. Denna arkitektur ger en mer responsiv realtidsvisning speciellt för stora modeller. Den drar fördel av modern OpenGL (XNUMX) och hårdvaruaccelererad rendering för att bibehålla en hög detaljnivå och bildhastighet när du panorerar, zoomar eller roterar stora modeller.
Efter att varje modell har renderats roterar vårt skript varje modell fem gånger och mäter den tid som krävs för att slutföra denna uppgift. Den dividerar sedan det med antalet renderade bildrutor och beräknar den genomsnittliga poängen för bildrutor per sektion (FPS).
Solid | |
---|---|
Solidworks R8 | Genomsnittlig FPS |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Solidworks grävare | Genomsnittlig FPS |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Solidworks Jet Engine | Genomsnittlig FPS |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Solidworks rallybil | Genomsnittlig FPS |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Det är intressant att se en liten nedgång i prestanda för Turing GPU:erna i Solidworks R8 och Rally Car jämfört med Pascal, även om dessa filer kanske inte fullt ut utnyttjar de nyare GPU:erna. RTX 5000 gav överlägsen prestanda i Digger och Jet Engine och överträffade de andra med stor marginal. Med vårt Solidworks använde vi betavisningsläget som kan vara orsaken till den ovanliga skalningen som kan ses på Audi R8 och RallyCar Assembly.
Nästa upp är riktmärket Environmental Systems Research Institute (Esri). Esri är en leverantör av programvara för Geographic Information System (GIS). Esris Performance Team designade sina PerfTool-tilläggsskript för att automatiskt starta ArcGIS Pro. Denna applikation använder en "ZoomToBookmarks"-funktion för att bläddra i olika fördefinierade bokmärken och skapa en loggfil med alla viktiga datapunkter som krävs för att förutsäga användarupplevelsen. Skriptet slingrar automatiskt bokmärkena tre gånger för att ta hänsyn till cachelagring (minne och diskcache). Med andra ord simulerar detta riktmärke tung grafisk användning som man kan se genom Esris ArcGIS Pro 2.3-programvara.
Testerna består av tre huvudsakliga datamängder. Två är 3-D stadsvyer över Philadelphia, PA och Montreal, QC. Dessa stadsvyer innehåller texturerade 3D-byggnader med flera patcher draperade på en terrängmodell och draperade flygbilder. Den tredje datamängden är en 2-D kartvy över Portland, OR-regionen. Dessa data innehåller detaljerad information om vägar, markanvändningsområden, parker och skolor, floder, sjöar och bergskuggad terräng.
När man tittar på dragtid för Montreal-modellen, visade NVIDIA Quadro RTX 5000 en genomsnittlig dragtid på 00:01:31.067, medan genomsnittlig och lägsta FPS visade 527.636 respektive 190.775.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Ritningstid | Genomsnitt |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
Genomsnittlig FPS | Genomsnitt |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
Minsta FPS | Genomsnitt |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
Nästa upp är vår Philly-modell, där RTX 5000 visade en genomsnittlig dragtid på 00:01:01.111, medan genomsnittlig och lägsta FPS visade 531.315 respektive 224.341.
ESRI ArcGIS Pro 2.3 Philly | |
---|---|
Ritningstid | Genomsnitt |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
Genomsnittlig FPS | Genomsnitt |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
Minsta FPS | Genomsnitt |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Vår sista modell är från Portland. Här hade RTX 5000 en genomsnittlig dragtid på 00:00:32.541. Genomsnittlig FPS visade 2,783.547 medan Minimum FPS visade 1,007.309.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Ritningstid | Genomsnitt |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
Genomsnittlig FPS | Genomsnitt |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
Minsta FPS | Genomsnitt |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Slutsats
NVIDIA Quadro RTX 5000 är en av företagets nyare GPU:er baserad på dess Turing-arkitektur. Turing kommer att bli en helt ny version av GPU-arkitekturen eftersom NVIDIA både vill förändra saker och ting nu med ett öga på framtida utvecklingar. RTX 5000 riktar sig till kreativa proffs som har komplexa projekt som kräver effektivt och snabbt arbete, och har imponerande hårdvara under huven inklusive 3,072 384 CUDA-kärnor, 48 Tensor-kärnor, 16 RT-kärnor och 6 GB GDDRXNUMX-minne. För de som behöver ännu mer GPU-prestanda kan RTX skala med en andra GPU genom NVIDIA NVLink.
För alla dess komponenter som borde leda till överlägsen prestanda, satte vi den genom en mängd tester, nya och gamla, bara för att se vad den kan göra. En överraskning för ingen, NVIDIA Quadro RTX 5000 var den bästa presterande i de flesta av våra tester. I LuxMark och Arion mer än fördubblade RTX 5000 poängen för P5000. RTX 5000 hade stark prestanda i Solidworks Digger och Jet Engine benchmarks. Man bör komma ihåg att RTX 5000, hur kraftfull den än är, inte är toppen av raden i Turing GPU:er.
Om ett kreativt proffs letar efter ett större prestandasprång inom de flesta områden, kommer NVIDIA Quadro RTX 5000 att passa detta. Våra prestandaresultat ovan belyser de områden där RTX 5000 lyser och några platser där en Pascal-baserad GPU presterar tillräckligt bra. Sammantaget, med RTX-familjen har NVIDIA gjort ett utmärkt jobb och fortsätter att tänja på gränserna för vad som är tillgängligt för kreativa material på en stationär dator. RTX 5000 för sin del fyller ut mellansortimentet väl, och erbjuder en bra balans mellan prestanda och pris.
Anmäl dig till StorageReviews nyhetsbrev