Home PrivatkundenKundenzubehör NVIDIA Quadro RTX 5000 Testbericht

NVIDIA Quadro RTX 5000 Testbericht

by Adam Armstrong

Bereits im August kündigte NVIDIA auf der SIGGRAPH eine völlig neue Grafikarchitektur, Turing, sowie neue Quadro RTX-GPUs an. Von den mehreren damals angekündigten neuen GPUs werden wir uns heute speziell mit der NVIDIA Quadro RTX 5000 GPU befassen. Gilt als die erste Raytracing-GPU, die auch Deep Learning und Advanced Shading nutzt. Der RTX 5000 ist für Workloads der nächsten Generation konzipiert und bietet das Potenzial, fotorealistische Szenen in Echtzeit wiederzugeben – ein Segen für Videoeditoren sowie Automobil- und Architekturdesigner.


Bereits im August kündigte NVIDIA auf der SIGGRAPH eine völlig neue Grafikarchitektur, Turing, sowie neue Quadro RTX-GPUs an. Von den mehreren damals angekündigten neuen GPUs werden wir uns heute speziell mit der NVIDIA Quadro RTX 5000 GPU befassen. Gilt als die erste Raytracing-GPU, die auch Deep Learning und Advanced Shading nutzt. Der RTX 5000 ist für Workloads der nächsten Generation konzipiert und bietet das Potenzial, fotorealistische Szenen in Echtzeit wiederzugeben – ein Segen für Videoeditoren sowie Automobil- und Architekturdesigner.

Die treibende Kraft hinter der neuen GPU-Welle ist die neue Turing-Architektur von NVIDIA. Das Unternehmen wird für seine GPU-Führerschaft geschätzt und baut darauf mit seiner neuen Kern-GPU-Architektur auf. Das Thema der Architektur ist etwas zu tiefgreifend, um hier näher darauf einzugehen, aber um es zusammenzufassen: Turing nutzt mehrere Hardware-Fortschritte, um beeindruckende neue Ergebnisse zu erzielen. Für das Raytracing nutzt die Architektur sogenannte RT-Kerne, die die Berechnung der Ausbreitung von Licht und Schall in 3D-Umgebungen um bis zu 10 Giga Rays pro Sekunde beschleunigen. Ein Streaming-Multiprozessor verbessert die Rasterleistung und fügt eine verbesserte Grafikpipeline und neue programmierbare Schattierungstechnologien hinzu. Turing verfügt über neue Tensorkerne, die 500 Billionen Tensoroperationen pro Sekunde ermöglichen. Und Turing ermöglicht es Benutzern, mehr CUDA-Kerne zu nutzen, um bis zu 16 Billionen Gleitkommaoperationen parallel mit 16 Billionen Ganzzahloperationen pro Sekunde zu unterstützen.

Die NVIDIA Quadro RTX 5000 richtet sich an kreative Profis, die schnell und effektiv an komplexen Projekten arbeiten müssen. Die GPU verfügt über 3,072 CUDA-Kerne, 384 Tensor-Kerne, 48 RT-Kerne und 16 GB GDDR6-Speicher. Diese beeindruckende Menge an Hardware ist in der Lage, komplexe Modelle und Szenen mit physikalisch korrekten Schatten, Reflexionen und Brechungen zu rendern. Die RTX 5000 unterstützt NVIDIA NVLink, sodass Benutzer ihren Speicher und ihre Leistung mit mehreren GPU-Konfigurationen skalieren können. Sofern auf ihrer Workstation Platz vorhanden ist, können Benutzer zwei Quadro RTX 5000-GPUs für eine Bandbreite von bis zu 50 GB/s und insgesamt 32 GB GDDR6-Speicher anschließen. Die GPU ist außerdem mit VirtualLink ausgestattet, das Konnektivität mit der nächsten Generation hochauflösender VR-Head-Mount-Displays bietet.

NVIDIA Quadro RTX 5000-Spezifikationen

Architektur Nvidia Turing
GPU-Speicher 16GB GDDR6
Speicherschnittstelle 256-bit
Speicherbandbreite Bis zu 448 GB/s
ECC Ja
NVIDIA CUDA-Kerne 3,072
NVIDIA Tensorkerne 384
NVIDIA RT-Kerne 48
Leistung mit einfacher Genauigkeit 11.2 TFLOPS
Tensorleistung 89.2 TFLOPS
NVIDIA NV-Link Verbindet 2 Quadro RTX 5000 GPUs
NVIDIA NVLink-Bandbreite 50 GB/s (bidirektional)
System Interface PCI Express 3.0 x 16
Energieverbrauch Gesamtleistung der Platine: 265 W
Grafikleistung insgesamt: 230 W
​Thermische Lösung aktiv
Formfaktor 4.4 "H x 10.5" L, doppelter Steckplatz, volle Höhe
Display-Anschlüsse 4xDP 1.4, 1x USB-C
Maximale Anzahl gleichzeitiger Anzeigen 4x 4096×2160 bei 120 Hz
4x 5120×2880 bei 60 Hz
​2x 7680×4320 bei 60 Hz
Codierungs-/Decodierungs-Engines 1X kodieren, 2X dekodieren
VR Ready Ja
Grafik-APIs DirectX 12.0
Shader Modell 5.1
OpenGL 4.5
Vulkan 1.0
APIs berechnen
CUDA
Directcompute
​OpenCL

Kennzahlen

Um die Leistung der neuen Architektur in der NVIDIA Quadro RTX 5000-GPU zu testen, haben wir sie in unserer Lenovo ThinkSystem P920-Workstation mit Windows 10 installiert. Für einen umfassenden Überblick über die Leistung jeder Karte haben wir mehrere Branchen-Benchmarks und GPU-Beschleunigung genutzt Software, die die zu testende Karte voll ausnutzen kann. Wir werden es nicht nur mit der NVIDIA Quadro RTX 4000 vergleichen, die die Turning-Architektur teilt, sondern auch mit der vorherigen Pascal Quadro-Reihe einschließlich der P6000, der P5000und der P4000. Dabei geht es weniger um das, was besser ist, sondern eher um das, was man mit der gewählten GPU erwarten kann.

Um eine bessere Vorstellung davon zu bekommen, wie sich diese GPUs auf verschiedenen Architekturen skaliert haben, haben wir die folgende Tabelle eingefügt, die die RTX-Familie in ihrer heutigen Form zusammenfasst. Die RTX 5000 sitzt in einem mittleren Steckplatz, eine Stufe über der Einstiegs-RTX 4000 und unter den beiden leistungsstärkeren Geschwistern RTX 6000 und RTX 8000.

NVIDIA Quadro-GPUs
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPU-Speicher 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
Speicherschnittstelle 256-bit 256-bit 384-bit 384-bit
Speicherbandbreite BIS zu 416 GB/s Bis zu 448 GB/s Bis zu 672 GB/s Bis zu 672 GB/s
NVIDIA CUDA-Kerne 2,304 3,072 4,608 4,608
NVIDIA Tensorkerne 288 384  576 576
NVIDIA RT-Kerne 36 48 72 72
Leistung mit einfacher Genauigkeit 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Tensorleistung 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Unser erster Benchmark ist das plattformübergreifende OpenCL-Benchmark-Tool LuxMark. LuxMark basiert auf der LuxCore-API und wird als Werbekomponente der LuxCoreRender-Suite angeboten. Es verwendet einen neuen Mikrokernel-basierten OpenCL-Pfad-Tracer als Rendering-Generator für seinen Benchmark und bietet eine einzigartige Möglichkeit, die in einer bestimmten Workstation installierte GPU zu belasten.

LuxMark
GPUs Ergebnisse
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Während die Pascal-GPUs den LuxMark mit guten Ergebnissen abschlossen, ist bei den Turning-GPUs ein deutlicher Leistungssprung zu erkennen. Kein Wunder, dass die RTX 5000 mit einer Punktzahl von 29,404 die beste Leistung erbrachte.

Als nächstes kommt Arion, ein von RandomControl entwickeltes CUDA-Benchmarking-Tool, das es Workstations ermöglicht, CPUs oder GPUs in einer Rendering-Anwendung zu belasten. ArionBench ist ein auf der Arion 2-Technologie basierendes Softwaretool, das CPU/GPUs durch die Simulation des Lichtflusses in einer 3D-Szene einer starken Belastung aussetzt.

Arion
GPUs Ergebnisse
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Ein weiterer großer Punktesprung von Pascal zu Turing, wobei die RTX 5000 den Rest weit überholte und deutlich schneller war als die P6000.

Unser nächster Benchmark nutzt SolidWorks 2019 und vier 3D-Modelle, die einen Audi R8, einen Baubagger, ein Düsentriebwerk sowie ein Rallyeauto abdecken. Solidworks ist eine branchenführende GPU-beschleunigte 3D-CAD-Modellierungsanwendung, die auf Windows-basierten Systemen läuft. SolidWorks wird von Dassault Systèmes entwickelt und von über zwei Millionen Ingenieuren und mehr als 165,000 Unternehmen weltweit verwendet. Für Benchmarking-Zwecke nutzen wir die neue Funktion „Performance Pipeline“ in SolidWorks 2019. Diese Architektur bietet eine reaktionsschnellere Echtzeitanzeige, insbesondere für große Modelle. Es nutzt modernes OpenGL (4.5) und hardwarebeschleunigtes Rendering, um beim Schwenken, Zoomen oder Drehen großer Modelle ein hohes Maß an Detailgenauigkeit und Bildrate beizubehalten.

Nachdem jedes Modell gerendert wurde, dreht unser Skript jedes Modell fünfmal und misst die Zeit, die zum Abschließen dieser Aufgabe erforderlich ist. Anschließend wird dieser Wert durch die Anzahl der gerenderten Frames dividiert und der durchschnittliche FPS-Wert (Frames per Section) berechnet.

Solidworks
Solidworks R8 Durchschnittliche FPS
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Solidworks Digger Durchschnittliche FPS
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Solidworks-Düsentriebwerk Durchschnittliche FPS
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
Solidworks Rallye-Auto Durchschnittliche FPS
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Es ist interessant, einen leichten Leistungsabfall der Turing-GPUs in Solidworks R8 und Rally Car im Vergleich zum Pascal zu beobachten, obwohl diese Dateien die neueren GPUs möglicherweise nicht vollständig nutzen. Der RTX 5000 lieferte in den Bereichen Digger und Jet Engine eine überlegene Leistung und übertraf die anderen bei weitem. Bei unseren Solidworks haben wir den Beta-Anzeigemodus verwendet, der möglicherweise die Ursache für die ungewöhnliche Skalierung ist, die bei den Audi R8- und RallyCar-Baugruppen zu sehen ist.

Als nächstes folgt der Benchmark des Environmental Systems Research Institute (Esri). Esri ist ein Anbieter von Software für geografische Informationssysteme (GIS). Das Performance-Team von Esri hat seine PerfTool-Add-In-Skripte so konzipiert, dass ArcGIS Pro automatisch gestartet wird. Diese Anwendung verwendet eine „ZoomToBookmarks“-Funktion, um verschiedene vordefinierte Lesezeichen zu durchsuchen und eine Protokolldatei mit allen wichtigen Datenpunkten zu erstellen, die zur Vorhersage des Benutzererlebnisses erforderlich sind. Das Skript durchläuft die Lesezeichen automatisch dreimal, um das Caching (Speicher und Festplatten-Cache) zu berücksichtigen. Mit anderen Worten, dieser Benchmark simuliert eine starke grafische Nutzung, die man möglicherweise durch die ArcGIS Pro 2.3-Software von Esri sehen könnte.

Die Tests bestehen aus drei Hauptdatensätzen. Zwei davon sind 3D-Stadtansichten von Philadelphia, PA und Montreal, QC. Diese Stadtansichten enthalten texturierte 3D-Multipatch-Gebäude, die auf einem Geländemodell drapiert sind, sowie drapierte Luftbilder. Der dritte Datensatz ist eine 2D-Kartenansicht der Region Portland, OR. Diese Daten enthalten detaillierte Informationen zu Straßen, Grundstücken, Parks und Schulen, Flüssen, Seen und schattigem Gelände.

Betrachtet man die Zeichenzeit des Montreal-Modells, zeigte die NVIDIA Quadro RTX 5000 eine durchschnittliche Zeichenzeit von 00:01:31.067, während die durchschnittliche und minimale FPS 527.636 bzw. 190.775 betrug.

ESRI ArcGIS Pro 2.3 Montreal
Ziehzeit Durchschnittlich
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX4000 00:01:31.284
Quadro RTX5000 00:01:31.067
Durchschnittliche FPS Durchschnittlich
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX4000 502.395
Quadro RTX5000 527.636
Mindest-FPS Durchschnittlich
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX4000 180.699
Quadro RTX5000 190.775

Als nächstes kommt unser Philly-Modell, bei dem die RTX 5000 eine durchschnittliche Ziehzeit von 00:01:01.111 zeigte, während die durchschnittliche und minimale FPS 531.315 bzw. 224.341 betrug.

ESRI ArcGIS Pro 2.3 Philly
Ziehzeit Durchschnittlich
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX4000 00:01:00.231
Quadro RTX5000 00:01:01.111
Durchschnittliche FPS Durchschnittlich
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX4000 434.170
Quadro RTX5000 531.315
Mindest-FPS Durchschnittlich
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX4000 196.825
Quadro RTX5000 224.341

Unser letztes Modell stammt aus Portland. Hier hatte die RTX 5000 eine durchschnittliche Ziehzeit von 00:00:32.541. Der durchschnittliche FPS-Wert betrug 2,783.547, während der minimale FPS-Wert 1,007.309 betrug.

ESRI ArcGIS Pro 2.3 Portland
Ziehzeit Durchschnittlich
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX4000 00:00:32.646
Quadro RTX5000 00:00:32.541
Durchschnittliche FPS Durchschnittlich
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX4000 2,821.928
Quadro RTX5000 2,783.547
Mindest-FPS Durchschnittlich
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX4000 1,083.260
Quadro RTX5000 1,007.309

Schlussfolgerung

Die NVIDIA Quadro RTX 5000 ist eine der neueren GPUs des Unternehmens, die auf der Turing-Architektur basieren. Turing dürfte eine völlig neue Sicht auf die GPU-Architektur sein, da NVIDIA mit Blick auf zukünftige Entwicklungen jetzt Änderungen vornehmen möchte. Der RTX 5000 richtet sich an Kreativprofis, die komplexe Projekte haben, die effizientes und schnelles Arbeiten erfordern. Er verfügt über beeindruckende Hardware unter der Haube, darunter 3,072 CUDA-Kerne, 384 Tensor-Kerne, 48 RT-Kerne und 16 GB GDDR6-Speicher. Für diejenigen, die noch mehr GPU-Leistung benötigen, kann die RTX über NVIDIA NVLink mit einer zweiten GPU skaliert werden.

Für alle seine Komponenten, die zu einer überlegenen Leistung führen sollen, haben wir es einer Flut neuer und alter Tests unterzogen, nur um zu sehen, was es leisten kann. Es überrascht niemanden, dass die NVIDIA Quadro RTX 5000 in den meisten unserer Tests die beste Leistung erbrachte. Bei LuxMark und Arion hat die RTX 5000 die Ergebnisse der P5000 mehr als verdoppelt. Die RTX 5000 zeigte eine starke Leistung in den Solidworks Digger- und Jet Engine-Benchmarks. Man sollte bedenken, dass die RTX 5000, so leistungsstark sie auch ist, nicht die Spitzenklasse der Turing-GPUs darstellt.

Wenn ein Kreativprofi in den meisten Bereichen nach einem größeren Leistungssprung sucht, ist die NVIDIA Quadro RTX 5000 genau das Richtige für Sie. Unsere obigen Leistungsergebnisse heben die Bereiche hervor, in denen die RTX 5000 glänzt, und einige Stellen, an denen eine Pascal-basierte GPU ausreichend gut abschneidet. Insgesamt hat NVIDIA mit der RTX-Familie hervorragende Arbeit geleistet und die Grenzen dessen, was Kreativen auf einem Desktop zur Verfügung steht, weiter verschoben. Die RTX 5000 wiederum füllt das Mittelklasse-Angebot gut aus und bietet ein gutes Gleichgewicht zwischen Leistung und Preis.

NVIDIA RTX 5000 bei Amazon

Besprechen Sie diese Rezension

Melden Sie sich für den StorageReview-Newsletter an