Startseite PrivatkundenKundenzubehör NVIDIA Quadro RTX 4000 Testbericht

NVIDIA Quadro RTX 4000 Testbericht

by StorageReview Consumer Desk

Die im November letzten Jahres angekündigte Quadro RTX 4000 ist Teil der professionellen GPU-Familie von NVIDIA. Der RTX 4000 wurde speziell für CAD-Software-Profis entwickelt und bietet intensiven Realismus und immersive Interaktion mit ihren Designs. Dadurch können sie erweiterte Simulationen und Analysen auf ihrem lokalen Arbeitsplatzrechner ausführen.


Die im November letzten Jahres angekündigte Quadro RTX 4000 ist Teil der professionellen GPU-Familie von NVIDIA. Der RTX 4000 wurde speziell für CAD-Software-Profis entwickelt und bietet intensiven Realismus und immersive Interaktion mit ihren Designs. Dadurch können sie erweiterte Simulationen und Analysen auf ihrem lokalen Arbeitsplatzrechner ausführen.

Ähnlich wie andere NVIDIA-GPUs nutzt die RTX 4000 NVIDIA Quadro Scalable Visual Solutions (SVS). Dadurch kann jede einzelne RTX 4000-Karte bis zu vier 5K-Monitore bei 60 Hz oder zwei 8K-Displays unterstützen. Bei Verwendung von zwei Quadro Sync II-Boards kann ein System bis zu acht RTX 4000-GPUs unterstützen und 32 separate Displays synchronisieren. NVIDIA gibt außerdem an, die Bandbreite gegenüber der Quadro P40 der vorherigen Generation um 4000 % verbessert zu haben, was teilweise auf 8 GB GDDR6-Grafikspeicher zurückzuführen ist.

Die RTX 4000 verfügt über einen Single-Slot-Formfaktor von 4.4 Zoll H x 9.5 Zoll L, sodass die GPU in eine Vielzahl von Workstation-Gehäusen passt. In diesem schlanken Formfaktor konnte NVIDIA 2304 CUDA-Kerne, 288 Tensor-Kerne, 36 RT-Kerne und 8 GB GDDR6-Speicher unterbringen. Diese Hardware ist für intensive AEC-, DCC-, KI-, VR- und Grafik-Workloads konzipiert. Der RTX 4000 ist mit VirtualLink ausgestattet, um die Konnektivität zu hochauflösenden VR-Head-Mounted-Displays der nächsten Generation zu vereinfachen.

Technische Daten der Quadro RTX 4000

Architektur Nvidia Turing
GPU-Speicher 8GB GDDR6
Speicherschnittstelle 256-bit
Speicherbandbreite Bis zu 416 GB/s
NVIDIA CUDA-Kerne 2,304
NVIDIA Tensorkerne 288
NVIDIA RT-Kerne 36
Leistung mit einfacher Genauigkeit 7.1 TFLOPS
Tensorleistung 57.0 TFLOPS
System Interface PCI Express 3.0 x 16
Energieverbrauch Gesamtleistung der Platine: 160 W
Grafikleistung insgesamt: 125 W
​Thermische Lösung aktiv
Formfaktor 4.4 Zoll H x 9.5 Zoll L, Einzelschlitz
Maximale Anzahl gleichzeitiger Anzeigen 4x 3840×2160 bei 120 Hz
4x 5120×2880 bei 60 Hz
​2x 7680×4320 bei 60 Hz
VR Ready Ja
Grafik-APIs Shader Modell 5.1
OpenGL 4.5
DirectX 12.0
Vulkan 1.0
APIs berechnen CUDA
Directcompute
​OpenCL

Kennzahlen

Um die Leistung der neuen Architektur in der NVIDIA Quadro RTX 4000-GPU zu testen, haben wir sie in unserer Lenovo ThinkSystem P920-Workstation mit Windows 10 installiert. Für einen umfassenden Überblick über die Leistung jeder Karte haben wir mehrere Branchen-Benchmarks und GPU-Beschleunigung genutzt Software, die die zu testende Karte voll ausnutzen kann. Wir werden es nicht nur mit der NVIDIA Quadro RTX 5000 vergleichen, die die Turning-Architektur teilt, sondern auch mit der vorherigen Pascal Quadro-Reihe einschließlich der P6000, der P5000und der P4000. Dabei geht es weniger um das, was besser ist, sondern eher um das, was man mit der gewählten GPU erwarten kann.

Um eine bessere Vorstellung davon zu bekommen, wie sich diese GPUs von verschiedenen Architekturen aus skaliert haben, haben wir die folgende Tabelle für die RTX in ihrer heutigen Form eingefügt. Die RTX 4000 ist eindeutig die Einstiegskarte in die Familie, wobei die Karten der P-Serie mit der P1000 ihren Anfang nahmen. Natürlich skaliert die RTX-Familie bis hin zur RTX 8000 und bringt nebenbei mehr Grafikspeicher, Bandbreite und Kerne mit.

NVIDIA Quadro-GPUs
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPU-Speicher 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
Speicherschnittstelle 256-bit 256-bit 384-bit 384-bit
Speicherbandbreite BIS zu 416 GB/s Bis zu 448 GB/s Bis zu 672 GB/s Bis zu 672 GB/s
NVIDIA CUDA-Kerne 2,304 3,072 4,608 4,608
NVIDIA Tensorkerne 288 384 576 576
NVIDIA RT-Kerne 36 48 72 72
Leistung mit einfacher Genauigkeit 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Tensorleistung 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Unser erster Benchmark ist das plattformübergreifende OpenCL-Benchmark-Tool LuxMark. LuxMark basiert auf der LuxCore-API und wird als Werbekomponente der LuxCoreRender-Suite angeboten. Es verwendet einen neuen Mikrokernel-basierten OpenCL-Pfad-Tracer als Rendering-Generator für seinen Benchmark und bietet eine einzigartige Möglichkeit, die in einer bestimmten Workstation installierte GPU zu belasten.

LuxMark
GPUs Ergebnisse
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Während die Pascal-GPUs den LuxMark mit guten Ergebnissen abschlossen, ist bei den Turning-GPUs ein deutlicher Leistungssprung zu erkennen. Die RTX 4000 belegte mit einer Punktzahl von 5000 den zweiten Platz hinter der RTX 28,338.

Als nächstes kommt Arion, ein von RandomControl entwickeltes CUDA-Benchmarking-Tool, das es Workstations ermöglicht, CPUs oder GPUs in einer Rendering-Anwendung zu belasten. ArionBench ist ein auf der Arion 2-Technologie basierendes Softwaretool, das CPU/GPUs durch die Simulation des Lichtflusses in einer 3D-Szene einer starken Belastung aussetzt.

Arion
GPUs Ergebnisse
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Ein weiterer großer Punktesprung von Pascal zu Turing, wobei die RTX 4000 einen ziemlich großen Sprung gegenüber der P6000 machte.

Unser nächster Benchmark nutzt SolidWorks 2019 und vier 3D-Modelle, die einen Audi R8, einen Baubagger, ein Düsentriebwerk sowie ein Rallyeauto abdecken. Solidworks ist eine branchenführende GPU-beschleunigte 3D-CAD-Modellierungsanwendung, die auf Windows-basierten Systemen läuft. SolidWorks wird von Dassault Systèmes entwickelt und von über zwei Millionen Ingenieuren und mehr als 165,000 Unternehmen weltweit verwendet. Für Benchmarking-Zwecke nutzen wir die neue Funktion „Performance Pipeline“ in SolidWorks 2019. Diese Architektur bietet eine reaktionsschnellere Echtzeitanzeige, insbesondere für große Modelle. Es nutzt modernes OpenGL (4.5) und hardwarebeschleunigtes Rendering, um beim Schwenken, Zoomen oder Drehen großer Modelle ein hohes Maß an Detailgenauigkeit und Bildrate beizubehalten.

Nachdem jedes Modell gerendert wurde, dreht unser Skript jedes Modell fünfmal und misst die Zeit, die zum Abschließen dieser Aufgabe erforderlich ist. Anschließend wird dieser Wert durch die Anzahl der gerenderten Frames dividiert und der durchschnittliche FPS-Wert (Frames per Section) berechnet.

Solidworks
Solidworks R8 Durchschnittlich
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Solidworks Digger Durchschnittlich
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Solidworks-Düsentriebwerk Durchschnittlich
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
Solidworks Rallye-Auto Durchschnittlich
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Bei Solidworks R8 und Rally Car bedeutet das für die Turing-Modelle einen leichten Leistungsabfall, bei Digger und Jet Engine gibt es jedoch einen großen Leistungssprung. Bei unseren Solidworks-Tests verwendeten wir den Beta-Anzeigemodus, der möglicherweise die Ursache für die ungewöhnliche Skalierung bei den Baugruppen Audi R8 und RallyCar ist.

Als nächstes folgt der Benchmark des Environmental Systems Research Institute (Esri). Esri ist ein Anbieter von Software für geografische Informationssysteme (GIS). Das Performance-Team von Esri hat seine PerfTool-Add-In-Skripte so konzipiert, dass ArcGIS Pro automatisch gestartet wird. Diese Anwendung verwendet eine „ZoomToBookmarks“-Funktion, um verschiedene vordefinierte Lesezeichen zu durchsuchen und eine Protokolldatei mit allen wichtigen Datenpunkten zu erstellen, die zur Vorhersage des Benutzererlebnisses erforderlich sind. Das Skript durchläuft die Lesezeichen automatisch dreimal, um das Caching (Speicher und Festplatten-Cache) zu berücksichtigen. Mit anderen Worten, dieser Benchmark simuliert eine starke grafische Nutzung, die man möglicherweise durch die ArcGIS Pro 2.3-Software von Esri sehen könnte.

Die Tests bestehen aus drei Hauptdatensätzen. Zwei davon sind 3D-Stadtansichten von Philadelphia, PA und Montreal, QC. Diese Stadtansichten enthalten texturierte 3D-Multipatch-Gebäude, die auf einem Geländemodell drapiert sind, sowie drapierte Luftbilder. Der dritte Datensatz ist eine 2D-Kartenansicht der Region Portland, OR. Diese Daten enthalten detaillierte Informationen zu Straßen, Grundstücken, Parks und Schulen, Flüssen, Seen und schattigem Gelände.

Betrachtet man die Zeichenzeit des Montreal-Modells, zeigte die NVIDIA Quadro RTX 4000 eine durchschnittliche Zeichenzeit von 00:01:31.284, während die durchschnittliche und minimale FPS 502.395 bzw. 180.699 betrug.

ESRI ArcGIS Pro 2.3 Montreal
Ziehzeit Durchschnittlich
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX4000 00:01:31.284
Quadro RTX5000 00:01:31.067
Durchschnittliche FPS Durchschnittlich
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX4000 502.395
Quadro RTX5000 527.636
Mindest-FPS Durchschnittlich
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX4000 180.699
Quadro RTX5000 190.775

Als nächstes kommt unser Philly-Modell, bei dem die RTX 4000 eine durchschnittliche Ziehzeit von 00:01:00.231 zeigte, während die durchschnittliche und minimale FPS 434.170 bzw. 196.825 betrug.

ESRI ArcGIS Pro 2.3 Philly
Ziehzeit Durchschnittlich
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX4000 00:01:00.231
Quadro RTX5000 00:01:01.111
Durchschnittliche FPS Durchschnittlich
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX4000 434.170
Quadro RTX5000 531.315
Mindest-FPS Durchschnittlich
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX4000 196.825
Quadro RTX5000 224.341

Unser letztes Modell stammt aus Portland. Hier hatte die RTX 4000 eine durchschnittliche Ziehzeit von 00:00:32.646. Der durchschnittliche FPS-Wert betrug 2,821.928, während der minimale FPS-Wert 1,083.260 betrug.

ESRI ArcGIS Pro 2.3 Portland
Ziehzeit Durchschnittlich
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX4000 00:00:32.646
Quadro RTX5000 00:00:32.541
Durchschnittliche FPS Durchschnittlich
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX4000 2,821.928
Quadro RTX5000 2,783.547
Mindest-FPS Durchschnittlich
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX4000 1,083.260
Quadro RTX5000 1,007.309

Schlussfolgerung

Die NVIDIA Quadro RTX 4000 ist die GPU der unteren Turing-Architektur, aber das bedeutet nicht, dass sie nicht leistungsstark ist. Der RTX 4000 ist mit 2304 CUDA-Kernen und einer 8 GB GDDR6-GPU ausgestattet. Wie alle Quadro RTX-Modelle ist auch der 4000 in der Lage, beschleunigtes Raytracing, Deep Learning und erweitertes Shading in seinem zugänglichen Single-Slot-Formfaktor bereitzustellen. Dadurch können Kreativprofis schneller Erkenntnisse gewinnen und gleichzeitig ihre kreativen Bemühungen beschleunigen. Der RTX 4000 ist außerdem mit VirtualLink ausgestattet, das die Konnektivität mit hochauflösenden VR-Head-Mount-Displays der nächsten Generation vereinfacht.

Leistungstechnisch schnitt die RTX 4000 sehr gut ab, vor allem wenn man bedenkt, dass sie am unteren Ende der neuen GPUs liegt. In unserem LuxMark-Benchmark hat es sein Pascal-Pendant fast verdoppelt und sogar das P6000 übertroffen. In Arion hat die RTX 4000 die P4000 mehr als verdoppelt und die P6000 erneut deutlich übertroffen. In unseren Solidworks-Benchmarks übertraf die RTX 4000 die P4000 deutlich und glänzte im Digger- und Jet Engine-Benchmark besser. Bei ESRi hatte die RTX 4000 eine viel bessere Leistung als die P4000 (und in einigen Fällen die P5000), aber es gibt Workloads, bei denen die P6000 die bessere Leistung erbrachte. Man sollte bedenken, dass sich die RTX 4000 am unteren Ende der Turing-Architektur und die P6000 am höchsten Ende der Pascal-Architektur befindet.

Alles in allem ist die Quadro RTX 4000 eine willkommene Ergänzung zu NVIDIAs großer Palette beeindruckender GPUs und bietet sehr beeindruckende Leistungswerte für die Einsteigerkarte, obwohl sie nur etwa 900 US-Dollar kostet.

Quadro RTX 4000 auf Amazon

Quadro RTX 4000 Produktseite

Besprechen Sie diese Rezension

Melden Sie sich für den StorageReview-Newsletter an