Die im November letzten Jahres angekündigte Quadro RTX 4000 ist Teil der professionellen GPU-Familie von NVIDIA. Der RTX 4000 wurde speziell für CAD-Software-Profis entwickelt und bietet intensiven Realismus und immersive Interaktion mit ihren Designs. Dadurch können sie erweiterte Simulationen und Analysen auf ihrem lokalen Arbeitsplatzrechner ausführen.
Die im November letzten Jahres angekündigte Quadro RTX 4000 ist Teil der professionellen GPU-Familie von NVIDIA. Der RTX 4000 wurde speziell für CAD-Software-Profis entwickelt und bietet intensiven Realismus und immersive Interaktion mit ihren Designs. Dadurch können sie erweiterte Simulationen und Analysen auf ihrem lokalen Arbeitsplatzrechner ausführen.
Ähnlich wie andere NVIDIA-GPUs nutzt die RTX 4000 NVIDIA Quadro Scalable Visual Solutions (SVS). Dadurch kann jede einzelne RTX 4000-Karte bis zu vier 5K-Monitore bei 60 Hz oder zwei 8K-Displays unterstützen. Bei Verwendung von zwei Quadro Sync II-Boards kann ein System bis zu acht RTX 4000-GPUs unterstützen und 32 separate Displays synchronisieren. NVIDIA gibt außerdem an, die Bandbreite gegenüber der Quadro P40 der vorherigen Generation um 4000 % verbessert zu haben, was teilweise auf 8 GB GDDR6-Grafikspeicher zurückzuführen ist.
Die RTX 4000 verfügt über einen Single-Slot-Formfaktor von 4.4 Zoll H x 9.5 Zoll L, sodass die GPU in eine Vielzahl von Workstation-Gehäusen passt. In diesem schlanken Formfaktor konnte NVIDIA 2304 CUDA-Kerne, 288 Tensor-Kerne, 36 RT-Kerne und 8 GB GDDR6-Speicher unterbringen. Diese Hardware ist für intensive AEC-, DCC-, KI-, VR- und Grafik-Workloads konzipiert. Der RTX 4000 ist mit VirtualLink ausgestattet, um die Konnektivität zu hochauflösenden VR-Head-Mounted-Displays der nächsten Generation zu vereinfachen.
Technische Daten der Quadro RTX 4000
Architektur | Nvidia Turing |
GPU-Speicher | 8GB GDDR6 |
Speicherschnittstelle | 256-bit |
Speicherbandbreite | Bis zu 416 GB/s |
NVIDIA CUDA-Kerne | 2,304 |
NVIDIA Tensorkerne | 288 |
NVIDIA RT-Kerne | 36 |
Leistung mit einfacher Genauigkeit | 7.1 TFLOPS |
Tensorleistung | 57.0 TFLOPS |
System Interface | PCI Express 3.0 x 16 |
Energieverbrauch | Gesamtleistung der Platine: 160 W Grafikleistung insgesamt: 125 W Thermische Lösung aktiv |
Formfaktor | 4.4 Zoll H x 9.5 Zoll L, Einzelschlitz |
Maximale Anzahl gleichzeitiger Anzeigen | 4x 3840×2160 bei 120 Hz 4x 5120×2880 bei 60 Hz 2x 7680×4320 bei 60 Hz |
VR Ready | Ja |
Grafik-APIs | Shader Modell 5.1 OpenGL 4.5 DirectX 12.0 Vulkan 1.0 |
APIs berechnen | CUDA Directcompute OpenCL |
Kennzahlen
Um die Leistung der neuen Architektur in der NVIDIA Quadro RTX 4000-GPU zu testen, haben wir sie in unserer Lenovo ThinkSystem P920-Workstation mit Windows 10 installiert. Für einen umfassenden Überblick über die Leistung jeder Karte haben wir mehrere Branchen-Benchmarks und GPU-Beschleunigung genutzt Software, die die zu testende Karte voll ausnutzen kann. Wir werden es nicht nur mit der NVIDIA Quadro RTX 5000 vergleichen, die die Turning-Architektur teilt, sondern auch mit der vorherigen Pascal Quadro-Reihe einschließlich der P6000, der P5000und der P4000. Dabei geht es weniger um das, was besser ist, sondern eher um das, was man mit der gewählten GPU erwarten kann.
Um eine bessere Vorstellung davon zu bekommen, wie sich diese GPUs von verschiedenen Architekturen aus skaliert haben, haben wir die folgende Tabelle für die RTX in ihrer heutigen Form eingefügt. Die RTX 4000 ist eindeutig die Einstiegskarte in die Familie, wobei die Karten der P-Serie mit der P1000 ihren Anfang nahmen. Natürlich skaliert die RTX-Familie bis hin zur RTX 8000 und bringt nebenbei mehr Grafikspeicher, Bandbreite und Kerne mit.
NVIDIA Quadro-GPUs | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPU-Speicher | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Speicherschnittstelle | 256-bit | 256-bit | 384-bit | 384-bit |
Speicherbandbreite | BIS zu 416 GB/s | Bis zu 448 GB/s | Bis zu 672 GB/s | Bis zu 672 GB/s |
NVIDIA CUDA-Kerne | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIA Tensorkerne | 288 | 384 | 576 | 576 |
NVIDIA RT-Kerne | 36 | 48 | 72 | 72 |
Leistung mit einfacher Genauigkeit | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Tensorleistung | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Unser erster Benchmark ist das plattformübergreifende OpenCL-Benchmark-Tool LuxMark. LuxMark basiert auf der LuxCore-API und wird als Werbekomponente der LuxCoreRender-Suite angeboten. Es verwendet einen neuen Mikrokernel-basierten OpenCL-Pfad-Tracer als Rendering-Generator für seinen Benchmark und bietet eine einzigartige Möglichkeit, die in einer bestimmten Workstation installierte GPU zu belasten.
LuxMark | |
---|---|
GPUs | Ergebnisse |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Während die Pascal-GPUs den LuxMark mit guten Ergebnissen abschlossen, ist bei den Turning-GPUs ein deutlicher Leistungssprung zu erkennen. Die RTX 4000 belegte mit einer Punktzahl von 5000 den zweiten Platz hinter der RTX 28,338.
Als nächstes kommt Arion, ein von RandomControl entwickeltes CUDA-Benchmarking-Tool, das es Workstations ermöglicht, CPUs oder GPUs in einer Rendering-Anwendung zu belasten. ArionBench ist ein auf der Arion 2-Technologie basierendes Softwaretool, das CPU/GPUs durch die Simulation des Lichtflusses in einer 3D-Szene einer starken Belastung aussetzt.
Arion | |
---|---|
GPUs | Ergebnisse |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Ein weiterer großer Punktesprung von Pascal zu Turing, wobei die RTX 4000 einen ziemlich großen Sprung gegenüber der P6000 machte.
Unser nächster Benchmark nutzt SolidWorks 2019 und vier 3D-Modelle, die einen Audi R8, einen Baubagger, ein Düsentriebwerk sowie ein Rallyeauto abdecken. Solidworks ist eine branchenführende GPU-beschleunigte 3D-CAD-Modellierungsanwendung, die auf Windows-basierten Systemen läuft. SolidWorks wird von Dassault Systèmes entwickelt und von über zwei Millionen Ingenieuren und mehr als 165,000 Unternehmen weltweit verwendet. Für Benchmarking-Zwecke nutzen wir die neue Funktion „Performance Pipeline“ in SolidWorks 2019. Diese Architektur bietet eine reaktionsschnellere Echtzeitanzeige, insbesondere für große Modelle. Es nutzt modernes OpenGL (4.5) und hardwarebeschleunigtes Rendering, um beim Schwenken, Zoomen oder Drehen großer Modelle ein hohes Maß an Detailgenauigkeit und Bildrate beizubehalten.
Nachdem jedes Modell gerendert wurde, dreht unser Skript jedes Modell fünfmal und misst die Zeit, die zum Abschließen dieser Aufgabe erforderlich ist. Anschließend wird dieser Wert durch die Anzahl der gerenderten Frames dividiert und der durchschnittliche FPS-Wert (Frames per Section) berechnet.
Solidworks | |
---|---|
Solidworks R8 | Durchschnittlich |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Solidworks Digger | Durchschnittlich |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Solidworks-Düsentriebwerk | Durchschnittlich |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Solidworks Rallye-Auto | Durchschnittlich |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Bei Solidworks R8 und Rally Car bedeutet das für die Turing-Modelle einen leichten Leistungsabfall, bei Digger und Jet Engine gibt es jedoch einen großen Leistungssprung. Bei unseren Solidworks-Tests verwendeten wir den Beta-Anzeigemodus, der möglicherweise die Ursache für die ungewöhnliche Skalierung bei den Baugruppen Audi R8 und RallyCar ist.
Als nächstes folgt der Benchmark des Environmental Systems Research Institute (Esri). Esri ist ein Anbieter von Software für geografische Informationssysteme (GIS). Das Performance-Team von Esri hat seine PerfTool-Add-In-Skripte so konzipiert, dass ArcGIS Pro automatisch gestartet wird. Diese Anwendung verwendet eine „ZoomToBookmarks“-Funktion, um verschiedene vordefinierte Lesezeichen zu durchsuchen und eine Protokolldatei mit allen wichtigen Datenpunkten zu erstellen, die zur Vorhersage des Benutzererlebnisses erforderlich sind. Das Skript durchläuft die Lesezeichen automatisch dreimal, um das Caching (Speicher und Festplatten-Cache) zu berücksichtigen. Mit anderen Worten, dieser Benchmark simuliert eine starke grafische Nutzung, die man möglicherweise durch die ArcGIS Pro 2.3-Software von Esri sehen könnte.
Die Tests bestehen aus drei Hauptdatensätzen. Zwei davon sind 3D-Stadtansichten von Philadelphia, PA und Montreal, QC. Diese Stadtansichten enthalten texturierte 3D-Multipatch-Gebäude, die auf einem Geländemodell drapiert sind, sowie drapierte Luftbilder. Der dritte Datensatz ist eine 2D-Kartenansicht der Region Portland, OR. Diese Daten enthalten detaillierte Informationen zu Straßen, Grundstücken, Parks und Schulen, Flüssen, Seen und schattigem Gelände.
Betrachtet man die Zeichenzeit des Montreal-Modells, zeigte die NVIDIA Quadro RTX 4000 eine durchschnittliche Zeichenzeit von 00:01:31.284, während die durchschnittliche und minimale FPS 502.395 bzw. 180.699 betrug.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Ziehzeit | Durchschnittlich |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX4000 | 00:01:31.284 |
Quadro RTX5000 | 00:01:31.067 |
Durchschnittliche FPS | Durchschnittlich |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX4000 | 502.395 |
Quadro RTX5000 | 527.636 |
Mindest-FPS | Durchschnittlich |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX4000 | 180.699 |
Quadro RTX5000 | 190.775 |
Als nächstes kommt unser Philly-Modell, bei dem die RTX 4000 eine durchschnittliche Ziehzeit von 00:01:00.231 zeigte, während die durchschnittliche und minimale FPS 434.170 bzw. 196.825 betrug.
ESRI ArcGIS Pro 2.3 Philly | |
---|---|
Ziehzeit | Durchschnittlich |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX4000 | 00:01:00.231 |
Quadro RTX5000 | 00:01:01.111 |
Durchschnittliche FPS | Durchschnittlich |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX4000 | 434.170 |
Quadro RTX5000 | 531.315 |
Mindest-FPS | Durchschnittlich |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX4000 | 196.825 |
Quadro RTX5000 | 224.341 |
Unser letztes Modell stammt aus Portland. Hier hatte die RTX 4000 eine durchschnittliche Ziehzeit von 00:00:32.646. Der durchschnittliche FPS-Wert betrug 2,821.928, während der minimale FPS-Wert 1,083.260 betrug.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Ziehzeit | Durchschnittlich |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX4000 | 00:00:32.646 |
Quadro RTX5000 | 00:00:32.541 |
Durchschnittliche FPS | Durchschnittlich |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX4000 | 2,821.928 |
Quadro RTX5000 | 2,783.547 |
Mindest-FPS | Durchschnittlich |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX4000 | 1,083.260 |
Quadro RTX5000 | 1,007.309 |
Schlussfolgerung
Die NVIDIA Quadro RTX 4000 ist die GPU der unteren Turing-Architektur, aber das bedeutet nicht, dass sie nicht leistungsstark ist. Der RTX 4000 ist mit 2304 CUDA-Kernen und einer 8 GB GDDR6-GPU ausgestattet. Wie alle Quadro RTX-Modelle ist auch der 4000 in der Lage, beschleunigtes Raytracing, Deep Learning und erweitertes Shading in seinem zugänglichen Single-Slot-Formfaktor bereitzustellen. Dadurch können Kreativprofis schneller Erkenntnisse gewinnen und gleichzeitig ihre kreativen Bemühungen beschleunigen. Der RTX 4000 ist außerdem mit VirtualLink ausgestattet, das die Konnektivität mit hochauflösenden VR-Head-Mount-Displays der nächsten Generation vereinfacht.
Leistungstechnisch schnitt die RTX 4000 sehr gut ab, vor allem wenn man bedenkt, dass sie am unteren Ende der neuen GPUs liegt. In unserem LuxMark-Benchmark hat es sein Pascal-Pendant fast verdoppelt und sogar das P6000 übertroffen. In Arion hat die RTX 4000 die P4000 mehr als verdoppelt und die P6000 erneut deutlich übertroffen. In unseren Solidworks-Benchmarks übertraf die RTX 4000 die P4000 deutlich und glänzte im Digger- und Jet Engine-Benchmark besser. Bei ESRi hatte die RTX 4000 eine viel bessere Leistung als die P4000 (und in einigen Fällen die P5000), aber es gibt Workloads, bei denen die P6000 die bessere Leistung erbrachte. Man sollte bedenken, dass sich die RTX 4000 am unteren Ende der Turing-Architektur und die P6000 am höchsten Ende der Pascal-Architektur befindet.
Alles in allem ist die Quadro RTX 4000 eine willkommene Ergänzung zu NVIDIAs großer Palette beeindruckender GPUs und bietet sehr beeindruckende Leistungswerte für die Einsteigerkarte, obwohl sie nur etwa 900 US-Dollar kostet.
Besprechen Sie diese Rezension
Melden Sie sich für den StorageReview-Newsletter an