Bereits im August kündigte NVIDIA auf der SIGGRAPH eine völlig neue Grafikarchitektur, Turing, sowie neue Quadro RTX-GPUs an. Von den mehreren damals angekündigten neuen GPUs werden wir uns heute speziell mit der NVIDIA Quadro RTX 5000 GPU befassen. Gilt als die erste Raytracing-GPU, die auch Deep Learning und Advanced Shading nutzt. Der RTX 5000 ist für Workloads der nächsten Generation konzipiert und bietet das Potenzial, fotorealistische Szenen in Echtzeit wiederzugeben – ein Segen für Videoeditoren sowie Automobil- und Architekturdesigner.
Bereits im August kündigte NVIDIA auf der SIGGRAPH eine völlig neue Grafikarchitektur, Turing, sowie neue Quadro RTX-GPUs an. Von den mehreren damals angekündigten neuen GPUs werden wir uns heute speziell mit der NVIDIA Quadro RTX 5000 GPU befassen. Gilt als die erste Raytracing-GPU, die auch Deep Learning und Advanced Shading nutzt. Der RTX 5000 ist für Workloads der nächsten Generation konzipiert und bietet das Potenzial, fotorealistische Szenen in Echtzeit wiederzugeben – ein Segen für Videoeditoren sowie Automobil- und Architekturdesigner.
Die treibende Kraft hinter der neuen GPU-Welle ist die neue Turing-Architektur von NVIDIA. Das Unternehmen wird für seine GPU-Führerschaft geschätzt und baut darauf mit seiner neuen Kern-GPU-Architektur auf. Das Thema der Architektur ist etwas zu tiefgreifend, um hier näher darauf einzugehen, aber um es zusammenzufassen: Turing nutzt mehrere Hardware-Fortschritte, um beeindruckende neue Ergebnisse zu erzielen. Für das Raytracing nutzt die Architektur sogenannte RT-Kerne, die die Berechnung der Ausbreitung von Licht und Schall in 3D-Umgebungen um bis zu 10 Giga Rays pro Sekunde beschleunigen. Ein Streaming-Multiprozessor verbessert die Rasterleistung und fügt eine verbesserte Grafikpipeline und neue programmierbare Schattierungstechnologien hinzu. Turing verfügt über neue Tensorkerne, die 500 Billionen Tensoroperationen pro Sekunde ermöglichen. Und Turing ermöglicht es Benutzern, mehr CUDA-Kerne zu nutzen, um bis zu 16 Billionen Gleitkommaoperationen parallel mit 16 Billionen Ganzzahloperationen pro Sekunde zu unterstützen.
Die NVIDIA Quadro RTX 5000 richtet sich an kreative Profis, die schnell und effektiv an komplexen Projekten arbeiten müssen. Die GPU verfügt über 3,072 CUDA-Kerne, 384 Tensor-Kerne, 48 RT-Kerne und 16 GB GDDR6-Speicher. Diese beeindruckende Menge an Hardware ist in der Lage, komplexe Modelle und Szenen mit physikalisch korrekten Schatten, Reflexionen und Brechungen zu rendern. Die RTX 5000 unterstützt NVIDIA NVLink, sodass Benutzer ihren Speicher und ihre Leistung mit mehreren GPU-Konfigurationen skalieren können. Sofern auf ihrer Workstation Platz vorhanden ist, können Benutzer zwei Quadro RTX 5000-GPUs für eine Bandbreite von bis zu 50 GB/s und insgesamt 32 GB GDDR6-Speicher anschließen. Die GPU ist außerdem mit VirtualLink ausgestattet, das Konnektivität mit der nächsten Generation hochauflösender VR-Head-Mount-Displays bietet.
NVIDIA Quadro RTX 5000-Spezifikationen
Architektur | Nvidia Turing |
GPU-Speicher | 16GB GDDR6 |
Speicherschnittstelle | 256-bit |
Speicherbandbreite | Bis zu 448 GB/s |
ECC | Ja |
NVIDIA CUDA-Kerne | 3,072 |
NVIDIA Tensorkerne | 384 |
NVIDIA RT-Kerne | 48 |
Leistung mit einfacher Genauigkeit | 11.2 TFLOPS |
Tensorleistung | 89.2 TFLOPS |
NVIDIA NV-Link | Verbindet 2 Quadro RTX 5000 GPUs |
NVIDIA NVLink-Bandbreite | 50 GB/s (bidirektional) |
System Interface | PCI Express 3.0 x 16 |
Energieverbrauch | Gesamtleistung der Platine: 265 W Grafikleistung insgesamt: 230 W Thermische Lösung aktiv |
Formfaktor | 4.4 "H x 10.5" L, doppelter Steckplatz, volle Höhe |
Display-Anschlüsse | 4xDP 1.4, 1x USB-C |
Maximale Anzahl gleichzeitiger Anzeigen | 4x 4096×2160 bei 120 Hz 4x 5120×2880 bei 60 Hz 2x 7680×4320 bei 60 Hz |
Codierungs-/Decodierungs-Engines | 1X kodieren, 2X dekodieren |
VR Ready | Ja |
Grafik-APIs | DirectX 12.0 Shader Modell 5.1 OpenGL 4.5 Vulkan 1.0 APIs berechnen CUDA Directcompute OpenCL |
Kennzahlen
Um die Leistung der neuen Architektur in der NVIDIA Quadro RTX 5000-GPU zu testen, haben wir sie in unserer Lenovo ThinkSystem P920-Workstation mit Windows 10 installiert. Für einen umfassenden Überblick über die Leistung jeder Karte haben wir mehrere Branchen-Benchmarks und GPU-Beschleunigung genutzt Software, die die zu testende Karte voll ausnutzen kann. Wir werden es nicht nur mit der NVIDIA Quadro RTX 4000 vergleichen, die die Turning-Architektur teilt, sondern auch mit der vorherigen Pascal Quadro-Reihe einschließlich der P6000, der P5000und der P4000. Dabei geht es weniger um das, was besser ist, sondern eher um das, was man mit der gewählten GPU erwarten kann.
Um eine bessere Vorstellung davon zu bekommen, wie sich diese GPUs auf verschiedenen Architekturen skaliert haben, haben wir die folgende Tabelle eingefügt, die die RTX-Familie in ihrer heutigen Form zusammenfasst. Die RTX 5000 sitzt in einem mittleren Steckplatz, eine Stufe über der Einstiegs-RTX 4000 und unter den beiden leistungsstärkeren Geschwistern RTX 6000 und RTX 8000.
NVIDIA Quadro-GPUs | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPU-Speicher | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Speicherschnittstelle | 256-bit | 256-bit | 384-bit | 384-bit |
Speicherbandbreite | BIS zu 416 GB/s | Bis zu 448 GB/s | Bis zu 672 GB/s | Bis zu 672 GB/s |
NVIDIA CUDA-Kerne | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIA Tensorkerne | 288 | 384 | 576 | 576 |
NVIDIA RT-Kerne | 36 | 48 | 72 | 72 |
Leistung mit einfacher Genauigkeit | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Tensorleistung | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Unser erster Benchmark ist das plattformübergreifende OpenCL-Benchmark-Tool LuxMark. LuxMark basiert auf der LuxCore-API und wird als Werbekomponente der LuxCoreRender-Suite angeboten. Es verwendet einen neuen Mikrokernel-basierten OpenCL-Pfad-Tracer als Rendering-Generator für seinen Benchmark und bietet eine einzigartige Möglichkeit, die in einer bestimmten Workstation installierte GPU zu belasten.
LuxMark | |
---|---|
GPUs | Ergebnisse |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Während die Pascal-GPUs den LuxMark mit guten Ergebnissen abschlossen, ist bei den Turning-GPUs ein deutlicher Leistungssprung zu erkennen. Kein Wunder, dass die RTX 5000 mit einer Punktzahl von 29,404 die beste Leistung erbrachte.
Als nächstes kommt Arion, ein von RandomControl entwickeltes CUDA-Benchmarking-Tool, das es Workstations ermöglicht, CPUs oder GPUs in einer Rendering-Anwendung zu belasten. ArionBench ist ein auf der Arion 2-Technologie basierendes Softwaretool, das CPU/GPUs durch die Simulation des Lichtflusses in einer 3D-Szene einer starken Belastung aussetzt.
Arion | |
---|---|
GPUs | Ergebnisse |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Ein weiterer großer Punktesprung von Pascal zu Turing, wobei die RTX 5000 den Rest weit überholte und deutlich schneller war als die P6000.
Unser nächster Benchmark nutzt SolidWorks 2019 und vier 3D-Modelle, die einen Audi R8, einen Baubagger, ein Düsentriebwerk sowie ein Rallyeauto abdecken. Solidworks ist eine branchenführende GPU-beschleunigte 3D-CAD-Modellierungsanwendung, die auf Windows-basierten Systemen läuft. SolidWorks wird von Dassault Systèmes entwickelt und von über zwei Millionen Ingenieuren und mehr als 165,000 Unternehmen weltweit verwendet. Für Benchmarking-Zwecke nutzen wir die neue Funktion „Performance Pipeline“ in SolidWorks 2019. Diese Architektur bietet eine reaktionsschnellere Echtzeitanzeige, insbesondere für große Modelle. Es nutzt modernes OpenGL (4.5) und hardwarebeschleunigtes Rendering, um beim Schwenken, Zoomen oder Drehen großer Modelle ein hohes Maß an Detailgenauigkeit und Bildrate beizubehalten.
Nachdem jedes Modell gerendert wurde, dreht unser Skript jedes Modell fünfmal und misst die Zeit, die zum Abschließen dieser Aufgabe erforderlich ist. Anschließend wird dieser Wert durch die Anzahl der gerenderten Frames dividiert und der durchschnittliche FPS-Wert (Frames per Section) berechnet.
Solidworks | |
---|---|
Solidworks R8 | Durchschnittliche FPS |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Solidworks Digger | Durchschnittliche FPS |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Solidworks-Düsentriebwerk | Durchschnittliche FPS |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Solidworks Rallye-Auto | Durchschnittliche FPS |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Es ist interessant, einen leichten Leistungsabfall der Turing-GPUs in Solidworks R8 und Rally Car im Vergleich zum Pascal zu beobachten, obwohl diese Dateien die neueren GPUs möglicherweise nicht vollständig nutzen. Der RTX 5000 lieferte in den Bereichen Digger und Jet Engine eine überlegene Leistung und übertraf die anderen bei weitem. Bei unseren Solidworks haben wir den Beta-Anzeigemodus verwendet, der möglicherweise die Ursache für die ungewöhnliche Skalierung ist, die bei den Audi R8- und RallyCar-Baugruppen zu sehen ist.
Als nächstes folgt der Benchmark des Environmental Systems Research Institute (Esri). Esri ist ein Anbieter von Software für geografische Informationssysteme (GIS). Das Performance-Team von Esri hat seine PerfTool-Add-In-Skripte so konzipiert, dass ArcGIS Pro automatisch gestartet wird. Diese Anwendung verwendet eine „ZoomToBookmarks“-Funktion, um verschiedene vordefinierte Lesezeichen zu durchsuchen und eine Protokolldatei mit allen wichtigen Datenpunkten zu erstellen, die zur Vorhersage des Benutzererlebnisses erforderlich sind. Das Skript durchläuft die Lesezeichen automatisch dreimal, um das Caching (Speicher und Festplatten-Cache) zu berücksichtigen. Mit anderen Worten, dieser Benchmark simuliert eine starke grafische Nutzung, die man möglicherweise durch die ArcGIS Pro 2.3-Software von Esri sehen könnte.
Die Tests bestehen aus drei Hauptdatensätzen. Zwei davon sind 3D-Stadtansichten von Philadelphia, PA und Montreal, QC. Diese Stadtansichten enthalten texturierte 3D-Multipatch-Gebäude, die auf einem Geländemodell drapiert sind, sowie drapierte Luftbilder. Der dritte Datensatz ist eine 2D-Kartenansicht der Region Portland, OR. Diese Daten enthalten detaillierte Informationen zu Straßen, Grundstücken, Parks und Schulen, Flüssen, Seen und schattigem Gelände.
Betrachtet man die Zeichenzeit des Montreal-Modells, zeigte die NVIDIA Quadro RTX 5000 eine durchschnittliche Zeichenzeit von 00:01:31.067, während die durchschnittliche und minimale FPS 527.636 bzw. 190.775 betrug.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Ziehzeit | Durchschnittlich |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX4000 | 00:01:31.284 |
Quadro RTX5000 | 00:01:31.067 |
Durchschnittliche FPS | Durchschnittlich |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX4000 | 502.395 |
Quadro RTX5000 | 527.636 |
Mindest-FPS | Durchschnittlich |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX4000 | 180.699 |
Quadro RTX5000 | 190.775 |
Als nächstes kommt unser Philly-Modell, bei dem die RTX 5000 eine durchschnittliche Ziehzeit von 00:01:01.111 zeigte, während die durchschnittliche und minimale FPS 531.315 bzw. 224.341 betrug.
ESRI ArcGIS Pro 2.3 Philly | |
---|---|
Ziehzeit | Durchschnittlich |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX4000 | 00:01:00.231 |
Quadro RTX5000 | 00:01:01.111 |
Durchschnittliche FPS | Durchschnittlich |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX4000 | 434.170 |
Quadro RTX5000 | 531.315 |
Mindest-FPS | Durchschnittlich |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX4000 | 196.825 |
Quadro RTX5000 | 224.341 |
Unser letztes Modell stammt aus Portland. Hier hatte die RTX 5000 eine durchschnittliche Ziehzeit von 00:00:32.541. Der durchschnittliche FPS-Wert betrug 2,783.547, während der minimale FPS-Wert 1,007.309 betrug.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Ziehzeit | Durchschnittlich |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX4000 | 00:00:32.646 |
Quadro RTX5000 | 00:00:32.541 |
Durchschnittliche FPS | Durchschnittlich |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX4000 | 2,821.928 |
Quadro RTX5000 | 2,783.547 |
Mindest-FPS | Durchschnittlich |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX4000 | 1,083.260 |
Quadro RTX5000 | 1,007.309 |
Schlussfolgerung
Die NVIDIA Quadro RTX 5000 ist eine der neueren GPUs des Unternehmens, die auf der Turing-Architektur basieren. Turing dürfte eine völlig neue Sicht auf die GPU-Architektur sein, da NVIDIA mit Blick auf zukünftige Entwicklungen jetzt Änderungen vornehmen möchte. Der RTX 5000 richtet sich an Kreativprofis, die komplexe Projekte haben, die effizientes und schnelles Arbeiten erfordern. Er verfügt über beeindruckende Hardware unter der Haube, darunter 3,072 CUDA-Kerne, 384 Tensor-Kerne, 48 RT-Kerne und 16 GB GDDR6-Speicher. Für diejenigen, die noch mehr GPU-Leistung benötigen, kann die RTX über NVIDIA NVLink mit einer zweiten GPU skaliert werden.
Für alle seine Komponenten, die zu einer überlegenen Leistung führen sollen, haben wir es einer Flut neuer und alter Tests unterzogen, nur um zu sehen, was es leisten kann. Es überrascht niemanden, dass die NVIDIA Quadro RTX 5000 in den meisten unserer Tests die beste Leistung erbrachte. Bei LuxMark und Arion hat die RTX 5000 die Ergebnisse der P5000 mehr als verdoppelt. Die RTX 5000 zeigte eine starke Leistung in den Solidworks Digger- und Jet Engine-Benchmarks. Man sollte bedenken, dass die RTX 5000, so leistungsstark sie auch ist, nicht die Spitzenklasse der Turing-GPUs darstellt.
Wenn ein Kreativprofi in den meisten Bereichen nach einem größeren Leistungssprung sucht, ist die NVIDIA Quadro RTX 5000 genau das Richtige für Sie. Unsere obigen Leistungsergebnisse heben die Bereiche hervor, in denen die RTX 5000 glänzt, und einige Stellen, an denen eine Pascal-basierte GPU ausreichend gut abschneidet. Insgesamt hat NVIDIA mit der RTX-Familie hervorragende Arbeit geleistet und die Grenzen dessen, was Kreativen auf einem Desktop zur Verfügung steht, weiter verschoben. Die RTX 5000 wiederum füllt das Mittelklasse-Angebot gut aus und bietet ein gutes Gleichgewicht zwischen Leistung und Preis.
Besprechen Sie diese Rezension
Melden Sie sich für den StorageReview-Newsletter an