Die NVIDIA RTX A4000 ist Teil der neuesten professionellen Desktop-GPU-Reihe des Unternehmens, die für Desktop-Workstations gedacht ist, die hohe Leistung für Echtzeit-Raytracing, KI-beschleunigte Berechnungen und Hochleistungsgrafiken benötigen. NVIDIA behauptet, dass der A4000 unter Nutzung der RTX-Architektur der zweiten Generation die leistungsstärkste Single-Slot-GPU ist, die auf dem Markt für Profis erhältlich ist.
Die NVIDIA RTX A4000 ist Teil der neuesten professionellen Desktop-GPU-Reihe des Unternehmens, die für Desktop-Workstations gedacht ist, die hohe Leistung für Echtzeit-Raytracing, KI-beschleunigte Berechnungen und Hochleistungsgrafiken benötigen. NVIDIA behauptet, dass der A4000 unter Nutzung der RTX-Architektur der zweiten Generation die leistungsstärkste Single-Slot-GPU ist, die auf dem Markt für Profis erhältlich ist.
Der A4000 sitzt direkt hinter dem RTX A5000 und RTX-A6000 in NVIDIAs neuer Reihe professioneller RTX-Karten mit 48 RT-Kernen (2nd gen), 192 Tensorkerne der dritten Generation und 6,144 CUDA-Kerne mit 16 GB Grafikspeicher. Während NVIDIA den Namen Quadro aufgab, um seine professionelle Produktlinie hervorzuheben, verfügt der RTX A4000 immer noch über dieselben professionellen Funktionen, Hardware- und Softwarezertifizierungen und zertifizierten Treiber, für die die Quadro-Produktreihe bekannt war.
Für die Konnektivität verfügt der 4.4 Zoll hohe x 9.5 Zoll lange A4000 über vier DisplayPort 1.4a-Anschlüsse und den üblichen 1x 6-Pin-PCIe-Stromanschluss. Die Belüftung verläuft oben an jedem DisplayPort und auf der Vorderseite der Karte, während sich auf der gegenüberliegenden Seite ein kleinerer Lüfter befindet.
NVIDIA RTX A4000 vs. Quadro RTX 4000
NVIDIA betrachtet die RTX A4000 als Nachfolger Quadro RTX4000, eine in die Jahre gekommene Karte, die zum Zeitpunkt dieser Rezension einige Jahre alt ist. In unserem Testbericht aus dem Jahr 2019 zeigte die RTX 4000 eine für eine Einsteigerkarte sehr beeindruckende Leistung, was sie zu einer großartigen Ergänzung des beeindruckenden Portfolios des Unternehmens macht, obwohl sie bei ihrer Veröffentlichung einen Preis von etwa 900 US-Dollar hatte. Angesichts der Fortschritte, die NVIDIA kürzlich in seiner GPU-Architektur gemacht hat, sind wir jedoch immer gespannt, was sie mit ihren Karten der Workstation-Klasse zu bieten haben.
Sie werden sofort sehen, dass der A4000 den GPU-Speicher der Quadro-Karte auf 16 GB verdoppelt und gleichzeitig die Anzahl der CUDA-Kerne fast verdreifacht. In Verbindung mit einer leichten Erhöhung der Speicherbandbreite (448 GB/s) sieht der neue A4000 bereits deutlich besser aus. Diese Spezifikationen passen eher zur RTX 3070, der leistungsstarken Desktop-Consumer-Karte von NVIDIA.
NVIDIA Ampere
Wie wir in unserer Testbericht zur RTX A6000ist das bedeutendste Upgrade für die professionellen Grafikkarten der nächsten Generation des Unternehmens NVIDIA Ampere. Hier liegt der wahre Leistungssprung. Highlights dieser neuen Architektur, die den maßgeschneiderten 8-nm-NVIDIA-Prozess von Samsung mit 28 Milliarden Transistoren nutzt. Es verfügt außerdem über einen verbesserten Streaming-Multiprozessor und Raytracing-Kerne der zweiten Generation (die die Raytracing-Hardwarebeschleunigung verbessern) sowie Tensorkerne der dritten Generation, wobei letzterer die KI-Inferenzleistung und DLSS verbessert, was zu einer besseren Leistung bei höheren Auflösungen führt.
Die Ampere-Architektur erhöht außerdem die CUDA-Kerne um bis zu das Doppelte der Gleitkommazahl mit einfacher Genauigkeit im Vergleich zu Modellen der letzten Generation. Dies bedeutet spürbare Leistungsverbesserungen in Bereichen wie der 3D-Modellentwicklung und Aufgaben wie der Desktop-Simulation für computergestütztes Engineering.
Mit einer dreijährigen Garantie kostet die NVIDIA RTX A3 je nach Marke etwa 4000 US-Dollar.
NVIDIA RTX A4000-Spezifikationen
GPU-Speicher | 16 GB GDDR6 |
Speicherschnittstelle | 256-bit |
Speicherbandbreite | 448 GB / s |
Fehlerkorrekturcode (ECC) | Ja |
Auf der NVIDIA Ampere-Architektur basierende CUDA-Kerne | 6,144 |
NVIDIA-Tensorkerne der dritten Generation | 192 |
NVIDIA RT Cores der zweiten Generation | 48 |
Leistung mit einfacher Genauigkeit | 19.2 TFLOPS3 |
RT Core-Leistung | 37.4 TFLOPS3 |
Tensorleistung | 153.4 TFLOPS4 |
Systemschnittstelle | PCI Express 4.0 x16 |
Leistungsaufnahme | Gesamtleistung der Platine: 140 W |
Thermische Lösung | Aktives |
Formfaktor | 4.4 Zoll H x 9.5 Zoll L,
einzelner Steckplatz |
Display-Anschlüsse | 4x DisplayPort 1.4a |
Maximale gleichzeitige Anzeige | 4x 4096 x 2160 @ 120 Hz,
4x 5120 x 2880 @ 60 Hz, 2x 7680 x 4320 bei 60 Hz |
Stecker | 1x 6-Pin PCIe |
Codierungs-/Decodierungs-Engines | 1x kodieren, 1x dekodieren (+AV1 dekodieren) |
VR bereit | Ja |
Grafik-APIs | DirectX 12.075, Shader-Modell 5.175,
OpenGL 4.686, Vulkan 1.26 |
APIs berechnen | CUDA, DirectCompute, OpenCL™ |
Nvidia RTX A4000 Kennzahlen
Um seine Leistung zu beurteilen, haben wir den RTX A4000 einer Reihe ressourcenintensiver Tests unterzogen und ihn mit dem höherklassigen RTX A6000 verglichen, um Ihnen die Unterschiede zwischen den beiden Enden des RTX-Architekturspektrums der zweiten Generation aufzuzeigen. Wir haben sowohl den A4000 als auch den A6000 in einem installiert Lenovo ThinkStation P620 und HP ZCentral 4R zum Prüfen.
HP ZCentral 4R:
- Intel Xeon 2295 (3.0 GHz Grundfrequenz, bis zu 4.6 GHz mit Intel vPro Technologie)
- 64 GB DDR4-2933 ECC SDRAM
- 1TB M.2 SSD
Lenovo ThinkStation P620:
- AMD Ryzen Threadripper Pro 3995WX Prozessor (2.70 GHz, bis zu 4.20 GHz Max Boost, 64 Kerne, 128 Threads, 32 MB Cache)
- 64GB von DDR4 RAM
- 1 TB PM981 SSD
SPECviewperf 2020
An erster Stelle steht der SPECviewperf 2020 Benchmark, der weltweite Standard zur Messung der Grafikleistung professioneller Anwendungen, die unter den Anwendungsprogrammierschnittstellen OpenGL und Direct X laufen. Die Ansichtssätze (oder Benchmarks) stellen Grafikinhalte und -verhalten tatsächlicher Anwendungen dar, ohne dass die Anwendungen selbst installiert werden müssen. Zu diesen Ansichtssätzen gehören 3D Max, CATIA, Creo, Energy, Maya, Medical, Siemens NX und Solidworks.
Ansichtssätze | NVIDIA RTX 4000 Lenovo ThinkStation P620 |
Nvidia RTX A4000 HP ZCentral 4R |
Nvidia RTX A6000 Lenovo ThinkStation P620 | NVIDIA RTX A6000 HP ZCentral 4R |
3dsmax-07 | 90.29 | 90.8 | 131.96 | 127.89 |
Catia-06 | 67.54 | 58.75 | 90.99 | 75.32 |
Creo-03 | 103.84 | 90.65 | 125.88 | 99.54 |
Energie-03 | 21.97 | 22.16 | 42.22 | 38.83 |
Maya-06 | 224.81 | 215.15 | 314.82 | 273.01 |
Medizinisch-03 | 22.55 | 21.53 | 34.87 | 30.58 |
Snx-04 | 322.7 | 328.37 | 450.72 | 422.01 |
SW-05 | 107.06 | 108.76 | 161.4 | 152.19 |
Bei diesem Benchmark zeigte der RTX A4000 aufgrund der neuen Ampere-Architektur sowohl im Lenovo- als auch im HP-System (die sehr ähnliche Ergebnisse zeigten) eine hervorragende Leistung. Den gleichen Trend werden Sie auch bei den übrigen Benchmarks feststellen.
Obwohl der Leistungsunterschied zum High-End-Modell (A6000) manchmal erheblich ist, bietet der A4000 immer noch ausreichend Leistung für die intensivsten Anwendungsfälle.
Als nächstes führten wir SPECworkstation3 durch, einen Test, der auf Benchmarks spezialisiert ist, die zum Testen aller wichtigen Aspekte der Workstation-Leistung entwickelt wurden; Es verwendet über 30 Workloads, um CPU, Grafik, E/A und Speicherbandbreite zu testen. Die Arbeitsbelastungen fallen in breitere Kategorien wie Medien und Unterhaltung, Finanzdienstleistungen, Produktentwicklung, Energie, Biowissenschaften und allgemeine Abläufe. Wir werden für jede einzelne die Ergebnisse einer breiten Kategorie auflisten, im Gegensatz zu den einzelnen Arbeitslasten. Die Ergebnisse sind ein Durchschnitt aller einzelnen Arbeitsbelastungen in jeder Kategorie.
SPECworkstation3
Kategorie | NVIDIA RTX A4000 Lenovo ThinkStation P620 | NVIDIA RTX A4000 HP ZCentral 4R |
NVIDIA RTX A6000 Lenovo ThinkStation P620 | NVIDIA RTX A6000 HP ZCentral 4R |
MICH | 5.87 | 3.37 | 6.04 | 3.49 |
ProdDev | 5.01 | 3.35 | 5.49 | 3.63 |
LifeScience | 3.99 | 3.51 | 4.61 | 3.76 |
Energie | 4.68 | 2.58 | 5.58 | 2.79 |
FSI | 9.46 | 3.96 | 9.49 | 3.38 |
GeneralOps | 2.2 | 1.59 | 2.14 | 1.63 |
GPU berechnen | 5.25 | 5.19 | 7.44 | 7.22 |
Insgesamt sahen wir beim Einbau im P4000 eine beeindruckendere Leistung des A620, der manchmal sogar ähnliche oder sogar bessere Ergebnisse im Vergleich zum A6000 lieferte (insbesondere in den Kategorien „Allgemeiner Betrieb“ und „Finanzdienstleistungen“). Beim Einbau in die HP ZCentral-Workstation zeigte der A4000 mit Ausnahme der GPU-Rechenkategorie deutlich niedrigere Werte.
Institut für Umweltsystemforschung (Esri)
Als nächstes folgt der Benchmark des Environmental Systems Research Institute (Esri). Esri ist ein Anbieter von Geographic Information System (GIS)-Software, während sein Performance-Team seine PerfTool-Add-In-Skripte so entwickelt hat, dass ArcGIS Pro automatisch gestartet wird.
Diese Anwendung verwendet eine „ZoomToBookmarks“-Funktion, um verschiedene vordefinierte Lesezeichen zu durchsuchen und eine Protokolldatei mit allen wichtigen Datenpunkten zu erstellen, die zur Vorhersage des Benutzererlebnisses erforderlich sind. Das Skript durchläuft die Lesezeichen automatisch dreimal, um das Caching (Speicher und Festplatten-Cache) zu berücksichtigen. Mit anderen Worten, dieser Benchmark simuliert eine starke grafische Nutzung, die man möglicherweise durch die ArcGIS Pro-Software von Esri sehen kann.
Die Tests bestehen aus drei Hauptdatensätzen. Zwei davon sind 3D-Stadtansichten von Philadelphia, Pennsylvania, und Montreal, QC. Diese Stadtansichten enthalten texturierte 3D-Multipatch-Gebäude, die auf einem Geländemodell drapiert sind, sowie drapierte Luftbilder. Der dritte Datensatz ist eine 2D-Kartenansicht der Region Portland OR. Diese Daten enthalten detaillierte Informationen zu Straßen, Landnutzungsparzellen, Parks und Schulen, Flüssen, Seen und schattigem Gelände.
An erster Stelle steht Montreal. Hier erreichte die RTX A4000 einen durchschnittlichen FPS von 471.31 und einen minimalen FPS von 194.66 im P620. Die HP ZCentral 4R-Konfiguration zeigte einen durchschnittlichen FPS von 349.32 und einen minimalen FPS von 167.86.
ESRI ArcGIS Pro 2.3 Montreal | |
Durchschnittliche FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 471.31 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 349.32 |
Nvidia RTX A6000 | 614.03 |
Mindest-FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 194.66 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 167.86 |
Nvidia RTX A6000 | 238.18 |
Als nächstes ist Philly an der Reihe. Hier erreichte die RTX A4000 einen durchschnittlichen FPS von 323.15 und einen minimalen FPS von 164.68 im P620. Die HP ZCentral 4R-Konfiguration zeigte einen durchschnittlichen und minimalen FPS von 363.24 bzw. 202.02.
ESRI ArcGIS Pro 2.3 Philly | |
Durchschnittliche FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 323.15 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 363.24 |
Nvidia RTX A6000 | 542.70 |
Mindest-FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 164.68 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 202.02 |
Nvidia RTX A6000 | 237.54 |
Unser letztes Modell stammt aus Portland, wo die RTX A4000 eine durchschnittliche FPS von 2,305.81 und eine minimale FPS von 790.43 im P620 hatte. Die HP ZCentral 4R-Konfiguration zeigte einen durchschnittlichen und minimalen FPS von 1,694.04 bzw. 637.65.
ESRI ArcGIS Pro 2.3 Portland | |
Durchschnittliche FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 2,305.81 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 1,694.04 |
Nvidia RTX A6000 | 2,756.82 |
Mindest-FPS | |
NVIDIA RTX A4000 (ThinkStation P620) | 790.43 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 637.65 |
Nvidia RTX A6000 | 906.17 |
Mixer
Als nächstes kommt der allgegenwärtige Blender, eine Open-Source-3D-Modellierungsanwendung. Dieser Benchmark wurde mit dem Dienstprogramm Blender Benchmark ausgeführt. Als Rendermethode wurde NVIDIA OptiX gewählt, im Gegensatz zu CUDA, da der A4000 (wie der höherpreisige A6000) RTX nutzen kann. In diesem in Sekunden gemessenen Benchmark gilt: Je niedriger, desto besser.
Obwohl der A6000 im P620 und HP ZCentral 4R fast doppelt so schnell war, war dies zu erwarten und der A4000 zeigte dennoch Ergebnisse der nächsten Generation für seine Klasse.
LuxMark
LuxMark ist ein plattformübergreifendes OpenCL-Benchmarking-Tool von denjenigen, die die Open-Source-3D-Rendering-Engine LuxRender betreiben. Dieses Tool untersucht die GPU-Leistung in den Bereichen 3D-Modellierung, Beleuchtung und Videoarbeit. Für diesen Test haben wir die neueste Version, v4alpha0, verwendet. Bei LuxMark gilt: Höher ist besser, wenn es um die Punktzahl geht.
Im Lenovo P620 erzielte die RTX A4000 in der Kategorie „Lebensmittelwiedergabe“ 4,627 Punkte, während Hallbench 12,314 Punkte erzielte. Diese lagen hinter den meisten getesteten Laufwerken, aber auch hier waren die Ergebnisse immer noch gut, da die anderen getesteten GPUs mit leistungsstärkeren Komponenten ausgestattet sind.
In einem HP ZCentral 4R erzielte der RTX A4000 eine Punktzahl von 12,117 bzw. 4,540 in den Kategorien „Lebensmittel“ und „Hallbench“.
OctaneBench
Zuletzt werfen wir einen Blick auf OctaneBench. Dies ist ein Benchmarking-Dienstprogramm für OctaneRender und einen anderen 3D-Renderer mit RTX-Unterstützung (ähnlich V-Ray).
RTX A4000 Gesamtpunktzahl: 392.47 | |||||
Lenovo ThinkStation P620 | |||||
Szene | Kernel | Frau/s | Ratio | Gewicht | Score |
Innenraum (von Julia Lynen) | Infokanäle | 239.64 | 4.651 | 10 | 11.63 |
Innenraum (von Julia Lynen) | direkte Beleuchtung | 71.47 | 4.015 | 40 | 40.15 |
Innenraum (von Julia Lynen) | Pfadverfolgung | 35.13 | 4.113 | 50 | 51.41 |
Idee (von Julio Cayetano) | Infokanäle | 247.17 | 2.874 | 10 | 7.19 |
Idee (von Julio Cayetano) | direkte Beleuchtung | 66.43 | 3.156 | 40 | 31.56 |
Idee (von Julio Cayetano) | Pfadverfolgung | 60.06 | 3.099 | 50 | 38.74 |
ATV (von Jürgen Aleksejev) | Infokanäle | 223.54 | 7.121 | 10 | 17.80 |
ATV (von Jürgen Aleksejev) | direkte Beleuchtung | 67.25 | 4.421 | 40 | 44.21 |
ATV (von Jürgen Aleksejev) | Pfadverfolgung | 57.24 | 4.430 | 50 | 55.38 |
Box (von Enrico Cerica) | Infokanäle | 259.13 | 3.941 | 10 | 9.85 |
Box (von Enrico Cerica) | direkte Beleuchtung | 55.13 | 3.983 | 40 | 39.83 |
Box (von Enrico Cerica) | Pfadverfolgung | 48.12 | 3.578 | 50 | 44.72 |
RTX A4000 Gesamtpunktzahl: 391.72 | |||||
HP ZCentral 4R | |||||
Szene | Kernel | Frau/s | Ratio | Gewicht | Score |
Innenraum (von Julia Lynen) | Infokanäle | 238.19 | 4.623 | 10 | 11.56 |
Innenraum (von Julia Lynen) | direkte Beleuchtung | 71.49 | 4.017 | 40 | 40.17 |
Innenraum (von Julia Lynen) | Pfadverfolgung | 35.14 | 4.114 | 50 | 51.43 |
Idee (von Julio Cayetano) | Infokanäle | 244.42 | 2.842 | 10 | 7.11 |
Idee (von Julio Cayetano) | direkte Beleuchtung | 66.26 | 3.148 | 40 | 31.48 |
Idee (von Julio Cayetano) | Pfadverfolgung | 59.98 | 3.095 | 50 | 38.68 |
ATV (von Jürgen Aleksejev) | Infokanäle | 222.32 | 7.083 | 10 | 17.71 |
ATV (von Jürgen Aleksejev) | direkte Beleuchtung | 67.12 | 4.413 | 40 | 44.13 |
ATV (von Jürgen Aleksejev) | Pfadverfolgung | 57.19 | 4.426 | 50 | 55.33 |
Box (von Enrico Cerica) | Infokanäle | 257.61 | 3.918 | 10 | 9.80 |
Box (von Enrico Cerica) | direkte Beleuchtung | 54.97 | 3.971 | 40 | 39.71 |
Box (von Enrico Cerica) | Pfadverfolgung | 48.02 | 3.570 | 50 | 44.63 |
Hier sehen wir eine Gesamtpunktzahl von 392.47 bzw. 391.72, wenn sie in den Workstations von HP und Lenovo eingesetzt werden. Das ist etwa die Hälfte dessen, wozu der A8000 fähig ist; Für eine Einsteigerkarte ist es jedoch ein beeindruckendes Ergebnis, das den Vorgänger deutlich übertrifft.
Im Vergleich zu High-End-Consumer-Grade-Karten bewertete die offizielle OctaneBench-Website die leistungsstarken RTX 3070 und 3060 TI und RTX 3080 (Laptop-Modell) mit 400 bzw. 376 Punkten, während die Quadro RTX4000 zeigten nur 228 in ihren Charts.
Schlussfolgerung
Der RTX A4000 ist NVIDIAs neueste Midrange-Version aus seinem Portfolio professioneller GPUs, die auf der RTX-Architektur der zweiten Generation basieren. Während die A6000 ein ultimativer Leistungsträger zu einem Premium-Preis ist, ist die neue A4000 die günstigste Karte der Reihe und verfügt über 6,144 CUDA-Verarbeitungskerne, 48 RT-Kerne der nächsten Generation, HDCP 2.2-Unterstützung und die PCI Express 4.0 x16-Schnittstelle. Außerdem können maximal vier 4096 x 2160-Displays bei 120 Hz angeschlossen werden. Diese Karte ist für Berufstätige gedacht, die bescheidenere Anforderungen und ein kleineres Budget haben, obwohl sie dennoch ein breites Spektrum an ressourcenintensiven beruflichen Arbeitsbelastungen bewältigen kann.
NVIDIA gibt an, dass es sich im Wesentlichen um einen Ersatz der Quadro RTX 4000 handelt; Aber das ist sicherlich eine Untertreibung, denn der neue A4000 übertrifft es in jeder Hinsicht. Die Leistung entspricht eher der Desktop-Version der begehrten und leistungsstarken RTX 3070. Allerdings verdoppelt die neue NVIDIA-Karte die GPU-Speichergröße der RTX 4000 auf 16 GB GDDR6, was ihr eine deutlich höhere Leistung ermöglicht beim Umgang mit komplexen 3D-Datensätzen.
Wie bereits erwähnt, ist dieser deutliche Leistungsschub in erster Linie auf NVIDIA Ampere zurückzuführen, eine Architektur der nächsten Generation, die Samsungs maßgeschneiderten 8-nm-NVIDIA-Prozess nutzt. Es zeichnet sich außerdem durch einen verbesserten Streaming-Multiprozessor, Raytracing-Kerne der 2. Generation und eine deutlich bessere Raytracing-Hardwarebeschleunigung aus.
Darüber hinaus verwendet Ampere Tensorkerne der 3. Generation, um die KI-Inferenzleistung zu verbessern, während DLSS zu einer spürbar besseren Leistung bei höheren Auflösungen führt. Ampere hat noch viel mehr zu bieten, und das alles bedeutet einfach, dass die RTX A4000 (wie auch die A8000) einen großen Fortschritt in der GPU-Technologie darstellt und selbst Einstiegskarten wie diese im Vergleich zur Vorgängergeneration enorme Leistungssteigerungen vorweisen können. Mit dieser Version gibt NVIDIA denjenigen, die sich High-End-Workstation-GPUs nicht leisten können, die Möglichkeit, auf diese beeindruckende Architektur zuzugreifen.
Für wen ist die RTX A4000 geeignet? Ingenieure und Architekten, die fortschrittliche professionelle Anwendungen verwenden und keine Workstation-GPU der Spitzenklasse benötigen, werden im A4000 mit Sicherheit die ideale Wahl für ihre Arbeitslasten finden. Wer die bestmögliche Leistung seiner Workstation benötigt (und dazu noch ein viel größeres Budget hat), könnte sich für das Flaggschiff von NVIDIA entscheiden RTX-A6000 und A5000, der zwischen den beiden liegt.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed