NVIDIA GeForce RTX 5090 im Test: Markteinführung am 30. Januar 2025, UVP 1,999 US-Dollar. Wird die 5090 Hochleistungs-Gaming und KI-Workloads neu definieren?
Die NVIDIA GeForce RTX 5090, die am 30. Januar 2025 mit einem UVP von 1,999 US-Dollar auf den Markt kommt, wird Hochleistungs-Gaming und KI-Workloads neu definieren. Diese Flaggschiff-GPU basiert auf der Blackwell-Architektur und erweitert die Grenzen der Rechenleistung mit 32 GB GDDR7-Speicher, einem 512-Bit-Speicherbus und einer massiven Steigerung der CUDA-, Tensor- und RT-Kernleistung. Entscheidend ist, dass NVIDIA mehrere KI-Ansprüche für die 50er-Serie-Plattform hat, die in diesem Test untersucht werden sollen.
Das Herzstück der Weiterentwicklungen der RTX 5090 ist DLSS 4 mit Multi Frame Generation, das KI nutzt, um bis zu drei zusätzliche Frames pro gerendertem Frame zu generieren und so bei unterstützten Titeln eine bis zu 8-fache Leistungssteigerung zu erzielen. Das neue Transformer-basierte KI-Modell verbessert Ray Reconstruction, Super Resolution und DLAA, verbessert die visuelle Wiedergabetreue erheblich und reduziert gleichzeitig die Latenz durch NVIDIA Reflex 2.
Über die offensichtlichen Gaming-Vorteile hinaus wird die RTX 5090 als KI-Kraftpaket angepriesen, das generative KI-Workflows mit nativer FP4-Präzision beschleunigt und den Modellspeicherbedarf im Vergleich zu früheren FP16-Implementierungen halbiert. Wir haben uns kürzlich die RTX 4090 vs. RTX 6000 Ada um zu sehen, ob eine auf Spiele ausgerichtete Karte gegen ein Produktivitätskraftwerk für Workstation-basierte KI-Workloads bestehen kann. Die Ergebnisse zeigen im Allgemeinen die Dominanz der 6000 Ada, aber für diejenigen mit kleinem Budget schnitt die 4090 überraschend gut ab. Die neue RTX 5090 zielt darauf ab, die Grenze zwischen den Gaming- und Produktivitäts-GPUs mit mehreren eingebetteten KI-Verbesserungen weiter zu verwischen.
NVIDIA GeForce RTX 5090 Blackwell-Architektur und Hardware-Innovationen
Das Herzstück der RTX 5090 enthält 21,760 CUDA-Kerne, eine Steigerung von 33 % gegenüber den 4090 Kernen der RTX 16,384. Diese enorme Kernanzahl, kombiniert mit den Tensor-Kernen der 5. Generation und den RT-Kernen der 4. Generation, soll eine beispiellose Leistung beim Gaming, bei rechenintensiven Workloads und bei der KI-Beschleunigung liefern.
Die 680 Tensor-Kerne (im Vergleich zu 512 beim RTX 4090) bieten noch schnellere Matrixoperationen und ermöglichen so eine effizientere KI-Inferenz. Gleichzeitig verbessern die 170 RT-Kerne – eine Steigerung von 33 % gegenüber den 4090 des RTX 128 – die Raytracing-Leistung und ermöglichen noch realistischere Beleuchtung, Schatten und Reflexionen in Spielen und professionellen Rendering-Aufgaben. Diese Upgrades führen zu einer erstaunlichen FP104.8-Leistung von 16 TFLOPS, eine Verbesserung um 27 % gegenüber den 4090 TFLOPS des RTX 82.58.
Die RTX 5090 verfügt außerdem über 32 GB GDDR7-Speicher, was im Vergleich zu den 4090 GB GDDR24X der RTX 6 eine erhebliche Verbesserung in puncto Bandbreite und Kapazität darstellt. Die 5090 läuft auf einem 512-Bit-Speicherbus und erreicht eine erstaunliche Speicherbandbreite von 1.79 TB/s, fast das Doppelte der 1.01 TB/s der RTX 4090. Diese massive Bandbreitensteigerung ist besonders wirkungsvoll für KI-Workloads, bei denen die Inferenz einen schnellen Zugriff auf Modellgewichte erfordert. Schnellerer Speicher ermöglicht eine reibungslosere Handhabung komplexer KI-Modelle und reduziert die Latenz während der Inferenz. Darüber hinaus beschleunigt die erhöhte Bandbreite den GPU Direct Storage und ermöglicht Anwendungsfälle wie das sequentielle Laden massiver Modellgewichte direkt von schnellen Speichergeräten. Dadurch können selbst die größten KI-Modelle ausgeführt werden, ohne dass sie vollständig in den Speicher geladen werden müssen.
NVIDIA GeForce RTX 50-Serie – Spezifikationen
Die Nvidia RTX 5090 stellt in fast jeder Hinsicht ein deutliches Upgrade gegenüber der RTX 4090 dar. Nachfolgend finden Sie einen detaillierten Vergleich der beiden GPUs:
GPU-Vergleich | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 5080 | NVIDIA RTX 5070 |
GPU-Name | GB202 | AD102 | GB203 | GB205 |
Architektur | Blackwell 2.0 | Ada Lovelace | Blackwell 2.0 | Blackwell 2.0 |
Prozessgröße | 4 nm | 5 nm | 4 nm | 4 nm |
Transistoren | 92,200 Millionen | 76,300 Millionen | 45,600 Millionen | 31,000 Millionen |
Signaldichte | 123.9 M/mm² | 125.3 M/mm² | 120.6 M/mm² | 117.9 M/mm² |
Die Größe | 744 mm² | 609 mm² | 378 mm² | 263 mm² |
Schlitzbreite | Dual-Slot | Dreifach-Slot | Dual-Slot | Dual-Slot |
Abmessungen | 304 mm x 137 mm x 48 mm | 304 mm x 137 mm x 61 mm | 304 mm x 137 mm x 48 mm | N / A |
TDP | 575 W | 450 W | 360 W | 250 W |
Ausgänge | 1x HDMI 2.1b, 3x DisplayPort 2.1b | 1x HDMI 2.1, 3x DisplayPort 1.4a | 1x HDMI 2.1b, 3x DisplayPort 2.1b | 1x HDMI 2.1b, 3x DisplayPort 2.1a |
Power-Steckverbinder | 1x 16-Pin | 1x 16-Pin | 1x 16-Pin | 1x 16-Pin |
Bus-Schnittstelle | PCIe 5.0 x16 | PCIe 4.0 x16 | PCIe 5.0 x16 | PCIe 5.0 x16 |
Basisuhr | 2017 MHz | 2235 MHz | 2295 MHz | 2165 MHz |
Boost Uhr | 2407 MHz | 2520 MHz | 2617 MHz | 2510 MHz |
Speicheruhr | 2209 MHz (28 Gbit / s effektiv) | 1313 MHz (21 Gbit / s effektiv) | 2366 MHz (30 Gbit / s effektiv) | 2209 MHz (28 Gbit / s effektiv) |
Speichergröße | 32 GB | 24 GB | 16 GB | 12 GB |
Speichertyp | GDDR7 | GDDR6X | GDDR7 | GDDR7 |
Memory-Bus | 512 Bit | 384 Bit | 256 Bit | 192 Bit |
Speicherbandbreite | 1.79 TB / s | 1.01 TB / s | 960.0 GB / s | 672.2 GB / s |
CUDA-Kerne | 21,760 | 16,384 | 10,752 | 6,144 |
Tensorkerne | 680 | 512 | 336 | 192 |
ROPs | 192 | 176 | 128 | 64 |
SM-Zählung | 170 | 128 | 84 | 48 |
Tensorkerne | 680 | 512 | 336 | 192 |
RT-Kerne | 170 | 128 | 84 | 48 |
L1 Cache | 128 KB (pro SM) | 128 KB (pro SM) | 128 KB (pro SM) | 128 KB (pro SM) |
L2 Cache | 88 MB | 72 MB | 64 MB | 40 MB |
Pixelrate | 462.1 GPixel/s | 443.5 GPixel/s | 335.0 GPixel/s | 160.6 GPixel/s |
Texturrate | 1,637 GTexel/s | 1,290 GTexel/s | 879.3 GTexel/s | 481.9 GTexel/s |
FP16 (halb) | 104.8 TFLOPS (1:1) | 82.58 TFLOPS (1:1) | 56.28 TFLOPS (1:1) | 30.84 TFLOPS (1:1) |
FP32 (Float) | 104.8 TFLOPS | 82.58 TFLOPS | 56.28 TFLOPS | 30.84 TFLOPS |
FP64 (doppelt) | 1.637 TFLOPS (1:64) | 1,290 GFLOPS (1:64) | 879.3 GFLOPS (1:64) | 481.9 GFLOPS (1:64) |
Einführungspreis (USD) | $1,999 | $1,599 | $999 | $549 |
Aufbau und Design der NVIDIA GeForce RTX 5090
Die RTX 5090 Founders Edition behält Nvidias elegantes Industriedesign mit subtilen Verfeinerungen bei. Mit einer Länge von 304 mm und einer Breite von 137 mm passt die Karte in eine Standardkonfiguration mit 2 Steckplätzen und ist damit für ihre Leistung überraschend kompakt.
Nvidia hat für die RTX 5090 ein Dual-Flow-Through-Design eingeführt, das die Kühlleistung und den Luftstrom verbessert. Die Karte verfügt über eine sogenannte 3D-Dampfkammer, gepaart mit zwei Axiallüftern, um die Temperaturen auch bei hoher Arbeitsbelastung unter Kontrolle zu halten. Obwohl es schwierig ist, es zu erkennen, wenn man es nicht in der Hand hält, kann man das Licht durch beide Kühlkörperabschnitte hinter jedem Lüfter sehen.
Der zentrale Teil der Karte besteht aus der Platine mit kleinen Schläuchen, die die Kabel zu jedem Videoausgang führen. Dies erhöht die Kühlleistung der RTX 5090 erheblich und ermöglicht es ihr, ein ähnliches Profil wie die RTX 4090 beizubehalten, obwohl sie deutlich mehr Strom verbraucht.
Eines der herausragenden Merkmale der RTX 5090 ist die Verwendung einer werkseitig aufgetragenen Wärmeleitpaste aus flüssigem Metall. Diese sorgt für eine bessere Wärmeleitfähigkeit als herkömmliche Wärmeleitpaste, sodass die GPU niedrigere Temperaturen und eine höhere Dauerleistung aufrechterhalten kann.
Trotz der erhöhten maximalen Leistungsaufnahme von 575 W behält die RTX 5090 ihren kompakten Dual-Slot-Formfaktor bei und ist daher für High-End-PC-Builds besser geeignet als die sperrigere Triple-Slot-RTX 4090.
Die Karte unterstützt außerdem PCIe Gen 5, das eine höhere Bandbreite für Motherboards und Peripheriegeräte der nächsten Generation bietet. Damit ist sie bereit für die Zukunft des Gamings und der Content-Erstellung.
Zeitalter des KI-Gamings
Bei der RTX 5090 geht es nicht nur um pure Power. Es geht darum, Gaming mit KI neu zu definieren. Nvidia hat seine KI-gesteuerten Funktionen auf die nächste Stufe gehoben und diese Generation zu einem Wendepunkt in puncto Leistung und Bildtreue gemacht.
DLSS 4: Multi-Frame-Generierung
DLSS (Deep Learning Super Sampling) ist seit Jahren ein Eckpfeiler der GPUs von Nvidia, aber die RTX 5090 führt DLSS 4 ein – was die Dinge auf ein ganz neues Niveau hebt. Während frühere Versionen von DLSS einen AI-Frame für jeden herkömmlich gerenderten Frame generieren konnten, kann DLSS 4 jetzt bis zu drei AI-Frames pro gerendertem Frame generieren.
Dies führt zu einem unglaublich flüssigen Spielerlebnis, selbst bei den anspruchsvollsten Spielen mit maximalen Einstellungen. In Kombination mit Reflex 2, der Latenzreduzierungstechnologie von Nvidia, sehen Spiele besser aus und reagieren schneller als je zuvor.
Ray-Rekonstruktion
Raytracing war schon immer eine anspruchsvolle Funktion, aber die KI-gestützte Ray Reconstruction der RTX 5090 ändert das Spiel. Durch den Ersatz herkömmlicher Rauschunterdrücker durch ein KI-trainiertes Netzwerk hat Nvidia die Qualität von Raytracing-Reflexionen, Schatten und Beleuchtung deutlich verbessert.
Diese Funktion verbessert die Bildqualität, indem sie zusätzliche Pixel für Raytracing-Szenen generiert, sodass diese realistischer und eindringlicher wirken. Dies ist ein bedeutender Fortschritt für Raytracing, insbesondere bei anspruchsvollen Titeln.
AV1-Kodierung und -Dekodierung
Für Content-Ersteller enthält die RTX 5090 3x NVENC-Encoder der 9. Generation und 2x NVDEC-Decoder der 6. Generation mit voller AV1-Kompatibilität. Dies gewährleistet eine schnellere, effizientere Videocodierung und -decodierung und macht sie zu einer ausgezeichneten Wahl für Streamer und Videoeditoren.
NVIDIA GeForce RTX 5090 Testbericht – Leistungsbenchmarks
Um die Vorteile der neuen NVIDIA GeForce RTX 5090 voll auszuschöpfen, haben wir unsere AMD ThreadRipper-Plattform genutzt. Dieses System bietet in seiner Konfiguration eine 64-Kern-CPU und einen Wasserkühlkreislauf. Es verfügt über genügend zugrunde liegende CPU-Leistung, damit die GPU ihre Arbeit ungehindert erledigen kann. Die vollständige Konfiguration des Systems ist unten aufgeführt.
StorageReview AMD ThreadRipper-Testplattform
- Motherboard: ASUS Pro WS TRX50-SAGE WLAN
- ZENTRALPROZESSOR: AMD Ryzen Threadripper 7980X 64-Kern
- RAM: 32 GB DDR5 4800 MT/s
- Lagerung: 2 TB Samsung 980 Pro
- OS: Windows 11 Pro für Arbeitsstationen
- Treiber: NVIDIA 571.86 GameReady-Treiber
Zum Zeitpunkt dieser Überprüfung verwendeten wir die Vorab veröffentlichte NVIDIA 571.86 GameReady-Treiber für die GPUs, die wir getestet haben. Es ist jedoch wichtig zu beachten, dass nicht alle Anwendungen die neue Blackwell-Architektur vollständig unterstützen. Viele der von uns verwendeten Tests wurden aktualisiert und viele werden noch aktualisiert. Daher werden wir weiterhin ältere Tests untersuchen, wenn sie für die Verwendung mit den neuen GPUs der 50er-Serie von NVIDIA optimiert werden.
UL Procyon: KI-Textgenerierung
Die Benchmark für die Textgenerierung mit Procyon AI Benchmark vereinfacht AI LLM-Leistungstests, indem es eine kompakte und konsistente Bewertungsmethode bietet. Es ermöglicht wiederholte Tests über mehrere LLM-Modelle hinweg und minimiert gleichzeitig die Komplexität großer Modellgrößen und variabler Faktoren. Es wurde in Zusammenarbeit mit führenden KI-Hardware-Herstellern entwickelt und optimiert die Verwendung lokaler KI-Beschleuniger für zuverlässigere und effizientere Leistungsbewertungen. Die unten gemessenen Ergebnisse wurden mit TensorRT getestet.
Im Procyon® AI Text Generation Benchmark führt die Nvidia RTX 5090 mit der höchsten Gesamtpunktzahl und schnellste Leistung aller getesteten Modelle:
- Phi: 5,749 RTX 5090 und übertrifft damit die RTX 4090 4,958 und RTX 6000 Ada 4,508.
- Mistral: 6,267 RTX 5090, gefolgt von RTX 4090 5,094 und RTX 6000 Ada 4,255.
- Lama3: 6,104 RTX 5090, mit RTX 4090 bei 4,849 und RTX 6000 Ada bei 4,026.
- Lama2: 6,591 RTX 5090, vor RTX 4090 5,013 und RTX 6000 Ada 3,957.
In Hinsicht auf Gesamtdauerübertrifft die RTX 5090 auch die anderen GPUs:
- Phi: 10.280 s RTX 5090, schneller als RTX 4090 12.872 s und RTX 6000 Ada 13.869 s.
- Mistral: 12.593 s RTX 5090, wobei die RTX 4090 17.010 s und die RTX 6000 Ada 19.092 s erreichten.
- Lama3: 14.304 s RTX 5090, vor RTX 4090 19.991 s und RTX 6000 Ada 22.062 s.
- Lama2: 23.018 s RTX 5090, schneller als RTX 4090 32.448 s und RTX 6000 Ada 38.923 s.
Die RTX 5090 liefert in diesem Test durchweg eine überlegene Gesamtleistung und schnellere Verarbeitungszeiten in jeder Kategorie.
UL Procyon: KI-Textgenerierung | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
Phi-Gesamtpunktzahl | 5,749 | 4,958 | 4,508 |
Phi-Ausgabezeit bis zum ersten Token | 0.244 s | 0.255 s | 0.288 s |
Phi-Ausgabetoken pro Sekunde | 314.435 Token/s | 244.343 Token/s | 228.359 Token/s |
Phi Gesamtdauer | 10.280 s | 12.872 s | 13.869 s |
Mistral-Gesamtpunktzahl | 6,267 | 5,094 | 4,255 |
Mistral-Ausgabezeit bis zum ersten Token | 0.297 s | 0.322 s | 0.419 s |
Mistral-Ausgabetoken pro Sekunde | 255.945 Token/s | 183.266 Token/s | 166.633 Token/s |
Mistral Gesamtdauer | 12.593 s | 17.010 s | 19.092 s |
Llama3 Gesamtpunktzahl | 6,104 | 4,849 | 4,026 |
Llama3-Ausgabezeit bis zum ersten Token | 0.234 s | 0.259 s | 0.348 s |
Llama3-Ausgabetoken pro Sekunde | 214.285 Token/s | 150.039 Token/s | 138.620 Token/s |
Llama3 Gesamtdauer | 14.304 s | 19.991 s | 22.062 s |
Llama2 Gesamtpunktzahl | 6,591 | 5,013 | 3,957 |
Llama2-Ausgabezeit bis zum ersten Token | 0.419 s | 0.500 s | 0.679 s |
Llama2-Ausgabetoken pro Sekunde | 134.502 Token/s | 92.853 Token/s | 78.532 Token/s |
Llama2 Gesamtdauer | 23.018 s | 32.448 s | 38.923 s |
UL-Procyon: KI-Bilderzeugung
Die Procyon AI-Benchmark zur Bildgenerierung bietet eine konsistente, genaue Möglichkeit, die KI-Inferenzleistung auf unterschiedlicher Hardware zu messen, von NPUs mit geringem Stromverbrauch bis hin zu High-End-GPUs. Es umfasst drei Tests: Stable Diffusion XL (FP16) für High-End-GPUs, Stable Diffusion 1.5 (FP16) für mittelstarke GPUs und Stable Diffusion 1.5 (INT8) für Geräte mit geringem Stromverbrauch. Der Benchmark verwendet für jedes System die optimale Inferenz-Engine und gewährleistet so faire und vergleichbare Ergebnisse.
Im Procyon AI Image Generation Benchmark übertrifft die Nvidia RTX 5090 die anderen GPUs in allen Tests:
- Stabile Diffusion 1.5 (FP16): Die RTX 5090 führt mit einer Gesamtpunktzahl von 8,193, einer Generierungszeit von 12.204 s und einer Bildgenerierungsgeschwindigkeit von 0.763 s/Bild.
- Stabile Diffusion 1.5 (INT8): Die RTX 5090 führt erneut mit einer Gesamtpunktzahl von 79,272, einer Generierungszeit von 3.154 s und einer Bildgenerierungsgeschwindigkeit von 0.394 s/Bild.
- Stabile Diffusion XL (FP16): Abschließend kann die RTX 5090 mit einem Gesamtwert von 7,179 bei einer Generierungszeit von 83.573 s und einer Bildgenerierungsgeschwindigkeit von 5.223 s/Bild erneut die Nase vorn haben.
UL Procyon: KI-Bildgenerierung | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
Stabile Diffusion 1.5 (FP16) – Gesamtpunktzahl | 8,193 | 5,260 | 4,230 |
Stabile Diffusion 1.5 (FP16) – Gesamtzeit | 12.204 s | 19.011 s | 23.639 s |
Stable Diffusion 1.5 (FP16) – Bildgenerierungsgeschwindigkeit | 0.763 s/Bild | 1.188 s/Bild | 1.477 s/Bild |
Stabile Diffusion 1.5 (INT8) – Gesamtpunktzahl | 79,272 | 62,160 | 55,901 |
Stabile Diffusion 1.5 (INT8) – Gesamtzeit | 3.154 s | 4.022 s | 4.472 s |
Stabile Diffusion 1.5 (INT8) – Bildgenerierungsgeschwindigkeit | 0.394 s/Bild | 0.503 s/Bild | 0.559 s/Bild |
Stabile Diffusion XL (FP16) – Gesamtpunktzahl | 7,179 | 5,025 | 3,043 |
Stabile Diffusion XL (FP16) – Gesamtzeit | 83.573 s | 119.379 s | 197.172 s |
Stabile Diffusion XL (FP16) – Bildgenerierungsgeschwindigkeit | 5.223 s/Bild | 7.461 s/Bild | 12.323 s/Bild |
Luxmark
Luxmark ist ein GPU-Benchmark, der LuxRender, einen Open-Source-Raytracing-Renderer, verwendet, um die Leistung eines Systems bei der Verarbeitung hochdetaillierter 3D-Szenen zu bewerten. Dieser Benchmark ist für die Beurteilung der grafischen Darstellungsfähigkeit von Servern und Workstations relevant, insbesondere für visuelle Effekte und Architekturvisualisierungsanwendungen, bei denen eine genaue Lichtsimulation von entscheidender Bedeutung ist.
Im Luxmark OpenCL-Benchmark führt die NVIDIA RTX 5090 mit den höchsten Punktzahlen sowohl im Hall- als auch im Food-GPU-Test:
- Lebensmittelpunktzahl: 23,141 RTX 5090 und übertrifft damit die RTX 4090 17,171 und RTX 6000 Ada 14,873.
- Hall-Ergebnis: 51,725 RTX 5090 und übertrifft damit die RTX 4090 38,887 und RTX 6000 Ada 32,132.
Luxmark (höher ist besser) | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
Lebensmittelpunktzahl | 23,141 | 17,171 | 14,873 |
Hall-Ergebnis | 51,725 | 38,887 | 32,132 |
Geekbench 6
Geekbench 6 ist ein plattformübergreifender Benchmark, der die Gesamtsystemleistung misst. Mit dem Geekbench-Browser können Sie jedes beliebige System damit vergleichen.
Die NVIDIA RTX 5090 führt mit einem überlegenen Geekbench GPU OpenCL-Score von 374,807. Dieser Score übertrifft die 6000 der RTX 336,882 Ada und die 4090 der RTX 333,384 und macht sie zum Spitzenreiter in diesem Vergleich.
Geekbench (höher ist besser) | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
GPU OpenCL-Wertung | 374,807 | 333,384 | 336,882 |
V-Ray
Die V-Ray Benchmark misst die Rendering-Leistung für CPUs, NVIDIA-GPUs oder beide mithilfe fortschrittlicher V-Ray 6-Engines. Es verwendet schnelle Tests und ein einfaches Bewertungssystem, damit Benutzer die Rendering-Fähigkeiten ihrer Systeme bewerten und vergleichen können. Es ist ein unverzichtbares Tool für Profis, die effiziente Einblicke in die Leistung suchen.
In diesem Test übernimmt die NVIDIA RTX 5090 mit einem beeindruckenden Ergebnis von 14,764 die Führung und übertrifft die RTX 4090 10,847 und die RTX 6000 Ada 10,766 deutlich. Auch bei der Rendering-Leistung dominiert die RTX 5090 deutlich.
V-Ray (höher ist besser) | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
vPfade | 14,764 | 10,847 | 10,766 |
NVIDIA GeForce RTX 5090 Stromverbrauch
Der Stromverbrauch ist ein wesentlicher Bestandteil jeder High-End-Computerplattform. Jede neue GPU-Generation verbraucht unter Last mehr Strom, was größere Netzteile und einen ausreichenden Luftstrom zur Kühlung bedeutet. Allerdings gibt es noch einen weiteren Aspekt der Leistung: Schnellere GPUs können höhere Spitzenwerte aufweisen, aber die Dauer jeder Arbeitslast nimmt ab.
NVIDIA hat am Editor's Day auf der CES 2025 die verbesserte Energieeffizienz der Blackwell-Architektur vorgestellt, die wir in einer KI-gesteuerten Arbeitslast sehen wollten. Durch die Nutzung der Quarch Netzanalysator In unserem Testlabor haben wir den Gesamtstromverbrauch des Systems gemessen, während das Procyon AI-Bildgenerator Stabiler Diffusion XL FP16-Test. Diese Arbeitslast brachte jede GPU an ihre Leistungsgrenzen, wobei definierte Start- und Stopppunkte für jedes generierte Bild deutlich sichtbar waren.
Zunächst betrachten wir die NVIDIA RTX 6000 Ada, die eine maximale Leistungsaufnahme von 300 W hat. Während des Bildgenerierungstests mit Procyon AI konnten wir beobachten, dass die Systemleistung von einer Hintergrundlast von 235 W auf 514 W bzw. unter Last um 279 W anstieg. Bei der Betrachtung der Zeit pro Bild zeigte sich, dass die GPU beim vorletzten Bild 12.6 Sekunden lang belastet wurde. Der Gesamtstromverbrauch für die Erstellung des letzten Bilds betrug 1.76 Wh.
Als nächstes betrachten wir denselben Testabschnitt, der mit der NVIDIA GeForce RTX 4090 ausgeführt wurde, die eine maximale Leistungsaufnahme von 450 W hat. Beim Test zur KI-Bildgenerierung steigerte sich der Systemverbrauch von einem Minimum von 233 W auf durchschnittlich 669 W, was unter Last einer Steigerung von 436 W entspricht. Bei der Erstellung des vorletzten Bildes betrug die Zeit unter Last 2 Sekunden. Das entspricht einem Gesamtstromverbrauch von 7.3 Wh in diesem Zeitraum.
Zum Schluss schauen wir uns die neue NVIDIA GeForce RTX 5090 an, die mit 600 W den höchsten maximalen Stromverbrauch aufweist. Während diese Karte den Procyon AI-Bildgenerierungstest durchführt, erhöht sich die Systemleistung von 272 W im Hintergrund auf 811 W und arbeitet auf 539 W. Die Zeit zur Generierung des vorletzten Bildes wurde mit nur 5.1 Sekunden gemessen, und in diesem Zeitraum wurden 1.16 Wh verbraucht.
Als wir alle drei NVIDIA-Grafikprozessoren durchgingen, stieg zwar die Spitzenleistung jedes schnelleren Modells, der Gesamtenergieverbrauch sank jedoch. Dies ist ein wesentlicher Faktor, wenn Sie den Kauf neuer Grafikprozessoren für Workloads in Erwägung ziehen. Der Stromverbrauch steigt zwar, aber die zum Abschließen bestimmter Workloads benötigte Energie sinkt.
Schlussfolgerung
Dieser Testbericht bietet einen sehr frühen Einblick in die Gesamtleistung der NVIDIA GeForce RTX 5090. Nicht alle Software ist für die neue Architektur optimiert und Linux-Treiber für KI-zentriertere Workloads werden erst verfügbar sein, wenn die Karte Ende Januar in den allgemeinen Verkauf geht.
Wir konnten bei allen Workloads, die von der neuen RTX 5090 profitieren konnten, massive Leistungssteigerungen feststellen. Einige Anwendungen werden Updates benötigen, da wir Situationen von Inkompatibilität bis hin zu langsameren Vorgängen als erwartet festgestellt haben. Was uns begeistert, ist zu sehen, wie viel Leistungspotenzial diese Karte bietet. Im Vergleich zur RTX 4090 bei den Text- und Bildgenerierungs-Workloads von Procyon AI bot die RTX 5090 eine Steigerung von 16 % bzw. 56 %. Bei der V-Ray-Messung der Rendering-Leistung stieg die Leistung der RTX 5090 gegenüber ihrem Vorgänger um 36 %. Keine der GPU-beschleunigten Workloads, die wir sehen, wird zurückgefahren. Die Dinge werden intensiver. Wenn Sie das Konzept der KI-Assistenten einführen, werden die Benutzer nicht nur spielen oder arbeiten; Sie werden einen KI-Workload parallel laufen haben. Dies erfordert zusätzliche GPU-Ressourcen neben einer anderen intensiven Aufgabe.
Damit kommen wir zum Thema Preis und Wert. Die GeForce RTX 4090 kam zu einem Einstiegspreis von 1,599 US-Dollar, während die neue GeForce RTX 5090 der Startpreis auf 1,999 US-Dollar, eine Steigerung von 25 % für das Top-End-Angebot. Lohnt sich das für viele? Ja. Für Benutzer, die ihre GPUs häufig bis zur maximalen Sättigung auslasten, ermöglicht eine schnellere GPU, mehr Dinge zu tun. Wenn Ihre Arbeitslast in kürzerer Zeit ausgeführt werden kann und Sie produktiver sind, können sich diese Kosten, verteilt auf die Jahre Ihres PCs, durchaus lohnen. Wird jeder das Topmodell brauchen? Wahrscheinlich nicht. Es wird eine breite Palette von Modellen geben, darunter die RTX 5070 zu einem Preis von 549 US-Dollar, wobei die RTX 5060 noch günstiger sein wird.
Auch der Stromverbrauch ist bei dieser Karte der nächsten Generation zu berücksichtigen. Die GeForce RTX 4090 war mit 450 W sehr stromhungrig, die RTX 5090 steigert den Verbrauch auf satte 575 W. Dies stellt das Gehäusedesign von PCs und Workstations vor neue Herausforderungen, da zusätzliche Kühlanforderungen und größere Netzteile berücksichtigt werden müssen.
Insgesamt hat uns die neue NVIDIA GeForce RTX 5090 sehr beeindruckt und wir sind gespannt, wie weit die Leistungssteigerungen gehen werden, wenn die Anwendungsunterstützung weiter verbreitet wird. Wie die RTX 3090 und A6000 oder RTX 4090 und 6000 Ada zuvor zeigt die GeForce RTX 5090, in welche Richtung das nächste Workstation-Modell gehen wird, und wir können es kaum erwarten.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed