Le nuove GPU basate su Ampere di NVIDIA sono qui e, se sei fortunato, potresti effettivamente comprarne una. Al momento della stesura di questo documento, nel febbraio 2021, le scorte di nuove GPU sono ancora estremamente scarse e non si prevede che torneranno alla normalità almeno fino al terzo trimestre di quest'anno. Ma ti stai davvero perdendo così tanto se non riesci a mettere le mani su una nuova NVIDIA GeForce RTX 3 per la tua workstation? Naturalmente ci sono molti fattori da sapere se è necessario eseguire l'aggiornamento.
Le nuove GPU basate su Ampere di NVIDIA sono qui e, se sei fortunato, potresti effettivamente comprarne una. Al momento della stesura di questo documento, nel febbraio 2021, le scorte di nuove GPU sono ancora estremamente scarse e non si prevede che torneranno alla normalità almeno fino al terzo trimestre di quest'anno. Ma ti stai davvero perdendo così tanto se non riesci a mettere le mani su una nuova NVIDIA GeForce RTX 3 per la tua workstation? Naturalmente ci sono molti fattori da sapere se è necessario eseguire l'aggiornamento.
Oggi daremo un’occhiata a una serie di casi d’uso per far luce sulla validità dell’attesa. Esamineremo casi d'uso professionali creativi, cose come Blender, Davinci Resolve e LuxMark, ma esamineremo anche un benchmark di apprendimento automatico basato sulla libreria TensorFlow open source in Python e un po' di giochi per buona misura. Confronteremo una NVIDIA GeForce RTX 3090 Founder's Edition con la NVIDIA Quadro RTX 8000, la (ex) re della linea di workstation NVIDIA. Anche se un confronto più appropriato sarebbe con la Quadro RTX 6000, poiché entrambe le schede hanno 24 GB di VRAM, i risultati sarebbero quasi identici, poiché le capacità di calcolo effettive della 8000 e della 6000 sono le stesse e nessuno di questi benchmark utilizzava più di 24 GB. della VRAM. Abbiamo anche un paio di workstation OEM per il confronto, inclusa una Lenovo P920 che abbiamo recensito in precedenza con due RTX 8000 e un nuovo Lenovo P620 ricco dell'ultimo Threadripper PRO di AMD.
Perché stiamo confrontando una scheda Quadro per workstation con una scheda GeForce consumer? Perché mai prima d'ora NVIDIA ha lanciato una scheda consumer così potente e la proposta di valore di spendere un terzo del denaro rispetto alla linea Quadro è diventata molto allettante. Soprattutto perché al momento della stesura di questo articolo non esiste una parola ufficiale su un vero successore di TITAN RTX, che tradizionalmente ha riempito la nicchia delle GPU da lavoro e da gioco. È anche impossibile ignorare lo stato del mondo in questo momento, con le soluzioni di lavoro da casa che rappresentano una priorità assoluta per molte persone e avere una GPU estremamente potente per CAD di giorno e giocare di notte sembra meglio che mai. Lo sappiamo, possiamo ascoltarvi attraverso lo schermo sulle differenze per una “vera” scheda workstation! Ci arriveremo, lo promettiamo; continua a leggere.
Di seguito sono riportate le specifiche principali del sistema di test e della GPU, incluse le versioni di driver e BIOS.
OS | Windows 10 Professional (versione 20H2, ottobre 2020) |
CPU | AMD Ryzen 9 3900X |
Memorie | 4x8 GB (32 GB) G.Skill TridentZ Neo 3600 MHz CL16 |
Test Drive | Samsung 2Pro da 970TB |
Scheda madre | ASRock X570 Taichi (BIOS v4.00, PCIe Gen4) |
Gpu 1 | NVIDIA RTX 3090 Founder's Edition (driver Studio 461.40) |
Gpu 2 | NVIDIA Quadro RTX 8000 (driver di produzione R460 U3, 461.40) |
Quadro RTX8000 | RTX 3090 F | |
Architettura | Turing (12 nm) | Ampere (8 nm) |
Core CUDA | 4,608 | 10,496 |
Tensor Core | 576 (2a generazione) | 328 (3a generazione) |
RT | 72 (prima generazione) | 82 (2a generazione) |
Memoria GPU | GDDR48 da 6 GB con ECC | 24GB GDDR6X |
Prestazioni FP32 | 16.3 TFLOPS | 35.6 TFLOPS |
Consumo di energia | 295W | 350W |
Interfaccia PCIe | PCIe 3.0 x16 | PCIe 4.0 x16 |
refrigeratore | In stile soffiatore | Fluire attraverso |
Supporto multi-GPU NVLink | Si | Si |
Supporto SR-IOV | Si | Non |
Benchmark GeForce RTX 3090 e Quadro RTX 8000
Cominciamo con i giochi. Potrebbe sembrare una cosa strana da includere in un articolo sulla grafica delle workstation, ma con così tante persone che lavorano da casa al giorno d'oggi, non è irragionevole aspettarsi che molti professionisti finiscano il loro lavoro e inizino a giocare sulla stessa macchina. Abbiamo testato Cyberpunk 2077, Shadow of the Tomb Raider e Borderlands 3. Borderlands e Tomb Raider hanno strumenti di benchmarking integrati e, mentre Cyberpunk no, riteniamo di essere in grado di registrare una buona quantità di dati tra le due schede per dare una media. Tutti i test sono stati eseguiti a 1440p; Borderlands è stato impostato su tutte le impostazioni massime tranne il motion blur; Tomb Raider era impostato su tutto al massimo, RTX Ultra e nessun DLSS; e Cyberpunk 2077 era impostato su RTX Medium Preset, con DLSS impostato su Qualità. I titoli di eSport come League of Legends e CS:GO manterranno facilmente oltre 250 FPS con entrambe queste schede, quindi non sono stati testati a fondo. Aneddoticamente, abbiamo visto oltre 150 FPS costantemente con entrambe le carte in Call of Duty: Warzone, ma non l'abbiamo testato abbastanza a fondo da considerarlo un vero punto di riferimento da includere in questa classifica.
Senza alcuna sorpresa per nessuno, l'RTX 3090 è la migliore GPU da gioco in assoluto sul mercato in questo momento e mentre l'AMD Radeon 6900XT se la vedrà testa a testa in alcuni titoli, quando si tratta di ray-tracing, la 3090 non ha concorrenza . Cyberpunk 2077, lo adori o lo odi, è il titolo più impegnativo disponibile al momento e in tutti i nostri test, l'RTX 3090 ha mantenuto almeno 65 FPS, anche in scene molto affollate, e la maggior parte delle volte l'FPS era alto. Anni '70 e anni '80 con tempi di frame costantemente bassi. È sicuro affermare che qualsiasi cosa meno impegnativa può essere facilmente eseguita con le impostazioni massime e mantenere framerate elevati. Tieni inoltre presente che questi test sono stati eseguiti nel febbraio 2021, prima che NVIDIA rilasciasse il supporto Resizable BAR per le schede GeForce. Questo standard PCIe, commercializzato come Smart Access Memory sulle nuove schede AMD, consentirà alle CPU l'accesso diretto all'intera VRAM contemporaneamente e migliorerà le prestazioni nei giochi. I primi risultati mostrano un guadagno FPS compreso tra il 2% e il 5%, a seconda del gioco. La BAR ridimensionabile probabilmente non aumenterà le prestazioni nelle attività di elaborazione e, come tale, probabilmente non arriverà presto sulla linea Quadro.
Il risultato più interessante qui è quanto sia competente una scheda da gioco la Quadro RTX 8000. Anche se non dovrebbe essere una sorpresa data la sua potenza pura, il suo design e i suoi driver non sono stati affatto ottimizzati per i giochi, ma in tutti i giochi, tranne Cyberpunk 2077, mantiene ben oltre 60 FPS. Cyberpunk era nella migliore delle ipotesi instabile, ma riducendo il ray-tracing e impostando DLSS su Prestazioni ha migliorato notevolmente i risultati, mantenendo oltre 60 FPS in tutte le scene tranne quelle più impegnative. Vale la pena notare che ci siamo imbattuti in molti bug relativi al ray-tracing durante l'esecuzione di Cyberpunk su Quadro, in particolare un problema in cui i riflessi scomparivano completamente e le scene diventavano scure. Ciò non è accaduto sull'RTX 3090, quindi lo attribuiremo a un problema relativo al driver Quadro e al famigerato bug di Cyberpunk.
Shadow of the Tomb Raider su GeForce RTX 3090, 1440p con RTX attivato e DLSS disattivato.
Il prossimo è la roba buona; i risultati della workstation che ti aspetti di vedere. Questa serie di benchmark esaminerà le prestazioni nella modellazione 3D, nell'illuminazione e nel lavoro video. Inizieremo con LuxMark, un'utilità di benchmarking GPU OpenCL. Abbiamo utilizzato la versione più recente, v4alpha0, così come la vecchia v3 con la classica LuxBall.
Dire che l'RTX 3090 ha prestazioni impressionanti sarebbe un eufemismo. Nelle applicazioni fortemente legate alla GPU, la nuova architettura Ampere mostra davvero i muscoli, battendo anche il Lenovo P920 e le sue doppie RTX 8000. In LuxMark v3, le prestazioni erano più del doppio e i benchmark v4 si avvicinavano al 150% delle prestazioni. Aspettatevi di vedere molti più grafici simili a questo, ma (avviso spoiler) non tutto è così chiaro come sembra.
Successivamente, diamo un'occhiata a V-Ray di Chaos Group. Questo benchmark riguarda il set di strumenti di rendering e simulazione 3D di V-Ray, disponibile come plug-in per un'ampia gamma di applicazioni di modellazione 3D, come Cinema 4D, Maya, Rhino e Unreal, tra gli altri. Questo benchmark si concentra specificamente sulle prestazioni CUDA e RTX. Abbiamo utilizzato la versione più recente del benchmark V-Ray (v5) così come quella precedente (v4), solo per confronto.
La storia qui è molto simile a LuxMark con l'RTX 3090 che supera di gran lunga l'RTX 8000 e supera persino il Lenovo P920 e le sue doppie GPU. Questo benchmark ci consente specificamente di vedere gli enormi miglioramenti apportati da NVIDIA ai core di ray-tracing di seconda generazione; le prestazioni CUDA sono quasi raddoppiate, mentre le prestazioni RTX sono quasi del 2%.
Il prossimo è l'onnipresente Blender, un'applicazione di modellazione 3D open source. Questo benchmark è stato eseguito utilizzando l'utilità Blender Benchmark. NVIDIA OptiX è stato il metodo di rendering scelto, al contrario di CUDA, poiché tutti questi sistemi possono utilizzare RTX.
La storia è più o meno la stessa ancora una volta, con i core RTX di nuova generazione che eseguono rapidamente il rendering di Blender, bruciando anche il rendering BMW in meno di 10 secondi. Questa storia continua, ma non preoccuparti, diventerà presto molto interessante. Qui esaminiamo OctaneBench, un'utilità di benchmarking per OctaneRender, un altro renderer 3D con supporto RTX, simile a V-Ray.
Sì. Successivamente, daremo un'occhiata alle applicazioni di editing video, in particolare Davinci Resolve Studio 16.2.8 e Adobe Premiere Pro 2020. Utilizzeremo PugetBench per Adobe CC e PugetBench per Resolve, entrambi sviluppati da PugetSystems, produttore di PC che realizza workstation professionali per applicazioni specifiche. Questo grafico esamina specificamente il punteggio GPU del benchmark complessivo, valutando le prestazioni negli effetti accelerati dalla GPU.
Infine, abbiamo alcuni casi d'uso in cui la proposta di valore diminuisce leggermente. Applicazioni come Premiere Pro e Davinci Resolve variano notevolmente in termini di prestazioni a seconda del progetto e degli effetti e spesso presentano colli di bottiglia nella CPU. C'è un miglioramento, soprattutto in Resolve che ha un'ottimizzazione GPU molto migliore, ma gli utenti della suite Adobe Creative Cloud troveranno più valore nelle schede GeForce di fascia bassa come RTX 3080 dove otterrai apparentemente il 90% delle prestazioni per 46 % del prezzo (basato sul prezzo consigliato delle carte Founder's Edition). Sebbene non riportate qui, le prestazioni in After Effects e Photoshop erano simili, dove la maggior parte dei test erano limitati dalla CPU. Vale anche la pena notare che le schede Quadro e GeForce utilizzano entrambe la versione di settima generazione di NVENC (l'encoder NVIDIA), quindi i tempi di rendering H.7 e HEVC saranno simili. Tieni presente che le schede GeForce sono limitate a 264 attività di codifica simultanee (per cose come streaming e registrazione), mentre le Quadro non hanno tale limite. Siamo a conoscenza di aggiramenti per questo limite, ma ne parleremo più avanti. L'RTX 3 utilizza una nuova generazione di NVDEC (decoder NVIDIA), quindi ci saranno miglioramenti marginali nello scrubbing della timeline quando si lavora con filmati HEVC e H.3090.
Passiamo dall'applicazione creativa a qualcosa di nuovo. Daremo un'occhiata alle prestazioni di apprendimento automatico di queste carte utilizzando un benchmark giustamente chiamato AI-Benchmark. È una libreria Python open source che esegue una serie di test di deep learning utilizzando la libreria di machine learning TensorFlow. Puoi saperne di più qui nonché quali metodologie di test specifiche utilizza.
I vostri sussulti collettivi sono stati ascoltati. Qui è la stessa storia della maggior parte dei benchmark creativi, con la scheda GeForce che apparentemente raddoppia le prestazioni della Quadro. Questo test è stato eseguito su Windows 10, ma puoi aspettarti risultati simili nella tua distribuzione Linux preferita. Al momento del test, TensorFlow non era stato aggiornato per supportare le nuove schede Ampere, ma con un po' di trucchetto siamo riusciti a farlo funzionare mescolando e abbinando componenti di diversi kit di sviluppo CUDA. Ci aspettiamo che una versione opportunamente aggiornata in futuro possa solo migliorare i risultati.
Ultimo, ma sicuramente non meno importante, esamineremo SPECviewperf 2020, la revisione più recente dell'utilità di benchmarking standard del settore della Standard Performance Evaluation Corporation. Questo benchmark esamina le prestazioni grafiche in una varietà di applicazioni professionali. Abbiamo incluso anche il Lenovo P620 equipaggiato con una vecchia Quadro P6000 per confronto.
È qui che le cose si fanno interessanti. I risultati della modellazione 3D sono più o meno quelli che ti aspetteresti, con l'RTX 3090 che supera l'RTX 8000 con un buon margine, ma applicazioni come CATIA e Creo, e i test energetici e medici, in realtà hanno il 3090 sottoperformante di un piccolo, ma significativo margine. Ha sottoperformato anche rispetto alla Quadro P6000 significativamente più vecchia del nostro Lenovo P620. Ma che dire di Siemens NX? Questo è il punto cruciale della situazione tra workstation e consumer, Quadro e GeForce. Stai leggendo correttamente quel grafico; il 3090 ha ottenuto un 25.37 in Siemens NX. Abbiamo eseguito questo test sette volte e abbiamo fatto riferimento ad altri risultati di benchmarking su Internet e questo risultato è assolutamente corretto. In questo test l'RTX 3090 ha avuto meno del 5% delle prestazioni del Lenovo P620 con l'RTX 8000. Esploriamolo più approfonditamente nella sezione successiva.
Workstation e GPU consumer; I guidatori
La GeForce RTX 3090 è una GPU molto potente, non si può negarlo, e anche la Quadro RTX 8000 è una GPU potente, ma dove differiscono è importante. L'RTX 3090 è prima di tutto una scheda video da gioco. È stata progettata ed è commercializzata come la migliore GPU in assoluto per i giochi e la "prima scheda da gioco con capacità 8K al mondo". Il fatto che riesca a superare l'RTX 8000 in una moltitudine di compiti, con margini estremi nella maggior parte dei casi, è una testimonianza della sua potenza pura, essenzialmente brutale che si fa strada attraverso questi test. La Quadro RTX 8000 è innanzitutto una scheda workstation, progettata per essere posizionata in workstation, stipata in server montati su rack, collegata tra loro tramite NVLink, virtualizzata, utilizzata duramente e riposta bagnata (metaforicamente, ovviamente) e sopravvivere.
Ciò solleva quindi la domanda: perché la GeForce RTX 3090 ha sottoperformato la Quadro RTX 3 di 8000 anni fa in alcune attività e persino la Quadro P6 di quasi 6000 anni fa? Nello specifico, perché l'RTX 8000 vede prestazioni di un ordine di grandezza superiori nel Siemens NX? Siamo sicuri che tu, lettore esperto, lo sai già; si tratta di ottimizzazioni del driver. NVIDIA è giudice, giuria e carnefice quando si tratta di quali GPU ottenere ottimizzazioni per workstation ed è chiaro che non volevano che l'RTX 3090 fosse in grado di spazzare via completamente la precedente linea Quadro in ogni applicazione. Molti potenziali acquirenti rimarranno molto delusi nel vedere le loro speranze di prestazioni della workstation di alto livello di giorno e i giochi di fascia alta di notte non sono possibili, almeno non al prezzo consigliato di $ 3090 dell'RTX 1,499. "Bene, ecco a cosa serve la linea TITAN", ti sentiamo dire, ma al momento non è disponibile un sostituto TITAN RTX e il prezzo del 3090 lo posiziona sicuramente come un sostituto TITAN. NVIDIA vanta addirittura che il 3090 abbia "prestazioni di classe TITAN" nella prima riga dei materiali di marketing, ma il risultato di Siemens NX non è neanche lontanamente vicino alla "classe TITAN". Il 3090 è solo un 3080 sovradimensionato e troppo caro? Beh, non proprio. È ancora la migliore GPU disponibile per modellatori 3D e lavori video, soprattutto con i suoi 24 GB di VRAM che consentono ai creativi di lavorare con modelli di grandi dimensioni e filmati 8K con facilità, ma questo la colloca in una nicchia piuttosto piccola, una nicchia precedentemente servita da TITAN. carte di classe. Se non lavori con applicazioni CAD come Siemens NX, Creo o CATIA, l'RTX 3090 è ancora attraente, ma è assolutamente un fallimento se tali applicazioni sono fondamentali per il tuo flusso di lavoro.
Ci sono anche altre considerazioni. Sebbene sia la scheda Quadro che quella GeForce offrano configurazioni multi-GPU su NVLink, e vale la pena notare che solo la 3090 ha questa capacità tra le schede della serie 3000, solo la Quadro può essere virtualizzata con SR-IOV. Se il tuo carico di lavoro prevede la distribuzione di una GPU o due GPU NVLinked su più VM, Quadro è ancora la tua unica scelta. Sebbene ci siano modi per aggirare questo problema, resta il fatto che questa funzionalità è limitata artificialmente dal driver GeForce di NVIDIA. Lo stesso driver che, tra l'altro, offre certificazioni per alcune applicazioni creative come la suite Adobe e Autodesk, nonché la certificazione WHQL (Windows Hardware Quality Labs) nella sua variante Studio, confondendo ulteriormente il punto. Anche se prevediamo che un vero sostituto TITAN basato su Ampere arriverà in futuro da NVIDIA, le limitazioni artificiali poste sulla GeForce RTX 3090, incluso il limite alle codifiche simultanee con NVENC, sembrano fuori contatto con ciò che gli utenti professionali stanno cercando in questo momento. .
Durante la stesura di questo articolo, NVIDIA ha anche annunciato la sua nuova linea di GPU specifiche per il mining di criptovaluta e l'intenzione di dimezzare le prestazioni di mining della prossima RTX 3060. Questa diminuzione delle prestazioni di mining di criptovalute è completamente artificiale ed eseguita interamente tramite driver, portando ulteriormente a casa il punto. che siamo semplicemente in balia di qualunque cosa NVIDIA ritenga degne di fare le nostre carte. Questo limite “inattaccabile” sul 3060 verrà sfruttato? Senza dubbio, allo stesso modo in cui è stato superato il limite NVENC. Ma per ora, NVIDIA ha tutte le carte in regola e per molti flussi di lavoro professionali altamente ottimizzati per CUDA, RTX, TensorFlow e altre piattaforme informatiche specifiche di NVIDIA, semplicemente non c'è altra scelta se non NVIDIA.
Conclusione
Analizziamolo un po'. Dovresti mantenere attivi gli avvisi di stock per l'RTX 3090? Affrontare le code fuori dal tuo MicroCenter locale per avere la possibilità di ottenerne uno? Come per la maggior parte delle cose, la risposta è: “dipende”.
- Lavori esclusivamente con modelli 3D di grandi dimensioni in applicazioni come Blender e Cinema 4D o modifichi regolarmente file video 6K e 8K di grandi dimensioni? Allora si; l'RTX 3090 è la migliore GPU professionale creativa sul mercato per flussi di lavoro accelerati CUDA e RTX.
- Hai abbastanza reddito disponibile per un impianto di gioco assolutamente senza compromessi? Inoltre sì; l'RTX 3090 è la migliore GPU da gioco che il denaro possa acquistare, in particolare nei giochi con ray-tracing e supporto DLSS 2.0, un elenco che cresce ogni giorno.
- Lavori principalmente nel CAD, in particolare in ambito scientifico con applicazioni come Creo e CATIA? Allora no; l'RTX 3090 non fornisce le necessarie ottimizzazioni dei driver fornite con la linea di schede Quadro, e nessuna quantità di potenza bruta forzata può superare questo problema. Stiamo lavorando per mettere le mani sul nuovo RTX-A6000, il vero sostituto dell'RTX 8000, per aiutare a informare persone come te.
- Lavori nel campo del machine learning e dell’intelligenza artificiale? Questo è un miscuglio, perché sembra un "sì" dato che le prestazioni in TensorFlow sono eccellenti, ma sfortunatamente non ci sono abbastanza test standardizzati o punti dati per trarre una conclusione definitiva rispetto a una scheda Quadro più recente. Inoltre, al momento della stesura di questo articolo, TensorFlow non è stato aggiornato per supportare correttamente le schede Ampere. La nostra risposta attuale è un debole sì. Possiamo guardare MLCommons e MLperf in futuro come follow-up, in particolare per i casi d'uso dell'intelligenza artificiale e dell'apprendimento automatico.
- Attualmente possiedi una TITAN RTX e stai cercando di aggiornarla? Ti consigliamo di attendere un annuncio ufficiale da parte di NVIDIA sul TITAN basato su Ampere, che si dice arriverà prima o poi. Se i tuoi casi d'uso fanno buon uso del TITAN, l'RTX 3090 potrebbe subire un downgrade, a seconda del flusso di lavoro.
- Esegui molta virtualizzazione della GPU? Questo è un no deciso; l'RTX 3090 non supporta nativamente SR-IOV.
Considerato tutto ciò, speriamo che questo possa influenzare la tua decisione di aggiornare o meno e se scegli GeForce o Quadro. Se il prezzo consigliato di $ 1,499 dell'RTX 3090 è troppo ricco per le tue esigenze e non hai bisogno di più di 10 GB di VRAM, anche l'RTX 3080 è un'ottima opzione. Sebbene non siano stati testati esplicitamente qui, abbiamo riscontrato che i nostri risultati erano generalmente migliori del 20%-30% rispetto all'RTX 3080 in base ai risultati sul web, quindi puoi aspettarti che superi (e sottoprestazioni) la Quadro RTX 8000 in applicazioni simili. Potrebbe anche valere la pena aspettare la tanto vociferata RTX 3080 Ti, ogni volta che arriverà, per una via di mezzo. Per ora, terremo gli occhi aperti affinché la TITAN basata su Ampere colmi davvero il divario tra una scheda workstation completa e una scheda gaming completa. Terremo anche d'occhio la pipeline dei driver di NVIDIA per vedere se risolveranno eventuali carenze legate al funzionamento della scheda nelle versioni future, ma abbiamo i nostri dubbi. Ci piacerebbe sentire la tua opinione al riguardo e anche se ci fossero benchmark o casi d'uso che ci sono sfuggiti e che vorresti vedere, soprattutto per quanto riguarda l'intelligenza artificiale e l'apprendimento automatico. Mettiti in contatto con noi sui nostri canali social e resta sintonizzato per recensioni più creative su professionisti e workstation.
Leggi di più - Recensione NVIDIA RTX A6000
NVIDIA Quadro RTX 8000 su Amazon
NVIDIA GeForce RTX 3090 Founder's Edition su Amazon
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed