NVIDIA GeForce RTX 5070 Founders Edition 評測:我們測試了其 Blackwell 架構、DLSS 4、AI 效能和遊戲基準。
NVIDIA GeForce RTX 5070 Founders Edition 加入了新的 50 系列產品線,繼高階 5080 之後推出,以中階產品的形式展示了 NVIDIA 的 Blackwell 架構。儘管人們對其電源效率、AI 馬力和光線追蹤改進有很多猜測,但我們將在實際測試中親自發現。在經過從 AI 文本生成到高級 3D 渲染等各種基準測試後,我們可以準確地告訴您它在 NVIDIA 的下一代產品中的位置。
遊戲玩家和硬體愛好者都熱切希望看到 RTX 5070 是否最終能夠提供中階顯示卡一直承諾的強大性價比。過去幾年中,多代 RTX 受到供應限制、價格虛高以及換代不盡如人意等問題困擾,消費者渴望更有意義的改進。
從紙面上看,RTX 5070 有望比 RTX 4070 實現大幅提升,其宣稱具有 DLSS 4 的多幀生成、更高的內存頻寬和額外的原始計算能力,所有這些都是為了實現更流暢的遊戲體驗和更快的生產力。因此,讓我們來看看它的功能、規格和細節,然後深入了解這些進步與上一代相比的真正優勢,將炒作與實際的性能提升區分開來。
NVIDIA GeForce RTX 5070 Founders Edition 架構
RTX 5 利用 PCIe Gen5070 接口,具有 6,144 個 CUDA 核心,基本運行頻率為 2.16 GHz,最高可達 2.51 GHz。這使得 FP31 運算效能達到 32 TFLOPS,比 4070 的 29 TFLOPS 有明顯的提升。第四代光線追蹤核心可提供 4 TFLOPS 的 RT 功率,提供更好的即時反射、全域照明和路徑追蹤支援。第五代 Tensor 核心推動 94 AI TOPS,顯著提高 AI 增強升級、幀生成和計算工作負載。
NVIDIA 表示,與 RTX 4070 FE 相比,5070 FE 在使用具有多幀生成的 DLSS 1.9 時,3D 渲染性能提高了 4 倍,光柵化性能提高了 20%。對於仍在使用 RTX 3070 的使用者來說,差異更加明顯:DLSS 3 的效能提高了 4 倍以上,傳統光柵效能提高了 65%。
最顯著的硬體改進之一是轉向 GDDR7 記憶體。 RTX 5070 保留了 12GB 的 VRAM,但在 6 位元總線上從 GDDR7X 升級到 GDDR192,將記憶體頻寬增加到 675 GB/s,比 33 的 4070 GB/s 提升了 504%。這意味著更快的紋理加載、更好的 4K 性能以及改進的創意應用程式中大數據集的處理。
DLSS 4 和 AI 驅動的功能
DLSS 4 支援是 RTX 50 系列最大的吸引力之一。它引入了多幀生成,這是一種新的人工智慧技術,可以為每個渲染幀創建多個幀,從而顯著提高支援遊戲的 FPS。 DLSS 4 增強了光線重建和超分辨率,提高了影像清晰度和穩定性。
在發佈時,已有超過 75 款遊戲支援 DLSS 4,其中包括《Avowed》和《Kingdom Come Deliverance II》等較新的遊戲,以及《Red Dead Redemption II》和《Microsoft Flight Simulator》等較老的遊戲。由於新的 RT 核心和 AI 輔助去噪技術,利用光線追蹤和路徑追蹤的遊戲可能會獲得明顯的提升。
對於競技遊戲玩家,NVIDIA Reflex 2 帶來了 Frame Warp 功能,這是一種透過根據即時滑鼠輸入動態調整幀時間來減少系統延遲的新方法。這可能使《鬥陣特攻》、《決勝時刻》多人遊戲、《漫威的對手》和其他電競遊戲等快節奏射擊遊戲受益。
內容創作與專業工作負載的增強功能
除了遊戲之外,RTX 5070 也非常適合創作者。一項重大升級是專用的硬體加速 4:2:2 視訊編碼,這使得專業級視訊的匯出速度比 RTX 6 快 4070 倍。
對於基於 AI 的工作流程,由於 FP5070 加速和最新的 Blackwell 張量核心,4070 的 GenAI 性能是 RTX 4 的三倍。雖然它的功能肯定不如 50 系列的上層型號,但它仍然使其成為機器學習、人工智慧驅動的圖像處理和計算攝影的強大選擇——幫助用戶更快地訓練模型、使用人工智慧增強圖像並突破創意自動化的極限。
NVIDIA GeForce RTX 5070 Founders Edition 效率與散熱
儘管 RTX 250 的 TGP 增加了 4070W(高於 200 的 5070W),但考慮到性能的顯著提升,其效率仍然令人驚訝。 NVIDIA 很好地平衡了功耗和運算輸出,確保使用者獲得顯著的效能提升,而不會導致能耗過度增加。雖然更高的 TGP 可能會讓人感到驚訝,但效率和冷卻方面的改進使其成為需要持續電力而又不浪費過多能源的用戶的明智之舉。
此外,NVIDIA RTX 5070 Founders Edition 採用最佳化的雙風扇設置,可有效管理氣流和散熱。透過更大的散熱器和改進的蒸汽室,很明顯 NVIDIA 優先考慮了熱穩定性。這意味著用戶可以推動 5070 完成擴展的 AI 訓練運行、高解析度渲染或其他密集型工作負載,而不必擔心熱節流導致的效能下降。
對於那些需要可靠性能而又不必擔心過熱的人來說,5070 的設計感覺像是一次精心設計的升級,而不是簡單的強力動力提升。
顯示與連接
正如預期的那樣,RTX 5070 專為高刷新率遊戲和專業顯示設定而打造。它透過三個 DisplayPort 4b 連接埠和一個 HDMI 480b 連接埠支援 8Hz 的 120K 和 2.1Hz 的 2.1K。這使其成為具有極高刷新率的電競顯示器、高階 4K 遊戲顯示器以及影片製作、8D 渲染和 HDR 內容創作的專業 3K 顯示器的絕佳選擇。
不過值得注意的是,HDMI 論壇在 2.2 年國際消費電子展 (CES 2025) 上宣布了 HDMI 96,它將頻寬大幅提升至 10Gbps,可實現 240K 解析度和高達 XNUMXHz 的刷新率。如果您希望為該等級的效能做好未來準備,則可能需要等待新一代 RTX 卡才能充分利用。
現在,讓我們檢查效能結果並看看 RTX 5070 提供了什麼。對於 RTX 4070 用戶(甚至是那些仍持有 30 或 20 系列 GPU 的用戶)來說,最大的問題是其在 AI 驅動圖形、光線追蹤和記憶體速度方面的改進是否值得升級。
NVIDIA GeForce RTX 5070 Founders Edition 規格
GPU比較 | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
GPU名稱 | AD104 | GB205 | GB203 | GB203 |
卓越的建築 | 艾達洛夫萊斯 | 布萊克威爾2.0 | 布萊克威爾2.0 | 布萊克威爾2.0 |
進程大小 | 5納米 | 5納米 | 5納米 | 5納米 |
晶體管 | 35,800億 | 31,000萬元 | 45,600萬元 | 45,600萬元 |
密度 | 121.8M/平方毫米 | 117.9M/平方毫米 | 120.6M/平方毫米 | 120.6M/平方毫米 |
模具尺寸 | 294平方毫米 | 263平方毫米 | 378平方毫米 | 378平方毫米 |
槽寬 | 雙槽 | 雙槽 | 2.5插槽 | 雙槽 |
尺寸 | 240 mm x 110 mm x 40 mm | 242毫米×112毫米 | 304 x 126 x 50毫米 | 304 mm x 137 mm x 48 mm |
TDP | 200W¯¯ | 250W¯¯ | 300W¯¯ | 360W¯¯ |
視頻連接 | 1個HDMI 2.1、3個DisplayPort 1.4a | 1 個 HDMI 2.1b、3 個 DisplayPort 2.1a | 1 個 HDMI 2.1b、3 個 DisplayPort 2.1b | 1 個 HDMI 2.1b、3 個 DisplayPort 2.1b |
電源連接器 | 1x 16 針 | 1x 16 針 | 1x 16 針 | 1x 16 針 |
總線接口 | PCIe 4.0 x16 | PCIe 5.0 x16 | PCIe 5.0 x16 | PCIe 5.0 x16 |
基地時鐘 | 1920 MHz | 2165 MHz | 2300 MHz | 2295 MHz |
提升時鐘 | 2475 MHz | 2510 MHz | 超頻模式:2482MHz 預設模式:2452MHz(加速時脈) |
2617 MHz |
記憶時鐘 | 1313 MHz(21 Gbps 有效) | 2209 MHz(28 Gbps 有效) | 1750 MHz(28有效)Gbps |
2366 MHz(30 Gbps 有效) |
內存大小 | GB 12 | GB 12 | GB 16 | GB 16 |
內存類型 | GDDR6X | GDDR7 | GDDR7 | GDDR7 |
內存總線 | 192位 | 192位 | 256位 | 256位 |
內存帶寬 | 504.2 GB / s | 672.2 GB / s | 896.0 GB / s | 960.0 GB / s |
CUDA核心 | 5888 | 6,144 | 8960 | 10,752 |
TMU | 184 | 192 | 280 | 336 |
個ROPs | 64 | 64 | 128 | 128 |
SM 計數 | 46 | 48 | 70 | 84 |
張量核心 | 184 | 192 | 280 | 336 |
RT核心 | 46 | 48 | 70 | 84 |
L1緩存 | 128 KB(每個 SM) | 128 KB(每個 SM) | 128 KB(每個 SM) | 128 KB(每個 SM) |
L2緩存 | 36 MB | 40 MB | 64 MB | 64 MB |
像素率 | 158.4 G像素/秒 | 160.6 G像素/秒 | 313.9 G像素/秒 | 335.0 G像素/秒 |
紋理速率 | 455.4 GTexel/秒 | 481.9 GTexel/秒 | 686.6 GTexel/秒 | 879.3 GTexel/秒 |
FP16(半) | 29.15 兆次浮點運算 (1:1) | 30.84 兆次浮點運算 (1:1) | 43.94 兆次浮點運算 (1:1) | 56.28 兆次浮點運算 (1:1) |
FP32(浮點) | 29.15 TFLOPS | 30.84 TFLOPS | 43.94 TFLOPS | 56.28 TFLOPS |
FP64(雙) | 455.4 GFLOPS (1:64) | 481.9 GFLOPS (1:64) | 686.6 GFLOPS (1:64) | 879.3 GFLOPS (1:64) |
發行價(美元) | $599 | $549 | $749 | $999 |
StorageReview AMD Threadripper 測試平台
以下是我們將用於 RTX 5070 FE 測試的測試平台:
- 主板: 華碩 Pro WS TRX50-SAGE WIFI
- 中央處理器: AMD 銳龍 Threadripper 7980X 64 核心
- 隨機存取存儲器: 128GB DDR5 4800MT/秒
- 貯存: 2TB 三星 980 Pro
- 操作系統: Windows 11 Pro for Workstations
- 司機: NVIDIA 571.86 GameReady 驅動程式
AMD Ryzen Threadripper 7980X 位於我們的測試系統的核心,具有 64 個核心和廣泛的多執行緒功能。這確保了 CPU 限制不會幹擾以 GPU 為中心的基準測試,尤其是在 AI 處理、光線追蹤和高解析度渲染方面,這些方面的工作負載大量轉移到 GPU。
我們將 7980X 與 ASUS Pro WS TRX50-SAGE WIFI 主機板配對,以提供充足的 PCIe 頻寬,確保 GPU 能夠充分發揮其潛力而不會出現瓶頸。我們的系統還包括 128GB 的 5MT/s DDR4800 內存,在處理大型資料集時提供足夠的空間以確保平穩運行。儘管三星 980 Pro 是一款稍舊的 Gen4 SSD,但它仍然具有快速的讀取/寫入速度,可將載入時間保持在最短,並防止資料密集型任務(如 AI 模型推理或紋理流)受到儲存效能的阻礙。
此設定應該使我們能夠隔離並準確測量 GeForce RTX 5070 的實際效能,所以讓我們立即開始。
我們將 RTX 5070 FE 與以下 GPU 進行比較:
- NVIDIA RTX 5080 (16GB GDDR7)
- 華碩 Prime NVIDIA RTX 5070 Ti (16GB GDDR7)
- NVIDIA RTX 4070(12GB GDDR6X)
UL Procyon:人工智慧文字生成
我們首先要進行的測試是 Procyon AI 文字產生基準。該基準透過提供緊湊而一致的評估方法簡化了 AI LLM 性能測試,允許跨多個 LLM 模型進行重複測試,同時最大限度地降低大模型尺寸和可變因素的複雜性。該基準測試由 AI 硬體領導者共同開發,優化了本地 AI 加速器的使用,以實現更可靠、更有效率的效能評估。下面測量的結果是使用 TensorRT 測試的。
在這裡,RTX 5070 Founders Edition 在每項測試中都比上一代 4070 有所改進。無論是總體得分、第一個令牌的輸出時間或每秒令牌數,5070 FE 的效能都有所提升 - 通常在 10-15% 左右。這種提升意味著更快的人工智慧輸出、更短的等待時間和更流暢的模型推理。例如,在 Phi 基準測試中,4070 的得分從 3,191 上升到 3,453 FE 上的 5070,每秒令牌數從 141.575 上升到 150.435。雖然並不是驚天動地,但這種差異足以看到合成工作負載和實際使用情況的明顯改善。
與功能更強大的 5070 Ti 相比,5070 FE 預計落後約 15-25%,具體取決於特定測試。例如,在相同的 Phi 基準測試中,Ti 版本的總得分達到 4,179,較 FE 的 3,453 有顯著提高。在 Mistral 和 Llama 系列測試中,這種效能差距保持一致,表明 Ti 為需要更大 AI 吞吐量的用戶提供了更可觀的利潤。同時,旗艦產品 5080 位居排行榜首位,比 5070 Ti 領先 5-10%。它的優勢最明顯體現在令牌產生速度和第一個令牌的時間上,在大容量工作負載下,縮短幾分之一秒的時間就可以帶來很大的效果。
雖然 5070 FE 在 AI 推理任務方面表現不俗,但想要更快產生時間或處理大量資料集的高階使用者可能會發現 5070 Ti 或 5080 更能滿足他們在這項效能方面的需求。
UL Procyon:人工智慧文字生成 | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
Phi 總分 | 3,191 | 3,453 | 4,179 | 4,400 |
Phi 輸出到第一個代幣的時間 | 0.356小號 | 0.323小號 | 0.290小號 | 0.277小號 |
Phi 每秒輸出令牌 | 141.575 令牌/秒 | 150.435 令牌/秒 | 192.487 令牌/秒 | 209.459 令牌/秒 |
Phi 總持續時間 | 21.743小號 | 20.302小號 | 15.771小號 | 14.908小號 |
米斯特拉爾總分 | 2,987 | 3,562 | 4,412 | 4,635 |
米斯特拉爾輸出第一個令牌的時間 | 0.508小號 | 0.433小號 | 0.374小號 | 0.347小號 |
米斯特拉爾每秒輸出令牌 | 99.590 令牌/秒 | 120.507 令牌/秒 | 160.167 令牌/秒 | 163.598 令牌/秒 |
米斯特拉爾總持續時間 | 30.651小號 | 25.496小號 | 19.480小號 | 18.933小號 |
Llama3 總分 | 2,810 | 3,125 | 4,187 | 4,424 |
Llama3 輸出第一個令牌的時間 | 0.423小號 | 0.379小號 | 0.306小號 | 0.283小號 |
Llama3 每秒輸出令牌 | 82.130 令牌/秒 | 100.388 令牌/秒 | 131.853 令牌/秒 | 136.177 令牌/秒 |
Llama3 整體持續時間 | 36.147小號 | 29.720小號 | 22.786小號 | 21.985小號 |
Llama2 總分 | 2,658 | 3,125 | 4,284 | 4,790 |
Llama2 輸出第一個令牌的時間 | 0.947小號 | 0.785小號 | 0.560小號 | 0.493小號 |
Llama2 每秒輸出令牌 | 49.487 令牌/秒 | 56.647 個代幣/秒 | 75.905 令牌/秒 | 83.653 令牌/秒 |
Llama2 整體持續時間 | 61.300小號 | 53.234小號 | 39.545小號 | 35.703小號 |
UL Procyon: 人工智能圖像生成
Procyon AI 影像產生基準 持續準確地測量各種硬體(從低功耗 NPU 到高階 GPU)的 AI 推理效能。它包括三個測試:針對高階 GPU 的穩定擴散 XL (FP16)、針對中功率 GPU 的穩定擴散 1.5 (FP16) 和針對低功耗設備的穩定擴散 1.5 (INT8)。基準測試針對每個系統使用最佳推理引擎,確保結果公平且可比較。
RTX 5070 FE 在每個影像產生測試中都比 4070 有所進步 - 最顯著的是在穩定擴散 1.5 (FP16) 中,它的總分從 2,400 上的 4070 躍升至 2,937 FE 上的 5070。這一差距意味著 FP16 和 INT8 基準測試中影像生成速度更快、推理時間更短,這使得 5070 FE 成為專注於 AI 驅動圖形工作負載的用戶的有力競爭者。與 5070 Ti 和 5080 相比,5070 FE 在大多數測試中落後約 20-25%,這可能證明對於對 AI 影像產生有極高需求的用戶來說,Ti 的價格更高是合理的。同時,5080 更進一步,比 Ti 又高出 15-20%。
從實際角度來看,RTX 5070 FE 比 4070 有明顯優勢,推理時間明顯更快,內容創建工作流程更流暢。但是,如果您經常處理複雜或大規模的影像產生任務,那麼 20 Ti 提供的額外 25-5070% 的效能提升(或 15 提供的額外 20-5080% 的效能提升)可能值得投資。
UL Procyon:AI 影像產生(總分:越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
穩定擴散 1.5 (FP16) — 總體得分 | 2,400 | 2,937 | 3,755 | 4,650 |
穩定擴散 1.5 (FP16) — 總時間 | 41.661小號 | 34.038小號 | 26.625小號 | 21.503小號 |
穩定擴散 1.5 (FP16) — 影像產生速度 | 2.604 秒/影像 | 2.127 秒/影像 | 1.664 秒/影像 | 1.344 秒/影像 |
穩定擴散 1.5 (INT8) — 總體得分 | 31,048 | 36,320 | 46,744 | 55,683 |
穩定擴散 1.5 (INT8) — 總時間 | 8.052小號 | 6.883小號 | 5.348小號 | 4.490小號 |
穩定擴散 1.5 (INT8) — 影像生成速度 | 1.006 秒/影像 | 0.860 秒/影像 | 0.669 秒/影像 | 0.561 秒/影像 |
穩定擴散 XL (FP16) — 總體得分 | 1,940 | 2,473 | 3,352 | 4,257 |
穩定擴散 XL (FP16) — 總時間 | 309.269s | 242.606s | 178.946小號 | 140.928s |
穩定擴散 XL (FP16) — 影像產生速度 | 19.329 秒/影像 | 15.163 秒/影像 | 11.184 秒/影像 | 8.808 秒/影像 |
樂士馬克
Luxmark 是一個 GPU 基準測試,它使用開源光線追蹤渲染器 LuxRender 來評估系統在處理高度詳細的 3D 場景方面的效能。此基準測試適用於評估伺服器和工作站的圖形渲染能力,特別是對於視覺效果和建築視覺化應用程序,其中準確的光模擬至關重要。
在衡量高級光線追蹤效能的 Luxmark 中,RTX 5070 FE 在食物場景測試中比 20 提升了約 4070%(7,535 對 9,061),在大廳場景中提升了約 10%(20,003 對 22,062)。與 5070 Ti 相比,它在食物方面落後約 33%(9,061 對 12,073),在大廳方面落後 30%(22,062 對 28,635)——對於處理大型 3D 渲染或 VFX 項目的用戶來說,這個明顯的差距可能證明 Ti 的價格更高是合理的。 5080 進一步擴大了利潤空間,在食品領域比 5070 FE 高出 50% 以上(9,061 比 13,637),在大廳領域比 40 FE 高出約 22,062%(30,815 比 XNUMX)。
Luxmark(越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
食物評分 | 7,535 | 9,061 | 12,073 | 13,637 |
霍爾分數 | 20,003 | 22,062 | 28,635 | 30,815 |
在相關工作流程中(例如建築視覺化或視覺效果製作),5070 FE 仍然比 4070 有了顯著的提升。
Geekbench 6
Geekbench 6 是衡量整體系統效能的跨平台基準測試。 Geekbench 瀏覽器可讓您將任何系統與其進行比較。
在下面的結果表中,RTX 5070 FE 獲得了 188,892 分,比 4070 的 174,725 分有了很大的提高。 Geekbench 8 的 GPU OpenCL 得分從 6 躍升至 174,725,增幅達 188,892%,乍看之下可能並不大。然而,對於那些處理資源密集型任務(如高解析度影片編輯、複雜的 3D 渲染或機器學習推理)的人來說,它仍然可以提供適度的提升。雖然它不會顯著影響簡單的工作流程,但如果您經常將 GPU 推到極限,額外的空間可能會更加明顯。
Geekbench(越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
GPU OpenCL 分數 | 174,725 | 188,892 | 246,875 | 265,397 |
與 50 系列的高端型號相比,差距預計會擴大。 5070 Ti 獲得了 246,875 分,功率提高了約 30%。在排行榜上,5080 的排名進一步提升至 265,397,對工作站專業人士和狂熱愛好者來說極具吸引力。儘管如此,對於那些希望在更繁重的基於 GPU 的任務中獲得明顯升級,但又不必花費更昂貴價格的用戶來說,5070 FE 是一個最佳選擇。
的V-Ray
的V-Ray 基準測試使用先進的 V-Ray 6 引擎測量 CPU、NVIDIA GPU 或兩者的渲染效能。它使用快速測試和簡單的評分系統來讓使用者評估和比較其係統的渲染能力。對於尋求高效績效洞察的專業人士來說,它是一個不可或缺的工具。
在這裡,RTX 5070 FE 的得分為 6,553,比 RTX 47 的得分 4,469 大幅提升了 4070%。對於從 5070 升級到 4070 的專業人士或愛好者來說,渲染時間可能會顯著減少,具體取決於其其餘系統設定。
V-Ray(越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
虛擬路徑 | 4,469 | 6,553 | 8,018 | 9,311 |
將 RTX 5070 與高階型號進行比較,5070 Ti 的 vpath 得分為 8,018,比 5070 FE 高出約 22%。 5080 再次進一步提升至 9,311,效能比 42 FE 高出 5070%。雖然 Ti 和 5080 更適合重負荷渲染工作負載,但 5070 FE 仍然比上一代有了很大的進步,使其成為一個強大的中檔選擇。
3D馬克
3DMark Port Royal、Speed Way 和 Steel Nomad 是測試不同場景下效能的 GPU 基準測試。 Port Royal 專注於光線追踪,Speed Way 評估賽車模擬中的性能,Steel Nomad 則以高強度、逼真的圖形挑戰 GPU。它們評估 GPU 在渲染、照明和動態場景方面的能力。
3DMark 測驗(分數越高越好) | NVIDIA GeForce RTX 4070 | NVIDIA RTX 5070 | 華碩 PRIME NVIDIA RTX 5070 Ti |
皇家港口 | 11,074 | 14,026 | 19,290 |
速度之路 | 4,477 | 5,869 | 7,709 |
鋼鐵游牧者 | 3,748 | 5,019 | 6,458 |
NVIDIA RTX 5070 在 31DMark 基準測試中比 RTX 4070 性能高出 3%,以其價格水準實現了大幅價值升級。 ASUS PRIME RTX 5070 Ti 的效能更進一步,平均比 RTX 41 高出 4070%。
NVIDIA GeForce RTX 5070 Founders 電源效率結果
我們一直使用 Procyon AI Image 測試作為基準來測量所有新的 50 系列 NVIDIA GPU 的功耗。運行穩定擴散 XL FP16 測試,我們查看生成的倒數第二張影像的間隔。我們測量該間隔從開始到結束的時間、消耗的峰值功率、平均高功耗以及測試完成後的空閒功率。我們的測試表明,在持續工作負載下,平均功耗為 2W,峰值達到 409W,空閒功耗為 429W。 NVIDIA GeForce RTX 184 的標稱功率為 5070W,實際耗電量約 250W,峰值為 225W。這張卡完成了我們的 245 秒的測試週期,總能耗為 19.2Wh。這比 2.46Ti 有了明顯的上升,是 GeForce RTX 5070 測量值的兩倍以上。
穩定擴散 XL FP16 影像功率使用情況(越低越好) | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 | NVIDIA RTX 5090 |
耗電量 | 2.46Wh | 1.66Wh | 1.39Wh | 1.16Wh |
測試時間 | 19.2小號 | 11.1小號 | 8.7小號 | 5.1小號 |
結論
NVIDIA RTX 5070 FE 的價格達到了至關重要的 549 美元,融合了性能和下一代功能,但價格卻不高。對於使用 30 系列或 20 系列 GPU 的用戶來說,這款顯示卡代表著明顯的升級 - 更高的幀率、改進的內存頻寬以及 DLSS 4 的多幀生成等 AI 功能有助於提供更流暢、響應更靈敏的體驗。如果您使用的是 40 系列 GPU,5070 仍然可以帶來有意義的改進,特別是在渲染和 AI 工作負載方面。
在我們的測試中,RTX 5070 在 AI 驅動的應用程式中的表現始終比 4070 高出 10-15%,在渲染和運算密集型任務方面的表現甚至更大。例如,V-Ray 的效能提升了 40% 以上,顯著減少了複雜光線追蹤場景的渲染時間。這些收益凸顯了 NVIDIA 的 Blackwell 進步,包括增強的張量和 RT 核心以及向 GDDR7 記憶體的切換,從而可以更好地處理高解析度紋理和苛刻的創意工作負載。雖然 12GB 的 VRAM 有點不盡人意,但對於許多遊戲和 AI 任務來說已經足夠了,尤其是較小的本地型號。
最終,RTX 5070 FE 感覺像是一個平衡的選擇,可以以合理的價格獲得下一代功能。 NVIDIA 透過 5070 Ti 和 5080 為需要更多功能的使用者留下了空間,但對於大多數使用者來說,5070 在成本和效能之間取得了出色的平衡。然而,真正的考驗是可用性。如果 NVIDIA 保持庫存水準穩定,這款顯示卡最終將能夠成為兼具效能和可訪問性的中階顯示卡,並且不會出現前幾代顯示卡的供應問題。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱