NVIDIA GeForce RTX 5080 將於 30 年 2025 月 5090 日與旗艦 RTX XNUMX 一起推出,並定位為 NVIDIA Blackwell 系列中更實惠的高效能選項。
NVIDIA GeForce RTX 5080 將於 30 月 5090 日與旗艦 RTX 999 一起推出,定位為 NVIDIA Blackwell 系列中更實惠的高效能選項。它的售價為 1,999 美元,比 5090 美元的 RTX XNUMX 低了一步,但仍然提供尖端的性能。這使得它可能成為那些想要頂級功能但又不想旗艦價格標籤的開發者、內容創作者和遊戲玩家的最愛。
RTX 5090 配備了與 RTX 5080 相同的先進 AI 功能,帶來了 NVIDIA 的最新創新,例如 具有多幀生成功能的 DLSS 4 射線重建,面向更廣大的受眾。這些技術重新定義了遊戲性能和視覺保真度,使 RTX 5080 即使在最苛刻的遊戲中也能提供流暢的幀速率和令人驚嘆的圖形。
產品規格
RTX 5080 具有 10,752 個 CUDA 核心,比 RTX 4080 的 9,728 個核心顯著提升,但仍低於 RTX 5090 的 21,760 個核心。這意味著在遊戲和人工智慧加速工作負載方面具有出色的效能,儘管上限比旗艦產品略低。
GPU比較 | NVIDIA RTX 6000 Ada | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 5080 | NVIDIA RTX 5070 |
GPU名稱 | AD102 | GB202 | AD102 | GB203 | GB205 |
卓越的建築 | 艾達洛夫萊斯 | 布萊克威爾2.0 | 艾達洛夫萊斯 | 布萊克威爾2.0 | 布萊克威爾2.0 |
進程大小 | 5納米 | 4納米 | 5納米 | 4納米 | 4納米 |
晶體管 | 76,300萬元 | 92,200萬元 | 76,300萬元 | 45,600萬元 | 31,000萬元 |
密度 | 125.3M/平方毫米 | 123.9M/平方毫米 | 125.3M/平方毫米 | 120.6M/平方毫米 | 117.9M/平方毫米 |
模具尺寸 | 609平方毫米 | 744平方毫米 | 609平方毫米 | 378平方毫米 | 263平方毫米 |
槽寬 | 雙槽 | 雙槽 | 三槽 | 雙槽 | 雙槽 |
尺寸 | 267mm x 122mm | 304 mm x 137 mm x 48 mm | 304 mm x 137 mm x 61 mm | 304 mm x 137 mm x 48 mm | 242毫米×112毫米 |
TDP | 300W | 575W¯¯ | 450W¯¯ | 360W¯¯ | 250W¯¯ |
輸出 | 4 個顯示端口 1.4a | 1 個 HDMI 2.1b,3 個 DisplayPort 2.1b | 1個HDMI 2.1、3個DisplayPort 1.4a | 1 個 HDMI 2.1b、3 個 DisplayPort 2.1b | 1 個 HDMI 2.1b、3 個 DisplayPort 2.1a |
電源連接器 | 1x 16 針 | 1x 16 針 | 1x 16 針 | 1x 16 針 | 1x 16 針 |
總線接口 | PCIe 4.0 x16 | PCIe 5.0 x16 | PCIe 4.0 x16 | PCIe 5.0 x16 | PCIe 5.0 x16 |
基地時鐘 | 915 MHz | 2017 MHz | 2235 MHz | 2295 MHz | 2165 MHz |
提升時鐘 | 2505 MHz | 2407 MHz | 2520 MHz | 2617 MHz | 2510 MHz |
記憶時鐘 | 2500 MHz 20(Gbps 有效) | 2209 MHz(28 Gbps 有效) | 1313 MHz(21 Gbps 有效) | 2366 MHz(30 Gbps 有效) | 2209 MHz(28 Gbps 有效) |
內存大小 | GB 48 | GB 32 | GB 24 | GB 16 | GB 12 |
內存類型 | GDDR6 | GDDR7 | GDDR6X | GDDR7 | GDDR7 |
內存總線 | 384位 | 512位 | 384位 | 256位 | 192位 |
內存帶寬 | 960 GB / s | 1.79 TB / s | 1.01 TB / s | 960.0 GB / s | 672.2 GB / s |
CUDA核心 | 18,176 | 21,760 | 16,384 | 10,752 | 6,144 |
TMU | 568 | 680 | 512 | 336 | 192 |
個ROPs | 192 | 192 | 176 | 128 | 64 |
SM 計數 | 142 | 170 | 128 | 84 | 48 |
張量核心 | 568 | 680 | 512 | 336 | 192 |
RT核心 | 142 | 170 | 128 | 84 | 48 |
L1緩存 | 128 KB(每個 SM) | 128 KB(每個 SM) | 128 KB(每個 SM) | 128 KB(每個 SM) | 128 KB(每個 SM) |
L2緩存 | 96MB | 88 MB | 72 MB | 64 MB | 40 MB |
像素率 | 481.0 G像素/秒 | 462.1 G像素/秒 | 443.5 G像素/秒 | 335.0 G像素/秒 | 160.6 G像素/秒 |
紋理速率 | 1,423 GTexel/秒 | 1,637 GTexel/秒 | 1,290 GTexel/秒 | 879.3 GTexel/秒 | 481.9 GTexel/秒 |
FP16(半) | 91.06 兆次浮點運算 (1:1) | 104.8 兆次浮點運算 (1:1) | 82.58 兆次浮點運算 (1:1) | 56.28 兆次浮點運算 (1:1) | 30.84 兆次浮點運算 (1:1) |
FP32(浮點) | NVIDIA RTX 5090 | 104.8 TFLOPS | 82.58 TFLOPS | 56.28 TFLOPS | 30.84 TFLOPS |
FP64(雙) | 91.06 TFLOPS | 1.637 兆次浮點運算 (1:64) | 1,290 GFLOPS (1:64) | 879.3 GFLOPS (1:64) | 481.9 GFLOPS (1:64) |
發行價(美元) | 6,799美元 | $1,999 | $1,599 | $999 | $549 |
RTX 16 在 7 位元匯流排上配備 384GB GDDR5080 顯存,為現代遊戲和創意應用程式提供充足的頻寬。雖然它與 5090 的 32GB 和 512 位元總線不匹配,但對於大多數用戶來說已經足夠了。和 RTX 360 的 TDP 為 5080W,比 RTX 4080 更耗電,但仍比 5090 的 575W 更容易管理。這使其更適合擁有標準高階 PC 構造的用戶。
若想更深入了解 Blackwell 架構以及為 50 系列 GPU 提供支援的創新,請查看我們的 RTX 5090 評測.
構建和設計
RTX 5080 保留了NVIDIA Founders Edition 卡的時尚雙插槽設計,使其比三插槽RTX 4090 更緊湊。高效率冷卻工作負載。與 3 不同的是,RTX 5090 採用傳統導熱化合物而非液態金屬。在我們的露天測試台中,GeForce RTX 5090 在正常溫度下運作沒有任何問題,儘管它在負載下的功耗比 GeForce RTX 5080 低得多。

(5090 右圖)(5080 左圖)
該卡的尺寸(長 304 毫米 x 寬 137 毫米 x 高 48 毫米)使其非常適合大多數高階 PC 建造。其雙插槽外形尺寸確保與各種機殼相容。流通式冷卻設計改善了氣流,即使在重負載下也能保持卡片涼爽和安靜。

1x 16 針至 3x 8 針連接器
主要特點和性能
RTX 5080 與 RTX 5090 具有許多相同的 DNA,包括 Blackwell 架構以及對具有多幀生成功能的 DLSS 4 的支援。雖然 RTX 5080 的原始性能與上一代 RTX 4080 相比並不完全匹配,但它仍然提供了令人印象深刻的性能提升,使其成為遊戲玩家和創作者等人士的引人注目的升級。
遊戲和人工智慧功能
RTX 5080 受益於與 RTX 5090 相同的 AI 驅動遊戲進步,包括 DLSS 4 和光線重建。這些功能使該卡即使在最苛刻的遊戲中也能提供更流暢的幀速率和增強的視覺保真度。 與 5090 一樣,RTX 5080 利用 DLSS 4 的多幀產生為每個渲染幀產生最多三個 AI 幀。這使得支援的遊戲效能顯著提升,使高刷新率的 4K 遊戲變得更加容易。
5080 的 128 個 RT 核心(相比 5090 的 170 個)仍然提供出色的光線追蹤效能,可在遊戲中實現逼真的光照、陰影和反射。 雖然 RTX 5090 更適合繁重的 AI 工作負載,但 RTX 5080 的第五代 Tensor Core 和 FP5 精度仍然使其成為涉足 AI 輔助工作流程的創作者的有力選擇。
NVIDIA GeForce RTX 5080 評測 – 效能基準
為了最大限度地發揮新 NVIDIA GeForce RTX 5080 的效能,我們使用了高效能 AMD ThreadRipper 平台。該系統採用 64 核心 CPU 和水冷迴路,提供 CPU 功率,確保 GPU 滿載運作而不會出現瓶頸。使用相同的配置來測試 NVIDIA GeForce RTX 6000 Ada、5090 和 4090,確保對所有顯示卡進行公平比較。以下是完整的系統配置:
StorageReview AMD ThreadRipper 測試平台
- 主板: 華碩 Pro WS TRX50-SAGE WIFI
- 中央處理器: AMD 銳龍 Threadripper 7980X 64 核心
- 隨機存取存儲器: 32GB DDR5 4800MT/秒
- 貯存: 2TB 三星 980 Pro
- 操作系統: Windows 11 Pro for Workstations
- 司機: NVIDIA 571.86 GameReady 驅動程式
UL Procyon:人工智慧文字生成
Procyon AI 文字產生基準 透過提供緊湊且一致的評估方法,簡化了 AI LLM 性能測試。它允許跨多個 LLM 模型進行重複測試,同時最大限度地減少大模型大小和可變因素的複雜性。它與人工智慧硬體領導者共同開發,優化了本地人工智慧加速器的使用,以實現更可靠、更有效率的效能評估。下面測量的結果是使用 TensorRT 進行測試的。
Procyon AI 文字產生基準測試顯示,RTX 5080 在所有測試中的效能都緊跟著 RTX 6000 Ada。在 披 在測試中,5080 的得分為4,400,略低於6000 Ada 的4,508,但這兩張卡在每秒輸出令牌和總體持續時間方面表現相似,RTX 5090 和4090 的得分更高,分別為5,749 和4,958。
對於 寒冷西北風 測試中,RTX 5080 得分為 4,635,優於 6000 Ada(得分為 4,255),但仍落後於 5090(6,267)和 4090(5,094)。 5080 每秒輸出代幣的速度比 6000 Ada 更快,且整體持續時間稍短。
適用於 駱駝3其中,RTX 5080 得分為 4,424,表現優於 6000 Ada 的 4,026,但仍落後於 5090(6,104)和 4090(4,849)。在此測試中,5080 比 6000 Ada 實現了更好的每秒輸出令牌,但兩張卡的總體持續時間相似。
最後,在 駱駝2 測試中,RTX 5080 得分為 4,790,落後於 5090(6,591)和 4090(5,013),但仍略勝 6000 Ada(3,957)。 5080 實現了比 6000 Ada 更快的代幣輸出速度,並且其整體持續時間比 6000 Ada 略短。總體而言,RTX 5080 提供了可靠的 AI 影像生成性能,在 6000 項測試中的 3 項測試中保持了相對於 4 Ada 的競爭優勢。
UL Procyon:人工智慧文字生成 | NVIDIA RTX 5080 | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
Phi 總分 | 4,400 | 5,749 | 4,958 | 4,508 |
Phi 輸出到第一個代幣的時間 | 0.277小號 | 0.244小號 | 0.255小號 | 0.288小號 |
Phi 每秒輸出令牌 | 209.459 令牌/秒 | 314.435 令牌/秒 | 244.343 令牌/秒 | 228.359 令牌/秒 |
Phi 總持續時間 | 14.908小號 | 10.280小號 | 12.872小號 | 13.869小號 |
米斯特拉爾總分 | 4,635小號 | 6,267 | 5,094 | 4,255 |
米斯特拉爾輸出第一個令牌的時間 | 0.347小號 | 0.297小號 | 0.322小號 | 0.419小號 |
米斯特拉爾每秒輸出令牌 | 163.598 令牌/秒 | 255.945 令牌/秒 | 183.266 令牌/秒 | 166.633 令牌/秒 |
米斯特拉爾總持續時間 | 18.933小號 | 12.593小號 | 17.010小號 | 19.092小號 |
Llama3 總分 | 4,424 | 6,104 | 4,849 | 4,026 |
Llama3 輸出第一個令牌的時間 | 0.283小號 | 0.234小號 | 0.259小號 | 0.348小號 |
Llama3 每秒輸出令牌 | 136.177小號 | 214.285 令牌/秒 | 150.039 令牌/秒 | 138.620 令牌/秒 |
Llama3 整體持續時間 | 21.985小號 | 14.304小號 | 19.991小號 | 22.062小號 |
Llama2 總分 | 4,790 | 6,591 | 5,013 | 3,957 |
Llama2 輸出第一個令牌的時間 | 0.493小號 | 0.419小號 | 0.500小號 | 0.679小號 |
Llama2 每秒輸出令牌 | 83.653 令牌/秒 | 134.502 令牌/秒 | 92.853 令牌/秒 | 78.532 令牌/秒 |
Llama2 整體持續時間 | 35.703s | 23.018小號 | 32.448小號 | 38.923小號 |
UL Procyon: 人工智能圖像生成
Procyon AI 影像產生基準 提供一致、準確的方法來測量從低功耗 NPU 到高階 GPU 等各種硬體的 AI 推理效能。它包括三個測試:適用於高階 GPU 的 Stable Diffusion XL (FP16)、適用於中型功能 GPU 的 Stable Diffusion 1.5 (FP16) 以及適用於低功耗設備的 Stable Diffusion 1.5 (INT8)。此基準測試為每個系統使用最佳推理引擎,確保結果公平且可比較。
在這項 AI 影像生成基準測試中,RTX 5080 表現強勁,但仍落後於更高等級的 RTX 5090 和 4090。 穩定擴散 1.5 (FP16) 測試中,RTX 5080 得分為 4,650,略高於 6000 Ada 的 4,230,但落後於 5090(8,193)和 4090(5,260)。 5080 的影像產生速度比 5090 和 4090 慢,每張影像花費 1.344 秒,而 0.763 為 5090 秒,1.188 為 4090 秒,但仍比 6000 Ada(1.477 秒)快。
對於 穩定擴散1.5 (INT8) 測試中,RTX 5080 得分為 55,683,落後於 5090(79,272)和 4090(62,160),但領先 6000 Ada(55,901)。 5080 的影像產生速度(每張影像 0.561 秒)慢於 5090(0.394 秒)和 4090(0.503 秒),但略領先 6000 Ada(0.559 秒)。
在 穩定擴散 XL (FP16) 測驗中,5080得分為4,257。它的表現再次優於 5090 (7,179) 和 4090 (5,025),但明顯領先 6000 Ada (3,043)。 5080 的影像產生速度為每張影像 8.808 秒,低於 5090(5.223 秒)和 4090(7.461 秒),但高於 6000 Ada(12.323 秒)。
雖然 RTX 5080 始終落後於高端型號,但它在所有(總體得分)測試中保持了優於 6000 Ada 的競爭優勢,以相對較低的價格提供了可靠的圖像生成性能。
UL Procyon:AI 影像產生(總分:越高越好) | NVIDIA RTX 5080 | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
穩定擴散 1.5 (FP16) – 總分 | 4,650 | 8,193 | 5,260 | 4,230 |
穩定擴散 1.5 (FP16) – 總時間 | 21.503小號 | 12.204小號 | 19.011小號 | 23.639小號 |
穩定擴散 1.5 (FP16) – 影像產生速度 | 1.344 秒/影像 | 0.763 秒/影像 | 1.188 秒/影像 | 1.477 秒/影像 |
穩定擴散 1.5 (INT8) – 總分 | 55,683 | 79,272 | 62,160 | 55,901 |
穩定擴散 1.5 (INT8) – 總時間 | 4.490小號 | 3.154小號 | 4.022小號 | 4.472小號 |
穩定擴散 1.5 (INT8) – 影像生成速度 | 0.561 秒/影像 | 0.394 秒/影像 | 0.503 秒/影像 | 0.559 秒/影像 |
穩定擴散 XL (FP16) – 總分 | 4,257 | 7,179 | 5,025 | 3,043 |
穩定擴散 XL (FP16) – 總時間 | 140.928s | 83.573小號 | 119.379小號 | 197.172小號 |
穩定擴散 XL (FP16) – 影像產生速度 | 8.808 秒/影像 | 5.223 秒/影像 | 7.461 秒/影像 | 12.323 秒/影像 |
樂士馬克
Luxmark 是一個 GPU 基準測試,它使用開源光線追蹤渲染器 LuxRender 來評估系統在處理高度詳細的 3D 場景方面的效能。此基準測試適用於評估伺服器和工作站的圖形渲染能力,特別是對於視覺效果和建築視覺化應用程序,其中準確的光模擬至關重要。
在 Luxmark 基準測試中,RTX 5080 的得分為 13,637 “食物” 場景,落後於 RTX 5090,得分為 23,141。 RTX 4090 的表現也優於 5080,得分為 17,171。 RTX 6000 Ada 得分為 14,873,略高於 5080。 “大廳” 場景方面,5080 得分為 30,815,落後於 5090 的 51,725 和 4090 的 38,887。不過,它的表現略優於 RTX 6000 Ada,得分為 32,132。雖然 RTX 5080 無法與高端型號相媲美,但它的表現確實與 6000 Ada 接近,尤其是在美食和大廳場景中。
Luxmark(越高越好) | NVIDIA RTX 5080 | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
食物評分 | 13,637 | 23,141 | 17,171 | 14,873 |
霍爾分數 | 30,815 | 51,725 | 38,887 | 32,132 |
Geekbench 6
Geekbench 6 是衡量整體系統效能的跨平台基準測試。 Geekbench 瀏覽器可讓您將任何系統與其進行比較。
Geekbench 6 結果表明,RTX 5080 的 GPU OpenCL 得分為 265,397。它明顯落後於更高級別的 RTX 5090,後者得分為 374,807。 RTX 4090 和 RTX 6000 Ada 的表現類似,得分分別為 333,384 和 336,882。 5080的得分明顯較低,落後41,423 4090分,顯示在該基準測試中與90系列卡和6000 ada型號相比存在明顯的性能差距。
Geekbench(越高越好) | NVIDIA RTX 5080 | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
GPU OpenCL 分數 | 265,397 | 374,807 | 333,384 | 336,882 |
的V-Ray
的V-Ray 基準測試使用先進的 V-Ray 6 引擎測量 CPU、NVIDIA GPU 或兩者的渲染效能。它使用快速測試和簡單的評分系統來讓使用者評估和比較其係統的渲染能力。對於尋求高效績效洞察的專業人士來說,它是一個不可或缺的工具。
V-Ray 基準測試得出的結論是,RTX 5080 表現良好,路徑得分為 9,311。雖然較高等級的RTX 5090 以14,764 條路徑領先,但5080 的性能與RTX 1,000 的4090 條路徑和RTX 10,847 Ada 的6000 條路徑相差在10,766 點以內,這表明它在這項測試中的競爭非常激烈。
V-Ray(越高越好) | NVIDIA RTX 5080 | NVIDIA RTX 5090 | NVIDIA RTX 4090 | NVIDIA RTX 6000 Ada |
虛擬路徑 | 9,311 | 14,764 | 10,847 | 10,766 |
NVIDIA GeForce RTX 5080 功耗
功耗是任何高端運算平台的重要組成部分。每一代新一代 GPU 在負載下都會消耗更多電量,這意味著需要更大的電源和充足的冷卻氣流。然而,與效能相關的功耗還有另一個面向:更快的 GPU 可能會更高,但每個工作負載的持續時間會縮短。
NVIDIA 在 CES 2025 編輯日期間討論了 Blackwell 架構的能源效率提升,我們希望看到這一成果在 AI 驅動的工作負載中發揮作用。利用 Quarch 電源分析儀 在我們的測試實驗室中,我們測量了運行時的系統總功耗 Procyon AI 影像產生器 穩定擴散 XL FP16 測試。這種工作負載將每個 GPU 推向了其功率極限,並為每個生成的影像定義了清晰的起始點和停止點。這裡, 我們將新款 GeForce RTX 5090 與上一代 GeForce RTX 4090 和 RTX 6000 Ada 的結果進行比較。
NVIDIA GeForce RTX 5080 所列的峰值功耗為 360W。在執行Procyon AI影像產生測試時,系統功耗從測試準備時的239W增加到GPU負載時的584W,增加了345W。我們測量了測試中創建倒數第二張圖像所需的能量,該圖像耗時 8.7 秒,使用了 1.39Wh 的能量。
結論
NVIDIA GeForce RTX 5080 是 50 系列產品中的最佳選擇,以更平易近人的價格提供尖端功能和卓越性能。它非常適合圖形密集型用例,需要AI 驅動工作負載的最新進展,而無需花費太多錢購買旗艦RTX 5090。來說,RTX 5090 是最佳選擇可能是最受歡迎的選擇。
價格方面,NVIDIA 將 GeForce RTX 5080 定價為 999 美元,是 GeForce RTX 5090 價格的一半。 GeForce RTX 40,後者的售價為5080 美元。因此,雖然 RTX 4080 仍將進行重大改變,但 RTX 1,199 對於想要最新功能集的人來說具有有吸引力的價格。它還具有比 GeForce RTX 5090 功耗更低的額外優勢,因此對於擁有可支援 5080W 但不支援 4090W GPU 的平台的買家來說,RTX 450 無需更改硬體即可插入。
關於效能,我們將其與 GeForce RTX 5090、GeForce RTX 4090 和 RTX 6000 Ada 進行分組。與上一代頂級消費者和工作站產品相比,NVIDIA GeForce RTX 5080 的表現出奇地好。雖然它在我們的 AI 工作負載中沒有擊敗 GeForce RTX 4090,但也並沒有落後太多。 RTX 5080 在渲染工作負載方面進一步下滑,但與價格較高的顯示卡相比表現良好。
總體而言,NVIDIA GeForce RTX 5080 以極具吸引力的 999 美元標價提供了很高的價值,使其成為渲染、AI 或遊戲工作負載的不錯選擇。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱