探索我们对 NVIDIA GeForce RTX 5090 移动 GPU 性能、规格和基准的全面评论。
GeForce RTX 50 系列标志着笔记本电脑 GPU 向前迈出了一大步,这要归功于 NVIDIA 的新 Blackwell 架构,该架构可增强 AI 处理、光线追踪和电源效率。在这篇评测中,我们将重点介绍 Razer Blade 5090 中的 GeForce RTX 16 移动 GPU,这是一款强大的 GPU,旨在以便携形式提供一流的性能。虽然它的目标不是与高端台式机相媲美,但其令人印象深刻的规格使其成为专业人士和需要强大动力的移动游戏玩家的强大选择。
GeForce RTX 50 系列引入了原生 FP4 支持、更先进的 Tensor Core 和改进的光线追踪功能,同时提供比前几代更好的电池效率。借助通过 DLSS 4 实现的 AI 驱动渲染和帧生成,它已准备好为移动 GPU 的可能性设定新的基准。
GeForce RTX 5090 移动版与 5090 台式机:有何区别?
GeForce RTX 5090 移动版和 台式机型号 可能共享相同的 Blackwell 2.0 架构和 5nm 工艺,但它们的用途截然不同。不出所料,桌面版明显更大,晶体管数量几乎翻了一番(92.2B vs. 45.6B),TDP 也高得多(575W vs. 150W)。这允许更高的基础时钟和加速时钟。
虽然移动版的设计注重效率和便携性,但桌面版提供了更强大的功能,CUDA 核心、内存带宽和整体计算性能几乎是后者的两倍,但代价是功耗更高、尺寸更大。归根结底,桌面版 GeForce RTX 5090 是一款性能猛兽,而移动版在性能和移动性之间取得了平衡。
平台概述:Razer Blade 16
虽然这里的重点是 GeForce RTX 5090 移动 GPU,但值得讨论一下它所运行的机器——Razer Blade 16。总的来说,这是一个令人印象深刻的平台,可以展示 5090 的功能,其高端规格让 GPU 可以发挥其作用。
Razer Blade 16 是一款专为高性能计算而打造的高端工作站级笔记本电脑。它搭载 AMD Ryzen AI 9 HX 370,这是一款 12 核(24 线程)处理器,最大加速时钟频率为 5.18GHz,并配备 32GB DDR5 内存,运行速度为 8000MT/s。
Razer Blade 16 规格
规格 | 信息 |
运行系统 | Windows 11专业版 |
处理器 | AMD Ryzen™ AI 9 HX 370(12 核/24 线程,3.3 GHz 基本/5.1 GHz 最大加速) |
图像 | NVIDIA GeForce RTX 5090(24 GB GDDR7 VRAM) |
屏 显: | 16 英寸 QHD+ OLED(2560 x 1600)240 Hz |
2 TB SSD(M.2 PCIe Gen 4 NVMe x4、x2) | |
内存 | 32 GB LPDDR5X 8000 MHz(焊接) |
键盘 | 每键 RGB (Razer Chroma™) N 键翻转 |
连接方式 | Wi-Fi 7、蓝牙 5.4、三频 2×2 WLAN |
端口 | 3 个 USB 3.2 Gen 2 型 A、2 个 USB4 型 C(PD 和 DisplayPort 1.4)、MicroSD(UHS-II)、HDMI 2.1 |
音频 | 6 个立体声扬声器、THX 空间音频、7.1 编解码器(通过 HDMI)、双阵列麦克风 |
电池 | 90 WHr 锂离子电池(50 分钟内充满 30%,80 分钟内充满 48%),280 W 电源适配器 |
建造与完成 | CNC 铣削铝,阳极氧化黑色,防指纹涂层 |
尺寸 | 14.9 毫米 ~ 17.4 毫米 x 250.5 毫米 x 355 毫米(0.59 英寸 ~ 0.69 英寸 x 9.86 英寸 x 13.98 英寸) |
重量 | 2.14公斤/ 4.71磅 |
安全性 | Windows Hello IR FHD 网络摄像头、TPM 2.0、Kensington 安全插槽 |
保修政策 | 1 年笔记本电脑、2 年电池保修 |
NVIDIA GeForce RTX 5090 Mobile 配备 24GB GDDR7 内存。在巨大的散热器组件下,我们可以看到 3GB 三星模块焊接在 GPU 的周边。
为了支持这种级别的性能,该系统配备了强大的工作站级 280W 电源,这对于提供 GPU 在插入电源时充分发挥其潜力所需的持续电力至关重要。GeForce RTX 5090 移动 GPU 的最大 TGP 为 150W,而在 Razer Blade 16 中,在性能模式下运行时配置为 135W。
Blackwell 架构:更多核心,更强大的 AI 能力
Blackwell 架构是 GeForce RTX 50 移动 GPU 系列的核心,与上一代 Ada Lovelace 相比,该系列引入了几项重要升级。GeForce RTX 5090 移动版配备 10,496 个 CUDA 核心和第五代 Tensor 核心,大幅提升了 AI 处理能力。FP5 精度现已获得原生支持,通过减少内存负载和计算要求,GPU 可以更高效地处理 AI 模型。
DLSS 4 和多帧生成:更多帧速率
DLSS 4 借助全新 Transformer 模型,引入了多帧生成功能,可为每个传统渲染帧生成最多三个额外帧。这可显著提高帧速率,同时保持高图像质量。Transformer 模型以 DLSS 早期版本中使用的卷积神经网络 (CNN) 为基础,但它更进一步,可以分析整个帧及其随时间的变化。这可使细节更清晰、重影更少、边缘更平滑,在快速移动的场景中尤其明显。
在游戏中 Alan Wake 2 和 赛博朋克 2077:幻影自由NVIDIA 声称 DLSS 4 可将帧率提高至原生渲染的 8 倍。与 DLAA(深度学习抗锯齿)和 DLSS 光线重建结合使用时,您可以在游戏过程中获得更高的帧率和更流畅、更稳定的视觉效果。Transformer 模型还可以提高纹理质量,使头发、链条和反射等细节看起来更自然、更一致,即使在快速移动的场景中也是如此。
高级射线追踪和巨型几何
全新第四代光线追踪核心专为处理 NVIDIA 所谓的“超级几何”而设计,本质上就是现代游戏环境中的更高三角形数量和复杂性。GeForce RTX 4 系列可以处理比前几代更多的体素,从而产生更详细的角色模型、逼真的灯光和更丰富的环境细节。
RTX 神经辐射缓存使用 AI 更准确地估算间接照明,需要追踪的光线更少,同时提高性能和视觉一致性。该技术可实现更复杂的路径追踪解决方案,同时保持高帧率。 得益于这些人工智能驱动的优化,像 Alan Wake 2 和 门户RTX 受益于光线追踪场景中稳定性的提高和重影的减少.
效率和电源管理:电池性能更佳
随着新款 GeForce RTX 50 移动系列的推出,NVIDIA 付出了巨大的努力,将高性能与更好的能效结合起来。新的高级电源门控和加速频率切换系统可让 GPU 切换到低功耗状态,并立即适应不断变化的工作负载。时钟现在可以比前几代产品快 1000 倍,这意味着在繁重任务期间具有更好的响应能力,并且在系统不负载时延长了电池寿命。
Battery Boost 功能已得到增强,可根据场景复杂度动态调整 GPU 和 CPU 功率,旨在支持的游戏保持稳定的 60 FPS,同时在要求较低的场景中降低功耗。NVIDIA 表示,这可使游戏时的电池寿命延长 40%,视频播放时间延长 30%。例如,我们的测试设备(Razer Blade 16) 在玩以下游戏时,电池续航时间几乎是上一代的两倍: Baldur的门3 和 电池驱动的赛博朋克 2077.
视频编码和人工智能辅助创作
GeForce RTX 50 系列为使用笔记本电脑作为主系统的内容创作者带来了视频编码和处理的重大升级。GeForce RTX 5090 移动 GPU 具有三个第 9 代 NVENC 编码器和两个第 6 代解码器,支持 H.4 和 H.2 格式的 2:264:265 色度子采样。这可以实现更高的色彩精度和更高效的视频压缩。处理 HDR 内容或进行多轮色彩校正的创作者将受益于 4:2:2 编码带来的更高的色彩保真度和更小的文件大小。
FP4 支持还促进了 AI 辅助的创意工作。与之前基于 Ada 的模型相比,Stable Diffusion 等生成式 AI 模型现在在 GeForce RTX 2 系列 GPU 上的运行速度最高可提高 50 倍。FP4 减少了内存使用量并提高了处理速度,同时又不影响输出质量,让在笔记本电脑上本地运行大型 AI 模型变得更加容易。
RTX 神经面部和 AI 辅助渲染
GeForce RTX 50 移动系列中的 AI 不仅限于图形渲染,它还改进了角色和纹理的处理方式。GeForce RTX Neural Faces 使用生成式 AI,通过对数千种面部表情和光照场景进行训练来创建更逼真的人脸。它不依赖传统的动画方法,而是实时生成逼真的表情,使游戏和模拟中的角色看起来和移动更自然。
NVIDIA 还推出了 GeForce RTX 神经纹理压缩功能,该功能使用 AI 将纹理大小缩小多达 7 倍,而不会牺牲细节。这减少了内存使用量并加快了加载时间——这对大型开放世界游戏来说是一个巨大的胜利。开发人员可以通过 GeForce RTX 神经着色器 SDK 利用这些功能,在不超载 GPU 内存的情况下创建更详细、更身临其境的环境。
我们已经介绍了架构和主要功能,现在让我们来看看 GeForce RTX 5090 Mobile 在实际使用中的表现。从游戏到创意工作负载,我们在这里可以看到 GPU 的功能。
NVIDIA GeForce RTX 5090 移动版规格
GPU 比较 | GeForce RTX 5090 移动版 | GeForce RTX 5090 | GeForce RTX 4090 移动版 | GeForce RTX 4090 |
GPU名称 | GB203 | GB202 | AD103 | AD102 |
卓越 | 布莱克威尔2.0 | 布莱克威尔2.0 | 阿达洛夫莱斯 | 阿达洛夫莱斯 |
工艺尺寸 | 5纳米 | 5纳米 | 5纳米 | 5纳米 |
晶体管 | 45,600千万 | 92,200千万 | 45,900千万 | 76,300千万 |
密度 | 120.6米 / 平方毫米 | 123.9米 / 平方毫米 | 121.1米 / 平方毫米 | 125.3米 / 平方毫米 |
模具尺寸 | 378mm² | 744mm² | 379mm² | 609mm² |
插槽宽度/形状系数 | 移动IGP | 双槽 | 移动IGP | 三槽 |
尺寸 | 联络号码 | 304毫米x 137毫米x 48毫米 | 联络号码 | 304毫米x 137毫米x 61毫米 |
TDP | 150W 瓦 | 575W 瓦 | 120W 瓦 | 450W 瓦 |
视频连接 | 依赖于便携设备 | 1 个 HDMI 2.1b,3 个 DisplayPort 2.1b | 依赖于便携设备 | 1 个 HDMI 2.1、3 个 DisplayPort 1.4a |
电源连接器 | 没有 | 1x 16针 | 没有 | 1x 16针 |
总线接口 | PCIe 5.0 x16 | PCIe 5.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
基地时钟 | 990 MHz | 2017 MHz | 1335 MHz | 2235 MHz |
提升时钟 | 1515 MHz | 2407 MHz | 1695 MHz | 2520 MHz |
记忆时钟 | 1750 MHz 28 Gbps 有效 |
2209 MHz(有效28 Gbps) | 2250 MHz 18 Gbps 有效 |
1313 MHz(有效21 Gbps) |
内存大小 | 24 GB | 32 GB | 16 GB | 24 GB |
内存类型 | GDDR7 | GDDR7 | GDDR6 | GDDR6X |
Magistrala pamięci | 256 bit | 512 bit | 256 bit | 384 bit |
内存带宽 | 896.0 GB /秒 | 1.79 TB / s | 576.0 GB /秒 | 1.01 TB / s |
CUDA核心 | 10,496 | 21,760 | 9728 | 16,384 |
TMU | 328 | 680 | 304 | 512 |
个ROPs | 112 | 192 | 112 | 176 |
SM 计数 | 82 | 170 | 76 | 128 |
张量核心 | 328 | 680 | 304 | 512 |
RT核心 | 82 | 170 | 76 | 128 |
L1缓存 | 128 KB(每个 SM) | 128 KB(每个 SM) | 128 KB(每个 SM) | 128 KB(每个 SM) |
L2缓存 | 64 MB | 88 MB | 64 MB | 72 MB |
像素率 | 169.7 GPixel / s | 462.1 GPixel / s | 189.8 GPixel / s | 443.5 GPixel / s |
纹理速率 | 496.9 格塞尔/秒 | 1,637 格塞尔/秒 | 515.3 格塞尔/秒 | 1,290 格塞尔/秒 |
FP16(一半) | 31.80 TFLOPS (1:1) | 104.8 万亿次浮点运算 (1:1) | 32.98 TFLOPS (1:1) | 82.58 万亿次浮点运算 (1:1) |
FP32(浮点数) | 31.80 TFLOPS | 104.8 TFLOPS | 32.98 TFLOPS | 82.58 TFLOPS |
FP64 (双精度) | 496.9 GFLOPS (1:64) | 1.637 万亿次浮点运算 (1:64) | 515.3 GFLOPS (1:64) | 1,290 GFLOPS(1:64) |
发行价格(美元) | 取决于移动设备规格 | $1,999 | 取决于移动设备规格 | $1,599 |
NVIDIA GeForce RTX 5090 移动版性能
为了全面了解 GeForce RTX 5090 移动版的性能,我们进行了一系列基准测试,涵盖 AI 处理、渲染和游戏性能。这些测试包括 UL 南河豚 用于人工智能文本和图像生成, Geekbench 6 对于整体计算能力, 的V-Ray 用于光线追踪渲染,以及 3DMark 适用于真实游戏场景。我们还测量了电源效率,以评估 GPU 如何平衡性能和能耗。
测试系统规格
如上所述,我们在 雷蛇刃16,一款高性能游戏笔记本电脑,旨在充分利用最新硬件。以下是主要硬件配置:
- CPU: AMD Ryzen AI 9 HX 370(12 核、24 线程、最高 5.1 GHz)
- GPU: NVIDIA GeForce RTX 5090 移动版 (24GB GDDR7)
- RAM: 32GB DDR5-8000
- 存储: 三星 PM9A1 2TB NVMe SSD
- 屏显: 16 英寸 QHD+ 240Hz
- 电池: 95.2瓦
- 操作系统: 窗户11首页
我们将使用电池和交流电测试 GeForce RTX 5090 Mobile,以显示功率限制如何影响性能。许多高端 GPU 在使用电池运行时会节流以节省能源,直接影响帧速率、AI 处理速度和渲染时间。比较这些结果可以真实地了解笔记本电脑在不同使用场景下的表现。电源计划设置为“平衡”,以便在电池和插入电源测试中进行一致的基准测试。
虽然 GeForce RTX 5090 Mobile 专为便携性能而设计,但将其与台式机 GeForce RTX 5090 进行比较,可以为了解其功能提供有价值的背景信息。台式机显卡的功率预算和散热空间要高得多,因此比较结果凸显了在移动外形中保留了多少台式机级性能。
UL Procyon:AI 文本生成
我们首先要进行的测试是 Procyon AI 文本生成基准。该基准测试通过提供紧凑一致的评估方法简化了 AI LLM 性能测试。它允许在多个 LLM 模型上进行重复测试,同时最大限度地降低大模型尺寸和可变因素的复杂性。该基准测试由 AI 硬件领导者共同开发,优化了本地 AI 加速器的使用,以实现更可靠、更高效的性能评估。下面测量的结果是使用 TensorRT 测试的。
GeForce RTX 5090 Mobile 提供了令人印象深刻的 AI 文本生成性能,但插入电源和电池供电之间存在明显差距。插入电源后,与使用电池相比,移动 GPU 的每秒输出令牌数几乎增加了一倍,总体持续时间也显著缩短——例如,使用 Phi,它从 98.5 个令牌/秒跃升至 163.1 个令牌/秒,总时间从 30.8 秒缩短至 18.6 秒。由于 TDP 和核心数量更高,桌面版 GeForce RTX 5090 的输出率是移动版的两倍多,持续时间缩短了一半。这些结果凸显了移动版在平衡能效和可观性能方面的优势,不过,正如预期的那样,桌面版的 AI 处理仍然独树一帜。
UL Procyon:AI 文本生成 | GeForce RTX 5090 移动电池 | GeForce RTX 5090 移动版插件 | GeForce RTX 5090 |
菲总分 | 2,256 | 3.842 | 5,749 |
Phi 输出时间到第一个标记 | 0.496小号 | 0.283小号 | 0.244小号 |
每秒输出 Phi 令牌数 | 98.551 个代币/秒 | 163.135 个代币/秒 | 314.435 个代币/秒 |
Phi 总时长 | 30.863小号 | 18.624小号 | 10.280小号 |
米斯特拉尔总成绩 | 2,031 | 3,648 | 6,267 |
Mistral 输出第一个令牌的时间 | 0.740小号 | 0.430小号 | 0.297小号 |
每秒 Mistral 输出代币数 | 66.990 个代币/秒 | 125.637 个代币/秒 | 255.945 个代币/秒 |
米斯特拉尔总持续时间 | 45.510小号 | 24.454小号 | 12.593小号 |
Llama3 总体评分 | 1,798 | 3,398 | 6,104 |
Llama3 输出第一个标记的时间 | 0.734小号 | 0.380小号 | 0.234小号 |
Llama3 每秒输出令牌数 | 58.358 个代币/秒 | 107.906 个代币/秒 | 214.285 个代币/秒 |
Llama3 总时长 | 51.959小号 | 27.956小号 | 14.304小号 |
Llama2 总体评分 | 1,815 | 3,660 | 6,591 |
Llama2 输出第一个标记的时间 | 1.242小号 | 0.619小号 | 0.419小号 |
Llama2 每秒输出令牌数 | 30.225 个代币/秒 | 61.258 个代币/秒 | 134.502 个代币/秒 |
Llama2 总时长 | 98.110小号 | 48.279小号 | 23.018小号 |
UL Procyon: 人工智能图像生成
- Procyon AI 图像生成基准 持续准确地测量各种硬件(从低功耗 NPU 到高端 GPU)的 AI 推理性能。它包括三项测试:针对高端 GPU 的稳定扩散 XL (FP16)、针对中等功率 GPU 的稳定扩散 1.5 (FP16) 和针对低功耗设备的稳定扩散 1.5 (INT8)。基准测试使用每个系统的最佳推理引擎,确保结果公平且具有可比性。
在这里,GeForce RTX 5090 Mobile 再次显示出插入和电池模式之间的显著性能差距。在 Stable Diffusion XL (FP16) 中,插入分数是电池结果的两倍多(2,801 对 1,252),将生成时间从每幅图像近 30 秒缩短至 13.4 秒。台式机 GeForce RTX 5090 仍然处于不同的水平,插入分数是电池结果的两倍多,每幅图像的生成时间快得惊人,为 5.2 秒。Stable Diffusion 1.5 也呈现出同样的趋势,其中台式机卡的核心数量更多,功率余量更大,因此结果速度更快。话虽如此,移动版 GeForce RTX 5090 在负载下仍然表现良好。
UL Procyon:AI 图像生成(总分:越高越好) | GeForce RTX 5090 移动电池 | GeForce RTX 5090 移动版插件 | GeForce NVIDIA RTX 5090 |
稳定扩散 1.5 (FP16) — 总体得分 | 1,592 | 3,231 | 8,193 |
稳定扩散 1.5 (FP16) — 总时间 | 62.775小号 | 30.946小号 | 12.204小号 |
稳定扩散 1.5 (FP16) — 图像生成速度 | 3.923 秒/图像 | 1.934 秒/图像 | 0.763 秒/图像 |
稳定扩散 1.5 (INT8) — 总体得分 | 21,261 | 36,342 | 79,272 |
稳定扩散 1.5 (INT8) — 总时间 | 11.758小号 | 6.879小号 | 3.154小号 |
稳定扩散 1.5 (INT8) — 图像生成速度 | 1.006 秒/图像 | 0.860 秒/图像 | 0.394 秒/图像 |
稳定扩散 XL (FP16) — 总体得分 | 1,252 | 2,801 | 7,179 |
稳定扩散 XL (FP16) — 总时间 | 478.861小号 | 214.206小号 | 83.573小号 |
稳定扩散 XL (FP16) — 图像生成速度 | 29.929 秒/图像 | 13.388 秒/图像 | 5.223 秒/图像 |
乐士马克
Luxmark 是一个 GPU 基准测试,它使用开源光线追踪渲染器 LuxRender 来评估系统在处理高度详细的 3D 场景方面的性能。该基准测试适用于评估服务器和工作站的图形渲染能力,特别是对于视觉效果和建筑可视化应用程序,其中准确的光模拟至关重要。
在这里,结果凸显了 GeForce RTX 5090 Mobile 的稳定渲染能力,尤其是在插入电源时。Hall Score 从电池供电时的 14,555 跃升至接通电源时的 28,547,性能几乎翻了一番。然而,桌面版 GeForce RTX 5090 仍然遥遥领先,得分为 51,725,显示出更高的热量和功率限制的明显优势。虽然移动版为笔记本电脑提供了具有竞争力的渲染能力,但处理复杂 3D 场景的专业人士仍将受益于桌面 GPU 的原始实力。
Luxmark(越高越好) | GeForce RTX 5090 移动电池 | GeForce RTX 5090 移动版插件 | GeForce NVIDIA RTX 5090 |
食物评分 | 5,792 | 11,487 | 23,141 |
霍尔斯 | 14,555 | 28,547 | 51,725 |
Geekbench 6
Geekbench 6 是衡量整体系统性能的跨平台基准测试。Geekbench 浏览器可让您将任何系统与其进行比较。
GeForce RTX 5090 Mobile 在插电时 Geekbench 6 性能显著提升,在 OpenCL 测试中从 174,725 跃升至 208,451。这表明 GPU 可以在更高的功耗下发挥其优势,从而提供更好的计算性能。电池性能仍然稳定,但下降反映了在不插电运行时预期的功率效率权衡。台式机 GeForce RTX 5090 仍然以 374,807 的得分保持领先,但移动版在便携式外形方面提供了强劲的成绩。
Geekbench(越高越好) | GeForce RTX 5090 移动电池 | GeForce RTX 5090 移动版插件 | GeForce RTX 5090 |
GPU OpenCL 分数 | 174,725 | 208,451 | 374,807 |
的V-Ray
- 的V-Ray 基准测试使用先进的 V-Ray 6 引擎测量 CPU、NVIDIA GPU 或两者的渲染性能。它使用快速测试和简单的评分系统让用户评估和比较其系统的渲染能力。对于寻求高效性能见解的专业人士来说,它是一款必不可少的工具。
在 V-Ray 基准测试中,GeForce RTX 5090 Mobile 在插入电源后表现出显著的性能提升,其 vpaths 得分为 4,076 vs. 6,877 — 提高了近 70%。这表明 GPU 在不受电池限制的情况下能够更有效地处理要求苛刻的光线追踪渲染。也就是说,即使在电池模式下,它仍然可以提供可观的渲染能力,使其成为忙碌的创意专业人士的得力选择。虽然桌面型号以 14,764 的得分超过了它,但考虑到其较低的功率范围,移动 GPU 的性能仍然令人印象深刻。
V-Ray(越高越好) | GeForce RTX 5090 移动电池 | GeForce RTX 5090 移动版插件 | GeForce RTX 5090 |
虚拟路径 | 4,076 | 6,877 | 14,764 |
3D马克
3DMark Port Royal、Speed Way 和 Steel Nomad 是 GPU 基准测试,用于测试不同场景下的性能。Port Royal 专注于光线追踪,Speed Way 评估赛车模拟中的性能,Steel Nomad 则以高强度、逼真的图形来挑战 GPU。它们评估 GPU 在渲染、照明和动态场景中的能力。
3DMark 的结果进一步证实了插入电源后性能更强劲的趋势,尤其是在 Port Royal 中,得分从 6,798 增加了一倍多,达到 15,380。Speed Way 和 Steel Nomad 也显示出显着的提升,突显了 GPU 如何从图形密集型工作负载中的更高功率限制中受益。桌面版 GeForce RTX 5090 的得分全面较高,但移动版的性能足以让您在旅途中流畅地进行高端游戏和创意工作。
3DMark 测试(分数越高越好) | GeForce RTX 5090 移动电池 | GeForce RTX 5090 移动版插件 | GeForce RTX 5090 |
皇家港口 | 6,798 | 15,380 | 19,290 |
速度方式 | 2,885 | 6,223 | 7,709 |
钢铁游牧者 | 2,731 | 5,655 | 6,458 |
功耗:GeForce RTX 5090 移动版
功耗是任何计算平台的关键因素,但它直接影响移动环境中的电池寿命和热管理。每一代新 GPU 都倾向于进一步提高性能,但更高的功耗会导致热量输出增加,需要更高效的冷却解决方案。与可以依赖更大电源和主动冷却的台式机不同,移动 GPU 必须平衡性能和能效,以延长电池寿命,同时控制热量。虽然更强大的 GPU 可能会更快地完成任务,但持续的工作负载可能会导致热节流,影响长期性能。
在 Procyon AI 图像生成测试期间,我们测试了 NVIDIA RTX 5090 Mobile 的功耗(插入电源,取出电池)。虽然移动 GPU 的运行功耗明显低于其桌面版,但系统在负载下峰值功耗为 239W,平均功耗高达 206W。
测量的空闲功耗为 68.5W,这意味着 GPU 功耗达到约 137.5W。Razer 16 将 GeForce RTX 5090 Mobile 的最大功耗设置为 135W,这与我们的测量结果非常接近。测试仅用了 13.5 秒,在此期间仅消耗了 0.76Wh。这使得 GeForce RTX 5090 Mobile GPU 成为 AI 图像生成测试中最节能的 GPU。
功率测试对比 | GeForce RTX 5090 移动版(已插入) | AMD 9070XT | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 | NVIDIA RTX 5090 |
耗电量 | 0.76Wh | 3.41Wh | 2.46Wh | 1.66Wh | 1.39Wh | 1.16Wh |
测试时间 | 13.5小号 | 17.4小号 | 19.2小号 | 11.1小号 | 8.7小号 | 5.1小号 |
结语
NVIDIA GeForce RTX 5090 Mobile 为高性能笔记本电脑带来了显著的代际飞跃。这款 GPU 以 NVIDIA 的 Blackwell 架构为核心,融合了强大的 AI 马力、下一代光线追踪和改进的能效,功率高达 150W。它并不是想取代台式机显卡,但它提供了足够的功率来轻松运行密集的创意工作负载、AAA 游戏和 AI 任务,尤其是在插入电源时。与 Razer Blade 9 笔记本电脑中的 AMD Ryzen AI 370 HX 16 等强大的 CPU 搭配使用,它展示了移动平台的发展程度。
在我们的测试中,电池供电和插电供电模式之间的性能差异始终存在且非常显著 — — 但这是意料之中的。使用电池供电时,GeForce RTX 5090 Mobile 仍然非常适合较轻的任务,但一旦连接到交流电源,GPU 就会发挥其全部潜力。无论是在 V-Ray 中渲染场景、使用 Stable Diffusion XL 生成图像,还是在 3DMark 中提高帧速率,插电供电的结果始终提供类似桌面的响应速度,同时保持比以前的移动旗舰更好的效率。
虽然台式机 GeForce RTX 5090 在原始功率方面仍遥遥领先,但移动版的差距已经缩小到足以成为需要电力而又不必被束缚在塔式机箱和办公桌上的用户的合理选择。迄今为止,最突出的测试是在 Procyon AI 图像生成工作负载期间消耗的功率。NVIDIA GeForce RTX 5090 Mobile 打破了 GeForce RTX 5090FE,几乎减半。虽然移动卡的运行速度不如桌面卡快,但它在运行工作负载时消耗的电量非常少,因此它胜出。
如果您是 AI 爱好者、工程师或游戏玩家,需要以便携的形式获得顶级 GPU 性能,GeForce RTX 5090 Mobile 可以满足您的需求,但通常会受到笔记本电脑散热和功率限制的限制。虽然台式机 GeForce RTX 5090 仍然是实现最高性能的首选,但移动版本将这一功能的很大一部分带到了笔记本电脑上,而不会完全影响效率或移动性。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅