首页 电子消费品客户端配件 NVIDIA GeForce RTX 3090 与 Quadro RTX 8000 创意专业评测

NVIDIA GeForce RTX 3090 与 Quadro RTX 8000 创意专业评测

by 文斯·卡内维尔
Nvidia RTX 3090

NVIDIA 新推出的基于 Ampere 的 GPU 现已上市,如果幸运的话,您实际上可能会购买一个。 截至 2021 年 3 月撰写本文时,新 GPU 的库存仍然极为稀缺,预计至少要到今年第三季度才能恢复正常。 但是,如果您无法为工作站配备全新的 NVIDIA GeForce RTX 3090,您真的会错过这么多吗? 当然,如果您需要升级,有很多因素需要了解。

NVIDIA 新推出的基于 Ampere 的 GPU 现已上市,如果幸运的话,您实际上可能会购买一个。 截至 2021 年 3 月撰写本文时,新 GPU 的库存仍然极为稀缺,预计至少要到今年第三季度才能恢复正常。 但是,如果您无法为工作站配备全新的 NVIDIA GeForce RTX 3090,您真的会错过这么多吗? 当然,如果您需要升级,有很多因素需要了解。

Nvidia RTX 3090

今天,我们将看看一系列用例,以阐明等待是否值得。 我们将研究创造性的专业用例,例如 Blender、Davinci Resolve 和 LuxMark,但我们还将研究基于 Python 开源 TensorFlow 库的机器学习基准测试,以及一些针对好措施。 我们将 NVIDIA GeForce RTX 3090 Founder's Edition 与 NVIDIA Quadro RTX 8000(前)NVIDIA 工作站产品线之王进行比较。 虽然更适合与 Quadro RTX 6000 进行比较,因为两张卡都有 24GB 显存,但结果几乎相同,因为 8000 和 6000 的实际计算能力相同,而且这些基准测试都没有使用超过 24GB显存。 我们还有几个 OEM 工作站用于比较,包括 我们之前评测过的联想 P920 双 RTX 8000s 和一个新的 联想P620 配备 AMD 最新的 Threadripper PRO。

为什么我们要将工作站 Quadro 卡与消费级 GeForce 卡进行比较? 因为 NVIDIA 以前从未推出过如此强大的消费卡,而且与 Quadro 系列相比,花三分之一的钱的价值主张变得非常诱人。 特别是因为在撰写本文时,还没有关于真正的 TITAN RTX 继任者的官方消息,传统上填补了工作和娱乐 GPU 的空缺。 现在也不可能忽视世界的现状,在家工作的解决方案是很多人的首要任务,拥有一个非常强大的 GPU 白天用于 CAD 和晚上玩游戏听起来比以往任何时候都好。 我们知道,我们可以通过屏幕听到您关于“真正的”工作站卡的差异! 我们会到达那里,我们保证; 继续阅读。

主要测试系统和GPU规格如下,包括驱动和BIOS版本。

OS Windows 10 专业版(20H2 版,2020 年 XNUMX 月)
中央处理器 AMD Ryzen 9 3900X
内存 4x8GB (32GB) G.Skill TridentZ Neo 3600MHz CL16
试驾 2TB 三星 970 Pro
主机板 华擎 X570 太极 (BIOS v4.00, PCIe Gen4)
图形处理器 1 NVIDIA RTX 3090 创始人版(Studio Driver 461.40)
图形处理器 2 NVIDIA Quadro RTX 8000(产科驱动R460 U3,461.40)

 

四核RTX 8000 RTX 3090 FE
卓越 图灵 (12nm) 安培 (8nm)
CUDA核心 4,608 10,496
张量核心 576(第二代) 328(第三代)
RT核心 72(第一代) 82(第二代)
GPU内存 48GB GDDR6 带 ECC 24GB GDDR6X
FP32 性能 16.3 TFLOPS 35.6 TFLOPS
能量消耗 295W 350W
PCIe 接口 PCIe 3.0 x16 PCIe 4.0 x16
散热器 鼓风机式 流通式
NVLink 多 GPU 支持
SR-IOV支持 没有

GeForce RTX 3090 与 Quadro RTX 8000 基准测试

让我们从游戏开始。 在有关工作站图形的文章中包含这似乎是一件奇怪的事情,但如今有这么多人在家工作,期望许多专业人士在同一台机器上完成他们的工作并开始游戏并不是没有道理的。 我们测试了 Cyber​​punk 2077、Shadow of the Tomb Raider 和 Borderlands 3。Borderlands 和 Tomb Raider 有内置的基准测试工具,而 Cyber​​punk 没有,我们觉得我们能够在两张卡之间记录大量数据以给一个平均值。 所有测试均在 1440p 下完成; Borderlands 被设置为所有最大设置,除了运动模糊; 古墓丽影设置为全最大、RTX Ultra 且无 DLSS; Cyber​​punk 2077 设置为 RTX Medium Preset,DLSS 设置为 Quality。 像英雄联盟和 CS:GO 这样的电子竞技游戏使用这些卡中的任何一个都可以轻松保持超过 250 FPS,因此它们没有经过全面测试。 有趣的是,我们在《使命召唤:战区》中看到两张卡始终超过 150 FPS,但没有对其进行足够彻底的测试以将其视为包含在此图表中的真正基准。

rtx 3090 rtx 8000 游戏

毫无疑问,RTX 3090 是目前市场上绝对最好的游戏 GPU,虽然 AMD Radeon 6900XT 在某些游戏中将与它一较高下,但在光线追踪方面,3090 没有竞争对手. 赛博朋克 2077,不管你喜欢还是讨厌,它是目前最苛刻的游戏,在我们所有的测试中,RTX 3090 保持至少 65 FPS,即使在非常拥挤的场景中,大多数时候 FPS 都处于高位70 年代和低 80 年代,帧时间始终很短。 可以肯定地说,任何要求较低的东西都可以轻松地以最大设置运行并保持高帧率。 另请记住,这些测试是在 2021 年 2 月完成的,当时 NVIDIA 发布了对 GeForce 卡的可调整大小的 BAR 支持。 这种 PCIe 标准在 AMD 的新卡上作为智能存取内存销售,将允许 CPU 立即直接访问整个 VRAM 并提高游戏性能。 早期结果显示 FPS 提高 5%-XNUMX%,具体取决于游戏。 可调整大小的 BAR 可能不会提高计算任务的性能,因此可能不会很快出现在 Quadro 产品线中。

这里更有趣的结果是 Quadro RTX 8000 是多么强大的游戏卡。 虽然考虑到它的原始功能它似乎并不令人惊讶,但它的设计和驱动程序根本没有针对游戏进行优化,但在除了 Cyber​​punk 2077 之外的所有游戏中,它都保持超过 60 FPS。 Cyber​​punk 充其量是起伏不定的,但调回光线追踪并将 DLSS 设置为 Performance 大大改善了结果,在除要求最苛刻的场景外的所有场景中都保持超过 60 FPS。 值得注意的是,在 Quadro 上运行赛博朋克时,我们确实遇到了很多与光线追踪相关的错误,尤其是反射会完全消失并且场景会变暗的问题。 这在 RTX 3090 上没有发生,所以我们将其归结为与 Quadro 驱动程序和赛博朋克臭名昭著的漏洞有关的问题。

GeForce RTX 3090 上的古墓丽影之影,1440p,RTX 开启,DLSS 关闭。

接下来是好东西; 您期望看到的工作站结果。 这批基准测试将关注 3D 建模、照明和视频工作的性能。 我们将从 LuxMark 开始,这是一个 OpenCL GPU 基准测试实用程序。 我们使用了最新版本 v4alpha0,以及带有经典 LuxBall 的旧版 v3。

RTX 3090 RTX 8000 勒克斯马克

说 RTX 3090 具有令人印象深刻的性能是轻描淡写的说法。 在严重依赖 GPU 的应用程序中,新的 Ampere 架构真正发挥了它的力量,甚至击败了联想 P920 及其双 RTX 8000。 在 LuxMark v3 中,性能翻了一番以上,而 v4 基准测试性能接近 150%。 期待看到更多类似这样的图表,但(剧透警告)并非所有内容都像看起来那样清晰。

接下来,让我们来看看来自 Chaos Group 的 V-Ray。 该基准测试适用于 V-Ray 3D 渲染和模拟工具集,它可作为各种 3D 建模应用程序的插件使用,例如 Cinema 4D、Maya、Rhino 和 Unreal 等。 该基准测试特别关注 CUDA 和 RTX 性能。 我们使用了最新版本的 V-Ray 基准测试 (v5) 和旧版本 (v4),仅用于比较。

RTX 3090 RTX 8000 V 射线

这里的故事与 LuxMark 非常相似,RTX 3090 的性能大大优于 RTX 8000,甚至超过了联想 P920 及其双 GPU。 这个基准让我们看到了 NVIDIA 对其第二代光线追踪核心所做的巨大改进; CUDA性能提升约一倍,RTX性能提升近2%。

接下来是无处不在的 Blender,这是一款开源 3D 建模应用程序。 该基准测试是使用 Blender Benchmark 实用程序运行的。 NVIDIA OptiX 是选择的渲染方法,而不是 CUDA,因为所有这些系统都可以使用 RTX。

故事又一次大同小异,下一代 RTX 内核可以快速处理 Blender 渲染,甚至可以在 10 秒内烧毁 BMW 渲染。 这个故事还在继续,但别担心,它很快就会变得非常有趣。 在这里,我们看看 OctaneBench,它是 OctaneRender 的基准测试实用程序,OctaneRender 是另一个支持 RTX 的 3D 渲染器,类似于 V-Ray。

是的。 接下来,我们将看看视频编辑应用程序,特别是 Davinci Resolve Studio 16.2.8 和 Adob​​e Premiere Pro 2020。我们将使用 PugetBench for Adob​​e CC 和 PugetBench for Resolve,它们均由 普吉系统,一家为特定应用程序制造专业工作站的 PC 制造商。 这张图专门看整体基准的GPU分数,在GPU加速效果上给性能打分。

最后,我们有一些价值主张有所下降的用例。 Premiere Pro 和 Davinci Resolve 等应用程序的性能需求因项目和效果而异,而且它们通常会遇到 CPU 瓶颈。 有一个改进,特别是在具有更好 GPU 优化的 Resolve 中,但 Adob​​e Creative Cloud 套件的用户会发现低端 GeForce 卡(如 RTX 3080)的更多价值,在那里你可以获得 90 的表面上 46% 的性能价格的百分比(基于 Founder's Edition 卡的厂商建议零售价)。 虽然此处未报告,但 After Effects 和 Photoshop 中的性能相似,其中大多数测试都受 CPU 限制。 同样值得注意的是,Quadro 和 GeForce 卡都使用第 7 代版本的 NVENC(NVIDIA 编码器),因此 H.264 和 HEVC 渲染时间将相似。 请记住,GeForce 卡仅限于 3 个同时编码任务(例如流媒体和录制),而 Quadros 则没有这样的限制。 我们知道绕过此限制,但我们稍后会解决这个问题。 RTX 3090 确实使用了新一代 NVDEC(NVIDIA 解码器),因此在处理 HEVC 和 H.264 素材时,时间线擦除方面会有边际改进。

让我们从创意应用转向新事物。 我们将使用一个恰当地命名为 AI-Benchmark 的基准来查看这些卡的机器学习性能。 它是一个开源 Python 库,使用 TensorFlow 机器学习库运行一系列深度学习测试。 你可以找到更多相关信息 点击这里 以及它使用的具体测试方法。

RTX 3090 RTX 8000 人工智能

听到了你们集体的喘息声。 这与大多数创意基准测试的情况相同,GeForce 卡表面上是 Quadro 性能的两倍。 此测试是在 Windows 10 中完成的,但您可以在您选择的 Linux 发行版中获得类似的结果。 在测试时,TensorFlow 尚未更新以支持新的 Ampere 卡,但通过一些 hackery,我们能够通过混合和匹配不同 CUDA 开发工具包的组件使其运行。 我们希望将来适当更新版本只会改善结果。

最后但同样重要的是,我们将看看 SPECviewperf 2020,它是标准性能评估公司对行业标准基准测试实用程序的最新修订版。 该基准测试着眼于各种专业应用程序中的图形性能。 我们还包括了配备较旧 Quadro P620 的联想 P6000 以供比较。

存储回顾-NVIDIA-RTX-3090-SpecviewPerf

这就是事情变得有趣的地方。 3D 建模结果与您的预期相符,RTX 3090 的性能明显优于 RTX 8000,但 CATIA 和 Creo 等应用程序以及能源和医疗测试实际上 3090 的性能略有下降,但意义重大利润。 在我们的联想 P6000 中,它的表现甚至不如显着较旧的 Quadro P620。 但是西门子 NX 呢? 这是工作站与消费者、Quadro 与 GeForce 之间困境的症结所在。 您正在正确阅读该图表; 3090 在西门子 NX 中得分为 25.37。 我们跑了七次这个测试并参考了互联网上的其他基准测试结果,这个结果是绝对正确的。 在此测试中,RTX 3090 的性能不到联想 P5 与 RTX 620 的 8000%。 让我们在下一节中对此进行更多探讨。

工作站与消费者 GPU; 司机们

不可否认,GeForce RTX 3090 是一款非常强大的 GPU,而 Quadro RTX 8000 也是一款功能强大的 GPU,但它们的不同之处很重要。 RTX 3090 首先是一款游戏显卡。 它被设计和销售为绝对最佳的游戏 GPU 和“世界上第一款支持 8K 的”游戏卡。 事实上,它可以在众多任务中胜过 RTX 8000,在大多数情况下都具有极高的利润率,这证明了它的原始能力,本质上是蛮力通过这些测试的。 Quadro RTX 8000 首先是一款工作站卡,设计用于放置在工作站中,挤在机架式服务器中,通过 NVLink 连接在一起,虚拟化,努力运行并保持湿润(当然是比喻)并生存。

RTX 3090 RTX 8000 第 2 组

那么这就引出了一个问题,为什么 GeForce RTX 3090 在某些任务上的表现不如使用了 3 年的 Quadro RTX 8000,甚至还不如使用了将近 6 年的 Quadro P6000? 具体来说,为什么 RTX 8000 比西门子 NX 性能高一个数量级? 精明的读者,我们相信您已经知道; 它归结为驱动程序优化。 在哪些 GPU 获得工作站优化方面,NVIDIA 是法官、陪审团和刽子手,很明显,他们不希望 RTX 3090 能够在每个应用程序中完全抹杀他们之前的 Quadro 系列。 许多潜在买家会非常失望地看到他们希望白天拥有顶级工作站性能,而晚上却不可能玩高端游戏,至少在 RTX 3090 的建议零售价 1,499 美元的情况下是这样。 “好吧,这就是 TITAN 系列的用途,”我们听到您说,但目前没有可用的 TITAN RTX 替代品,而且 3090 的定价无疑将其定位为 TITAN 替代品。 NVIDIA 甚至在其营销材料的第一行中吹嘘 3090 具有“TITAN 级性能”,但西门子 NX 的结果远不及“TITAN 级”。 3090 只是过度建造、定价过高的 3080 吗? 好吧,不完全是。 它仍然是适用于 3D 建模者和视频工作的最佳 GPU,尤其是它的 24GB 显存允许创意人员轻松处理大型模型和 8K 素材,但这使其处于一个相当小的利基市场,一个以前由 TITAN 服务的利基市场-类卡片。 如果您不使用西门子 NX、Creo 或 CATIA 等 CAD 应用程序,那么 RTX 3090 仍然很有吸引力,但如果这些应用程序对您的工作流程至关重要,那么它绝对不能入手。

还有其他的考虑。 虽然 Quadro 和 GeForce 卡都通过 NVLink 提供多 GPU 设置,值得注意的是在 3090 系列卡中只有 3000 具有此功能,但只有 Quadro 可以使用 SR-IOV 进行虚拟化。 如果您的工作负载涉及将一个 GPU 或两个 NVLinked GPU 分配给多个 VM,Quadro 仍然是您唯一的选择。 虽然有很多方法可以解决这个问题,但问题仍然存在,即此功能受到 NVIDIA 的 GeForce 驱动程序的人为限制。 顺便说一下,同一个驱动程序确实为一些创意应用程序提供认证,如 Adob​​e 套件和 Autodesk,以及在其 Studio 变体中的 WHQL(Windows 硬件质量实验室)认证,进一步混淆了这一点。 虽然我们预计未来 NVIDIA 将推出真正基于安培的 TITAN 替代品,但对 GeForce RTX 3090 施加的人为限制(包括使用 NVENC 进行并发编码的限制)感觉与专业用户目前正在寻找的东西脱节.

在撰写本文时,NVIDIA 还宣布了他们新的加密货币挖矿专用 GPU 系列,并打算将即将推出的 RTX 3060 的挖矿性能降低一半。加密挖矿性能的下降完全是人为的,完全是通过驱动程序完成的,进一步说明了这一点无论 NVIDIA 认为我们的显卡值得做什么,我们都只能任其摆布。 3060 的这个“无法破解”的限制会被利用吗? 毫无疑问,NVENC 限制已被打破。 但就目前而言,NVIDIA 手握所有底牌,对于大量针对 CUDA、RTX、TensorFlow 和其他 NVIDIA 特定计算平台进行高度优化的专业工作流程,除了 NVIDIA 之外别无选择。

总结

让我们分解一下。 您是否应该为 RTX 3090 保持库存提醒? 勇敢地在您当地的 MicroCenter 外面排长队,以获得获得一个的机会? 与大多数事情一样,答案是“视情况而定”。

  • 您是专门在 Blender 和 Cinema 3D 等应用程序中处理大型 4D 模型,还是经常编辑大型 6K 和 8K 视频文件? 好的; RTX 3090 是市场上用于 CUDA 和 RTX 加速工作流程的最佳创意专业 GPU。
  • 您是否有足够的可支配收入来购买绝对不妥协的游戏装备? 也是的; RTX 3090 是金钱可以买到的最好的游戏 GPU,尤其是在支持光线追踪和 DLSS 2.0 的游戏中,这个列表每天都在增加。
  • 您是否主要从事 CAD 工作,尤其是在使用 Creo 和 CATIA 等应用程序的科学领域? 那就不要; RTX 3090 不提供 Quadro 系列卡附带的必要驱动程序优化,再多的强力原始功率也无法克服这一点。 我们正在努力获得新的 RTX-A6000,RTX 8000s 的实际替代品,以帮助告知像您这样的人。
  • 你在机器学习和人工智能领域工作吗? 这是一个好坏参半的包,因为 TensorFlow 的性能非常好,它看起来像是“是”,但不幸的是,没有足够的标准化测试或数据点来得出与更新的 Quadro 卡相比的明确结论。 此外,在撰写本文时,TensorFlow 尚未更新以正确支持安培卡。 我们目前的回答是肯定的。 我们可以看看 MLCommons 和 MLperf 在未来作为后续行动,专门针对 AI 和机器学习用例。
  • 您目前是否拥有 TITAN RTX 并希望升级? 我们建议您等待 NVIDIA 关于基于 Ampere 的 TITAN 的官方声明,据传最终会发布。 如果您的用例充分利用了 TITAN,RTX 3090 可能最终会降级,具体取决于您的工作流程。
  • 你做了很多 GPU 虚拟化吗? 这是一个坚定的否定; RTX 3090 本身不支持 SR-IOV。

考虑到所有这些,我们希望这可以告知您是否升级的决定,以及您是选择 GeForce 还是 Quadro。 如果 RTX 1,499 的 3090 美元建议零售价对您的血液来说太丰富,并且您不需要超过 10GB 的 VRAM,那么 RTX 3080 也是一个不错的选择。 虽然未在此处进行明确测试,但我们发现我们的结果通常比基于网络结果的 RTX 20 好 30%-3080%,因此您可以预期它在类似应用程序中优于(或低于)Quadro RTX 8000。 等待传闻中的 RTX 3080 Ti 可能也是值得的,无论何时,它都可以作为中间立场。 目前,我们将密切关注基于 Ampere 的 TITAN 能否真正填补完整工作站卡和完整游戏卡之间的空白。 我们还将密切关注 NVIDIA 的驱动程序管道,看看它们是否会在未来的版本中缓解该卡的任何与工作相关的缺点,但我们对此表示怀疑。 我们很想听听您对此的想法,如果我们遗漏了您希望看到的任何基准或用例,尤其是与人工智能和机器学习有关的。 在我们的社交渠道上与我们联系,并继续关注更多有创意的专业和工作站评论。

阅读更多 - NVIDIA RTX A6000 评测

亚马逊上的 NVIDIA Quadro RTX 8000

亚马逊上的 NVIDIA GeForce RTX 3090 创始人版

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅