NVIDIA RTX A6000 是该公司采用第二代 RTX 架构的最新版本。 新 GPU 将 10,752 个 CUDA 处理核心与其 84 个下一代 RT 核心相结合,在实时光线追踪和专业的最终帧光线追踪输出方面提供一流的性能。 尽管 NVIDIA 将 RTX A6000 视为 RTX 6000 的继任者,但它本质上是 RTX 8000 的直接替代品。
NVIDIA RTX A6000 是该公司采用第二代 RTX 架构的最新版本。 新 GPU 将 10,752 个 CUDA 处理核心与其 84 个下一代 RT 核心相结合,在实时光线追踪和专业的最终帧光线追踪输出方面提供一流的性能。 尽管 NVIDIA 将 RTX A6000 视为 RTX 6000 的后继产品,但它本质上是直接替代 RTX 8000.
截至本次评测,RTX 8000 已有大约 3 年历史,因此很高兴终于看到 NVIDIA 以前最好的工作站 GPU 的替代品。 该公司最近停止使用 Quadro 名称来标识其专业解决方案; 然而,RTX A6000 仍然具有与 Quadro 系列相同的所有专业功能、硬件和软件认证、认证驱动程序。
NVIDIA RTX A6000 对比 RTX 6000 对比 RTX 8000
RTX A6000 是一个巨大的升级,无论你将它与哪一张上一代卡进行比较,提供更逼真的运动物体输出并支持硬件加速运动模糊(后者用于在渲染时提高最终图像的整体真实感移动物体)。 它还具有加速的 AI 去噪功能,这意味着使用更少的渲染通道获得更高质量的输出,从而缩短渲染时间。 而且,A6000是NVIDIA首款支持PCIe Gen4标准的专业显卡。
新的 NVIDIA 卡将 RTX 6000 的内存大小增加了一倍,达到 48GB 的 GDDR6(与 RTX 8000 相同),使其能够处理更大的 3D 数据集。 这也意味着创意专业人士可以渲染大型 3D 场景,而无需降低场景的复杂性。 对于预算和工作量较大且需要超过 48GB 内存的专业人士,可以通过 NVIDIA NVLink 连接两张 A6000 卡以获得 96GB 的组合 GPU 内存。
也许 RTX A6000 最重要的升级是 NVIDIA安培,采用三星 8 纳米 NVIDIA 定制工艺的全新架构,拥有 28 亿个晶体管。 正如您将在下面的性能图表中看到的那样,在我们的大多数测试中,这种新架构将使 RTX 6000 脱颖而出。
安培的其他亮点包括:
- 改进的流式多处理器
- 第二代光线追踪核心,改进了光线追踪硬件加速
- 第三代 Tensor Cores,提高 AI 推理性能和 DLSS,从而在更高分辨率下实现更好的性能
与上一代模型相比,Ampere 架构还将 CUDA 内核增加了两倍的单精度浮点数。 这意味着 3D 模型开发和计算机辅助工程的桌面模拟等计算领域的性能显着提高。
NVIDIA RTX A6000 与 RTX 3090
是的,RTX A6000 是 RTX 8000 的直接替代品,技术上是 RTX 6000 的继任者,但实际上它在许多方面更符合 RTX 3090,就规格和潜在性能输出而言。 这两款卡都采用了新的 Ampere (8nm) 架构,并具有相似的 CUDA 和 RT 内核数。
两张卡之间的任何性能差异都可能是由于 RTX 3090 改进了驱动程序优化和更新的 RAM(3090 的 GDDR6X 与 A6000 的 GDDR6)。 尽管如此,RTX A6000 是 NVIDIA 的大规模发布,并且在某些领域的性能几乎优于市场上的任何其他产品,因此决定哪种卡最适合您实际上取决于您的特定用例,正如我们的评测基准将显示的那样。
NVIDIA RTX A6000 规格
GPU | RTX-A6000 |
卓越 | 安培 |
铸造厂 | Samsung |
工艺尺寸 | 8nm |
晶体管 | 28.3十亿 |
模具尺寸 | 628.4 mm2 |
CUDA 并行处理核心 | 10,752 |
NVIDIA 张量核心 | 336 |
NVIDIA RT 核心 | 84 |
GPU内存 | 48 GB GDDR6 带 ECC |
存储器接口 | 384 bit |
内存带宽 | 768 GB /秒 |
最大功耗 | 300W |
图形总线 | PCI Express 4.0x16 |
显示连接器 | DP 1.4 (4) |
外形 | 4.4” 高 x 10.5” 长双槽 |
产品重量 | 1.179 kg |
散热解决方案 | 活跃 |
vGPU 软件支持 | NVIDIA GRID、NVIDIA Quadro 虚拟数据中心工作站、NVIDIA 虚拟计算服务器 |
支持的 vGPU 配置文件 | 1GB、2GB、3GB、4GB、6GB、8GB、
12 GB,16 GB,24 GB,48 GB |
NVIDIA® 3D Vision® 和 3D Vision Pro | 通过 3 针迷你 DIN 支持 |
帧锁 | 兼容(与 Quadro Sync II) |
NVLink | 2 路薄型(2 槽和 3 槽桥)
连接 2 个 RTX A6000 |
NVLink 互连 | 112.5 GB/秒(双向) |
电源连接器 | 1x 8 针 CPU |
NVENC | NVDEC公司 | 1x | 2x(+AV1 解码) |
性能
为了衡量其性能,我们对 RTX A6000 进行了一系列资源密集型测试,并将其与 RTX 8000 和 RTX 3090 FE 进行了比较。 我们在这两个地方都安装了 RTX A6000 惠普 ZCentral 4R 和 P620 工作站,RTX 8000 也在我们的一些基准测试中使用了它:
惠普 ZCentral 4R:
- Intel Xeon 2295(3.0 GHz 基本频率,采用 Intel vPro 技术最高可达 4.6 GHz)
- 64GB DDR4-2933 ECC 内存
- 1TB M.2 SSD
联想 ThinkStation P620:
- AMD Ryzen Threadripper Pro 3995WX 处理器(2.70 GHz,最高 4.20 GHz Max Boost,64 核,128 线程,32 MB 缓存)
- DDR64 RAM的4GB
- 1TB PM981 固态硬盘
我们在定制的消费者版本中安装了 RTX 8000 和 RTX 3090,用于我们的 Blender 和 LuxMark 测试:
- AMD Ryzen 9 3900X
- 4x8GB (32GB) G.Skill TridentZ Neo 3600MHz CL16
- 2TB 三星 970 Pro
- 华擎 X570 太极 (BIOS v4.00, PCIe Gen4)
SPECviewperf 2020年
首先是 SPECviewperf 2020 基准测试,这是衡量在 OpenGL 和 Direct X 应用程序编程接口下运行的专业应用程序图形性能的全球标准。 视图集(或基准)表示来自实际应用程序的图形内容和行为,而无需自己安装应用程序。 这些视图集包括 3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX 和 Solidworks。
备注:我们在本次测试中使用了 4K 分辨率 (3800 x 2120),两者均安装在 HP ZCentral 4R 中。
视图集 | 英伟达 RTX A6000 联想ThinkStation P620 |
英伟达 RTX A6000 惠普 ZCentral 4R |
英伟达 RTX 8000 联想ThinkStation P620 |
3dsmax-07 | 131.96 | 127.89 | 110.01 |
卡地亚-06 | 90.99 | 75.32 | 69.37 |
Creo-03 | 125.88 | 99.54 | 108.11 |
能量-03 | 42.22 | 38.83 | 27.11 |
玛雅06 | 314.82 | 273.01 | 238.84 |
医疗-03 | 34.87 | 30.58 | 27.67 |
SNX-04 | 450.72 | 422.01 | 375.83 |
SW-05 | 161.4 | 152.19 | 136.5 |
对于此基准测试,RTX A6000 在两个工作站中都比上一代模型有了显着改进,尤其是在西门子 NX 类别中。 正如我们之前所说,Ampere 架构是性能的巨大飞跃,因此这当然是意料之中的,您会在我们的其他基准测试中看到这种性能趋势。
接下来,我们运行了 SPECworkstation3,这是一项专门用于测试工作站性能所有关键方面的基准测试; 它使用 30 多个工作负载来测试 CPU、图形、I/O 和内存带宽。 工作负载属于更广泛的类别,例如媒体和娱乐、金融服务、产品开发、能源、生命科学和一般运营。 我们将列出每个类别的大类结果,而不是单独的工作负载。 结果是每个类别中所有单个工作负载的平均值。
SPEC工作站3
分类 | 英伟达 RTX A6000 联想ThinkStation P620 |
英伟达 RTX A6000 惠普 ZCentral 4R |
NVIDIA RTX 8000 联想ThinkStation P620 |
我 | 6.04 | 3.49 | 3.82 |
产品开发 | 5.49 | 3.63 | 3.97 |
生命科学 | 4.61 | 3.76 | 4.07 |
新能源 | 5.58 | 2.79 | 没有完成 |
FSI | 9.49 | 3.38 | 4.08 |
通用操作 | 2.14 | 1.63 | 2.1 |
GPU计算 | 7.44 | 7.22 | 5.88 |
总的来说,当安装在 P620 内部时,我们看到大多数类别的性能又一次显着飞跃,有时是 RTX 8000 的两倍多。当安装在 HP ZCentral 工作站内部时,它显示的数字较低,GPU 计算除外.
环境系统研究所 (Esri)
接下来是环境系统研究所 (Esri) 基准。 Esri 是地理信息系统 (GIS) 软件的供应商,而他们的性能团队设计了他们的 PerfTool 插件脚本来自动启动 ArcGIS Pro。
此应用程序使用“ZoomToBookmarks”功能浏览各种预定义的书签,并创建一个日志文件,其中包含预测用户体验所需的所有关键数据点。 该脚本自动循环书签三次以说明缓存(内存和磁盘缓存)。 换句话说,该基准模拟了人们可能会通过 Esri 的 ArcGIS Pro 软件看到的大量图形使用。
测试由三个主要数据集组成。 两个是宾夕法尼亚州费城和魁北克省蒙特利尔的 3-D 城市景观。 这些城市视图包含覆盖在地形模型和覆盖航拍图像上的带纹理的 3-D 多面体建筑物。 第三个数据集是俄勒冈州波特兰地区的二维地图视图。 此数据包含有关道路、土地利用地块、公园和学校、河流、湖泊和山丘阴影地形的详细信息。
首先是蒙特利尔。 在这里,RTX A6000 达到了 614.03 的平均 FPS 和 238.18 的最低 FPS。
ESRI ArcGIS Pro 2.3 蒙特利尔 | |
平均 FPS |
|
NVIDIA RTX 8000 | 471.58 |
英伟达 RTX A6000 | 614.03 |
最低帧率 | |
NVIDIA RTX 8000 | 220.36 |
英伟达 RTX A6000 | 238.18 |
接下来是费城,RTX A6000 的平均 FPS 达到 542.70,最低 FPS 达到 237.54。
ESRI ArcGIS Pro 2.3 费城 | |
平均 FPS |
|
NVIDIA RTX 8000 | 509.31 |
英伟达 RTX A6000 | 542.70 |
最低帧率 |
|
NVIDIA RTX 8000 | 271.01 |
英伟达 RTX A6000 | 237.54 |
我们的最后一个模型是波特兰。 在这里,RTX A6000 的平均 FPS 为 2,756.82,最低 FPS 为 906.17。
ESRI ArcGIS Pro 2.3 波特兰 | |
平均 FPS |
|
NVIDIA RTX 8000 | 2,270.52 |
英伟达 RTX A6000 | 2,756.82 |
最低帧率 |
|
NVIDIA RTX 8000 | 965.13 |
英伟达 RTX A6000 | 906.17 |
混合器
接下来是无处不在的 Blender,这是一款开源 3D 建模应用程序。 该基准测试是使用 Blender Benchmark 实用程序运行的。 NVIDIA OptiX 是选择的渲染方法,而不是 CUDA,因为 A6000 及其同类产品可以使用 RTX。 在这个以秒为单位的基准测试中,越低越好。
在惠普和联想工作站中,A6000 在所有类别(Koro 除外)上都比 RTX 8000 表现出巨大的进步。 尽管它在所有类别中都落后于 RTX 3090,但 RTX A6000 为游戏巨头 GPU 提供了资金支持。
勒克斯马克
LuxMark 是开源 3D 渲染引擎 LuxRender 维护人员的 OpenCL 跨平台基准测试工具。 该工具着眼于 3D 建模、照明和视频工作领域的 GPU 性能。 对于这次审查,我们使用了最新版本 v4alpha0。 在 LuxMark 中,分数越高越好。
在食品渲染类别中,RTX A6000 在联想 P8,088 中得分为 620,是 RTX 8000(发布的 3,337)的两倍多,略微落后于 RTX 3090(发布的 8,929)。 在 Hallbench 渲染类别中,新的 NVIDIA 卡再次以 20,983(对比 9,794)是上一代卡的两倍多,同时落后于 RTX 3090 的 23,555。 在 HP ZCentral 4R 中,RTX A6000 在食品和 Hallbench 类别中的得分分别为 7,123 和 20,246。
辛烷值台
最后,我们看看 OctaneBench。 这是 OctaneRender 和另一个支持 RTX 的 3D 渲染器(类似于 V-Ray)的基准测试实用程序。
RTX A6000总分:664.40 | |||||
联想ThinkStation P620 | |||||
现场 | 核心 | 毫秒/秒 | 长宽比 | 重量 | 总分 |
室内情况 | 资讯频道 | 386.4874 | 7.502 | 10 | 18.75424 |
室内情况 | 直接照明 | 120.6423 | 6.778 | 40 | 67.77658 |
室内情况 | 路径追踪 | 60.07888 | 7.035 | 50 | 87.93748 |
主意 | 资讯频道 | 403.6568 | 4.694 | 10 | 11.73557 |
主意 | 直接照明 | 112.0406 | 5.323 | 40 | 53.22593 |
主意 | 路径追踪 | 101.651 | 5.245 | 50 | 65.56436 |
全地形越野车 | 资讯频道 | 369.6832 | 11.777 | 10 | 29.44275 |
全地形越野车 | 直接照明 | 114.5929 | 7.534 | 40 | 75.34053 |
全地形越野车 | 路径追踪 | 97.79354 | 7.569 | 50 | 94.61449 |
盒子 | 资讯频道 | 423.7369 | 6.445 | 10 | 16.11167 |
盒子 | 直接照明 | 93.5092 | 6.756 | 40 | 67.56445 |
盒子 | 路径追踪 | 82.13356 | 6.107 | 50 | 76.33231 |
RTX A6000总分:总分:651.2823 | |||||
惠普 ZCentral 4R | |||||
现场 | 核心 | 毫秒/秒 | 长宽比 | 重量 | 总分 |
室内情况 | 资讯频道 | 381.9805 | 7.414 | 10 | 18.53555 |
室内情况 | 直接照明 | 119.4807 | 6.712 | 40 | 67.12399 |
室内情况 | 路径追踪 | 58.97741 | 6.906 | 50 | 86.32525 |
主意 | 资讯频道 | 393.9745 | 4.582 | 10 | 11.45408 |
主意 | 直接照明 | 109.6025 | 5.207 | 40 | 52.06769 |
主意 | 路径追踪 | 99.80163 | 5.15 | 50 | 64.37154 |
全地形越野车 | 资讯频道 | 363.1271 | 11.568 | 10 | 28.92061 |
全地形越野车 | 直接照明 | 112.0573 | 7.367 | 40 | 73.67342 |
全地形越野车 | 路径追踪 | 95.76828 | 7.412 | 50 | 92.65507 |
盒子 | 资讯频道 | 414.6209 | 6.306 | 10 | 15.76505 |
盒子 | 直接照明 | 91.09318 | 6.582 | 40 | 65.81877 |
盒子 | 路径追踪 | 80.23866 | 5.966 | 50 | 74.57125 |
在这里,我们看到在惠普和联想工作站内部使用时的总分分别为 664.40 和 651.28,这与 RTX 3090(总分 671.02)非常相似。 此外,这比 RTX 8000(总分 315.02)的得分高出一倍多。
总结
至少可以说,RTX A6000 是 NVIDIA 发布的一款令人印象深刻的产品。 这款全新的专业显卡拥有 10,752 个 CUDA 处理核心,84 个下一代 RT 核心,48GB GDDR6 内存,支持 PCI Express 4.0 x16 接口。 新的 NVIDIA 卡将 RTX 6000 的 GPU 内存大小增加了一倍,达到 48GB GDDR6,使其能够处理更大、更复杂的 3D 数据集。 口袋更大且需要超过 48GB 内存的专业人士可以通过 NVIDIA NVLink 安装两张 A6000 卡,以获得 96GB 的 DDR6 RAM。
虽然 RTX A6000 在技术上是 RTX 6000 的继任者,但它更像是 RTX 8000 的直接替代品——NVIDIA 以前的顶级工作站 GPU。 即便如此,与上一代模型相比,它也不仅仅是一次迭代升级:它是性能上的巨大飞跃。
那怎么可能呢? 最重要的因素是 NVIDIA Ampere。 该架构采用三星的 8nm NVIDIA 定制工艺(具有 28 亿个晶体管)、改进的流式多处理器、第二代光线追踪核心,以及大幅改进的光线追踪硬件加速。 它还使用第三代 Tensor Core,这有助于提高 AI 推理性能和 DLSS,从而在更高分辨率下获得更好的性能。 这些只是 Ampere 带来的一些亮点,因此允许 RTX A8000 提供 巨大 飞跃,这在我们的性能测试中是显而易见的。
对于有能力(并且有必要)的人来说,另一个有趣的功能是 RTX A6000 对 Quadro Sync II 附加卡的支持。 这允许 GPU 在单个系统(或系统集群)内同步来自各种兼容 GPU 的显示和图像输出,因为每个 Quadro Sync II 卡可以同步最多四个 RTX A6000 卡的输出。 也就是说,用户最多可以在一个系统上安装两个 Quadro Sync II 卡,这意味着一个带有八个 GPU 的工作站(每个都有四个活动的独立显示输出)能够支持多达 32 个同步视频显示器。
尽管 RTX A6000 是 RTX 8000 的替代品,但它实际上与 RTX 3090 更具可比性,后者在我们的基准测试中略微落后。 正如我们之前提到的,这种微小的性能差异可能是由于 Quadro 驱动程序优化和更新的 RAM。
那么,RTX A6000 适合谁,我应该购买 RTX 3090 吗? 这得看情况。 决定获得哪个 GPU 应该基于您的工作流程是什么或者它在短期内可能是什么。 现在很难拿到任何 RTX 卡,但如果你有能力这样做,RTX A6000 最适合那些主要从事 CAD 工作的人(更具体地说,在科学领域使用 Creo 和 CATIA 等应用程序) ,因为 RTX 3090 不提供 Quadro 系列卡附带的必要驱动程序优化。 尽管我们没有在任何游戏体验基准测试中测试 RTX A6000,但 RTX 3090 无疑是金钱所能买到的最好的游戏 GPU,尤其是对于利用光线追踪和 DLSS 2.0 的游戏。
综上所述,基于 Ampere 的 RTX A6000 在某些领域的性能将大大优于市场上的几乎所有其他产品,因此如果您是需要为桌面工作站配备强大视觉计算 GPU 的专业人士,RTX A6000 是目前最好的卡。
参与 StorageReview
电子报 | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS订阅