TYAN Transport HX TN85-B8261 系列可配置为存储密集型或 GPU 密集型设备,解决各种用例。
TYAN Transport HX TN85-B8261 是一款新型双路 AMD EPYC 9004 平台,适用于繁重的存储 I/O 和 GPU 工作负载。这款准系统服务器最多可支持两个全高双宽 GPU、24 个 U.2 NVMe SSD 以及高达 6TB 的 DDR5 内存。在我们的评测中,我们利用双 AMD EPYC 96 核 Genoa CPU 以及针对 HPC 工作负载禁用 SMT 的应用程序特定 128 核 9754S Bergamo CPU 来探索其性能。
TYAN Transport HX TN85-B8261 特点
支持两个 AMD EPYC 9004 系列处理器的能力使 Tyan Transport 成为计算能力和存储容量至关重要的环境的理想选择。我们实验室之前的 Tyan 平台支持单插槽形式的 AMD EPYC 9004 系列 CPU,这是我们从该公司看到的第一个双插槽 AMD 9004 平台。
我们的服务器版本提供 24 个 NVMe 驱动器托架(带有免工具托盘),适合存储密集型配置。 Tyan 还提供前面有 4 个 NVMe 驱动器的版本,使用通道来支持最多 XNUMX 个 XNUMX 双宽 GPU。配置选择取决于用户的具体需求,无论是存储密度还是AI功率。
在内存支持方面,TN85-B8261 可容纳速度高达 5 MHz(每通道 4800 个 DIMM (1DPC))和 3600 MHz(每通道 2 个 DIMM (3DPC))的 RDIMM DDR5 内存,以及适用于 3600DPC 配置的 2DS RDIMM DDR6,144 3MHz。该服务器支持高达 5GB 的 RDIMM/12DS RDIMM DDR24 内存(通过每个 CPU XNUMX 个内存通道,总共 XNUMX 个),具有令人印象深刻的 DRAM 占用空间。
前面板左侧是两个 USB 3.2 Gen.1 端口,右侧是重置和电源按钮以及状态 LED 指示灯。将其翻转到背面可以看到连接性的测试,包括额外的两个 USB3.2 Gen.1 端口、两个用于高速网络的 10 GbE RJ-45 端口,以及一个用于 IPMI 的专用 GbE 端口、一个 VGA 端口和两个热插拔 2,700 瓦 PSU 模块。两侧还支持两个可选的 60 毫米后风扇,电源接头位于机箱的最左侧和右侧。这些将用于某些 PCIe 设备(例如加速器)需要额外气流的情况。
我们花了几分钟才弄清楚如何取下盖子看里面;然而,在这样做的过程中,我们分心了,发现了一个有趣的“天窗”迷你盖。卸下面板后,可以轻松访问服务器的六个高功率热插拔风扇和 NVMe 托架。
取下整个盖子后,首先引人注目的是 TN85-B8261 具有对所有 24 个 NVMe 托架的直接 CPU 访问功能,显着提高了性能并减少了存储操作的延迟。此功能允许 CPU 和存储之间建立直接路径,确保数据密集型应用程序在最佳状态下运行,而不会出现瓶颈问题。不过,这种方法的一个缺点是需要所有这些 PCIe 通道,这限制了后部扩展选项。
在背面,您可以看到许多 PCIe 电缆将前 NVMe 托架连接到主板上的不同位置。在这张照片中,您可以看到服务器左右两侧安装了两张 PCIe 卡,每侧都留有一个双宽全高插槽用于 GPU。中间是两个半高插槽,用于其他设备。在我们的设置中,一个插槽装有 PCIe M.2 SSD 底座。
TN85-B8261 服务器还通过 Aspeed AST2600 板载芯片组提供带外服务器管理功能。 AST2600 芯片组引入了 iKVM 功能,支持 24 位高质量视频压缩。这允许轻松的远程控制台访问,这对于管理数据中心或远程位置的服务器至关重要。
此功能还支持通过 IP、远程平台闪存和 USB 2.0 虚拟集线器进行存储。这些功能使管理员能够执行一系列远程管理任务,例如更新固件或操作系统安装,而无需物理访问服务器,从而确保运营效率并减少停机时间。该服务利用其自己的专用 LAN 端口,与两个板载 10GbE 端口分开。
TYAN运输HX TN85-B8261 B8261T85E24HR-2T规格
系统 | 外形 | 2U机架式 |
底盘型号 | TN85 | |
尺寸(长 x 宽 x 高) | 33.46" x 17.63" x 3.43" (850 x 448 x 87mm) | |
主板名称 | S8261GM2NE-2T# | |
主板信息 | 主板不单独出售 | |
控制面板 | 钮扣 | (1) PWR 带 LED / (1) UID / (1) RST |
LEDs | (1) HDD / (1) ID / (2) LAN / (1) 警告 | |
I / O端口 | (2) 个 USB 3.2 Gen.1 端口 | |
外部驱动器托架 | 数量 Q 类型 | (8) 2.5 英寸热插拔 NVMe |
前驱动器托架接口 | (8)NVMe U.2 | |
前置硬盘背板支持 | NVMe | |
系统散热配置 | FAN | (6) 个 6cm 热插拔中间风扇 + (2) 个 6cm 易插拔后风扇 |
可编程电源 | 类型 | CRPS |
输入范围 | 交流100-127V/14A / 交流200-240V/15.5A | |
频率 | 50 / 60赫兹 | |
输出瓦数 | 2,700瓦 | |
效率 | 80+钛 | |
冗余 | 1 1 + | |
操作性能 | 热插拔 | |
处理器 | 数量 Q 门票类型 | (2) 个 AMD 插槽 SP5 |
支持的CPU系列 | (2) AMD EPYC 9004 系列处理器 | |
热设计功率 | 最大功率可达 400W (TDP) | |
内存 | 支持的 DIMM 数量 | (12)+(12) 个 DIMM 插槽 |
DIMM 类型/速度 | RDIMM DDR5 4800 MHz (1DPC) / 3600MHz (2DPC) / 3DS RDIMM DDR5 3600MHz (2DPC) | |
容量 | 高达 6,144GB RDIMM/3DS RDIMM DDR5 4800/4000 内存 | |
记忆通道 | 每个 CPU 12 个通道 | |
内存电压 | 1.1V | |
扩展插槽 | PCIe | (6) 个 PCIe Gen.5 x16 插槽 |
预装TYAN Riser Card (PCIe Gen.5) | (1) M8261T85-LR32-2L 转接卡,用于 (2) 个 HH/HL PCIe 5.0 x16 插槽 / (1) M8261T85-L32T-2F 转接卡,用于 (2) 个 FH/FL PCIe 5.0 x16 插槽 / (1) M8261T85-R32T -2F 转接卡,用于 (2) 个 FH/FL PCIe 5.0 x16 插槽 | |
局域网 | 数量/港口 | (2) 个 10GbE 端口 + (1) 个 IPMI 专用 GbE |
控制器 | 英特尔 X550-AT2 | |
PHY | 瑞昱RTL8211F | |
存储NVMe | 连接器 (U.2) | (4) SFF-TA-1016 (MCIO 8x) 用于 (8) 个前置 NVMe |
图形 | 连接器类型 | D-Sub 15针 |
分辨率 | 高达 1920×1200 | |
芯片组 | 极速AST2600 | |
I / O端口 | USB | (2) 个 USB3.2 Gen.1 端口(@ 正面)/ (2) 个 USB3.2 Gen.1 端口(@ 背面) |
VGA | (1) 个 D-Sub 15 针端口 | |
RJ-45 | (2) 个 10 GbE 端口 + (1) 个 IPMI 专用 GbE | |
按键 | ID按钮/电源按钮/重置按钮 | |
TPM(可选) | TPM支持 | 请参阅我们的 TPM 支持列表。 |
接口 | SPI | |
系统监控 | 芯片组 | 极速AST2600 |
温度 | 监控 CPU、内存和系统环境的温度 | |
电压 | 监控 CPU、内存、芯片组和电源的电压 | |
LED | 过温警告指示灯 / 风扇和 PSU 故障 LED 指示灯 / 过压警告指示灯 | |
服务器管理 | 板载芯片组 | 板载Aspeed AST2600 |
AST2600 iKVM 功能 | 24 位高质量视频压缩 / 支持 IP 存储和远程平台闪存 / USB 2.0 虚拟集线器 | |
AST2600 IPMI 功能 | 符合 IPMI 2.0 标准的底板管理控制器 (BMC) / 10/100/1000 Mb/s MAC 接口 | |
BIOS | 品牌/ROM大小 | AMI/32MB |
专栏 | 硬件监视器/风扇速度自动控制/从 USB 设备启动/通过 LAN/存储的 PXE/控制台重定向/SMBIOS 3.5/PnP/LAN 唤醒/ACPI 6.4/ACPI 睡眠状态 S0、S5 | |
操作环境 | 工作温度。 | 10°C ~ 35°C (50°F ~ 95°F) |
非工作温度 | – 40° C ~ 70° C(-40° F ~ 158° F) | |
在/非工作湿度 | 90%,35° C 时无冷凝 | |
税法法规 | 联邦通信委员会 (SDoC) | A级 |
行政长官 (文件) | A级 | |
运行系统 | 操作系统支持列表 | 请参阅我们的 AVL 支持列表。 |
RoHS | 符合 RoHS 6/6 标准 | 有 |
包装内含 | 准系统 | (1) TN85-B8261 准系统 |
TYAN Transport HX TN85-B8261 性能
为了提供全面的性能分析,我们的基准测试包含各种密集测试,每个测试针对 CPU 性能的不同方面。我们使用 Blender OptiX 来评估渲染性能,使用 Blackmagic 来评估视频处理能力,使用 Geekbench 来评估整体系统性能。 Cinebench 将为我们提供有关图形和渲染效率的见解、用于数学计算的 y-cruncher 以及用于衡量数据处理和压缩速度的 7-Zip 压缩测试。
本次审查将重点关注计算方面而不是存储性能。
泰安运输HX TN85-B8261主要部件:
- 8 个 64GB 金士顿 DDR5 内存
- 在 Windows Server 2022 上测试
我们使用两种不同的 CPU 配置进行基准测试:96 核 AMD EPYC 9654 和 128 核 AMD EPYC 9754S(禁用 SMT)。此分析将展示在同一系统架构中使用具有更高内核数量和增强功能的处理器的性能优势。通过对比这些 EPYC 9004 CPU,我们可以突出处理效率和任务执行速度方面的潜在收益。我们还将其与搭载一个和两个 AMD EPYC 9354 32 核处理器的两台 Dell PowerEdge 服务器进行了比较,以展示 AMD CPU 系列的规模。
搅拌机优化
Blender 是一款开源 3D 建模应用程序。 该基准测试是使用 Blender Benchmark 实用程序运行的。 分数是每分钟的样本数,越高越好。
Transport HX TN85-B8261 服务器上的 Blender OptiX 基准测试比较了双 AMD EPYC 9654(96 核)和 AMD EPYC 9754S(128 核),揭示了 3D 建模任务中有趣的性能差异。在“Monster”场景中,128 核 EPYC 9754S 略胜于 96 核 EPYC 9654,渲染速度略有提高,每分钟 1,480 个样本,而每分钟 1,448 个。
然而,在“Junkshop”场景中,96 核配置以每分钟 1,009 个样本领先,而 943 核配置为 128 个样本。这表明更多的核心(没有 SMT)并不能保证所有渲染任务都有更好的性能。 “课堂”场景结果几乎相同,这表明对于某些类型的工作负载,额外核心的优势会减弱。
Blender OptiX 版本 4.0 (CPU)(每分钟样本数;越高越好) | Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
戴尔 PowerEdge R7625(2 个 AMD EPYC 9354) | 戴尔 PowerEdge R7615(AMD EPYC 9354) |
怪物 | 1,448 | 1,480 | 726 | 375 |
旧货店 | 1,009 | 943 | 474 | 248 |
课堂 | 748 | 758 | 389 | 198 |
Blackmagic RAW 速度测试
我们还开始运行 Blackmagic 的视频播放速度测试。这更像是一种混合测试,包括真实世界 RAW 解码的 CPU 和 GPU 性能。
Blackmagic RAW 速度测试(越高越好) | Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
戴尔PowerEdge R7625 (2 个 AMD EPYC 9354) |
戴尔 PowerEdge R7615(AMD EPYC 9354) |
8K 中央处理器 | FPS 63 | FPS 60 | FPS 53 | FPS 59 |
8K 图形处理器 | 无 | 无 | 无 | 无 |
UL Procyon 人工智能推理
UL Procyon AI 推理旨在衡量工作站在专业应用中的性能,但需要注意的是,该测试并未利用多个 CPU 功能。具体来说,该工具对工作站处理人工智能驱动的任务和工作流程的能力进行了基准测试,提供了对其处理复杂人工智能算法和应用程序的效率和速度的详细评估。
结果涵盖了一系列人工智能模型,表明该服务器具有处理不同类型人工智能工作负载的多功能性。
UL Procyon 平均推理时间 (越低越好) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
戴尔 PowerEdge R7625(2 个 AMD EPYC 9354) | 戴尔 PowerEdge R7615(AMD EPYC 9354) |
移动网络 V3 | 3.54 | 5.81 | 5.54 | 4.27 |
残差网络 50 | 14.85 | 26.75 | 20.61 | 18.39 |
盗梦空间V4 | 44.69 | 71.99 | 80.08 | 70.70 |
深实验室V3 | 43.13 | 59.10 | 65.35 | 59.17 |
优洛V3 | 61.19 | 90.76 | 92.37 | 84.89 |
真实ESRGAN | 3,908.70 | 4,529 | 5,691.98 | 5,233.51 |
总体得分 | 92 | 62 | 60 | 68 |
采用双 AMD EPYC 9754S(128 核)的 UL Procyon AI 推理基准测试表明,与 96 核对应产品相比,各种 AI 模型的推理时间有所增加。例如,MobileNet V3、ResNet-50、Inception V4、DeepLab V3 和 YOLO V3 的推理时间均增加,这表明额外的内核不会线性提高 AI 任务性能。真实的ESRGAN 模型的 次 显着上升至 4529,表明复杂的任务可能不会直接从更多核心中受益。总分从 62 分下降至 92 分,这凸显出更高的核心数量并不能保证更好的 AI 推理效率。
y 粉碎机
y-cruncher 是一个多线程和可扩展的程序,可以将 Pi 和其他数学常数计算到数万亿位。 自 2009 年推出以来,它已成为超频玩家和硬件爱好者的热门基准测试和压力测试应用程序。
Transport HX TN85-B8261 的 y-cruncher 基准测试结果说明了一个清晰的模式:128 核配置在所有计算任务(从计算 1 亿到 25 亿位 Pi)中始终表现得更好。这是禁用 SMT 的真正亮点的一项测试。
在计算 1 亿位数字时,128 核 CPU 在 13.764 秒内完成任务,而 15.088 核 CPU 需要 96 秒,表现出明显的提升。随着任务复杂性的增加,128 核配置的性能增强趋势是一致的。 2.5亿位时,时间从26.626秒减少到23.266秒; 5 亿位,从 45.696 到 40.520 秒;对于 10 亿位数字,从 83.853 到 77.635 秒。测试的最广泛的计算量为 25 亿位,时间从 213.950 秒减少到 201.693 秒。
y-cruncher(总计算时间) | Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
戴尔 PowerEdge R7625(2 个 AMD EPYC 9354) | 戴尔 PowerEdge R7615(AMD EPYC 9354) |
1亿位数字 | 15.088 | 13.764 | 22.868 | 36.686 |
2.5亿位数字 | 26.626 | 23.266 | 56.678 | 98.68 |
5亿位数字 | 45.696 | 40.520 | 118.455 | 无 |
10亿位数字 | 83.853 | 77.635 | 无 | 无 |
25亿位数字 | 213.950 | 201.693 | 无 | 无 |
Geekbench 6
Geekbench 6 是衡量整体系统性能的跨平台基准测试。 您可以在以下位置找到与任何您想要的系统的比较 Geekbench浏览器.
Transport HX TN85-B8261 AMD 配置显示出单核和多核性能的不同结果。 96 核配置在两项测试中得分较高:单核性能为 2,043,多核性能为 15,609,而 1,708 核配置的得分为 15,229(单核)和 128(多核)。这些结果表明,128 核配置中增加的核心并不能转化为 Geekbench 6 评测中更高的分数,尤其是在单核性能方面,96 核版本具有明显优势。
多核性能差异较小,但 96 核仍然领先,这表明基准测试对于禁用 SMT 的 CPU 可能不是最佳的。
Geekbench 6 (越高越好) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
戴尔PowerEdge R7625 (2 个 AMD EPYC 9354) |
戴尔 PowerEdge R7615(AMD EPYC 9354) |
CPU单核 | 2,043 | 1,708 | 2,074 | 2,070 |
CPU 多核 | 15,609 | 15,229 | 13,487 | 12,049 |
GPU | 无 | 无 | 无 | 无 |
Cinebench R23
该基准测试使用所有 CPU 核心和线程来生成总体分数。
在这里,AMD EPYC 9754S(128 核)配置在多核性能方面明显优于 96 核配置,得分分别为 132,994 至 83,092。这凸显了 128 核配置在处理任务方面的卓越能力,受益于更多内核。
然而,在单核测试中,TYAN服务器的96核AMD EPYC 9654 CPU得分更高,为1,304,而1,096核版本的得分为128。这表明 96 核处理器可能在每核效率或时钟速度方面具有优势,有利于单线程任务。
MP 比率表示多核性能相对于单核性能的效率,显示出显着差异:121.34 核设置为 128 倍,而 63.74 核设置为 96 倍。 128 核配置的这一较大比率反映了其在更多核心上扩展性能的能力增强,从而证明了其在高度并行计算环境中的有效性。
Cinebench R23 (越高越好) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
戴尔PowerEdge R7625 (2 个 AMD EPYC 9354) |
戴尔 PowerEdge R7615(AMD EPYC 9354) |
多核 | 83,092 | 132,994 | 88,551 | 52,401 |
单核 | 1,304 | 1,096 | 1,338 | 1,343 |
MP比率 | 63.74x | 121.34x | 66.20x | 39.03x |
Cinebench 2024
在采用 Redshift 渲染器测试的 Cinebench 2024 中,配备双 85 核 EPYC 8261 CPU 的 TYAN Transport HX TN96-B9654 在多核(128 比 3,277)和单核(2,703 比 75)方面均优于 68 核配置。 96) 测试。 MP 比率还显示,与 43.28 核设置 (128x) 相比,39.91 核设置 (XNUMXx) 具有更高的效率。
Cinebench R23(越高越好) | Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
戴尔 PowerEdge R7625(2 个 AMD EPYC 9354) | 戴尔 PowerEdge R7615(AMD EPYC 9354) |
多核 | 3,277 | 2,703 | 2,974 | 2,014 |
单核 | 75 | 68 | 76 | 71 |
MP比率 | 43.28x | 39.91 | 38.95x | 28.29x |
7-Zip 压缩
流行的 7-Zip 实用程序中的内置内存基准测试展示了每台机器的 CPU 性能。如果可能,我们以 128MB 字典大小运行此测试。
双 128 核 AMD EPYC 9754S 配置在压缩和解压缩任务方面表现出优于 96 核 EPYC 9654 设置的性能。 128 核设置的压缩 CPU 使用率达到惊人的 5,706% 和 5,741%,GIPS 评级分别为 2.789 和 2.783,明显超过 96 核s CPU 使用率分别为 4,339% 和 4,362%,GIPS 评级较低为 1.857 和 1.855。这表明在并行任务中可以更有效地利用处理器内核。
在解压缩方面,128 核配置同样表现出色,CPU 使用率分别为 6,211% 和 6,168%,GIPS 评级提高至 4.625 和 4.586,而 96 核配置的 CPU 使用率分别为 4,708% 和 4,656%,GIPS 评级较低为 4.721和4.817。 128 核配置的总评级令人印象深刻地达到 221.301 GIPS,而 96 核配置的总评级为 152.589 GIPS,这凸显了附加内核在处理数据密集型操作方面所提供的增强性能和效率。
7-Zip 压缩基准(越高越好) | Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9654,96 核) |
Transport / 运输 HX TN85-B8261 (2 个 AMD EPYC 9754S,128 核) |
压缩 | ||
当前 CPU 使用率 | 4,339% | 5,706% |
电流额定值/使用 | 1.857 吉普斯 | 2.789 吉普斯 |
额定电流 | 80.595 吉普斯 | 159.182 吉普斯 |
产生的 CPU 使用率 | 4,362% | 5,741% |
结果评级/使用 | 1.855 吉普斯 | 2.783 吉普斯 |
结果评级 | 80.923 吉普斯 | 159.755 吉普斯 |
解压 | ||
当前 CPU 使用率 | 4,708% | 6,211% |
电流额定值/使用 | 4.721 吉普斯 | 4.625 吉普斯 |
额定电流 | 222.278 吉普斯 | 287.250 吉普斯 |
产生的 CPU 使用率 | 4,656% | 6,168% |
结果评级/使用 | 4.817 吉普斯 | 4.586 吉普斯 |
结果评级 | 224.254 吉普斯 | 282.848 吉普斯 |
总评分 | ||
总 CPU 使用率 | 4,509% | 5,955% |
总评分/使用情况 | 3.336 吉普斯 | 3.684 吉普斯 |
总评分 | 152.589 吉普斯 | 221.301 吉普斯 |
总结
TYAN Transport HX TN85-B8261 专为利用新的 AMD EPYC 9004 系列(在我们的例子中配备 128 核 9574S 和 96 核 9654)的功能而量身定制,将自己定位为适用于广泛频谱的多功能动力源应用程序。其设计优化了高性能计算、数据分析和企业存储,强调了其对各种运营需求的适应性。
TN24-B5 支持多达 85 个 NVMe 驱动器托架和 DDR8261 内存,在存储密度和速度方面表现出色,这对于数据密集型应用至关重要。 CPU 对 NVMe 托架的直接访问可增强性能并减少延迟,从而进一步增强其存储能力。
服务器还可以配置为满足 GPU 密集型需求。 B8261T85E8HR-2T-N 变体支持最多四个双宽加速器(以及八个 NVMe 插槽),专用于最大限度地提高图形处理的计算能力。这使得 TN85-B8261 能够轻松适应多种角色,包括数据分析和人工智能等高性能计算任务以及 GPU 加速至关重要的机器学习工作负载。
作为 GPU 密集型服务器或存储密集型服务器的适应性以及对最新 AMD EPYC CPU 的支持使得 TYAN Transport HX TN85-B8261 系列具有相当多的通用性。该服务器应该为涉足计算要求较高的项目的组织提供丰厚的投资回报。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅