首页 企业版 技嘉 R281-NO0 NVMe 服务器评测

技嘉 R281-NO0 NVMe 服务器评测

by 亚当·阿姆斯特朗

GIGABYTE R281-NO0 是一款 2U 全 NVMe 服务器,围绕 英特尔第二代至强可扩展处理器 侧重于基于性能的工作负载。 在第二代 Intel Xeon Scalable 的支持下,支持 英特尔傲腾 DC 持久内存模块. Optane PMEM 可以带来更大的内存占用空间,因为虽然这些模块的性能不如 DRAM,但它们的容量要高得多。 利用 Optane 可以帮助释放技嘉 R2-NO281 中第二代英特尔至强可扩展处理器的全部潜力。

GIGABYTE R281-NO0 是一款 2U 全 NVMe 服务器,围绕 英特尔第二代至强可扩展处理器 侧重于基于性能的工作负载。 在第二代 Intel Xeon Scalable 的支持下,支持 英特尔傲腾 DC 持久内存模块. Optane PMEM 可以带来更大的内存占用空间,因为虽然这些模块的性能不如 DRAM,但它们的容量要高得多。 利用 Optane 可以帮助释放技嘉 R2-NO281 中第二代英特尔至强可扩展处理器的全部潜力。

 

技嘉 R281-NO0 其他有趣的硬件布局包括每个插槽最多 12 个 DIMM,总共 24 个。 较新的 CPU 支持高达 2933MHz 的 DRAM。 总的来说,用户可以为 GIGABYTE R281-NO0 配备高达 3TB 的 DRAM。 该服务器可以利用多个不同的转接卡,为可以利用 PCIe x16 插槽或以下插槽的设备提供多达六个全高半长插槽。 该公司拥有非常密集的附加插槽设计,具有针对不同用例的多种配置。 该服务器有一个模块化的背板,能够支持可交换的扩展器,根据需要提供 SAS 和 NVMe U.2(或组合)。

有了存储,用户不仅可以加很多,还可以加很多U.2和AIC形式的NVMe存储。 服务器正面有24个硬盘托架,支持2.5寸HDD或SSD,支持NVMe。 服务器后部还有两个 2.5 英寸驱动器托架,用于 SATA/SAS 引导/日志驱动器。 并且有大量 PCIe 扩展槽可用于各种 PCIe 设备,包括更多存储。 这种密度和性能非常适合针对 GPU 密度优化的 AI 和 HPC、针对 HCI 优化的多节点服务器以及针对 HDD/SSD 容量优化的存储服务器。

对于那些感兴趣的人,我们在这里有一个视频概述:

在电源管理方面,技嘉 R281-NO0 有两个 PSU,这并不罕见。 但是,它还具有智能电源管理功能,既可以提高服务器的电源使用效率,又可以在出现故障时保留电源。 该服务器具有称为冷冗余的功能,可在系统负载低于 40% 时将额外的 PSU 切换到待机模式,从而节省电力成本。 该系统具有 SCMP(智能危机管理/保护)。 使用 SCMP,如果一个 PSU 出现问题,则在维修/更换 PSU 时,只有两个节点会进入低功耗模式。

技嘉R281-NO0规格

外形 2U
主机板 MR91-FS0
中央处理器 第二代英特尔至强可扩展和英特尔至强可扩展处理器
英特尔至强铂金处理器、英特尔至强金牌处理器、英特尔至强银牌处理器和英特尔至强铜牌处理器
CPU TDP 高达 205W
插座 2x LGA 3647,插座 P
芯片组 英特尔C621
内存 24 个 DIMM 插槽
支持高达 64GB 的 RDIMM 模块
支持高达 128GB 的​​ LRDIMM 模块
支持 Intel Optane DC Persistent Memory (DCPMM)
1.2V模块:2933 (1DPC)/2666/2400/2133 MHz
海湾 正面:24 x 2.5″ U.2 热插拔 NVMe SSD 托架
后侧:2 x 2.5″ SATA/SAS 热插拔 HDD/SSD 托架
光驱类型 SATA III 6Gb/秒
带有附加 SAS 卡的 SAS
的RAID 对于 SATA 驱动器:Intel SATA RAID 0/1
对于 U.2 驱动器:Intel Virtual RAID On CPU (VROC) RAID 0、1、10、5
局域网 2 个 1Gb/s LAN 端口(Intel I350-AM2)
1 x 10/100/1000 管理局域网
扩展插槽
转接卡 CRS2131 1 x PCIe x16 插槽(Gen3 x16 或 x8),全高半长
1 x PCIe x8 插槽(Gen3 x0 或 x8),全高半长
1 x PCIe x8 插槽 (Gen3 x8),全高半长
转接卡 CRS2132 1 x PCIe x16 slot (Gen3 x16 or x8), 全高半长, CNV3124占用, 4 x U.2接口
1 x PCIe x8 插槽(Gen3 x0 或 x8),全高半长
1 x PCIe x8 插槽 (Gen3 x8), 全高半长
转接卡 CRS2124 1 x PCIe x8 插槽 (Gen3 x0),薄型半长
1 x PCIe x16 插槽 (Gen3 x16), Low profile half-length, CNV3124 占用, 4 x U.2 接口
2 个 OCP 夹层插槽 PCIe Gen3 x16
类型 1、P1、P2、P3、P4、K2、K3
1 x OCP夹层槽被CNVO124占用,4 x U.2夹层卡
I / O
全内走线 2 个电源连接器
4 个 SlimSAS 连接器
2 个 SATA 7 针连接器
2 x CPU 风扇接头连接器
1个USB 3.0接头
1 个 TPM 标头
1 个 VROC 连接器
1 x 前面板接头连接器
1 x HDD 背板接口
1 个 IPMB 连接器
1 x 清除 CMOS 跳线
1 x BIOS 恢复跳线
面前 2 x的USB 3.0
1 个带 LED 的电源按钮
1 个带 LED 的 ID 按钮
1 x重置按钮
1 个 NMI 按钮
1 x 系统状态 LED
1 x 硬盘活动 LED
2 x LAN 活动 LED
2 x的USB 3.0
1个VGA
1 x COM(RJ45 型)
2 x RJ45
1 个 MLAN
1 x 带 LED 的 ID 按钮
背板 Front side_CBP20O2:24 个 SATA/SAS 端口
Front side_CEPM480:8 个 U.2 端口
背面_CBP2020:2 个 SATA/SAS 端口
带宽:每端口 SATAIII 6Gb/s 或 SAS 12Gb/s
电力
支持 2 x 1600W 冗余 PSU
80 PLUS白金
交流输入 100-127V~/ 12A, 47-63Hz
​200-240V~/ 9.48A, 47-63Hz
直流输出 最大 1000W/ 100-127V

  • +12V/82A
  • +12Vsb/2.1A

最大 1600W/ 200-240V

  • +12V/132A
  • +12Vsb/ 2.1A
环境
工作温度 10°C至35℃,
工作湿度 8-80%(非冷凝)
非工作温度 -40°C至60℃,
非工作湿度 20%-95%(非凝结)
物理
尺寸(WxHxD)  438 x 87.5 x 730
重量  20kg

设计与建造

技嘉 R281-NO0 是一款 2U 机架式服务器。 正面有 24 个用于 NVMe U.2 SSD 的热插拔托架。 左侧是LED指示灯和reset、power、NMI、ID按键。 右侧是两个 USB 3.0 端口。

 

将设备翻转到背面,我们在左上角看到两个 2.5 英寸 SSD/HDD 托架。 托架下方是两个 PSU。 底部是一个 VGA 端口、两个 USB 3.0 端口、两个 GbE LAN 端口、一个串行端口和一个 10/100/1000 服务器管理 LAN 端口。 端口上方是六个 PCIe 插槽。

 

顶部很容易弹出,让用户可以接触到两个 Intel CPU(照片中被散热器覆盖)。 在这里还可以看到所有 DIMM 插槽。 从前面的背板回到子板的所有直接访问电缆可以看出,该服务器已加载 NVMe。 电缆本身排列整齐,似乎不会影响从前到后的气流。

技嘉R281-NO0配置

中央处理器 2 个英特尔 8280
内存 384GB 的 2933HMz
12 个美光 9300 NVMe 3.84TB

性能

SQL Server 性能

StorageReview 的 Microsoft SQL Server OLTP 测试协议采用事务处理性能委员会的基准 C (TPC-C) 的最新草案,这是一种模拟复杂应用程序环境中活动的在线事务处理基准。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。

每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试寻找延迟性能。

此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由戴尔的数据库基准工厂进行压力测试。 虽然我们对该基准的传统用法是在本地或共享存储上测试 3,000 规模的大型数据库,但在本次迭代中,我们专注于在我们的服务器上均匀分布四个 1,500 规模的数据库。

SQL Server 测试配置(每个虚拟机)

  • Windows服务器2012 R2的
  • 存储空间:分配 600GB,使用 500GB
  • SQL Server的2014的
    • 数据库大小:1,500 规模
    • 虚拟客户端负载:15,000
    • 内存缓冲区:48GB
  • 测试时长:3 小时
    • 2.5 小时预处理
    • 30分钟采样期

对于我们的事务性 SQL Server 基准测试,R281-NO0 的总得分为 12,645 TPS,单个 VM 的范围从 3,161.1 TPS 到 3,161,5 TPS。

对于 SQL Server 平均延迟,服务器的总分和单个 VM 分均为 1 毫秒。

Sysbench MySQL 性能

我们的第一个本地存储应用程序基准测试包括通过 SysBench 测量的 Percona MySQL OLTP 数据库。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。

每个 Sysbench VM 配置了三个虚拟磁盘:一个用于启动 (~92GB),一个用于预构建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

Sysbench 测试配置(每个虚拟机)

  • CentOS 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 数据库表:100
    • 数据库大小:10,000,000
    • 数据库线程:32
    • 内存缓冲区:24GB
  • 测试时长:3 小时
    • 2 小时预处理 32 个线程
    • 1 小时 32 个线程

在 Sysbench OLTP 中,技嘉获得了 19,154.9 TPS 的总分。

对于 Sysbench 延迟,服务器的平均延迟为 13.37 毫秒。

在我们的最坏情况(第 99 个百分位数)延迟中,服务器的聚合延迟为 24.53 毫秒。

VDBench 工作负载分析

在对存储阵列进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见的数据库传输大小测试,以及来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,64 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,16 个线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

对于随机 4K 读取,技嘉 R281-NO0 在 539,443µs 时以 114.8 IOPS 开始,然后在 5,326,746µs 的延迟时达到 238 IOPS 的峰值。

 

4k 随机写入显示低于 100µs 的性能,直到大约 3.25 万次 IOPS,峰值得分为 3,390,371 IOPS,延迟为 262.1µs。

 

对于顺序工作负载,我们查看了 64k。 对于 64K 读取,我们在大约 640µs 的延迟下看到了大约 4K IOPS 或 550GB/s 的峰值性能,然后才有所下降。

 

64K 写入性能低于 100µs,直到大约 175K IOPS 或 1.15GB/s,然后以 259,779 IOPS 或 1.62GB/s 的峰值达到 581.9µs 的延迟,然后下降一些。

 

我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,技嘉的峰值性能为 2,345,547 IPS,延迟为 159.4µs。

 

使用 SQL 90-10,我们看到服务器峰值为 2,411,654 IOPS,延迟为 156.1µs。

 

我们的 SQL 80-20 测试的服务器峰值为 2,249,683 IOPS,延迟为 166.1µs。

接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,GIGABYTE R281-NO0 在 2,240,831µs 的延迟时达到 165.3 IOPS 的峰值。

 

Oracle 90-10 的峰值性能为 1,883,800 IOPS,延迟为 136.2µs。

在 Oracle 80-20 中,服务器的峰值为 1,842,053 IOPS,延迟为 139.3µs。

 

接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI Full Clone (FC) Boot,GIGABYTE 的峰值为 1,853,086 IOPS,延迟为 198µs。

查看 VDI FC 初始登录,服务器在 83,797µs 时以 86.7 IOPS 启动,然后以 808,427 IOPS 稳定,延迟为 305.9µs,然后下降一些。

 

VDI FC Monday Login 看到服务器峰值为 693,431 IOPS,延迟为 207.6µs。

 

对于 VDI 链接克隆 (LC) 引导,技嘉服务器在 802,660µs 的延迟时达到 194 IOPS 的峰值。

查看 VDI LC 初始登录,服务器的峰值为 409,901 IOPS,延迟为 195.2µs。

最后,VDI LC Monday Login 的服务器峰值性能为 488,516 IOPS,延迟为 273µs。

结语

2U 技嘉 R281-NO0 是一款专为性能打造的全 NVMe 服务器。 该服务器采用两个第二代 Intel Xeon 可扩展 CPU,每个插槽最多支持 12 个 DIMM。 根据 CPU 的选择,它支持高达 2933MHz 的 DRAM 速度和 Intel Optane PMEM。 用户可以拥有高达 3TB 的 DRAM 或使用 Optane 的更大内存空间。 存储设置是高度可配置的,我们审查的构建支持 24 个 2.5 NVMe SSD。 一个有趣的电源功能是冷冗余,它可以在系统负载低于 40% 时将额外的 PSU 切换到待机模式,从而节省电力成本。

对于性能测试,我们运行了我们的应用程序分析工作负载以及我们的 VDBench 工作负载分析。 对于应用程序分析工作负载,我们从 SQL Server 开始。 在这里,我们看到总交易得分为 12,645 TPS,平均延迟为 1 毫秒。 转到 Sysbench,技嘉服务器为我们提供了 19,154 TPS 的总分,平均延迟为 13.37 毫秒,最坏情况下仅为 24.53 毫秒。

在我们的 VDBench 工作负载分析中,服务器获得了一些令人印象深刻的强劲数据。 峰值亮点包括5.3K读取4万IOPS、3.4K写入4万IOPS、4K读取64GB/s、64K写入1.62GB/s。 对于我们的 SQL 工作负载,服务器达到 2.3 万 IOPS,2.4-90 达到 10 万 IOPS,2.3-80 达到 20 万 IOPS。 对于 Oracle,我们看到 2.2 万 IOPS,Oracle 1.9-90 为 10 万 IOPS,1.8-80 为 20 万 IOPS。 对于我们的 VDI 克隆测试,我们看到 1.9 万的引导 IOPS、初始登录的 808K IOPS 和完整克隆的星期一登录的 693K IOPS。 对于链接克隆,我们看到启动时为 803K IOPS,初始登录时为 410K IOPS,星期一登录时为 489K IOPS。

GIGABYTE R281-NO0 是服务器的强大动力,能够支持广泛的闪存技术。 它围绕英特尔第二代可扩展硬件构建,还受益于支持傲腾 PMEM 的更新 CPU。 该服务器在存储端提供了大量的可配置性和一些极好的电源优势。 当然,我们最喜欢的是 2 个 NVMe SSD 托架; 任何有高性能存储需求的人都会如此。 GIGABYTE 的这款服务器经过精心设计,可以成为适用于各种用例的出色的大容量服务器。

技嘉R281-NO0

在 Reddit 上讨论

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅