Supermicro 1024US-TRT 是该公司 A+ Ultra 系列的 1U 服务器。 该服务器非常适合需要能够在密集计算用例中表现出色的性能驱动型解决方案的组织。 加上其广泛的网络选项,1024US-TRT 在 SC12UTS-R819K1P-A 机箱内配备了 H02DSU-iN 主板,前者以其双插槽支持为特色 AMD EPYC(米兰)系列处理器,高达 8TB 的 ECC DDR4 3200MHz SDRAM,使用 32 个 DIMM 插槽和 PCI Gen4 扩展插槽。
Supermicro 1024US-TRT 是该公司 A+ Ultra 系列的 1U 服务器。 该服务器非常适合需要能够在密集计算用例中表现出色的性能驱动型解决方案的组织。 加上其广泛的网络选项,1024US-TRT 在 SC12UTS-R819K1P-A 机箱内配备了 H02DSU-iN 主板,前者以其双插槽支持为特色 AMD EPYC(米兰)系列处理器,高达 8TB 的 ECC DDR4 3200MHz SDRAM,使用 32 个 DIMM 插槽和 PCI Gen4 扩展插槽。
Supermicro 1024UT 与 1023US
就在今年早些时候,我们在 1023US-TR4. 1023US 采用代号为 AMD Rome 的 EPYC 7002 系列。 有了 1024US,Supermicro 现在当然支持 EPYC 7003 CPU,通常被称为 AMD Milan。 AMD 的新处理器系列是对上一代处理器的重大升级。
尽管是 1U,Supermicro 1024US-TRT 支持 280W TDP,这意味着它能够利用 AMD 系列的广度。 这包括顶级 64 核 EPYC 7763,或者更多 VMware 许可友好 32 核 CPU,例如 EPYC 75F3。
对于存储,Supermicro 1024US-TRT 具有与 1023-TR4 相同的配置选项(3.5 英寸热插拔驱动器托架,可以填充 SATA、SAS 或 NVMe SSD)。 Supermicro 继续其独特的 3.5 英寸托架和 NVMe 组合,为用户提供尽可能多的系统构建灵活性。 这种特殊的 4 托架配置假设服务器本身将主要利用共享存储来承载其 AMD 内核。 也就是说,如果 CPU 接近是一个问题,则托架可以利用大容量 NVMe SSD 或 HDD 的体面数据足迹。
1023US 和 1024US 之间的其他显着变化是在机箱背面。 1024US 将 4US 的 1 个 1023GbE 网络端口替换为两个内置 10GbE 端口。 1024US 也获得了 PCIe 背板升级。 它现在支持三个 x16 端口,而 1023US 只有两个 x16,一个 x8。
我们的评论模型配备了四个 英特尔 P5510 3.84 PCIe 第 4 代 NVMe 固态硬盘、AMD EPYC 7713 处理器(64 核)和 512GB DDR4 内存。 对于引导,我们利用了 64GB SATADOM。
Supermicro 1024US-TRT 规格
处理器/芯片组 | ||
中央处理器 |
|
|
颜色 |
|
|
芯片组 |
|
|
系统内存 | ||
内存容量 |
|
|
内存类型 |
|
|
DIMM 尺寸 |
|
|
显存电压 |
|
|
错误检测 |
|
|
车载设备 | ||
VGA |
|
|
扩展插槽 | ||
1U |
|
|
输入/输出 | ||
的SATA |
|
|
局域网 |
|
|
USB |
|
|
VGA |
|
|
SAS |
|
|
NVMe |
|
|
其它 |
|
|
系统BIOS | ||
BIOS类型 |
|
|
BIOS 功能 |
|
|
底座 | ||
外形 |
|
|
型号 |
|
|
尺寸 | ||
高度 |
|
|
宽度 |
|
|
深度 |
|
|
重量 |
|
|
控制面板 | ||
钮扣 |
|
|
LEDs |
|
|
驱动器托架 | ||
热插拔 |
|
|
背板 | ||
硬盘背板 |
|
|
系统冷却 | ||
风扇 |
|
|
空气罩 |
|
|
可编程电源 | ||
具有 PMBus 的 1000W 冗余电源 | ||
总输出功率 |
|
|
尺寸 (宽 x 高 x 长) |
|
|
输入 |
|
|
+ 12V |
|
|
12伏特 |
|
|
输出类型 |
|
|
证书 | 钛级 | |
电脑健康监控 | ||
中央处理器 |
|
|
FAN |
|
|
温度 |
|
|
LED |
|
|
其他特点 |
|
|
操作环境/合规性 | ||
RoHS |
|
|
环境规格 |
|
Supermicro 1024US-TRT 设计和构建
1024US-TRT 与大多数其他 Supermicro 系统一样使用免工具导轨系统设计。 我们在安装系统时没有遇到任何问题,因为导轨的每一端都配备了可以轻松装入机架的方形销钉。
控制面板位于前面板右侧,由电源开/关按钮、复位按钮和六个状态 LED 组成:电源、硬盘、2x NIC、信息状态和 UID 指示灯。 占据前面板其余部分并沿底部延伸的是用于 SATA、NVME 和 SAS 驱动器的四个热插拔 3.5 英寸托架。 如果需要,您还可以在服务/资产标签的右侧添加光驱。
除冗余电源模块外,所有连接都位于机箱的背面板上。 从左到右分别是两个 10GBase-T 端口、两个 USB 3.0 端口、一个 IPMI 专用 LAN 端口、一个串行端口、一个 UID 指示灯和按钮(用于切换 UID 指示灯)、一个 VGA 端口和三个 x16 PCI 扩展槽(一个 PCI-E 薄型插槽和两个 PCI-E 全高、9.5 英寸长的插槽)。
要接触 H12DSU-iN 主板的内部组件,只需按下两个释放按钮,然后滑下顶盖(向服务器背面推),即可取下顶盖。 与 A+ 系列的服务器一样,1024US-TRT 采用智能布局设计,有充足的气流空间。
在正面,您会看到八个重型 PWM 风扇(具有最佳风扇速度控制),有助于保持系统平稳运行。 系统风扇旁边是 32 个 DIMM,它们支持高达 DDR4 3200 MHz 的 RAM 注册 ECC,并环绕着双 EPYC 7200 系列 CPU(7003 系列处理器需要更新到 BIOS 版本 2.0 或更高版本以获得直接支持)。 主板背面是冗余的 800W/1000W 钛级 PSU。
Supermicro 1024US-TRT 性能
Supermicro 1024U-TRT配置:
- 英特尔 P5510 3.84 PCIe 第 4 代 NVMe 固态硬盘
- AMD EPYC 7713 处理器(64 核)
- 512GB DDR4 RAM
- 64GB SATADOM 引导
SQL Server 性能
StorageReview 的 Microsoft SQL Server OLTP 测试协议采用事务处理性能委员会的基准 C (TPC-C) 的最新草案,这是一种模拟复杂应用程序环境中活动的在线事务处理基准。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。
每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试寻找延迟性能。
SQL Server 测试配置(每个虚拟机)
- Windows服务器2012 R2的
- 存储空间:分配 600GB,使用 500GB
- SQL Server的2014的
-
- 数据库大小:1,500 规模
- 虚拟客户端负载:15,000
- 内存缓冲区:48GB
- 测试时长:3 小时
-
- 2.5 小时预处理
- 30分钟采样期
对于 SQL Server 平均延迟,Supermicro 1024US-TRT 在 1.5 个虚拟机上的平均延迟为 8 毫秒。
Sysbench MySQL 性能
我们的第一个本地存储应用程序基准测试包括通过 SysBench 测量的 Percona MySQL OLTP 数据库。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。
每个 Sysbench VM 配置了三个虚拟磁盘:一个用于启动 (~92GB),一个用于预构建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。
Sysbench 测试配置(每个虚拟机)
- CentOS 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
- 数据库表:100
-
- 数据库大小:10,000,000
- 数据库线程:32
- 内存缓冲区:24GB
- 测试时长:3 小时
-
- 2 小时预处理 32 个线程
- 1 小时 32 个线程
使用 Sysbench OLTP,我们记录了 23,208 个虚拟机的总得分为 8 TPS,29,832 个虚拟机的总得分为 16TPS。
通过 Sysbench 平均延迟,我们看到 11.03 个虚拟机的总得分为 8 毫秒,17.16 个虚拟机的总得分为 16 毫秒。
对于我们最坏情况下的延迟(第 99 个百分位数),Supermicro 服务器的 19.41 个虚拟机的总得分为 8 毫秒,31.67 个虚拟机的总得分为 16 毫秒。
VDBench 工作负载分析
在对存储阵列进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。
这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见的数据库传输大小测试,以及来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,128 线程,0-120% iorate
- 64K 顺序读取:100% 读取,32 个线程,0-120% 迭代
- 64K 顺序写入:100% 写入,16 个线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
观察随机 4K 读取,Supermicro 1024US-TRT 在整个测试过程中记录了低于亚毫秒的延迟,从 283,023μs 的 75.2 IOPS 开始,然后以 2,843,723μs 的延迟达到 640.4 IOPS 的峰值。
对于随机 4K 写入,服务器以 184,623μs 开始 23 IOPS。 它在整个过程中显示出非常稳定的延迟,直到它达到大约 1.6 万 IOPS 标记,最终达到峰值并在 1.72 微秒时达到 990.4 万 IOPS 的峰值。 您还会注意到最后的性能和延迟略有下降。
接下来是顺序工作负载。 对于 64K 顺序读取,Supermicro 服务器在 39,459μs 延迟时以 4.92 IOPS (252.8GB/s) 开始,然后在 391,527μs 延迟时达到 24.2 IOPS 或 643.9GB/s 的峰值。 从四个 SSD 中看到接近 25GB/s 的速度非常漂亮,这也是 PCIe Gen4 带来的一大优势。
在 64K 顺序写入中,1024US-TRT 在接近 120K IOPS 标记之前始终显示亚毫秒延迟。 然后它达到 125,819 IOPS(或 7.86GB/s)的峰值,延迟为 1,719μs,最后性能受到影响。
我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,1024US-TRT 的峰值为 892,689 IOPS,延迟为 142.5μs。
对于 SQL 90-10,Supermicro 服务器以大约 94K IOPS 开始,延迟仅为 78.8μs,而峰值为 975,102 IOPS,延迟为 130.1μs。
在 SQL 80-20 中,1024US-TRT 的峰值为 918K IOPS,延迟为 138μs。
接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,1024US-TRT 开始时为 73.4μs,峰值为 966,601 IOPS,延迟为 128.2μs,最后性能略有下降。
查看 Oracle 90-10,Supermicro 服务器以 82,203 IOPS 开始,延迟为 74.9μs,峰值为 836K IOPS,延迟为 104.3μs。
使用 Oracle 80-20 时,1024US-TRT 以 60,321 IOPS 和 107.2 微秒的延迟开始,而峰值为 615,507 IOPS 和 141.6 微秒的延迟。
接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,Supermicro 1024US-TRT 在 738,270μs 的延迟下达到 172.5 IOPS 的峰值,然后在最后的性能上略有下降。
查看 VDI FC 初始登录,Supermicro 服务器以 39,100 IOPS 和 72.1μs 延迟开始,而在 389,068μs 延迟时达到 243.9 IOPS 的峰值。
VDI FC Monday Login 看到服务器以 36K IOPS 和 93.6μs 延迟启动,而在 361μs 时达到 160K IOPS 的峰值。
对于 VDI 链接克隆 (LC) 引导,Supermicro 服务器在 30,496μs 延迟时以 157.2 IOPS 开始,在 300,452μs 时达到 201 IOPS 的峰值。
查看 VDI LC 初始登录,1024US-TRT 开始时为 20,185 IOPS,延迟为 105.6μs,然后峰值为 195,871 IOPS,延迟为 145.4μs。
最后,VDI LC Monday Login 以 25,500 IOPS 和 111.4μs 的延迟开始,而在 259,817μs 时达到 212.4 IOPS 的峰值(在最后性能受到轻微影响之前)。
总结
Supermicro SuperStorage 1024US-TRT 是一款令人印象深刻的服务器,专为在密集计算用例中表现出色而设计。 为此,服务器可以配备一系列以性能为导向的组件,包括多达双路的 AMD EPYC 7003 系列处理器, 8TB Registered ECC DDR4 3200MHz SDRAM 通过其 32 个 DIMM 插槽和四个 NVMe/SAS/SATA 驱动器通过其四个 3.5 英寸托架。
1024US-TRT 还可以通过背面板上的扩展槽(一个薄型插槽和两个全高、4 英寸长的插槽)配备 PCIe Gen9.5 卡。 对于网络,1023US-TR4 具有双 10GBase-T LAN 端口和一个 RJ45 专用 IPMI LAN 端口。
首先查看我们的应用程序工作负载分析结果,我们记录了 SQL Server 平均延迟的总计 1.5 毫秒。 使用 Sysbench,我们看到 23,208 个虚拟机的事务总得分为 8 TPS,29,832 个虚拟机的事务总得分为 16TPS,而平均延迟给我们的总得分为 11.03 个虚拟机的 8 毫秒和 17.16 个虚拟机的 16 毫秒。 最后,最坏的情况记录了 19.41 个虚拟机的 8 毫秒和 31.67 个虚拟机的 16 毫秒。
通过我们的 VDBench 工作负载分析,服务器装有四个 Intel P5510 3.84 PCIe Gen 4 NVMe SSD,它们专为数据中心工作负载和类似环境而设计。 在这里,Supermicro 1024US-TRT 展示了一些非常令人印象深刻的结果,其中包括 2.8K 读取的 4 万 IOPS、1.6K 写入的 4 万 IOPS、24.2k 顺序读取的 64GB/s 和 7.86k 顺序写入的 64GB/s。
对于我们的 SQL 工作负载,Supermicro 服务器的峰值为 892,689 IOPS,975,102-90 为 10 IOPS,918-80 为 20K IOPS。 对于 Oracle,我们看到了 966,601 IOPS 的峰值,836-90 的峰值为 10K IOPS,615,507-80 的峰值为 20 IOPS。 1024US-TRT 在我们的 VDI 克隆测试中也继续向我们展示出色的性能数据。 对于完整克隆,Supermicro 服务器在启动时记录的峰值为 738,270 IOPS,在初始登录时为 389,068 IOPS,在星期一登录时为 361K IOPS。 对于链接克隆,我们看到启动的 IOPS 为 300,452,初始登录的 IOPS 为 195,871,星期一登录的 IOPS 为 259,817。
Supermicro 1024US-TRT 在测试期间向我们展示了 1U 服务器的出色性能和大量灵活性。 您可能已经注意到结果与 1023-TR4 非常相似; 但是,1024-TRT 使用较低时钟速度的内核提供这些数字。 因此,如果您正在寻找更高的性能,您一定会通过为服务器配备更高端的 AMD Milan (EPYC 7003) 型号来找到它。 也就是说,它清楚地向我们展示了 AMD 新处理器的进展看起来相当不错,因为它们提供与顶级罗马型号 (EPYC 7002) 相同的性能。
尽管 1024US-TRT 通过大容量 NVMe SSD 或 HDD 提供了可观的存储量,但那些寻求更密集解决方案的人应该寻找 Supermicro 的更大选择。 然而,总的来说,Supermicro 服务器充分利用了其新技术,并且肯定会提供一系列企业和 SMB 环境所需的性能。
参与 StorageReview
电子报 | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS订阅