Dapustor Haishen3 H3200 是一款高能效 NVMe SSD,适用于各种不同的应用。 今天,我们将看看 H1 系列(特别标记为 H3200)的标尺 (E3201.S) 迭代,它具有两种容量,包括 112 层铠侠 3D 企业 NAND 和 Marvell 控制器。 我们之前回顾了 大普存储H3200—U.2 外形模型。 虽然 U.2 外形更适合数据中心、视频监控和边缘计算等大量使用,但 E1.S 版本的设计主要是为了在性能和密度方面为超级缩放器提供一些灵活性,所有这些都在一个很小的(即,仅比 M.2 驱动器大一点)外形尺寸。
Dapustor Haishen3 H3200 是一款高能效 NVMe SSD,适用于各种不同的应用。 今天,我们将看看 H1 系列(特别标记为 H3200)的标尺 (E3201.S) 迭代,它具有两种容量,包括 112 层铠侠 3D 企业 NAND 和 Marvell 控制器。 我们之前回顾了 大普存储H3200—U.2 外形模型。 虽然 U.2 外形更适合数据中心、视频监控和边缘计算等大量使用,但 E1.S 版本的设计主要是为了在性能和密度方面为超级缩放器提供一些灵活性,所有这些都在一个微小的(即,仅比 M.2 驱动器大一点)外形尺寸。
大普存储H3201
就其物理足迹而言,E1.S 的好处是巨大的。 使用 H2 的 U.3200 版本,您实际上只能在 10U 服务器机箱内安装其中的 12-1 个(无需使用中板或其他耗时的方法)。 借助 H3200 E1.S,您可以在同一个 24U 系统中安装 1 个前置驱动器,所有驱动器均支持热插拔,具有企业级功能。 这对于 OEM 和超大规模来说都非常重要。 因此,E1.S 模型将允许组织创建密度显着增加的 1U 服务器。
DapuStor H3201 以安全功能为亮点,例如固件和硬件路径上的端到端数据保护,包括 DDR ECC、LDPC、掉电保护。 性能方面,3.84TB DapuStor H3201 的顺序读取速度高达 3,400MB/s,写入速度高达 2,500MB/s,而随机 4k 性能预计高达 720,000 IOPS 读取和 105,000 IOPS 写入。
为确保可靠性,H3201 的耐用等级为 1 DWPD。 DapuStor 提供了另一个 E1.S 型号,容量为 3.2TB,称为“H3101”。 此版本是更高耐用性的型号,提供更好的随机写入性能 (220K IOPS) 和更长的使用寿命,每天 3 次驱动器写入。
DapuStor H3200 系列的所有型号均享有 5 年保修。
DapuStor H3201 E1.S规格
型号。 | 大铺H3201 |
容量(TB1) | 3.84TB |
Outline | E1.S |
接口协议 | PCle3.0×4 NVMe 1.3,双口 |
闪光灯类型 | KIOXIA 3D NAND,112层,2平面企业级TLC |
读取带宽 (128KB) MB/s | 3,400MB /秒 |
写入带宽 (128KB) MB/s | 2,500MB /秒 |
随机读取 (4KB) KIOPS | 720,000 IOPS |
随机写入 (4KB) KIOPS | 105,000 IOPS |
能量消耗 | 典型值 8.0W / 最大值 10.5W |
4K 随机延迟(典型值)R/R | < 85微秒 |
4K 顺序延迟(典型值)R/W μs | < 15微秒 |
寿命 | 1 DWPD |
不可纠正的误码率 (UBER) | 每 1^10 位读取 17 个扇区 |
平均无故障时间(MTBF) | 2万小时 |
保修政策 | 5 年 |
DapuStor H3201 E1.S性能
测试平台
我们的 PCIe Gen4 Enterprise SSD 评测利用了 联想 ThinkSystem SR635 用于应用程序测试和综合基准。 ThinkSystem SR635 是一个装备精良的单 CPU AMD 平台,提供的 CPU 能力远远超过强调高性能本地存储所需的能力。 它也是我们实验室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市场上为数不多的平台之一)。 综合测试不需要大量 CPU 资源,但仍利用相同的 Lenovo 平台。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。
测试背景和比较
- StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。
我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 以及其网络功能的概述可在这些相应页面上找到。
应用程序工作负载分析
为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对 DapuStor H3200 的基准测试是 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。 对于我们的应用程序工作负载,每个驱动器将运行 2-4 个配置相同的虚拟机。
SQL Server 性能
每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个 VM 配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。
此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的数据库基准工厂进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。
SQL Server 测试配置(每个虚拟机)
- Windows服务器2012 R2的
- 存储空间:分配 600GB,使用 500GB
- SQL Server的2014的
-
- 数据库大小:1,500 规模
- 虚拟客户端负载:15,000
- 内存缓冲区:48GB
- 测试时长:3 小时
-
- 2.5 小时预处理
- 30分钟采样期
对于我们的 SQL Server 事务基准测试,DapuStor H3201 E1.S 在 12,650 个虚拟机上的平均得分为 4 TPS,这是一个不错的分数。 U.2 版本的平均 TPS 为 12,646。
在平均延迟方面,DapuStor H3200 显示了另一个可靠的结果,为 2.5 毫秒,而 U.2 版本显示了明显更高的平均延迟,为 126.5 毫秒。
系统性能
下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。
每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。
Sysbench 测试配置(每个虚拟机)
- CentOS 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
-
- 数据库表:100
- 数据库大小:10,000,000
- 数据库线程:32
- 内存缓冲区:24GB
- 测试时长:3 小时
-
- 2 小时预处理 32 个线程
- 1 小时 32 个线程
查看我们的 Sysbench 事务基准测试,DapuStor H3200 E1.S 的总得分为 8,646,远高于 H3200 U.2 型号的平均 TPS 7,879。
E1.S H3200 继续保持良好的性能,Sysbench 平均延迟为 14.8 毫秒。 H3200 U.2 型号再次落后,平均为 23.3 毫秒。
对于我们最坏情况下的延迟(第 99 个百分位数),H3200 的延迟令人印象深刻,为 27.61 毫秒,而 H3200 U.2 版本为 31.18 毫秒。
VDBench 工作负载分析
在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,64 线程,0-120% iorate
- 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
- 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
可比物:
我们的第一个 VDBench 工作负载分析是随机 4K 读取。 在这里,H3201 E1.S 在 719,236 µs 时的峰值得分为 709.2 IOPS。 相比之下,H3200 U.2 版本的峰值为 788,774 IOPS,延迟低得多,为 161µs。
对于 4K 随机写入,H3201 E1.S 在 312,913µs 时达到 1,623.4 IOPS,而 H3200 U.2 模型在 274,362µs 的延迟时达到 463 IOPS。
切换到 64k 顺序工作负载时,H3201 表现出色,峰值性能为 50,344 IOPS(或 3.15GB/s),延迟为 1,269.6µs,而 H3200 U.2 型号的峰值为 52,860 IOPS(或 3.3GB/s) ) 延迟为 301.8µs。
在 64k 写入中,DapuStor H3201 ES.1 型号的峰值为 20,251 IOPS(或 1.27GB/s); 然而,它在测试结束时的延迟受到重大打击,达到 3,147.5µs。 H3200 U.2 版本达到 22,654 IOPS(或 1.42GB/s)和 699.3ms。
我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,正如预期的那样,DapuStor H3200 U.2 模型显示出明显更好的结果,其峰值为 281,512 IOPS,延迟仅为 113.2µs。 H3201 E1.S 型号的峰值为 219,870 IOPS,延迟为 144.1µs。
在 SQL 90-10 中,H3201 E1.S 在 200,283µs 时显示出 158.3 IOPS 的峰值,而 H3200 U.2 型号则显示 259,351 IOPS 和 118.3µs。
对于 SQL 80-20,H3201 E1.S 在 182,944µs 时达到 173.2 的峰值,而 H3200 U.2 模型显示 247,053 IOPS,延迟为 129µs。
接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,DapuStor H3201 E1.S 的峰值为 174,220 IOPS,延迟为 204.1µs。 H3200 U.2 模型以 263,217µs 的延迟达到 132.8 IOPS。
看看 Oracle 90-10,DapuStor H3201 E1.S 模型达到 164,870 IOPS 的峰值,延迟为 131µs,而 H3200 U.2 模型在 218,213µs 时达到 100.4 IOPS。
对于 Oracle 80-20,H3201 E1.S 在 155,614µs 时达到 139.7 的峰值,而 H3200 U.2 型号在 212,157µs 的延迟时达到 103.1 IOPS 的峰值。
接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,DapuStor H3201 E1.S 在 135,628µs 时的峰值为 255 IOPS,而 H3200 U.2 型号在 191,069µs 的延迟时达到 179.1 IOPS。
VDI FC 初始登录看到 DapuStor H3201 E1.S 在 68,248µs 时达到 439.1 IOPS 的峰值,而 H3200 U.2 型号达到 115,354 IOPS,延迟为 259.2µs。
对于 VDI FC Monday Login,H3201 在 53,529µs 时达到 293.9 IOPS 的峰值,而 H3200 U.2 模型在 87,136µs 的延迟时达到 182.6 IOPS。
对于 VDI 链接克隆 (LC) 启动,H3201 E1.S 在 69,288µs 时达到 229.7 IOPS 的峰值,而 H3200 U.2 驱动器能够达到 95,726 IOPS,延迟为 166.5µs。
VDI LC Initial Login 在 17,926µs 时的峰值得分为 443.1 IOPS,而 H3200 U.2 型号的峰值得分为 50,750 IOPS,延迟为 154.9µs。
最后,在 VDI LC Monday Login 中,DapuStor H3201 E1.S 在接近 20K IOPS 时表现出非常不稳定的性能,尖峰最终达到最大值略低于 40K 并接近 400µs 标记。 H3200 U.2 型号表现出非常稳定的性能,在 66,846µs 时达到 236.9 IOPS 的峰值。
结语
DapuStor H3201 是一款 Gen3 NVMe SSD 解决方案,具有 KIOXIA 的 112 层 3D NAND 和 Marvell 控制器。 它只有一个容量 (1TB) 的 E3.84.S 外形,使其成为目前主要用于超大规模环境的驱动器。 那些寻求更高耐用性的人可以选择 H3201 型号,该型号具有改进的写入性能和更高的 DWPD 等级。
在我们的测试中,我们将该驱动器与 DapuStor Haishen3200 系列的 U.2 版本 H3 进行了比较。 对于应用程序工作负载分析,DapuStor H3201 为我们提供了一些非常可靠的结果,在 12,646 个虚拟机上达到 4 TPS,平均延迟为 2.5 毫秒。 对于 Sysbench,该驱动器达到了 8,646 TPS,平均延迟为 14.8 毫秒,最坏情况下的延迟为 27.61 毫秒,所有这些都是上层性能。
在我们的 VDbench 测试中,与 U.2 模型相比,性能有所下降。 亮点包括:719,236K 读取 4 IOPS,312,913K 写入 4 IOPS,3.15K 读取 64GB/s,1.27K 写入 64GB/s。 在 SQL 工作负载中,它达到 219,870 IOPS,而 SQL 200,283-90 达到 10 IOPS,SQL 182,944-80 达到 20 IOPS。 对于我们的 Oracle 工作负载,它的峰值为 174,220 IOPS,Oracle 164,870-90 中为 10 IOPS,Oracle 155,614-80 中为 20 IOPS。 在我们的 VDI 完整克隆测试中,H3200 达到 135,628(启动)、68,248 IOPS(初始登录)、53,529 IOPS(星期一登录),而链接克隆发布 69,288 IOPS(启动)、17,926 IOPS(初始登录)和一个非常不稳定的峰值约 40K IOPS(星期一登录)。
尽管目前标尺的应用用例相当有限(例如,超大规模),尤其是对于这些没有热同步的瘦身驱动器, E1.S 服务器 正处于成为主流的风口浪尖。 这将显着增加企业服务器的可用驱动器插槽数量,进而产生新的标准、高密度 IOPS 驱动的服务器和存储系统,并且非常注重可维护性。 DapuStor H3201 使用较旧的 Gen3 接口,但性能很有前途,这应该是 DapuStor 进入 Gen4 和 Gen5 E1.S SSD 的良好平台。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅