Memblaze 在 PBlaze64 3-5 系列中发布了一系列 910 层、916D NAND NVMe SSD。 这些驱动器以 U.2 和 AIC 两种形式发布,910 的容量一直高达 15.36TB。 驱动器的更高耐久性版本是 916。我们之前已经审查了 916 U.2 固态硬盘 现在专注于性能更高的 HHHL AIC 版本。
Memblaze 在 PBlaze64 3-5 系列中发布了一系列 910 层、916D NAND NVMe SSD。 这些驱动器以 U.2 和 AIC 两种形式发布,910 的容量一直高达 15.36TB。 驱动器的更高耐久性版本是 916。我们之前已经审查了 916 U.2 固态硬盘 现在专注于性能更高的 HHHL AIC 版本。
Memblaze PBlaze5 916 AIC SSD 具有 U.2 版本的所有优势,包括 AES 256 数据加密、完整数据路径保护和增强的电源故障保护。 916 版本还具有更高的耐用性,支持 3 DWPD,而 910 仅支持 1 DWPD。 916 AIC 利用四个额外的通道来推动更高的性能,引用速度高达 5.9GB/s 读取和 2.8GB/s 写入,吞吐量高达 1 万 IOPS 读取和 303K IOPS 写入。
Memblaze PBlaze5 916 AIC SSD 有 3.2TB 和 6.4TB 两种型号,在本次评测中我们关注的是 6.4TB 版本。
Memblaze PBlaze5 916 系列 AIC 规格
用户容量 (TB) | 3.2,6.4 |
外形 | HHHL AIC |
接口: | PCIe 3.0 x 8 |
顺序读取 (128KB)(GB/s) | 5.5,5.9 |
顺序写入(128KB)(GB/s) | 3.1,3.8 |
持续随机读取 (4KB) IOPS | 850K,1,000K |
持续随机写入 (4KB) IOPS(稳态) | 210K,303K |
延迟读/写 | 87 / 11 微秒 |
终身耐力 | 3 DWPD |
UBER | <10-17 |
平均无故障时间 | 2万小时 |
协议 | NVMe 1.2a |
NAND 闪存 | 3D eTLC NAND |
操作系统 | RHEL、SLES、CentOS、Ubuntu、Windows Server、VMware ESXi |
能量消耗 | 7〜25瓦 |
基本功能支持 | 电源故障保护、热插拔、完整数据路径保护、SMART:TRIM、多命名空间、AES 256 数据加密、快速重启、加密擦除、 |
高级功能支持 | TRIM、多命名空间、AES 256 数据加密、快速重启、加密擦除、双端口 |
软件支持 | 开源管理工具、CLI 调试工具、OS 内置驱动程序 (易于系统集成) |
性能
测试平台
我们的企业级 SSD 评测利用 Lenovo ThinkSystem SR850 进行应用程序测试和 戴尔 PowerEdge R740xd 用于综合基准。 ThinkSystem SR850 是一个装备精良的四 CPU 平台,提供的 CPU 能力远远超过对高性能本地存储施加压力所需的能力。 不需要大量 CPU 资源的综合测试使用更传统的双处理器服务器。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。
联想 ThinkSystem SR850
- 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
- 16 x 32GB DDR4-2666Mhz ECC 内存
- 2 个 RAID 930-8i 12Gb/s RAID 卡
- 8 个 NVMe 托架
- VMware ESXI 6.5
戴尔 PowerEdge R740xd
- 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
- 4 x 16GB DDR4-2666MHz ECC 内存
- 1x PERC 730 2GB 12Gb/s RAID 卡
- 附加 NVMe 适配器
- Ubuntu-16.04.3-桌面-amd64
测试背景和比较
这款 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。
我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 和 其网络功能的概述 在这些相应的页面上可用。
本次审查的可比性:
- 记忆 PBlaze5 3.2TB
- 液态元素 AIC 7.68TB
- 英特尔固态硬盘 DC P4610 1.6TB
- 华为ES3000 V5 3.2TB
- 英特尔固态硬盘 DC P4510 2TB、8TB
- Memblaze PBlaze5 910 AIC 7.68TB
应用程序工作负载分析
为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对 Memblaze PBlaze5 916 的基准测试是 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。 对于我们的应用程序工作负载,每个驱动器将运行 2-4 个配置相同的虚拟机。
SQL Server 性能
每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个 VM 配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。
此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的数据库基准工厂进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。
SQL Server 测试配置(每个虚拟机)
- Windows服务器2012 R2的
- 存储空间:分配 600GB,使用 500GB
- SQL Server的2014的
- 数据库大小:1,500 规模
- 虚拟客户端负载:15,000
- 内存缓冲区:48GB
- 测试时长:3 小时
- 2.5 小时预处理
- 30分钟采样期
对于我们的 SQL Server 事务基准测试,Memblaze PBlaze5 916 AIC 以 12,645.0 TPS 位居第三,尽管它距离第一名仅 1.1 TPS。
为了更好地了解性能,还需要考虑延迟。 在这里,916 AIC 以仅 1.3 毫秒的优势位居第二,击败了 910/916 系列的其他产品。
系统性能
下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。
每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。
Sysbench 测试配置(每个虚拟机)
- CentOS 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
- 数据库表:100
- 数据库大小:10,000,000
- 数据库线程:32
- 内存缓冲区:24GB
- 测试时长:3 小时
- 2 小时预处理 32 个线程
- 1 小时 32 个线程
在 Sysbench 事务基准测试中,916 AIC 以 9,298 TPS 位居第二。
对于 Sysbench 平均延迟,916 AIC 以 13.8 毫秒位居第二。
对于我们最坏情况下的延迟(第 99 个百分位数),916 AIC 仅以 25.2 毫秒的延迟位居榜首。
SideFX 的胡迪尼
Houdini 测试专门用于评估与 CGI 渲染相关的存储性能。 此应用程序的测试台是核心的变体 戴尔 PowerEdge R740xd 我们在实验室中使用的服务器类型具有双 Intel 6130 CPU 和 64GB DRAM。 在这种情况下,我们安装了运行裸机的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基准测试的输出以秒为单位来衡量,越少越好。
Maelstrom 演示代表了渲染管线的一部分,它通过演示其有效使用交换文件作为扩展内存形式的能力来突出存储的性能。 测试不会写出结果数据或处理点,以隔离延迟对底层存储组件的影响。 测试本身由五个阶段组成,我们将其中三个阶段作为基准测试的一部分运行,如下所示:
- 从磁盘加载打包点。 这是从磁盘读取的时间。 这是单线程的,可能会限制整体吞吐量。
- 将点解压缩到一个平面数组中,以便对其进行处理。 如果这些点不依赖于其他点,则可以调整工作集以保留在核心中。 这一步是多线程的。
- (未运行)处理点。
- 将它们重新打包成适合存储回磁盘的分桶块。 这一步是多线程的。
- (未运行)将分桶块写回磁盘。
在 Houdini 测试中,916 AIC 的得分为 3,070.7 秒,在非 Optane 驱动器的死点附近着陆,正好与 910 AIC 持平。
VDBench 工作负载分析
在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,64 线程,0-120% iorate
- 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
- 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
在我们的第一个 VDBench 工作负载分析随机 4K 读取中,将 Memblaze PBlaze5 916 AIC 与其他两个 AIC 驱动器进行了比较:Memblaze PBlaze5 910 和 Liqid Element。 在这里,916 并驾齐驱地落后于 910,Liqid 领先。 916 以 81,010μs 的 99 IOPS 开始,然后以 809,069 IOPS 的峰值达到 157μs 的延迟。
最后,随机 4K 写入显示 916 的位置相同。 在这里,916 以 64,157 IOPS 开始,仅需 17.7μs。 该驱动器能够保持在 100 微秒以下,实际上是 25 微秒,直到大约 578K IOPS,在下降之前达到峰值。
切换到顺序工作负载,首先我们看一下 64K 顺序读取。 在这里,916 再次排在最后,仅次于 910。916 的峰值为 50,011 IOPS 或 3.13GB/s,延迟为 319μs。
64K 写入让 916 滑到第二位,仅次于 910。916 以 4,308 IOPS 或 256MB/s 开始,并在 50μs 延迟线上达到 30K IOPS 或 1.85GB/s,然后以 42,319 IOPS 或 2.65 达到峰值GB/s,370μs 延迟。
接下来是我们的 SQL 工作负载,这里 916 再次垫底,但仅比 916 稍逊一筹。916 以 27,120 IOPS 和 100.9μs 延迟开始,然后以 269,845 IOPS 和 118.1μs 延迟达到峰值。 从开始到结束只有 18μs 的延迟差异。
对于 SQL 90-10,916 以 27,381 IOPS 和 97.7μs 的延迟排名第三。 916 在大约 100K IOPS 时超过 82μs,然后以 273,081μs 的延迟达到 116.3 IOPS 的峰值。
对于 SQL 80-20,916 的位置相同,从 28,023 IOPS 和 88.9μs 延迟开始,峰值为 277,572 IOPS,延迟为 114.6μs。
对于我们的 Oracle 工作负载,916 几乎没有超过 910。这里的驱动器以 30,716 IOPS 开始,延迟为 91.2 微秒,峰值为 282,888 IOPS,延迟为 126.2 微秒。
甲骨文 90-10 看到 916 几乎没有下降到最后。 在这里,驱动器以 40,494 IOPS 和 98.2 微秒的延迟开始,并以 202,512 IOPS 的峰值和 107.9 微秒的延迟达到峰值。
对于 Oracle 80-20,我们看到 916 再次仅次于 910。该驱动器以 42,276 IOPS 开始,延迟为 87.6μs,一直保持在 100μs 以下,直到大约 169K IOPS 达到峰值,达到 210,628 IOPS,延迟为 103.8μs .
接下来,我们继续我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆启动,916 以 22,788 IOPS 和 107.9μs 延迟获得第三名,并以 218,323 IOPS 和 158.9μs 延迟达到峰值。
对于 VDI FC 初始登录,916 以 910 IOPS 和 15,487μs 的延迟排在 69.7 之后,并保持在 100μs 以下,直到大约 65K IOPS。 该驱动器的峰值为 147,777 IOPS,延迟为 199.4μs。
VDI FC Monday Login 以 916 IOPS 和 10,213μs 的延迟率首先获得 89.4。 该驱动器保持在 100μs 以下,直到大约 35K IOPS,然后以 101,673 IOPS 达到峰值,延迟为 155.5μs。
对于 VDI 链接克隆 (LC),我们再次从启动测试开始。 在这里,916 排名第三,从 9,598 IOPS 和 127μs 延迟开始,峰值为 98,621 IOPS,延迟为 161.6μs。
在 VDI LC 初始登录中,916 击败 910 获得第二名。 在这里,驱动器以 5,599 IOPS 开始,延迟为 94.2μs,并在约 100K IOPS 时超过 20μs。 916 的峰值为 55,416 IOPS,延迟为 142.1μs。
最后,在 VDI LC Monday Login 中,916 以 78,483 IOPS 的峰值性能和 201.3μs 的延迟率排名第一。
总结
Memblaze PBlaze5 916 是该公司的 64 层 3D NAND NVMe SSD 之一。 对于这个特定的审查,我们查看了 AIC 外形。 AIC 外形允许 916 系列的所有相同优势、AES 256 数据加密、完整数据路径保护、增强的电源故障保护和更高的耐用性,同时提供比其 U.2 对应产品更高的性能。 916 AIC 的读取速度高达 5.9GB/s,写入速度高达 2.8GB/s,吞吐量高达 1 万 IOPS 读取和 303K IOPS 写入以及 3DWPD。
对于我们的应用程序工作负载分析,Memblaze PBlaze5 916 AIC 在 SQL Server 和 Sysbench 中均表现出强大的性能。 该驱动器以 12,645 TPS 和 1.3 毫秒的平均延迟在 SQL Server 输出中排名第三,位居第二。 对于 Sysbench,916 AIC 的 TPS 为 9,298,平均延迟为 13.8 毫秒,在我们最坏情况下的延迟为 25.2 毫秒,位居榜首。 Houdini 以 3070.7 秒的成绩表现不佳。
对于我们的 VDBench,我们测试了 916 AIC 与其他两种 AIC 模型,即 Memblaze PBlaze5 910 AIC 和 Liqid Element AIC。 这里的表现不错,但位置让它看起来好坏参半。 916 经常排在其他两个驱动器的最后,但每次都在 910 的嗅探距离之内。 亮点包括 4K IOPS 的随机 809K 读取分数、4K IOPS 的随机 578K 写入分数、64GB/s 的 3.13K 顺序分数和 2.65GB/s 的顺序写入分数。 这里更有趣的是延迟。 即使在峰值 370μs 也是最高的,驱动器在大部分随机 25K 写入中运行时间低于 4μs。 SQL 在每个测试中显示超过 88.9 万 IOPS 的峰值分数,延迟范围从 118.1μs 到仅 283μs,非常低并且在所有测试中都是一致的。 Oracle 峰值分数不如 SQL 强(虽然第一个是 87.6K IOPS),但它确实有另一个低一致延迟的表现,在最高峰时从 126.2μs 到 XNUMXμs 不等。
Memblaze PBlaze5 916 AIC 是需要一致、低延迟的应用程序的理想选择。 虽然它的附加卡特性使其放弃了热插拔能力(使其可能具有更高的维护性——尽管它也具有很高的耐用性),但它在性能上弥补了这一点,尤其是延迟性能。