主页 企业 Memblaze PBlaze5 920 系列 NVMe SSD 评测

Memblaze PBlaze5 920 系列 NVMe SSD 评测

by 布赖恩·比勒
记忆 PBlaze5 926

多年来,我们已经看到 Memblaze 推出的众多企业级 SSD,它们在技术和性能方面通常处于领先地位。 最近,他们在 Memblaze PBlaze5 系列中推出了一组新的 SSD,即 Memblaze PBlaze5 920 系列。 的 之前的916系列, PBlaze5 920 系列采用 U.2 和附加卡 (AIC) 外形规格。 与 920 系列最大的区别在于它使用了一组新的 NAND,从之前型号的 96 层迁移到 3 层 64D TLC NAND。 在高端,新的 Memblaze SSD 在性能范围的高端提供 5.9GB/s 和 970,000 IOPS。

多年来,我们已经看到 Memblaze 推出的众多企业级 SSD,它们在技术和性能方面通常处于领先地位。 最近,他们在 Memblaze PBlaze5 系列中推出了一组新的 SSD,即 Memblaze PBlaze5 920 系列。 的 之前的916系列, PBlaze5 920 系列采用 U.2 和附加卡 (AIC) 外形规格。 与 920 系列最大的区别在于它使用了一组新的 NAND,从之前型号的 96 层迁移到 3 层 64D TLC NAND。 在高端,新的 Memblaze SSD 在性能范围的高端提供 5.9GB/s 和 970,000 IOPS。

记忆 PBlaze5 920 926

920 系列有两种耐用等级,每天 1 个驱动器写入 (DWPD) 或 3 个 DWPD。 这将创建四个不同的驱动器,按外形尺寸和耐用性划分。 AIC 外形规格被指定为 C920 和 C926,其中 C920 是更以读取为中心的驱动器,而 C926 具有 3 DWPD 耐用等级。 同样,U.2 驱动器是 D920 和 D926,在耐用性上匹配相同的方式。 耐力较低的驱动器在两个农场因素中都有 3.84TB 和 7.68TB 的容量。 同样,两个系列的 3 DWPD SSD 容量分别为 3.2TB 和 6.4TB。 之前的 916 系列驱动器确实有更高容量的型号,Memblaze 这次已经放弃了,可能是由于容量不足。

Memblaze PBlaze5 920 926 底部

Memblaze 在这些 SSD 中嵌入了许多关键功能。 我们最喜欢的是无需重置即可升级驱动器固件的功能。 这意味着无需重启服务器即可更新驱动器。 Memblaze 还添加了他们所谓的“命名空间配额”。 这些驱动器现在支持 32 个命名空间,每个命名空间都有不同的 AES-256 密钥来加密数据。 在这些命名空间内,可以限制非关键应用程序以确保更重要应用程序的 QoS。 这些驱动器还支持许多功能以确保数据可靠性,包括: LDPC 纠错、AES-256 位数据加密、全数据路径保护、T10 PI 端到端保护和增强的电源故障保护。

这是我们的视频概述:

我们的评测型号是 6.4TB C926。

Memblaze PBlaze 920 系列规格

型号 D920 C920 D926 C926
用户容量 (TB) 3.84 7.68 3.84 7.68 3.2 6.4 3.2 6.4
接口 PCIe 3.0 x 4 PCIe 3.0 x 8 PCIe 3.0 x 4 PCIe 3.0 x 8
外形 2.5英寸U.2 HHHL AIC 2.5英寸U.2 HHHL AIC
128KB 顺序读取 (GB/s) 3.5 3.5 5.6 5.9 3.5 3.5 5.6 5.9
128KB 顺序写入 (GB/s) 3.3 3.5 3.3 3.7 3.3 3.5 3.3 3.7
持续随机读取 (4KB) IOPS 825 840 835 970 825 835 835 970
持续随机写入 (4KB) IOPS(稳态) 140 150 140 150 280 300 280 300
延迟读/写(μs) 90 / 12
终身耐力 1DWPD 3DWPD
不可纠正的误码率 < 10 -17
平均故障间隔时间 2万小时
协议 NVMe 1.2a
NAND 闪存 3D eTLC NAND
操作系统 RHEL、SLES、CentOS、Ubuntu、Windows Server、VMware ESXi
能量消耗 7~25w
基本功能支持 断电保护、热插拔、全数据路径保护、SMART、灵活的电源管理
高级功能支持 TRIM、多命名空间、AES 256 数据加密和加密擦除、双端口和预留(仅限 U.2)、EUI64/NGUID 可变扇区大小管理和 T10 PI (DIF/DIX)、无需重置的固件升级、命名空间配额
软件支持 开源管理工具,CLI 调试工具 OS in-box driver (Easy system integration)

 Memblaze PBlaze5 C926 性能

测试平台

我们的企业级 SSD 评测利用 Lenovo ThinkSystem SR850 进行应用程序测试和 戴尔 PowerEdge R740xd 用于综合基准。 ThinkSystem SR850 是一个装备精良的四 CPU 平台,提供的 CPU 能力远远超过对高性能本地存储施加压力所需的能力。 不需要大量 CPU 资源的综合测试使用更传统的双处理器服务器。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。

联想 ThinkSystem SR850

  • 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 内存
  • 2 个 RAID 930-8i 12Gb/s RAID 卡
  • 8 个 NVMe 托架
  • VMware ESXI 6.5

戴尔 PowerEdge R740xd

  • 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
  • 4 x 16GB DDR4-2666MHz ECC 内存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 适配器
  • Ubuntu-16.04.3-桌面-amd64

测试背景和比较

 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。

我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 和 其网络功能的概述 在这些相应的页面上可用。

本次审查的可比性:

应用程序工作负载分析

为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对 Memblaze PBlaze5 916 的基准测试是 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。 对于我们的应用程序工作负载,每个驱动器将运行 2-4 个配置相同的虚拟机。

SideFX 的胡迪尼

Houdini 测试专门用于评估与 CGI 渲染相关的存储性能。 此应用程序的测试台是我们在实验室中使用的具有双 Intel 740 CPU 和 6130GB DRAM 的核心 Dell PowerEdge R64xd 服务器类型的变体。 在这种情况下,我们安装了运行裸机的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基准测试的输出以秒为单位来衡量,越少越好。

Maelstrom 演示代表了渲染管线的一部分,它通过演示其有效使用交换文件作为扩展内存形式的能力来突出存储的性能。 测试不会写出结果数据或处理点,以隔离延迟对底层存储组件的影响。 测试本身由五个阶段组成,我们将其中三个阶段作为基准测试的一部分运行,如下所示:

  • 从磁盘加载打包点。 这是从磁盘读取的时间。 这是单线程的,可能会限制整体吞吐量。
  • 将点解压缩到一个平面数组中,以便对其进行处理。 如果这些点不依赖于其他点,则可以调整工作集以保留在核心中。 这一步是多线程的。
  • (未运行)处理点。
  • 将它们重新打包成适合存储回磁盘的分桶块。 这一步是多线程的。
  • (未运行)将分桶块写回磁盘。

在这里,我们看到 Memblaze PBlaze5 C926 以 2,883 秒的渲染时间在“中等”性能中排名倒数三分之一,比 44 下降了约 916 秒。

Memblaze PBlaze5 920 胡迪尼

SQL Server 性能

每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个 VM 配置了 16 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。

此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的数据库基准工厂进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。

SQL Server 测试配置(每个虚拟机)

  • Windows服务器2012 R2的
  • 存储空间:分配 600GB,使用 500GB
  • SQL Server的2014的
    • 数据库大小:1,500 规模
    • 虚拟客户端负载:15,000
    • 内存缓冲区:48GB
  • 测试时长:3 小时
    • 2.5 小时预处理
    • 30分钟采样期

对于我们的 SQL Server 事务基准测试,Memblaze PBlaze5 C926 的总得分为 12,644.2 TPS,单个虚拟机的得分在 3,161 到 3,161.09 TPS 之间。 这仅次于总计 916 TPS 的 12,645。

记忆 PBlaze5 926 SQL

C926 的平均延迟全线为 2 毫秒。 同样,略低于 916 的 1.25 毫秒。

系统性能

下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。

每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

Sysbench 测试配置(每个虚拟机)

  • CentOS 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 数据库表:100
    • 数据库大小:10,000,000
    • 数据库线程:32
    • 内存缓冲区:24GB
  • 测试时长:3 小时
    • 2 小时预处理 32 个线程
    • 1 小时 32 个线程

在 Sysbench 事务基准测试中,Memblaze PBlaze5 C926 的总得分为 8,751.6 TPS,而之前的 916 的总得分为 9,298 TPS。

Memblaze PBlaze5 926 系统平台

Sysbench 平均延迟看到 C926 的总延迟为 14.6 毫秒,而 916 为 13.8 毫秒。

对于我们最坏情况下的延迟(第 99 个百分位数),C926 向我们展示了 26.4 毫秒的延迟,而 916 的延迟为 25.2 毫秒。

VDBench 工作负载分析

在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,64 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

在我们的第一个 VDBench 工作负载分析,随机 4K 读取中,Memblaze PBlaze5 C926 AIC 的运行速度相当接近 916,但以 789,134 IOPS 的峰值得分和 159.8µs 的延迟仅次于此。

Memblaze PBlaze5 926 4k 读取

对于 4K 随机写入,C926 紧随 916 之后稍有下降,并以 558,945µs 的延迟达到 226.3 IOPS 的峰值。

切换到顺序工作负载时,我们看到 C926 以比 916K 读取中的 64 更低的延迟和更高的峰值运行。 C926 的峰值得分为 61,356 IOPS 或 3.83GB/s,延迟为 260µs。

Memblaze PBlaze5 926 64k 读取

对于 64K 顺序写入,C926 在大部分时间再次与 916 保持一致,然后继续达到更高的峰值(大约 43K IOPS 或 2.7GB/s,延迟大约 200µs),然后下降一些并低于另一个驱动器。

我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,Memblaze PBlaze5 C926 以稍微高一点的延迟开始,并一直保持到第二个峰值,延迟为 238,861µs,达到 133.5 IOPS。

SQL 90-10 描绘了类似的画面,C926 再次以 916 IOPS 的峰值性能仅次于 249,682,延迟为 127.6µs,然后有所下降。

使用 SQL 80-20,驱动器继续保持趋势,C926 以 250,990 IOPS 的峰值位居第二,延迟为 126.7µs。

接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,Memblaze PBlaze5 C926 以 268,147 IOPS 的峰值位居第二,延迟为 132.2µs。

Oracle 90-10 向我们展示了更多上述内容,C926 紧随 916 之后,峰值为 190,557 IOPS 114.9µs。

对于 Oracle 80-20,C926 的峰值落后于 916,达到 197,016 IOPS,延迟为 111µs。

接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,Memblaze PBlaze5 C926 的峰值为 209,687 IOPS,延迟为 165.2µs,低于 916。

VDI FC 初始登录看到 C926 超越 916 并以 157,217 IOPS 的峰值和 188.2µs 的延迟获得第一。

对于 VDI FC Monday Login,C926 和 916 在整个过程中并驾齐驱,在 C926 以 103,780 IOPS 的峰值结束和 152.8µs 的延迟领先之前重新夺回领先地位。

对于 VDI 链接克隆 (LC) 启动,C926 以 96,226 IOPS 的峰值得分和 165.7µs 的延迟跌回了熟悉的第二名。

VDI LC Initial Login 显示与上面的 FC 测试相同,C926 以 55,977 IOPS 的峰值得分领先,延迟为 141µs。

最后,在 VDI LC Monday Login 中,C926 以 80,393 IOPS 和 196.6µs 的延迟再次勉强拔得头筹。

结论

Memblaze 通过推出 5 系列扩展了 PBlaze920 产品线。 新驱动器系列的主要区别在于 NAND 从 64 层移动到 96 层。 新系列按 DWPD 分为两种类型,1 种或 3 种。它进一步按外形和容量细分。 对于本次特别评测,我们查看了 Memblaze PBlaze5 C926 HHHL AIC 外形规格,旨在满足那些需要更高性能和更高耐用性存储的需求。

在性能方面,我们将该驱动器与另一款 Membalze AIC SSD Memblaze PBlaze5 916 AIC 进行了比较。 虽然通常期望较新的驱动器性能更好,尤其是对于像 Memblaze 这样的公司。 然而,之前的 916 几乎在每个类别中都击败了 C926。 不多,但它确实领先了。 对于应用程序工作负载分析,我们看到 C926 在 SQL Server 中达到 2,644.2 TPS,平均延迟为 2 毫秒。 在这两种情况下都低于 916。 对于 Sysbench,该驱动器达到了 8,751.6 TPS,平均延迟为 14.6 毫秒,最坏情况延迟为 26.4 毫秒,在每次测试中再次落后于 916。

我们的 VDbench 测试或多或少与上述相似。 在大多数情况下,但并非所有情况下,较新的 C926 都略微落后于 916。亮点包括:789K 读取 4K IOPS,559K 写入 4K IOPS,3.83K 读取 64GB/s,2.7K 写入 64GB/s击败旧驱动器。 SQL 工作负载的 IOPS 为 239K,SQL 250-90 为 10K IOPS,SQL 251-80 为 20K IOPS,每次均仅次于 916。 同样接近的位置出现在 Oracle 工作负载中,在 Oracle 268-191 中为 90K IOPS,10K IOPS,在 Oracle 197-80 中为 20K IOPS。 在我们的 VDI 克隆测试中,新驱动器能够在完整和链接克隆测试的初始和星期一登录中击败旧驱动器。

虽然在 PBlaze 5 系列中落后于较旧的驱动器,但新的 Memblaze PBlaze5 920 系列仍然表现出色。 边缘卡模型在没有 2.5 英寸 NVMe 托架的传统服务器平台或需要从单个驱动器增加带宽的服务器中运行良好,而 U.2 PCIe Gen3 SSD 无法与之匹敌。 总体而言,Memblaze 继续推出满足主流市场需求的优质企业级 SSD。

Memblaze 产品页面

在 Reddit 上讨论

参与 StorageReview

订阅电子邮件 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅