首页 企业 铠侠 CM6 PCIe 4.0 SSD 评测

铠侠 CM6 PCIe 4.0 SSD 评测

by 亚当·阿姆斯特朗

NVMe SSD 已成为全面的最佳表现者。 他们一开始在 SAS 和 SATA 驱动器上取得了巨大的飞跃和突破,但近年来在每次迭代中都在慢慢地提高性能。 PCIe 3.0 有一个上限,当前的驱动器正在达到上限。 但现在有了第二代 AMD EPYC 7002 CPU,PCIe 4.0 就在这里,铠侠将它与 CM6 SSD 结合使用。

NVMe SSD 已成为全面的最佳表现者。 他们一开始在 SAS 和 SATA 驱动器上取得了巨大的飞跃和突破,但近年来在每次迭代中都在慢慢地提高性能。 PCIe 3.0 有一个上限,当前的驱动器正在达到上限。 但是现在有了二代 AMD 霄龙 7002 CPU, PCIe 4.0 就在这里,铠侠将它与 CM6 SSD 结合使用。

铠侠CM6

KIOXIA 在上届闪存峰会上发布了新的 PCIe 4.0 驱动器 CM6 和 CD6 作为演示,回到了早已被遗忘的物理事件时代。 当时,它们是第一款 PCIe 4.0 SSD,截至撰写本文时,CM6 SSD 系列可能仍然是为数不多的企业级 PCIe 4.0 SSD 之一。 新驱动器的重要之处在于更高的性能:据称达到 6.9GB/s 和 1.4 万次 IOPS 读取。 这些是一些令人印象深刻的理论数字。 这些驱动器还带有带内 NVMe-MI、持久事件日志和命名空间粒度。

铠侠CM6底

KIOXIA CM6 是 U.3 外形尺寸,符合 SFF-TA-1001 标准,允许它们用于支持三模的背板。 CM6 具有从 800GB 一直到 30.72TB 的各种容量。 根据用户的需求,这些驱动器分为读取密集型 (CM6-R) 和混合使用型 (CM6-V)。 除了用例特定模型之外,还有各种安全版本,包括 Sanitize Instat Erase (SIE)、自加密驱动器 (SED) 和 FIPS 140-2(2 级)模型。 该驱动器是双端口的,以提供高可用性。

铠侠CM6侧面

对于本次评测,我们正在研究容量为 6TB 的铠侠 CM6.4-V。

铠侠 CM6 PCIe 4.0 规格

型号 CM6-R(精读) CM6-V(混合用途)
外形 2.5 英寸 15 毫米 Z 高度
容量1 960GB、1.92TB、3.84TB、7.68TB、15.36TB、30.72TB 800GB、1.6TB、3.2TB、6.4TB、12.8TB
接口 PCIe Gen3 / 4、1×4 和 2×2
合规性 PCIe 4.0 和 NVMe 1.4
NAND型 KIOXIA BiCS FLASH96层3D TLC
顺序阅读 Gen3 = 高达 3,500MB/s
Gen4 = 高达 6,900MB/s
Gen3 = 高达 3,500MB/s
Gen4 = 高达 6,900MB/s
顺序写入 Gen3 = 高达 3,100MB/s
Gen4 = 高达 4,200MB/s
Gen3 = 高达 3,100MB/s
Gen4 = 高达 4,200MB/s
随机阅读 Gen3 = 高达 800K IOPS
Gen4 = 高达 1.4M IOPS
Gen3 = 高达 800K IOPS
Gen4 = 高达 1.4M IOPS
随机写入 Gen3 = 高达 155K IOPS
Gen4 = 高达 170K IOPS
Gen3 = 高达 290K IOPS
Gen4 = 高达 350K IOPS
能量消耗 有源:20W; 闲置:<5W
耐力 1 DWPD 5 年 3 DWPD 5 年
不可纠正的误码率 每 1^10 位读取 17 个扇区
平均无故障时间/平均故障率 2.5 万小时 / 0.35%
工作温度 0至70C

性能

测试平台

我们新的 PCIe Gen4 Enterprise SSD 评测利用了 联想 ThinkSystem SR635 用于应用程序测试和综合基准。 ThinkSystem SR635 是一个装备精良的单 CPU AMD 平台,提供的 CPU 能力远远超过强调高性能本地存储所需的能力。 它也是我们实验室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市场上为数不多的平台之一)。 综合测试不需要大量 CPU 资源,但仍利用相同的 Lenovo 平台。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。

PCIe Gen4综合及应用平台(Lenovo ThinkSystem SR635)

  • 1 个 AMD 7452(2.35GHz x 32 核)
  • 8 x 64GB DDR4-3200MHz ECC 内存
  • CentOS 7.7 1908
  • ESXi 6.7u3

PCIe Gen3 应用平台 (联想 ThinkSystem SR850)

  • 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 内存
  • 2 个 RAID 930-8i 12Gb/s RAID 卡
  • 8 个 NVMe 托架
  • VMware ESXI 6.7u3

PCIe Gen3 综合平台 (戴尔 PowerEdge R740xd)

  • 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
  • 4 x 16GB DDR4-2666MHz ECC 内存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 适配器
  • Ubuntu-16.04.3-桌面-amd64

作为新平台上的第一组评论,我们包括了过去的驱动结果,这些结果很接近但不是 100% 的同类比较,因为它们是在旧平台上进行测试的。 我们的综合测试差异不会在结果上产生太大偏差,但在单 CPU AMD 平台与四 CPU Intel 平台上运行的应用程序工作负载可能在某种程度上存在差异。 在我们的 MySQL 测试中,一款新的 Gen4 KIOXIA 产品确实领先,但在 SQL Server 中延迟是平均水平。 我们只有两个 Gen4 驱动器可以发布,我们没有大量的可比较数据,但在查看这些结果时需要注意。 我们还加强了综合测试以利用更快的 SSD,现在显示的测试结果具有更高的峰值线程数。

测试背景和比较

这款 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。

我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 以及其网络功能的概述可在这些相应页面上找到。

应用程序工作负载分析

为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对铠侠 CM6 的基准测试是 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。 对于我们的应用程序工作负载,每个驱动器将运行 4 个配置相同的虚拟机。

SQL Server 性能

每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 8 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。

此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的数据库基准工厂进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。

SQL Server 测试配置(每个虚拟机)

  • Windows服务器2012 R2的
  • 存储空间:分配 600GB,使用 500GB
  • SQL Server的2014的
    • 数据库大小:1,500 规模
    • 虚拟客户端负载:15,000
    • 内存缓冲区:48GB
  • 测试时长:3 小时
    • 2.5 小时预处理
    • 30分钟采样期

在我们的 SQL Server 事务基准测试中,KIOXIA CM6 以 12,633.6 TPS 的总成绩排名第四,尽管它仅比表现最佳者低 10.6 TPS。

铠侠 CM6 SQL TPS

对于 SQL Server 平均延迟,CM6 的平均延迟为 5.5 毫秒,与其同类 CD6 SSD 相同。

系统性能

下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。

每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预构建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 8 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

Sysbench 测试配置(每个虚拟机)

  • CentOS 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 数据库表:100
    • 数据库大小:10,000,000
    • 数据库线程:32
    • 内存缓冲区:24GB
  • 测试时长:3 小时
    • 2 小时预处理 32 个线程
    • 1 小时 32 个线程

查看我们的 Sysbench 事务基准,KIOXIA CM6 的 TPS 为 8,632 TPS,再次在我们的同类产品中排名第四。

铠侠 CM6 Sysbench TPS

在 Sysbench 平均延迟方面,CM6 以 14.82 毫秒再次排名第四。

对于我们最坏情况下的延迟(第 99 个百分位数),CM6 保持在舒适的位置,排在第四位,为 29.86 毫秒。

VDBench 工作负载分析

在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,128 线程,0-120% iorate
  • 4K 随机读取(高负载):100% 读取,512 线程,0-120% 迭代
  • 4K 随机写入(高负载):100% 写入,512 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,32 线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,16 个线程,0-120% 迭代
  • 64K 顺序读取(高负载):100% 读取,64 线程,0-120% iorate
  • 64K 顺序写入(高负载):100% 写入,64 个线程,0-120% iorate
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

可比物:

在我们的第一个 VDBench 工作负载分析随机 4K 读取中,KIOXIA CM6 在 846,288µs 的延迟下以 150 IOPS 的峰值性能表现令人印象深刻。 这使驱动器处于首位。

铠侠CM6 4K读取

新的 PCIe 4.0 驱动器可以承受更高的负载,如果我们不更努力地推动它们看看它们能做什么,我们就是失职了。 因此,对于随机 4K 读取高负载,CM6 能够以 1,507,564µs 的延迟达到 337.9 IOPS 的峰值。 比它的 CD6 对应物好得多。

铠侠CM6 4K读高

对于随机 4K 写入,总体排名第三。 它以低于 100µs 的延迟运行,直到大约 490K IOPS,并在 548,169µs 的延迟下达到 226.4 IOPS 的峰值。

随机 4K 写入高负载看到 CM6 继续达到 549,103 IOPS 的峰值,这次延迟为 922µs,落后于 CD6。

切换到顺序工作负载后,CM6 有机会再次大放异彩,以 64 IOPS 或 97,779GB/s 的峰值得分和仅 6.11µs 的延迟在 325K 读取中名列前茅。

铠侠CM6 64k读取高负载 64K 顺序读取类似于 4K 读取中的放置,CM6 峰值为 101,018 IOPS 或 6.3GB/s,延迟为 629µs。

铠侠CM6 64K读高64K 写入显示 CM6 的峰值得分很高,但在达到峰值后性能有所下降,排在第三位。 峰值性能约为 49K IOPS 或 3.1GB/s,延迟约为 50µs。

高负载 64K 顺序写入看到 CM6 有更高的峰值,但随后性能下降。 CM6 的峰值约为 49K IOPs 或 3.1GB/s,延迟非常低,我们在下降之前几乎看不到它。

我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,KIOXIA CM6 以 266,458 IOPS 的峰值和 119µs 的延迟位居第二。

 

对于 SQL 90-10,CM6 再次获得第二名,峰值性能为 265,276 IOPS,延迟为 119.2µs。

SQL 80-20 以 6 IOPS 263,819µs 的峰值性能位居第一,让 CM119.4 有机会炫耀。

接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,CM6 再次获得第一,峰值性能为 271,230 IOPS,延迟为 128.6µs。

Oracle 90-10 的 CM6 位居第二,峰值性能为 202,341 IOPS,延迟仅为 107.4µs。

CM6 以 80 IOPS 的峰值和 20µs 的低延迟在 Oracle 206,733-104.7 中再次获得第一名。

接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,CM6 以 223,668 IOPS 和 153.5µs 的延迟位居榜首。

对于 VDI FC 初始登录,CM6 以 154,836 IOPS 的峰值性能下滑至第三位,延迟为 189µs。

在我们的 VDI FC Monday Login 基准测试中,CM6 以 98,867 IOPS 的峰值和 158.4µs 的延迟排在第三位。

对于 VDI 链接克隆 (LC) 引导,铠侠 CM6 以 115,058 IOPS 的峰值得分重回榜首,延迟为 137.7µs。

VDI LC 初始登录在图表中有点难以阅读,但 CM6 以 38,848 IOPS 的峰值处于中间位置,延迟为 202.4µs,然后有所下降。

最后,VDI LC Monday Login 让 CM6 再次表现最佳,峰值得分为 96,008 IOPS,延迟为 162.5µs。

总结

KIOXIA CM6 即使不是第一款面向企业的 PCIe 4.0 SSD 也是其中之一。 新驱动器承诺具有更高的性能,在这种情况下高达 6.9GB/s 和高达 1.4 万次 IOPS。 CM6 是双端口的,为驱动器增加了一个级别的高可用性。 该驱动器的容量范围很广,从 800GB 到高达 30.72TB,中间有 9 种容量选项。 CM6 具有读取密集型和混合使用模型,分别具有 1 和 3 DWPD。 SSD 附带多种安全型号选项。

对于性能,我们运行了我们通常的应用程序工作负载分析和 VDBench,但有一些例外。 我们不得不跳过 Houdini 测试,因为测试平台是英特尔,而 KIOXIA 驱动器会受到 Gen3 端口的阻碍。 在 VDBench 上,我们添加了更高的负载测试,以对新驱动器施加更多压力,因为它们旨在处理它。

在我们的应用程序工作负载分析中,我们运行了 SQL Server 和 Sysbench。 对于 SQL Server,CM6 在 TPS 和平均延迟方面均排名第四,为 12,633.6 TPS 和 5.5ms,仍然是非常好的分数。 在 Sysbench 中,该驱动器再次以 8,632 TPS、14.82 毫秒的平均延迟和我们最坏情况下的 29.86 毫秒的延迟再次全面排名第四。

在 VDBench 中,驱动器真的很闪耀。 CM6 在我们的几个基准测试中表现最好。 基本亮点包括846K读取4K IOPS,1.5K读取高负载4万IOPS,548K写入4K IOPS,549K写入高负载4K IOPS,6.1K读取64GB/s,6.3K读取高负载64GB/s,在 3.1K 写入和 64K 写入高负载下均为 64GB/s。 SQL 的峰值为 266K IOPS,SQL 265-90 为 10K IOPS,SQL 264-80 为 20K IOPS。 Oracle 在 Oracle 271-202 中为我们提供了 90K IOPS、10K IOPS 和 Oracle 207-80 中的 20K IOPS 峰值。 VDI FC 为我们提供了 224K IOPS 启动、155K IOPS 初始登录和 99K IOPS 星期一登录。 VDI LC 看到 115K IOPS 启动、39K IOPS 初始登录和 96K IOPS 星期一登录。

这篇评论和 CD6 的评论具体审视了 PCIe 4.0 和更多存储设备进入市场的未来。 为 PCIe 4.0 提供前端到后端支持的服务器供应商并不多,在撰写本文时,联想是我们实验室中的唯一一家。 联想迅速抓住了第二代 AMD EPYC 2 处理器提供的所有优势,预计将推出铠侠 CM7002 等存储产品。 但对于铠侠来说,这让他们处于领先于其他人的有趣位置,但只有更新的基于 AMD 的服务器才能发挥他们驱动器的全部潜力(直到英特尔决定也加入游戏)。 目前,CM6 仍将在传统设备中工作,并准备好在公司升级时释放更多性能。

铠侠企业级固态硬盘

在 Reddit 上讨论

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅