KIOXIA CD6 是该公司的旗舰驱动器,旨在在要求苛刻的 24×7 环境中提供一致的性能,包括超大规模、物联网和大数据分析、虚拟化、媒体流和内容交付网络。 CD6 提供各种容量(960GB 至 15.36TB)以及多种不同的安全性和耐用性选项。
KIOXIA CD6 是该公司的旗舰驱动器,旨在在要求苛刻的 24×7 环境中提供一致的性能,包括超大规模、物联网和大数据分析、虚拟化、媒体流和内容交付网络。 CD6 提供各种容量(960GB 至 15.36TB)以及多种不同的安全性和耐用性选项。
KIOXIA 系列采用 2.5 英寸、15 毫米 Z 高度外形尺寸,并配备了该公司专有的控制器和 BiCS FLASH 96 层 3D TLC 内存。 它还利用单端口设计,这意味着从主机到 SSD 只有一条数据路径)。
We 之前回顾了 CD6 的预生产迭代 2020 年夏天,当时它是企业市场上首批 PCIe 4.0 驱动器之一。 由于该驱动器现已上市且生产样本上的固件版本更成熟,我们决定审查通过以下方式获得的 SSD
就性能而言,目前的 CD6 可提供高达 6.2GB/s 的读取速度(7.68GB 和 3.84GB 型号)和 4GB/s(15.36GB 和 7.68GB 型号)的连续写入速度。 随机性能预计将达到 1 万次以上的读取 IOPS,但写入时仅为 85,000 次 IOPS。
KIOXIA CD6 还具有第 6 代、双芯片故障恢复和双重奇偶校验保护、断电保护 (PLP) 和端到端数据校正功能。 数据安全选项包括 SIE、SED、FIPS 140-2。 功耗范围为 13-19 W 的有效功耗,有六种电源模式设置可用。
铠侠 CD6 固件规格
容量 | 15,360GB | 7,680 GB | 3,840GB | 1,920GB | 960GB |
基本规格 | |||||
界面 | PCIe 4.0、NVMe 1.4 | ||||
接口速度 | 64 GT/秒(Gen4 x4) | ||||
闪存类型 | BiCS 闪存 TLC | ||||
单端口 (1×4) 模式下的性能(最多) | |||||
持续 128 KiB 顺序读取 | 5,500MB /秒 | 6,200MB /秒 | 5,800MB /秒 | ||
持续 128 KiB 顺序写入 | 4,000MB /秒 | 2,350MB /秒 | 1,150MB /秒 | 1,300MB /秒 | |
持续 4 KiB 随机读取 | 750K IOPS | 1,000K IOPS | 700K IOPS | ||
持续 4 KiB 随机写入 | 30K IOPS | 85K IOPS | 60K IOPS | 30K IOPS | |
电源要求 | |||||
电源电压 | 12V±10%,3.3Vaux±15% | ||||
功耗(主动) | 19W 典型值。 | 15W 典型值。 | 13W 典型值。 | ||
功耗(就绪) | 5W 典型值。 | ||||
可靠性 | |||||
平均无故障时间 | 2,500,000小时 | ||||
保修政策 | 5 年 | ||||
DWPD | 1 | ||||
尺寸 | |||||
高度 | 15.0 毫米 + 0, – 0.5 毫米 | ||||
宽度 | 69.85±0.25毫米 | ||||
长度 | 最大100.45毫米 | ||||
重量 | 最大 130 克 | ||||
环境 | |||||
温度(工作) | 0°C至70°C | ||||
湿度(工作) | 5% 至 95% 相对湿度 | ||||
振动(操作) | 21.27米/秒2{ 2.17 Grms }(5 至 800 赫兹) | ||||
冲击(操作) | 9,800米/秒2{ 1,000 G }(0.5 毫秒持续时间) |
铠侠 CD6 性能
测试背景和比较
这款 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。
我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 以及其网络功能的概述可在这些相应页面上找到。
可比物:
测试平台
我们的 PCIe Gen4 Enterprise SSD 评测利用了 联想 ThinkSystem SR635 用于应用程序测试和综合基准。 ThinkSystem SR635 是一个装备精良的单 CPU AMD 平台,提供的 CPU 能力远远超过强调高性能本地存储所需的能力。 它也是我们实验室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市场上为数不多的平台之一)。 综合测试不需要大量 CPU 资源,但仍利用相同的 Lenovo 平台。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。
PCIe Gen4综合及应用平台(联想 ThinkSystem SR635)
- 1 个 AMD 7742(2.25GHz x 64 核)
- 8 x 64GB DDR4-3200MHz ECC 内存
- CentOS 7.7 1908
- ESXi 6.7u3
SQL Server 性能
每个 SQL Server VM 都配置有两个虚拟磁盘:100GB 卷用于启动,500GB 卷用于数据库和日志文件。 从系统资源的角度来看,我们为每个虚拟机配置了 8 个 vCPU、64GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。 虽然我们之前测试的 Sysbench 工作负载在存储 I/O 和容量方面使平台饱和,但 SQL 测试正在寻找延迟性能。
此测试使用在 Windows Server 2014 R2012 来宾虚拟机上运行的 SQL Server 2,并由 Quest 的 Benchmark Factory for Databases 进行压力测试。 存储评论的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,可模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们用于本次审核的 SQL Server VM 的每个实例都使用 333GB(1,500 规模)的 SQL Server 数据库,并测量 15,000 个虚拟用户负载下的事务性能和延迟。
SQL Server 测试配置(每个虚拟机)
- Windows服务器2012 R2的
- 存储空间:分配 600GB,使用 500GB
- SQL Server的2014的
- 数据库大小:1,500 规模
- 虚拟客户端负载:15,000
- 内存缓冲区:48GB
- 测试时长:3 小时
- 2.5 小时预处理
- 30分钟采样期
对于我们的 SQL Server 事务基准测试,KIOXIA CD6 以 12,651.5 TPS 位居第一。
对于 SQL Server 平均延迟,CD6 发布了出色的结果,平均延迟仅为 2.3 毫秒。
系统性能
下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。
每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 8 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。
Sysbench 测试配置(每个虚拟机)
- CentOS 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
- 数据库表:100
- 数据库大小:10,000,000
- 数据库线程:32
- 内存缓冲区:24GB
- 测试时长:3 小时
- 2 小时预处理 32 个线程
- 1 小时 32 个线程
查看我们的 Sysbench 交易基准,KIOXIA CD6 的结果处于中上水平(3rd) 和 10,975 TPS。
对于 Sysbench 平均延迟,CD6 发布了 11.66 毫秒,这对于 3rd 略落后于三星 PM9A3 和 Memblaze 驱动器。
对于我们最坏情况下的延迟(第 99 个百分位数),铠侠 CD6 以 22.81 毫秒排名第四。
VDBench 工作负载分析
在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美地代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。
所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,128 线程,0-120% iorate
- 16K 顺序读取:100% 读取,32 线程,0-120% 迭代
- 16K 顺序写入:100% 写入,16 个线程,0-120% 迭代
- 64K 顺序读取:100% 读取,32 线程,0-120% 迭代
- 64K 顺序写入:100% 写入,16 个线程,0-120% 迭代
- 4K、8K 和 16K 70R/30W 随机混合,64 线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
在我们的第一个 VDBench 工作负载分析随机 4K 读取中,KIOXIA CD6 的峰值性能为 1.03 万次 IOPS,延迟为 492.6 微秒,在测试的驱动器中排名第二。
在 4K 随机写入中,CD6 大幅下降到最后一位,峰值为 159K IOPS,延迟为 3,207µs。
切换到 64k 顺序工作负载后,CD6 再次排名最后,读取延迟为 4.16µs,读取速度为 66,563GB/s(960 IOPS)。
在 64K 写入中,CD6 的性能峰值为 623MB/s(9,970 IOPS),延迟为 6,382µs。
接下来是我们的 16K 顺序性能。 在读取方面,CD6 的峰值为 2.9GB/s(185,854 IOPS),延迟为 171.1µs。
KIOXIA 驱动器在 16K 顺序中继续其较弱的写入性能,峰值仅为 40K IOPS (623MB/s),延迟为 396µs。
在我们混合的 70/30 4k 配置文件(70% 读取,30% 写入)中,CD6 以 479,356 IOPS 的峰值在 131µs 的延迟中排名倒数第二。
在我们混合的 70/30 16k 配置文件中,CD6 在 130,996µs 的延迟下达到 485.8 IOPS,排名最后。
在我们最后的混合配置文件 (70/30 8k) 中,CD6 的峰值为 260,802 IOPS,延迟为 242.3µs。
我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20,它们都显示了相似的结果。 从 SQL 开始,KIOXIA 驱动器以 244K IOPS 的峰值性能和 130µs 的延迟略微落后。
SQL 90-10 在前 4 个驱动器之间的性能相似; 然而,CD6 再次略微落后,峰值为 237K IOPS,延迟为 133.2µs。
对于 SQL 80-20,CD6 再次落后,峰值为 231K IOPS,延迟为 136.2µs。
接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 与 SQL 基准测试一样,CD6 继续略微落后于其他测试驱动器。 从 Oracle 开始,CD6 在 228µs 时的峰值性能为 155.8K IOPS。
对于 Oracle 90-10,CD6 的峰值为 183K IOPS,延迟为 119µs。
查看 Oracle 80-20,CD6 在 185µs 时发布了 117.8K IOPS 的峰值性能。
接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI 完整克隆 (FC) 启动,CD6 开始时表现不错,但最终再次落伍,峰值为 192K IOPS,延迟为 175.2µs。
VDI FC 初始登录,CD6 以相当大的峰值落后,并在接近 40K IOPS 大关时跌出排行榜。 它成功地达到了 44K IOPS (671µs) 的峰值,然后才最终导致性能下降。
使用 VDI FC Monday Login,KIOXIA CD6 在 52µs 的延迟下以 286.3K IOPS 的速度远远落后于其他测试驱动器。
对于 VDI Linked Clone (LC) Boot,CD6 性能在延迟方面出现了大幅飙升(类似于 Micron Pro 驱动器),尽管它稳定在 40K IOPS 左右。 它最终以 93µs 达到稳定的 170.3K IOPS 峰值。
在 VDI LC 初始登录中,CD6 的性能从一开始就表现不佳,就像三星和美光驱动器一样。 它最终以 16µs 的速度达到了 513.2K IOPS 的峰值,这对于 3rd 位置,但仍然远离 Memblaze 和英特尔驱动器。
对于 VDI LC Monday Login,CD6 继续挣扎(再次像三星和美光驱动器),峰值约为 18K IOPS,但最终以 12K IOPS 结束,延迟为 1,363 µs。
总结
KIOXIA CD6 是每天写入一个驱动器的 NVMe TLC SSD,并且是首批利用 PCIe 4.0 接口的企业驱动器之一。 它采用 2.5 英寸 15mm Z 高度外形尺寸,采用铠侠 BiCS FLASH 96 层 3D TLC NAND,提供从 960GB 到 15.36TB 的各种容量。 它还带有一系列安全选项。
在性能方面,铠侠 CD6 在我们的测试中具有强大的应用程序性能,但在以写入为重点的基准测试中表现较弱。 我们针对其他四种具有类似规格和应用的 PCIe Gen4 企业级 7.68TB SSD 测试了 KIOXIA 驱动器:三星 PM9A3、Memblaze 6920 和英特尔 P5510,以及最新的 Micron 7400 Pro。 我们在分析过程中查看了应用程序工作负载分析和 VDBench 工作负载。
在我们的 Sysbench 测试中,我们看到铠侠 CD6 表现非常出色,总成绩为 10,975 TPS,平均延迟为 11.66 毫秒,最坏情况下为 22.81 毫秒。 在我们的 SQL Server 事务基准测试中,结果非常好,发布了 12,651.5TPS 和 2.3ms 的平均延迟。
切换到 VDBench 后,KIOXIA CD6 表现出参差不齐的性能,尤其是在写入方面表现不佳。 亮点包括在我们的 1.03k 工作负载中读取 159 万 IOPS 和写入 4K IOPS,同时在 4.16K 读取中达到 64GB/s,在 623K 写入中达到 64MB/s,在 2.9K 读取中达到 16GB/s,在 2.6MB/s 中再次达到 623GB/s在我们的顺序工作负载期间写入。 我们混合的 70/30 配置文件记录了 479K 的 4K IOPS、261K 的 8K IOPS 和 131K 的 16K IOPS。
在我们的 SQL 测试中,CD6 的峰值为 244K IOPS,SQL 237-90 为 10K IOPS,SQL 231-80 为 20K IOPS,始终落后于同类产品。 Oracle 工作负载讲述了类似的故事,在 Oracle 228-183 中记录了 90K IOPS、10K IOPS,在 Oracle 185-80 中记录了 20K IOPS。
接下来是我们的 VDI 克隆测试,完整和链接。 在完整克隆中,我们在启动时看到了 192K IOPS,在初始登录中看到了 44K IOPS(尽管之后性能出现了巨大的峰值),在星期一登录中看到了 52K IOPS。 在链接克隆中,KIOXIA 驱动器再次挣扎,在启动时显示出 93K IOPS 的峰值,而在周一登录时仅为 12K IOPS。 初始登录达到 16K IOPS 的峰值(第 3 名),尽管它仍然远远落后于 Intel 和 Memblaze 驱动器。
总的来说,我们很高兴再次访问频道中的 CD6,它具有更成熟的固件版本。 但最终写入性能与其竞争对手相比并没有那么好。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅