首页 企业 ScaleFlux CSD 3000 固态硬盘评测

ScaleFlux CSD 3000 固态硬盘评测

by 查尔斯·P·杰弗里斯

ScaleFlux 专注于大规模计算存储。 其新的计算存储设备 (CSD) 3000 是具有集成数据压缩和解压缩引擎的 Gen4 SSD,该公司称其可以将容量提高四倍,将性能提高一倍。 我们将对这些声明进行测试。

ScaleFlux 专注于大规模计算存储。 其新的计算存储设备 (CSD) 3000 是具有集成数据压缩和解压缩引擎的 Gen4 SSD,该公司称其可以将容量提高四倍,将性能提高一倍。 我们将对这些声明进行测试。

ScaleFlux CSD 3000

ScaleFlux CSD 3000 规格

对于计算存储的背景,我们的 ScaleFlux CSD 2000 审查 (这里回顾了 CSD 3000 的早期版本)值得一读。 简而言之,计算存储将计算资源集成在存储本身中,而不是依赖于主机系统的计算资源。

CSD 3000 的计算能力来自 SFX 3000 存储处理器,这是一款具有专用硬件加速功能的定制 SoC ARM 芯片。 该硬盘采用 2.5 英寸 U.2 外形尺寸,容量为 3.2TB、3.84TB、6.4GB 和 7.68TB。 它使用 PCIe Gen4 x4 接口,这是对 CSD 2000 的 Gen3 接口的改进。

ScaleFlux CSD 3000 端口

ScaleFlux 提供类似的驱动器 NSD 3000。它具有内置压缩功能,但没有 CSD 3000 的容量倍增器。

CSD 3000 的主要规格如下表所示。

外形 2.5英寸U.2(15毫米)
默认容量 3.2TB、3.84TB、6.4TB、7.68TB
主机接口 PCIe Gen4 x4
虚拟化 具有 15 个虚拟功能的 SR-IOV
安全

 

具有硬件安全加速的 TCG Opal 2.0

 

基于 SMBus 的 NVMe-MI 1.1

 

电力 <20W 典型值,<5W 空闲值

 

可靠性 端到端数据路径保护、断电

保护、LDPC 纠错、NAND Die RAID

顺序阅读 7.2 GB /秒
顺序写入 4.8 GB/秒*
随机读取 (4kB) 1450kIOPS
随机写入 (4kB) 380 kIOPS*
持续 70/30 随机 4kB 读/写 2:1 可压缩 时间 1020kIOPS

ScaleFlux CSD 3000 测试背景和比较

StorageReview 企业测试实验室提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。

我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。

ScaleFlux CSD 3000 测试台

我们使用了与常规测试台不同的系统来审查 CSD 3000。由于这款驱动器非常独特,并且利用了不同的测试平台,我们不会将它与传统的 Gen4 NVMe SSD 进行正面比较。 这篇评论利用了我们的英特尔 OEM 可扩展 Gen3 服务器,它配备了双英特尔 8380 处理器,提供的 CPU 能力远远超过强调高性能本地存储所需的能力。 其高级规范包括以下内容:

  • 2 个英特尔可扩展 Gen3 8380
  • 32 个 32GB DDR4 3200MHz
  • Ubuntu 20.04.2 实时服务器(合成工作负载)
  • VMware ESXi 7.0u2(应用程序工作负载)
  • 8 个 PCI Gen4 U.2 NVMe 托架

为了测量 ScaleFlux CSD 3000 的性能,我们利用 VDbench,它可以在每个工作负载之前调整压缩级别。 通常,默认情况下此设置保持为 0%,但我们在测试此 SSD 时将其提高到 50% 以获得 2:1 的压缩系数。 这两次运行反映在下面的图表中。

ScaleFlux CSD 3000 性能

备注:在我们审查了 ScaleFlux CSD 3000 之后,我们获得了两个带有生产固件的较新型号。 我们用这两个容量点的最新结果更新了评论。

VDBench 工作负载分析

对于基准存储设备,应用测试最好,综合测试次之。 虽然不能完美地代表实际工作负载,但综合测试可帮助存储设备建立可重复性因素的基线,从而轻松比较竞争解决方案。

这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试和常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 这些测试利用通用的 vdBench 工作负载生成器和脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。

我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与完全熵测试不同,后者使用 100% 的驱动器并将其置于稳定状态。 因此,这些数字将反映更高的持续写入速度。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,64 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

 

该驱动器的独特性意味着我们只会将它与自身进行比较。 为了进行比较,我们将查看带有 VDBench 发送不可压缩数据和 3000:2 可压缩数据的 ScaleFlux CSD 1。

在我们的第一个基准测试中,4K 随机读取,CSD 3000 的压缩性能稳步攀升至 909K IOPS,139TB 型号的延迟为 7.68µs(3.85TB 型号略低于其他型号)。 该驱动器在没有压缩和相同容量的情况下稍慢,在 886µs 时达到 142.4K IOPS。

ScaleFlux C3000 随机读取性能 未压缩的 CSD 3000 在我们的下一个测试 4K 随机写入中显示出过山车般的曲线,其中 7.68TB 模型显示了两者的最佳结果:峰值为 454K IOPS,延迟为 275.7µs。 压缩驱动器显示出更好的结果,均以 735K IOPS 和 168.2 µs 结束。

ScaleFlux C3000 随机写入性能

继续顺序 64K 测试,我们从读取性能开始,它讲述了一个类似的故事(压缩驱动器再次具有令人印象深刻的数字)。 两种容量的性能几乎相同,3.84TB 型号在 113µs 时略微超过容量更高的 7.06K IOPS(或 282GB/s)。 顶级未压缩驱动器 (7.68TB) 在 98µs 时达到 326.8K IOPS。

ScaleFlux C3000 顺序读取性能

64K 顺序写入结果更受压缩版本的青睐。 两种容量再次具有相同的性能(尽管如您所见,3.84TB 在 96µs 延迟下以 154K IOPS 略微优于更大的容量,在接近 100K IOPS 之前保持远低于 90µs。相反,未压缩的驱动器看到严重的峰值,29TB 容量在 534µs 时达到 7,68K IOPS,在 25TB 容量时在 616.6µs 时达到 3.85K IOPS。

ScaleFlux C3000 顺序写入性能

我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 SQL 工作负载测试是第一个; CSD 3000 在使用高容量模型进行压缩和未压缩时显示出相似的曲线,尽管压缩版本在 310K IOPS 和 101.9µs 的延迟下稍好一些。

ScaleFlux C3000 SQL 工作负载性能 对于 SQL 90-10,7.68TB 压缩 CSD 3000 再次成为性能最佳的驱动器,以 311K IOPS 和 101.3 µs 的延迟完成了测试。 相比之下,最好的未压缩驱动器(也是 7.68TB)以 285K IOPS 和 110.8µs 的延迟完成。

在 SQL 80-20 中,我们看到压缩 CSD 3000 的两种容量都位居榜首,7.68TB 型号以 319 IOPS 和 98.3µs 延迟结束。 未压缩的 7.68TB 明显落后(尽管非常接近小容量模型),在 277µs 时为 113.5K IOPS。

接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 在这里,压缩的 CSD 3000 驱动器继续其整体卓越性能。 从 Oracle 工作负载测试开始,表现最好的是具有 7.68K IOPS 的 336TB 压缩驱动器,延迟为 103.9 µs。 压缩后的 7.68TB 驱动器恢复良好,峰值为 279K IOPS,延迟为 126µs。

ScaleFlux C3000 Oracle 工作负载性能 在 Oracle 90-10 中; 压缩后的 7.86TB 驱动器以 229K IOPS 完成,延迟为 94.7µs。 3.84TB(压缩)和 7.68TB(未压缩)驱动器表现出相同的性能,在 214µs 的延迟下具有 101.4K IOPS。

转向 Oracle 80-20 再次讲述了类似的故事。 未压缩的 7.68TB 驱动器以 237K IOPS 完成,延迟为 91µs,而 7.68TB 压缩驱动器以 213 IOPS 落后,延迟仅为 101.9µs。

接下来,我们切换到 VDI 克隆测试、完整克隆 (FC) 和链接克隆 (LC)。 所有驱动器在 VDI FC 引导中都显示出轻微的尾端不稳定。 压缩后,7.68TB CSD 3000 以 270K IOPS 和 126.9µs 延迟再次名列前茅; 压缩后,其 7.68TB 驱动器的最佳性能容量(实际上超过了 3.84TB 压缩驱动器),具有 242K IOPS,延迟为 141.9µs。

ScaleFlux C3000 VDI 启动性能 VDI FC Initial Login 讲述了一个不同的故事,因为压缩的驱动器远远好于未压缩的驱动器。 7.68TB 压缩驱动器的峰值为 244K IOPS,延迟为 117.2µs,而 3.84TB 型号的峰值为 210K IOPS,延迟为 137.2µs。 未压缩驱动器以 127K IOPS 完成,延迟为 231.1µs (7.68TB) 和 94K IOPS,延迟为 312.4µs (3.84TB)。

压缩后的 CSD 3000 在我们上次的 FC 测试 Monday Login 中继续给人留下深刻印象,其最佳数值为 144K IOPS,延迟为 106.9µs (7.68TB)。 未压缩的 7.68TB 驱动器显示 100K IOPS,延迟为 154.6µs。

我们现在将切换到 LC 测试,其中所有驱动器在引导测试中均显示稳定线路。 压缩驱动器继续占据主导地位(尤其是 7.68TB,它发布了 131K IOPS 和 120.1µs 的延迟)。 顶级未压缩驱动器 (7.68TB) 能够在 110µs 时达到 144.4 IOPS。

我们在 LC Initial Login 中看到未压缩驱动器的行为不稳定,接近 20,000 IOPS; 它的最终数字是 49K IOPS/157.1µs (3.84TB) 和 56K IOPS/138µs (7.68TB)。 与往常一样,压缩驱动器表现出更好的性能和稳定性,以 73K IOPS/103.1µs (3.84TB) 和 80K IOPS/94.4µs (7.68TB) 完成测试。

在我们最近的测试中,未压缩的驱动器与压缩版本相比仍然表现不佳。 在 LC Monday Login 中,压缩驱动器再次显示出一些奇怪的延迟峰值,3.84TB 和 7.68TB 分别以 62K IOPS/250.1µs 和 75K IOPS/207.5µs 结束。 压缩驱动器的最终数字要好得多,为 109K IOPS/140.9µs (3.84TB) 和 124K IOPS/123.5µs (7.68TB)。

结论

ScaleFlux 继续专注于计算存储。 我们在本次评测中看到的 CSD 3000 驱动器主要通过提供 PCIe Gen2000 接口对早期的 CSD 4 进行了改进,这使其具有更高的性能潜力。

我们在我们的英特尔 OEM Gen3000 可扩展服务器中以未压缩状态和 3:2 压缩状态再次测试了 Linux 下的 CSD 1,以利用驱动器的板载压缩引擎。 该驱动器在使用可压缩数据的所有测试中都显示出卓越的性能和更低的延迟,通常具有两位数的性能增量。

压缩数据的性能亮点(最高结果/容量)包括 909TB 的 4K 随机读取中的 7.68K IOPS(相对于未压缩的 886K IOPS),735TB 的 4K 随机写入中的 7.68K IOPS(未压缩的 454K IOPS),7.06GB / s 64TB 的 3.85K 顺序读取(6.12GB/s 未压缩)和 6GB/s 的 64K 顺序写入(1.82GB/s 未压缩)。

CSD 3000 在我们的 SQL 和 Oracle 测试中显示了类似的压缩和未压缩数字,尽管压缩驱动器更加一致。 在一个示例 SQL 80-20 中,压缩驱动器在 319µs 延迟时实现了 98.3 IOPS(7.68TB 模型),而未压缩模型明显落后,在 277µs 时为 113.5K IOPS

最后,我们的 VDI 完整和链接克隆测试发现 CSD 3000 运行压缩数据与未压缩数据之间最显着的差异——也就是说,压缩数据的性能要好得多,也更一致。 举一个例子,VDI LC Initial Login 显示未压缩驱动器的峰值性能为 49K IOPS/157.1µs (3.84TB) 和 56K IOPS/138µs (7.68TB),而压缩驱动器显示以 73K IOPS/103.1µs 完成测试( 3.84TB) 和 80K IOPS/94.4µs (7.68TB)。

需要注意的是,在运行未压缩数据时,我们确实看到了一些无法解释的延迟峰值和性能下降。 这发生在我们的 4K/64K、SQL/Oracle 和 VDI FC/LC 测试中,因此它不仅仅局限于一个场景。

当 CSD3000 可以处理一些可压缩数据时,它的优势将得到最好的体现,因为这是它相对于传统 SSD 的整体优势最显着的地方。 ScaleFlux 还为此版本添加了 VMWare 支持,这是我们审查早期 CSD 2000 时所没有的。这是一个很大的优势,但它仍然缺少对 Windows 虚拟化的支持。 尽管如此,如果您可以将工作负载与平台支持和驱动器的强大压缩强度结合起来,ScaleFlux 的 CSD 3000 还是值得考虑的。

ScaleFlux 产品页面

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅