Fusion ioMemory PX600 是第三代 PCIe 应用加速器,强调耐用性和性价比。 PX600 和 其以价值为导向的 SX300 兄弟姐妹 包括 Fusion 的新“Atomic 系列”,它本质上是一个硬件平台,具有两种不同的 NAND 过度配置方案,这导致两个驱动器的性能和耐用性不同。 因此,我们将同时发布对这两个驱动器的评论。
Fusion ioMemory PX600 是第三代 PCIe 应用加速器,强调耐用性和性价比。 PX600 和 其以价值为导向的 SX300 兄弟姐妹 包括 Fusion 的新“Atomic 系列”,它本质上是一个硬件平台,具有两种不同的 NAND 过度配置方案,这导致两个驱动器的性能和耐用性不同。 因此,我们将同时发布对这两个驱动器的评论。
Atomic 系列采用了一种简化的主机内闪存方法; 尽管前几代 Fusion 的应用加速器已提供各种 MLC 和 SLC NAND 风格以及单个或多个控制器,但这些产品通过两个仅支持 MLC 的分支简化了决策过程,每个分支都利用一个控制器。 换句话说,因为 PX600 和 SX300 使用相同的控制器平台和相同的原始 NAND,以相同的方式配置相同数量的原始存储将在两个驱动器之间产生相似或相同的性能。
Fusion ioMemory PX600 是新的主力,旨在为倾向于混合读/写工作负载的高性能应用程序提供最高的事务处理率。 PX600 具有 1TB、1.3TB 和 2.6TB 容量的 HHHL 外形尺寸以及 5.2TB 的 FHHL 外形尺寸选项,所有接口均通过 PCIe 2.0 x8。
虽然整体产品阵容已经简化,但核心 Fusion 架构却没有。 两种设计均采用可编程 FPGA,与 ASIC 设计相比,可提供更大的长期灵活性和更新支持。 虽然新 Atomic 系列中的所有驱动器都使用 MLC,但 Fusion-io 这次已迁移到更小的 20 纳米光刻技术。 然而,更小的 NAND die 是一把双刃剑; 缩小允许容量增加(在 PX5.2 中高达 600TB),但它也带来了新的工程挑战。
PX600 可以利用 Fusion 的专有技术,包括 Adaptive Flashback,它通过在多个 NAND 故障的情况下保持驱动器在线及其数据安全来提高 NAND 芯片故障容忍度。 在这种情况下,ioMemory PX600 可以在不离线的情况下重新映射和恢复。 该驱动器通过 Fusion-io 的 VSL(虚拟存储层)软件与主机操作系统集成,提供对存储在 PX600 上的数据的本地访问。
Fusion-io ioMemory PX600 提供五年保修,最高可达每张卡使用的最大耐用度。 我们的评测单元是2.6TB容量的卡。
Fusion ioMemroy PX600 规格
- 容量
- 1TB (PX600-1000)
- 读取带宽:2.7GB/s
- 写入带宽:1.5GB/s
- 随机读取 IOPS 4K:196,000
- 随机写入 IOPS 4K:320,000
- 读取访问延迟:92µs
- 写访问延迟:15µs
- 耐力:12PBW
- 1.3TB (PX600-1300)
- 2.6TB (PX600-2600)
- 5.2TB (PX600-5200)
- 1TB (PX600-1000)
- 20纳米MLC NAND
- PCIe 2.0 x8 接口
- 重量:5.2 盎司(5.2TB 7.25 盎司)
- 保修:5 年(或使用的最大耐力)
- 功率要求:25W
- 温度
- 操作:0°C – 55°C
- 非运行时:-40°C – 70°C
- 气流:300 (LFM)2
- 湿度:非冷凝 5 – 95%
- 低气压
- 运行:-1,000 英尺至 10,000 英尺
- 非运行:-1,000 英尺至 30,000 英尺
- 操作系统
- 微软:Windows Server 2012 R2、2012、2008 R2 SP1
- Linux:RHEL 5/6、SLES 11、OEL 5/6、CentOS 5/6、Debian Squeeze、Ubuntu 12/13
- Unix:Solaris 11.1/11 x64、Solaris 10 U11 x64
- 管理程序:VMware ESXi 5.0/5.1/5.5、Windows Server 2012 Hyper-V、2012 R2 Hyper-V
设计与建造
Fusion-io Atomic 系列 PX600 是一款单控制器 PCIe 应用加速器,具有 HHHL 和 FHHL 外形规格。 对于 1-2.6TB 版本,该卡具有更小的 HHHL 外形尺寸,几乎可以普遍适用于市场上的服务器。 更大容量的 5.2TB 型号 (FHHL) 需要更大的高度来安装额外的 NAND,尽管它仍然适用于市场上的大多数服务器,只是不是所有插槽。
新的 Atomic 系列 PX600 卡类似于 Fusion-io 以前的应用加速器,利用 FPGA 控制器,能够利用主机资源。 Fusion-io 声称这提供了更接近 CPU 的更低延迟性能。 与 ioDrive2 系列相比的一个小区别是,最新型号都没有使用两个控制器(以前在 Duo SLC 和 MLC 产品中发现过)。 这有助于节省功耗,更不用说它为用户提供了一个单一的存储池,而不是两个他们需要一起条带化的存储池。
Fusion-io 还取消了 PX600 卡上的任何外部电源连接,这在第一代和第二代型号上已经出现。 这样做的原因是旧型号在更高性能模式下可能会消耗更多功率,并且某些服务器无法在高于最低 PCIe 功率规格的情况下安全运行。 然而,目前市场上的服务器支持更高的功率需求,因此 Fusion-io 包括通过插槽本身启用更高功率模式的能力。
测试背景和比较
Fusion-io ioMemory PX600 是单个 FPGA 控制器和带有 PCIe 2.0 x8 接口的英特尔 MLC NAND。
本次审查的可比性:
- 融合-io SX300 (3.2TB,1x FPGA 控制器,MLC NAND,PCIe 2.0 x8)
- Fusion-io ioDrive2 (1.2TB,1x FPGA 控制器,MLC NAND,PCIe 2.0 x4)
- Fusion-io ioDrive2 双核 (2.4TB,2 个 FPGA 控制器,MLC NAND,PCle 2.0 x8)
- Fusion-io ioDrive2 双核 (1.2TB,2 个 FPGA 控制器,SLC NAND,PCle 2.0 x8)
- Fusion-io ioScale (3.2TB,1x FPGA 控制器,MLC NAND,PCIe 2.0 x4)
- 华为Tecal ES3000 (2.4TB,3 个 FPGA 控制器,MLC NAND,PCIe 2.0 x8)
- 英特尔SSD 910 (800GB,4 个英特尔 EW29AA31AA1 控制器,MLC NAND,PCIe 2.0 x8)
- LSI Nytro WarpDrive(800GB,4 个 LSI SandForce SF-2500 控制器,MLC NAND,PCle 2.0 x8)
- 记忆 PBlaze3H (2.4TB,2 个 FPGA 控制器,MLC NAND,PCIe 2.1 x8)
- 记忆 PBlaze3L (1.2TB,1x FPGA 控制器,MLC NAND,PCIe 2.1 x8)
- 美光P320h (700GB,1 个 IDT 控制器,SLC NAND,PCIe 2.0 x8)
- 美光P420m (1.6TB,1x IDT 控制器,MLC NAND,PCIe 2.0 x8)
- OCZ ZD-XL 闪光灯 (1.6TB,8 个 LSI SandForce SF-2500 控制器,MLC NAND,PCle 2.0 x8)
- Virident FlashMAX II (2.2TB,2x FPGA 控制器,MLC NAND,PCIe 2.0 x8)
所有 PCIe 应用加速器都在我们的第二代企业测试平台上进行了基准测试,该平台基于 联想ThinkServer RD630. 对于综合基准,我们利用 FIO Linux 版本 2.0.10 和 Windows 版本 2.0.12.2。 在我们的综合测试环境中,我们使用时钟速度为 2.0GHz 的主流服务器配置,尽管具有更强大处理器的服务器配置可以产生更高的性能。
- 2x Intel Xeon E5-2620(2.0GHz,15MB 缓存,6 核)
- 英特尔 C602 芯片组
- 内存 – 16GB (2x 8GB) 1333Mhz DDR3 Registered RDIMM
- Windows Server 2008 R2 SP1 64 位或 CentOS 6.3 64 位
- 100GB 美光 P400e 启动固态硬盘
- LSI 9211-4i SAS/SATA 6.0GB/s HBA(用于启动 SSD)
- LSI 9207-8i SAS/SATA 6.0GB/s HBA(用于基准测试 SSD 或 HDD)
应用性能分析
为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对 ioMemory SX300 的前三个基准测试是 MarkLogic NoSQL 数据库存储基准, 通过 SysBench 的 MySQL OLTP 性能 和 Microsoft SQL Server OLTP 性能 具有模拟的 TCP-C 工作负载。
我们的 MarkLogic NoSQL 数据库环境需要四个一组的 SSD,可用容量至少为 200GB,因为 NoSQL 数据库的四个数据库节点需要大约 650GB 的空间。 我们的协议使用 SCST 主机并在 JBOD 中呈现每个 SSD,每个数据库节点分配一个。 测试在 24 个间隔内重复进行,总共需要 30-36 小时。 MarkLogic 记录每个 SSD 的总平均延迟以及间隔延迟。
ioMemory PX600 在 NoSQL 基准测试期间为获得最佳性能而过度配置时的平均延迟为 1.527 毫秒。 与 SX300 相比,结果非常相似,两个驱动器都在这个大型数据集中拥有最好的加速器。
在 NoSQL 基准测试期间,PX600 保持了非常低的事务延迟,只有少数峰值超过 10 毫秒。
我们的 通过 SysBench 进行 Percona MySQL 数据库测试 衡量 OLTP 活动的性能。 在此测试配置中,我们使用一组 联想 ThinkServer RD630s 并将数据库环境加载到单个 SATA、SAS 或 PCIe 驱动器上。 该测试测量平均 TPS(每秒事务数)、平均延迟以及 99 到 2 个线程范围内的平均 32% 延迟。 Percona 和 MariaDB 可以在其数据库的最新版本中使用 Fusion-io 闪存感知应用程序加速 API,尽管出于比较的目的,我们在“传统”块存储模式下测试了每个设备。 Fusion-io PX600 与 SX300 一起名列前茅,ioDrive2 的平均 TPS 从 435 线程时的大约 2TPS 扩展到 3,250 线程时的超过 32TPS。
SysBench 中 Fusion-io PX600 的平均延迟讲述了一个类似的故事,它从 5 个线程的略高于 2 毫秒扩展到 10 个线程的大约 32 毫秒。
在我们的 SysBench 测试中比较第 99 个百分位数的延迟时,Fusion-io PX600 再次击败竞争对手(连同其得分略高的 SX300 兄弟),在 18 线程时保持在 32 毫秒以下。
StorageReview 的 Microsoft SQL Server OLTP 测试协议 采用事务处理性能委员会基准 C (TPC-C) 的当前草案,这是一种在线事务处理基准,模拟复杂应用程序环境中的活动。 TPC-C 基准比综合性能基准更接近于衡量数据库环境中存储基础设施的性能优势和瓶颈。 我们的 SQL Server 协议使用 685GB(3,000 规模)的 SQL Server 数据库,并测量 30,000 个虚拟用户负载下的事务性能和延迟。
PX600 能够以 6320.5TPS 与其他产品保持同步,但 ioDrive2 Duo MLC 仍以 6322.8TPS 保持最佳表现。
对于我们在 MarkLogic NoSQL 数据库基准测试中的总体平均延迟排名,Fusion PX600 拥有出色的性能,响应时间为 3.0 毫秒,与其他 Fusion-io 解决方案的性能并列。
企业综合工作负载分析
闪存性能在每个存储设备的整个预处理阶段各不相同。 我们的综合企业存储基准流程从分析驱动器在彻底的预处理阶段的运行方式开始。 每个可比较的驱动器都使用供应商的工具进行安全擦除,在 16 个线程的重负载下使用相同的工作负载预处理到稳定状态,每个线程有 16 个未完成队列,然后按设定的时间间隔进行测试在多个线程/队列深度配置文件中显示轻度和重度使用情况下的性能。
- 预处理和初级稳态测试:
- 吞吐量(读+写 IOPS 聚合)
- 平均延迟(读+写延迟一起平均)
- 最大延迟(峰值读取或写入延迟)
- 延迟标准偏差(读+写标准偏差一起平均)
我们的企业综合工作负载分析包括两个基于实际任务的配置文件。 开发这些配置文件是为了更容易与我们过去的基准测试以及广泛发布的值(例如最大 4k 读写速度和 8k 70/30,通常用于企业硬件)进行比较。
- 4k
- 100% 读取或 100% 写入
- 100% 万
- 8k 70/30
- 70% 读取,30% 写入
- 100% 万
我们的第一个测试测量 100% 4k 随机写入性能,负载为 16T/16Q。 在这种情况下,Fusion-io PX600 是 Stock Linux 中记录的最慢的解决方案,而 HP Linux 环境显示出一些改进并超过了 ioDrive2 MLC Stock Linux。
当在相同设置下使用 Windows 时,当尘埃落定时,结果非常相似,HP Windows 中的 PX600 排名第四。 HP Windows 中的 ioDrive2 再次成为最佳 Fusion-io 解决方案。
在我们使用重 16T/16Q 负载进行的整体延迟测试中,Fusion-io PX600 显示出最高的平均延迟。 在 HP Linux 中,性能要好得多,到最后达到了大约 1.8 毫秒的结果。 华为 ES3000 显示出最低的平均延迟,尽管它是排行榜中最不稳定的。
在同一基准测试的 Windows 场景中,使用 HP Windows 的 PX600 位居第三,在 Stock Windows 中击败了 ioDrive2 Duo。 此外,华为 ES3000 从最不稳定(在 Linux 中)变为最稳定(在 Windows 中)。
PX600 在 Stock 和 HP Linux 环境中的最大响应时间非常相似。 此外,它是迄今为止排行榜上最稳定的解决方案之一,特别是与上一代 Fusion-io 兄弟相比,后者在整个过程中都有巨大的峰值。
在相同基准测试的 Windows 环境中,PX600 在 Stock 和 HP 配置方面表现出更多的不一致性,尽管它仍然比上一代 Fusion-io 解决方案好得多。
转到我们的标准偏差基准测试,该基准测试仔细研究了我们 4k 随机写入工作负载中的延迟一致性,我们的 HP Linux 配置显示了 PX600 的最佳结果。 尽管原厂配置和惠普配置在 80 分钟时都显示出明显的峰值,但在接下来的测试中它们都趋于稳定。
Windows 环境测试讲述了一个类似的故事,PX600 结果显示比 ioDrive2 解决方案更加一致的行为。
经过 12 小时的预处理后,Fusion-io PX600 提供了良好的 4k 随机读取性能,分别为 313,051IOPS 和 311,728IOPS(分别为 HP 和 Stock),写入速度为 180,146IOPS 和 146,004IOPS(分别为 HP 和 Stock)。 美光 P420m 拥有最佳读取吞吐量。
在 Windows 环境中,PX600 的速度稍有下降,Stock 读写吞吐量分别为 283,139IOPS 和 136,379IOPS。 在惠普,它的读取性能为 292,520IOPS,写入性能为 283,139IOPS。 这些数字低于 ioDrive2 Duo。
转到 Linux 环境中的整体延迟,PX600 HP 在读取功能(0.81 毫秒)方面显示出不错的平均延迟,尽管它是写入列(1.75 毫秒)中更好的解决方案之一。 在 Stock Linux 中,PX600 的延迟略高,读取时间为 0.82 毫秒,写入时间为 1.75 毫秒。
当使用 Windows 测试平均延迟时,结果显示 HP 的读取时间为 0.9ms,写入时间为 1.29ms,HP 的读取时间为 0.9ms,写入时间为 1.87ms。
PX600 Stock Linux 的最大读取延迟仅为 12.11 毫秒,写入延迟为 13.07 毫秒,令人印象深刻,而 HP Linux 的读取延迟为 12.30 毫秒,写入延迟为 13.90 毫秒。 这些结果比上一代 ioDrive2 Duo 好很多(尤其是在写入方面)。
在 Windows 中进行测试时,结果要高得多,读取时间为 277.97 毫秒,写入时间为 207.16 毫秒(Stock),读取时间为 383.24 毫秒,写入时间为 209.74 毫秒(HP)。
查看其在 Linux 中的标准偏差时,PX600 的读取时间为 0.317 毫秒,写入时间为 1.099 毫秒(HP),读取时间为 0.317 毫秒,写入时间为 1.631 毫秒(Stock)。 这足以将它放在包的中间,但它仍然落后于 ioDrive2 Duo。
在 Windows 环境中,我们记录了与 PX600 的标准偏差,读取时间为 0.516 毫秒,写入时间为 2.096 毫秒(Stock),读取时间为 0.542 毫秒,写入时间为 1.461 毫秒(HP),将其放置在包装底部附近和 ioDrive2 Duo 的后面阅读专栏。
在我们的下一个工作负载中,我们查看具有 8/70 读/写混合比率的 30k 配置文件。 在这种情况下,Fusion-io PX600(库存)以 340,000+IOPS 的爆发开始,然后减慢到大约 137,000IOPS 的速度。 在大多数基准测试中,HP Linux 的性能几乎完全反映了 Stock,但最终以更高的吞吐量告终。 Stock 和 HP Linux 读数均优于 ioDrive2 Duo 读数。
在同一测试的 Windows 环境下,结果几乎相同(虽然速度稍慢),华为 ES3000 再次位居榜首。
在我们的 600K 1.0/8 预处理测试开始时,Fusion-io PX70 在两种模式下的平均延迟低于 30 毫秒,并且在峰值时都徘徊在 1.7 毫秒左右。 ioDrive2 Duo (Stock Linux) 的整体延迟最高。
在 Windows 环境中的总体延迟结果非常相似,在我们的测试结束时,PX600 HP 以略低于 1.8 毫秒的成绩位居第二。 库存中的 ioDrive2 Duo 是这里最慢的卡。
在我们的 8k 70/30 测试期间,Micron P420m Linux 提供了最佳的峰值响应时间。 同样,PX600 驱动器(Stock 和 HP)显示出非常好的峰值延迟性能,而 ioDrive2 Duo 始终显示相当高的峰值。
然而,在我们的 Windows 环境中,PX600 解决方案显示出最高的峰值延迟,而 ioDrive2 Duo 显示出更一致的结果之一,除了最后的几个峰值。
Fusion-io PX600 HP/Stock Linux 的延迟一致性始终优于上一代模型(没有大的峰值),在我们的测试结束时徘徊在 1.0 毫秒左右。
在 Windows 环境中,PX600 配置再次发布了不错的数字,而 ioDrive2 Duo 的延迟始终不一致。
与我们在 16% 16k 写入测试中执行的固定 100 线程、4 队列最大工作负载相比,我们的混合工作负载配置文件可在各种线程/队列组合中扩展性能。 在这些测试中,我们将工作负载强度从 2 个线程和 2 个队列扩展到 16 个线程和 16 个队列。 在扩展的 8k 70/30 测试中,Fusion-io PX600 HP Linux 表现出色,以 170,000IOPS 左右的速度在排行榜上名列前茅,紧随其后(尽管仍然远远落后于令人印象深刻的华为 ES3000)。 ioDrive2 表现接近底部。
我们的 Windows 环境讲述了类似的故事,Fusion-io PX600 (HP) 在同类产品中排名第二。
测试平均延迟时的结果基本一致,PX600 HP Linux 位居第二(Stock Linux 的性能相当接近)。 华为再次成为表现最好的。
Fusion-io PX600 在 Windows 中的平均延迟再次令人印象深刻,HP 环境的延迟不到 1.8 毫秒。 使用 Stock Windows 的 PX600 在测试结束时徘徊在 2.0 毫秒左右。
Fusion-io PX600 的两种配置均未显示任何主要的最大延迟峰值,并且在整个测试期间,两个峰值均保持在 19 毫秒以下。
Windows 环境中的最大延迟对于 PX600 来说不太一致,在整个基准测试中出现了一些主要峰值。
Fusion-io PX600 HP Linux 的标准偏差非常令人印象深刻(Stock 紧随其后),无论是总体上还是与 ioDrive2 Duo 结果相比。
总体标准偏差结果在 Windows 环境中几乎相同(PX600 表现异常出色),尽管在接近尾声时某些解决方案出现了一些更高的峰值。
结语
Fusion-io Atomic 系列 PX600 是 Fusion-io (SanDisk) 的第三代 PCIe 应用程序加速器。 它旨在通过提供令人难以置信的低延迟和充足的耐用性来显着改进任务关键型应用程序。 PX600 提供 PCIe 2.0 x8 接口,提供 1TB、1.3TB、2.6TB(所有 HHHL)和 5.2TB(FHHL)的容量。 PX600 沿袭了过去 Fusion-io 型号的脚步,使用现场可编程门阵列 (FPGA) 来管理其 NAND。 因此,PX600 的适应性很强,Fusio-io 可以通过软件更新做(和改进)许多不同的事情(包括通过重新编程修复错误的能力,减少非经常性工程成本)。
与之前的 Gen2 卡相比的核心变化之一是转向更小的 NAND 封装。 这种迁移可能会有问题,因为较小的光刻 NAND 往往更难处理,从而影响性能。 但是,增加的密度会产生更高容量的卡。 当我们查看 PX600 的性能时,该卡在综合测试中放弃了一点,但此类测试的价值很小。 在企业方面更为重要的应用程序测试中,该卡表现出色。
在我们的 Microsoft SQL Server TPC-T 测试中,平均延迟与之前的版本几乎相同,仅略低于最佳结果。 在我们的 MarkLogic NoSQL 基准测试中,整体平均延迟的改善超出了 ioDrive2 Duo 的能力范围。 我们还在 MySQL Sysbench 测试中注意到了存储性能,其中 PX600 使用双控制器 Memblaze 应用程序加速器实现了跨越式发展,尽管 PX600 使用的是单控制器设计。 PX600 表现出弱点的主要领域是在我们的综合测试阵容中,事实证明,随着每个新一代产品的发布,它的相关性降低了。 我们看到越来越多的设备在我们的传统 4k 或 8k 70/30 测试中表现出弱点,但在我们的应用程序测试中证明非常有竞争力。
优点
- 尽管 NAND 芯片缩小面临挑战,但性能与上一代产品相当
- 优秀的驱动管理软件
- 针对应用程序性能和耐用性进行了调整
缺点
- Windows 与 Linux 中仍然存在一些峰值延迟问题
底线
Fusion ioMemory PX600 提供高达 5.2TB 的 PCIe 存储,专为对延迟敏感的企业应用程序进行调整。 PX600 提供同类领先的 SQL Server 延迟,同时为希望在不妥协的情况下兼顾性能、容量和寿命的企业提供强大的耐用性。