美光 P420m 是一款企业应用加速器,总容量高达 1.4TB,利用 PCIe 接口,并提供独特的半高半长 (HHHL) 和 2.5" 外形规格。美光选择了 25nm P420m 的 MLC NAND 不仅可以满足主流市场对性能和可靠性的要求,还可以提供比其更具成本效益和更高容量的产品 P320h 与 SLC NAND 配对。 P420m 和 P320h 之间的另一个核心区别是美光增加了电容器以在意外断电时保护飞行中的数据。 额外的数据保护功能可使卡保持足够长的供电时间,以刷新对 NAND 的所有写入,为企业提供多一层数据保护。 HHHL 卡通过 PCIe Gen2 x8 接口实现高达 3.3GB/s 的顺序读取性能和高达 630MB/s 的写入以及高达 750,000 IOPS 的随机读取和 95,000 IOPS 的写入活动。 PCIe Gen2.5 x2 上的 4" 接口分别高达 1.8GB/s 和 430,000 IOPS。
美光 P420m 是一款企业应用加速器,总容量高达 1.4TB,利用 PCIe 接口,并提供独特的半高半长 (HHHL) 和 2.5" 外形规格。美光选择了 25nm P420m 的 MLC NAND 不仅可以满足主流市场对性能和可靠性的要求,还可以提供比其更具成本效益和更高容量的产品 P320h 与 SLC NAND 配对。 P420m 和 P320h 之间的另一个核心区别是美光增加了电容器以在意外断电时保护飞行中的数据。 额外的数据保护功能可使卡保持足够长的供电时间,以刷新对 NAND 的所有写入,为企业提供多一层数据保护。 HHHL 卡通过 PCIe Gen2 x8 接口实现高达 3.3GB/s 的顺序读取性能和高达 630MB/s 的写入以及高达 750,000 IOPS 的随机读取和 95,000 IOPS 的写入活动。 PCIe Gen2.5 x2 上的 4" 接口分别高达 1.8GB/s 和 430,000 IOPS。
Micron P420m 的核心是与其兄弟产品相同的定制 Micron/IDT ASIC 控制器 美光 P320h PCIe 以及相同的 RAIN 架构(独立 NAND 的冗余阵列)。 RAIN 提供跨闪存通道使用 RAID5 的设备集成算法,使美光能够提供更高的性能、可靠性和数据完整性。 RAIN 还通过在检测到故障时启动自动后台重建,即使在发生通道故障后也能保证驱动器连续运行。 RAIN 是完全自动化的,完全在后台运行,不会降低系统级性能。
整个应用加速器市场在容量和性能方面提供了广泛的选择,但一个可能被忽视的特性是功耗。 一些解决方案消耗如此多的功率并排出如此多的能量,以至于主机内冷却成为一个严重的问题。 另一方面,P420m 完全符合 PCIe 规范,待机时的额定功率仅为 8W(7GB 350" 为 2.5W),根据容量、外形尺寸和性能调整选项,有源功率范围高达 30W。2.5"外形尺寸额定为 14GB 为 350W,22GB 为 700W。 HHHL 外形规格的 22GB 额定功率为 700W,而 1.4TB 型号的额定功率为 25W(开启功率节流)和 30W(未激活)。
如前所述,美光 P420m 提供 HHHL 和 2.5" PCIe 外形尺寸。2.5" PCIe 外形尺寸仍然是美光独有的,尽管其他人已经展示了该技术的演示。 戴尔为其创建了一个背板 12G PowerEdge 服务器 适用于允许将它们以四个一组安装在传统前置驱动器托架中的驱动器。 当然,能够通过服务器前端访问驱动器而无需关闭系统电源和取下盖子来维修驱动器被一些人视为一个巨大的好处。 这也有助于美光的 2.5" PCIe 驱动器成为该驱动器尺寸中迄今为止速度最快的存储,正如我们在 2.5" P320h 评测.
2.5" 提供 350GB 和 700GB 容量,而 HHHL 提供 700GB 和更高级别的 1.4TB 容量。HHHL 卡提供 5 PBW (700GB) 和 10 PBW (1.4TB) 的耐用性。我们的审查单位是四个1.4TB 容量卡。
美光 P420m 企业级 PCIe SSD 规格
- 容量
- 700GB(MTFDGAR700MAX-1AG1Z)
- 顺序读取:3.3GB/s(128KB,稳态)
- 顺序写入:600MB/s(128KB,稳态)
- 随机读取:750,000 IOPS(4KB,稳态)
- 随机写入:50,000 IOPS(4KB,稳态)
- 1.4TB (MTFDGAR1T4MAX-1AG1Z)
- 顺序读取:3.3GB/s(128KB,稳态)
- 顺序写入:630MB/s(128KB,稳态)
- 随机读取:750,000 IOPS(4KB,稳态)
- 随机写入:95,000 IOPS(4KB,稳态)
- 700GB(MTFDGAR700MAX-1AG1Z)
- 就绪延迟:<100µs
- 写入延迟:<13µs
- 接口:PCIe Gen2 x8
- 功率:最大30W,闲置8个
- 外形:HHHL
- 尺寸:68.90mm X 167.65mm X 18.71mm
- 工作温度:0°C 至 +50°C
- 可靠性和耐用性
- 不可纠正的误码率 (UBER):<1 个扇区/1017 读取位
- MTTF:2万小时
- PBW:5 (700GB)、10 (1.4TB)
- 操作系统兼容性
- 微软:Windows Server 2008 R2 SP1 (x86-64)、Windows Server 2008 R2 SP1 Hyper-V (x86-64)、Windows Server 2012 (x86-64) SP128、Windows 7 (x86-64)
- Linux:RHEL Linux 5.5、5.6、5.7、5.8、6.1、6.2、6.3 (x86-64)、SLES Linux 11 SP1 和 SP2 (x86-64)
- VMware 5.0、5.1 (x86-64)
- 开源 GPL(内核版本 2.6.25+)
设计与建造
美光 P420m 是一款半高半长的 x8 PCIe 应用加速器,其特点是在主板上安装了一个控制器,并附有子板以容纳更多的 MLC NAND 和电源故障电容器。 与其顶级产品、基于 SLC NAND 的 P320h 同级产品一样,P420m 遵循通用 HHHL 规范,几乎可以安装在任何开放式服务器 PCIe 插槽上。
电源故障电容器是美光 P420m 的新功能,有助于确保断电时的数据完整性,因为美光启用了利用 P420m 上的 DRAM 的回写缓存。 P320h 的默认配置设置为直写,但用户可以(自行决定)启用回写缓存以提高性能。 由于更改了默认条件以帮助从新的 MLC 平台获得更高的性能,美光选择无论安装环境的条件如何都确保可靠的性能。
卡的顶部有一个带有 Micron P420m 品牌的粘性黑色板。 该板还用于保护顶层子板及其电源故障电容器,以及控制器的散热器。 该控制器是 Micron/IDT ASIC 控制器,也可在 Micron P320h 上找到。 至于 NAND,美光包括 64 个他们自己的美光 31C12NQ314 25nm MLC NAND 封装。 结果是 2048GB 或原始容量,然后过度配置到 1.4TB 可用。
测试背景和比较
Micron P420m Enterprise PCIe SSD 使用 Micron/IDT ASIC 控制器和带有 PCIe 2.0 x8 接口的 Micron MLC NAND。
本次审查的可比性:
- Fusion-io ioDrive2 (1.2TB,1 x Xilinx Virtex-6 FPGA 控制器,MLC NAND,PCIe 2.0 x4)
- 华为Tecal ES3000 (1.2TB,3 个专有 FPGA 控制器,MLC NAND,PCIe 2.0 x8)
- 英特尔SSD 910 (800GB,4 个英特尔 EW29AA31AA1,MLC NAND,PCIe 2.0 x 8)
- LSI Nytro WarpDrive BLP4-400 (400GB,4 个 SandForce SF-2500 控制器,东芝 eMLC NAND,PCIe 2.0 x8)
- 美光P320h (700GB,IDT 控制器,SLC NAND,PCIe 2.0 x8)
- Virident FlashMAX II (2.2TB,2 个专有 FPGA 控制器,eMLC NAND,PCIe 2.0 x8)
所有 PCIe 应用加速器都在我们的第二代企业测试平台上进行了基准测试,该平台基于 联想ThinkServer RD630. 对于综合基准,我们利用 FIO Linux 版本 2.0.10 和 Windows 版本 2.0.12.2。 在我们的综合测试环境中,我们使用时钟速度为 2.0GHz 的主流服务器配置,尽管具有更强大处理器的服务器配置可以产生更高的性能。
- 2 x Intel Xeon E5-2620(2.0GHz,15MB 缓存,6 核)
- 英特尔 C602 芯片组
- 内存 – 16GB (2 x 8GB) 1333Mhz DDR3 Registered RDIMM
- Windows Server 2008 R2 SP1 64 位、Windows Server 2012 Standard、CentOS 6.3 64 位
- 100GB 美光 P400e 启动固态硬盘
- LSI 9211-4i SAS/SATA 6.0Gb/s HBA(用于启动 SSD)
- LSI 9207-8i SAS/SATA 6.0Gb/s HBA(用于基准测试 SSD 或 HDD)
值得注意的是,我们选择的可比较产品主要是基于 MLC 的驱动器,SLC Micron PCIe 驱动器除外。 也就是说,并非所有 PCIe 驱动器在性能目标和价格方面都是平等的。 特定的应用程序需要特定的存储需求,因此我们选择在 NAND 类型而不是控制器数量等方面对组件进行标准化。
应用性能分析
在企业市场中,产品声称在纸面上的表现与它们在实际生产环境中的表现之间存在巨大差异。 我们了解评估存储作为大型系统组件的重要性,最重要的是存储在与关键企业应用程序交互时的响应速度。 为此,我们推出了应用程序测试,包括我们专有的 MarkLogic NoSQL 数据库存储基准 和 通过 SysBench 的 MySQL 性能.
在 MarkLogic NoSQL 数据库环境中,我们测试了可用容量大于或等于 700GB 的单个 PCIe 应用加速器。 我们的 NoSQL 数据库需要大约 650GB 的可用空间才能使用,平均分配给四个数据库节点。 在我们的测试环境中,我们使用 SCST 主机并在 JBOD 中呈现每个 SSD(而一些 PCIe SSD 利用软件 RAID0),每个数据库节点分配一个设备或分区。 该测试以 24 个间隔重复进行,对于此类 SSD 总共需要 30-36 小时。 测量 MarkLogic 软件看到的内部延迟,我们记录了总平均延迟以及每个 SSD 的间隔延迟。
华为 ES3000 1.2TB HP 提供了该组中最好的延迟,峰值平均间隔延迟在 3.5-9.9 毫秒之间。
基于 SLC 的美光 P320h 700GB 在该组中排名第二,峰值测量值在 12-17.7 毫秒之间。
Virident FlashMAX II 2.2TB HP 位于我们基于 MLC 的 PCIe SSD 包的中间位置,平均延迟峰值在 16-26 毫秒之间。
与 Virident FlashMAX II 910TB 相比,英特尔 SSD 2.2 的总体平均延迟时间有所提高,峰值范围为 6-50 毫秒。
Fusion-io ioDrive2 也落后于多控制器 PCIe 应用程序加速器,其峰值也在 6-50 毫秒范围内。
Micron P420m 在我们的 MarkLogic NoSQL 数据库测试中垫底,峰值在 25-74 毫秒之间。
我们的下一个应用测试包括 通过 SysBench 进行 Percona MySQL 数据库测试,它衡量 OLTP 活动的性能。 在此测试配置中,我们使用一组 联想 ThinkServer RD630s 并将数据库环境加载到单个 SATA、SAS 或 PCIe 驱动器上。 该测试测量平均 TPS(每秒事务数)、平均延迟以及 99 到 2 个线程范围内的平均 32% 延迟。 Percona 和 MariaDB 在其最新版本的数据库中使用 Fusion-io 闪存感知应用程序 API,尽管为了进行比较,我们在其“传统”块存储模式下测试了每个设备。
在我们的 SysBench 测试中,美光 P420m Enterprise PCIe SSD 在 2,361 线程下的性能接近中上,测量值为 32TPS,略微超过 Fusion ioDrive2 MLC,领先于 Virident FlashMAX II 和 LSI Nytro翘曲驱动器。
凭借其强大的事务性能,美光 P420m 提供的平均延迟从 8.55 线程的 2 毫秒扩展到 13.55 线程的 32 毫秒。
虽然平均 TPS 或延迟很重要,但另一个有价值的考虑因素是第 99 个百分位数的延迟,它显示了测试过程中最坏情况下的性能。 美光 P420m 排名中等,范围从 18.8 毫秒到 25.8 毫秒。
企业综合工作负载分析
我们的 综合企业存储基准 该过程首先分析驱动器在彻底预处理阶段的运行方式。 每个可比较的驱动器都使用供应商的工具进行安全擦除,在 16 个线程的重负载下使用相同的工作负载预处理到稳定状态,每个线程有 16 个未完成队列,然后按设定的时间间隔进行测试在多个线程/队列深度配置文件中显示轻度和重度使用情况下的性能。
预处理和初级稳态测试:
- 吞吐量(读+写 IOPS 聚合)
- 平均延迟(读+写延迟一起平均)
- 最大延迟(峰值读取或写入延迟)
- 延迟标准偏差(读+写标准偏差一起平均)
我们的企业综合工作负载分析包括两个基于实际任务的配置文件。 开发这些配置文件是为了更容易与我们过去的基准测试以及广泛发布的值(例如最大 4k 读写速度和 8k 70/30,通常用于企业硬件)进行比较。
- 4k
- 100% 读取或 100% 写入
- 100% 万
- fio –filename=/dev/sdx –direct=1 –rw=randrw –refill_buffers –norandommap –randrepeat=0 –ioengine=libaio –bs=4k –rwmixread=100 –iodepth=16 –numjobs=16 –runtime=60 –group_reporting –名称=4ktest
- 8k 70/30
- 70% 读取,30% 写入
- 100% 万
- fio –filename=/dev/sdx –direct=1 –rw=randrw –refill_buffers –norandommap –randrepeat=0 –ioengine=libaio –bs=8k –rwmixread=70 –iodepth=16 –numjobs=16 –runtime=60 –group_reporting –名称=8k7030test
在衡量 PCIe 应用加速器的性能时,有必要评估它们在 Linux 和 Windows 中的性能。 我们这样做是因为有些卡更喜欢一个操作系统而不是另一个操作系统,并且组织的部署可能在很大程度上取决于在特定环境中实现真实世界的结果。 因此,我们按操作系统组织了结果; 首先显示所有 Linux 数据和图表,然后显示 Windows 结果。
在我们的第一个测试中,我们在 CentOS 4 中测量了 Micron P420m 从突发到稳定状态的 6.3K 随机写入性能,我们看到吞吐量峰值约为 158k IOPS,然后逐渐下降到略低于 100k IOPS。 与 Intel SSD 910 和 LSI Nytro WarpDrive 相比,这些速度是有利的,但与 ioDrive2 MLC 或多控制器 MLC 应用程序加速器(如 FlashMAX II 或华为 ES3000)相比则有所不足。
在我们的 Windows Server 2008 R2 环境中,性能几乎与我们的 Linux 发现相同,测得 159k IOPS 突发到大约 100k IOPS 稳定状态。
将我们的注意力转移到平均延迟上,美光 P420m 的响应时间约为 1.6 毫秒,然后在稳态下增加到约 2.5 毫秒。
类似于我们在 4K 随机写入测试中的随机 Linux 发现,我们测量的平均延迟从突发时的 1.6 毫秒到接近稳态时的 2.52 毫秒。
在我们的整个预处理过程中,美光 P420m 保持非常稳定,在大多数测试中保持其峰值低于 10 毫秒的组中最低之一。
在我们的 Windows Server 420K 随机写入测试中,美光 P4m 在峰值响应时间方面表现出色,在测试期间保持在 10 毫秒以下。
当谈到我们 4K 随机写入预处理测试中的延迟一致性时,美光 P420m 几乎名列前茅,仅次于基于 SLC 的 P420h 和华为 ES3000。
切换到我们的 Windows Server 环境后,Micron P420m 在 MLC 包中名列前茅,在延迟一致性方面仅次于基于 SLC 的 P320h。
经过 6 小时的预处理后,我们注意到美光 P420m 的读取性能非常出色,达到 587k IOPS,在 MLC 包中名列前茅。 4K 随机写入性能测得 99k IOPS,排名靠后,但仍领先于 Intel SSD 910 和 Nytro WarpDrive。
与我们的 Linux 测试环境相比,Windows Server 420 R2008 中的 Micron P2m 提供了性能提升,几乎与 P320h 相当。 写入性能保持不变,仅提高了约 100 IOPS。
在 16T/16Q 的重负载下,我们测得 Micron P0.43m 的随机读取平均稳态延迟为 2.56 毫秒,随机写入延迟为 420 毫秒。
在我们的 Windows 测试环境中,与 CentOS 中的 420 毫秒相比,美光 P0.40m 的平均读取延迟略低,为 0.43 毫秒。 平均写入延迟与 Linux 的调查结果相当。
当谈到 Linux 中的 4K 随机延迟时,美光 P420m 测得非常低,读取时间为 11.89 毫秒,写入时间为 7.75 毫秒。
在 Windows 中达到稳定状态后,美光 P420m 的读取响应时间有所改善,降至仅 1.64 毫秒。 峰值写入延迟略微上升至仅 8.64 毫秒。
就 Linux 中的延迟一致性而言,美光 P420m 在 MLC 组中提供了最佳的读取标准偏差,在写入标准偏差方面排名第二。
在我们的 Windows Server 环境中,P420m 的延迟一致性得到显着改善,保持领先地位。 写入延迟一致性也略有改善,尽管华为 ES3000 名列前茅。
在我们的下一个工作负载中,我们将查看具有 8/70 读/写混合比的随机 30k 配置文件。 在我们的 Linux 环境中,美光 P420m 再次进入中间位置,性能从突发的 175k IOPS 扩展到稳定状态下的大约 117k IOPS。
在我们的 Windows Server 环境中,Micron P420m 在我们的 8k 70/30 工作负载中表现略高,吞吐量峰值为 178k IOPS,稳定状态下稳定至 118k IOPS。
我们在 Linux 中来自美光 P8m 的 70K 30/420 预处理工作负载的平均延迟范围从突发的 1.46 毫秒到稳态的约 2.2 毫秒。
切换到我们的 Windows Server 环境后,我们发现 Micron P420m 的平均延迟略低,从突发状态的 1.43 毫秒到稳定状态下的 2.15 毫秒不等。
在具有 8k 70/30 工作负载的 Linux 环境中,美光 P420m 在大部分测试中测得大约 10 毫秒,少数峰值约为 140 毫秒。
虽然 Micron P420m 在我们的 Linux 测试环境中有一些更高的延迟峰值,但在 Windows Server 中,它在预调节期间保持在 16 毫秒以下。
比较延迟一致性,美光 P420m 在大部分测试中表现出同类产品中的佼佼者,一些尖峰使其进入基于 SLC 的 P320h 或 FlashMAX II 的范围。
在 Windows Server 2008 R2 中,美光 P420m 能够提供与华为 ES3000 非常接近的延迟一致性。
与我们在 16% 16k 写入测试中执行的固定 100 线程、4 队列最大工作负载相比,我们的混合工作负载配置文件可在各种线程/队列组合中扩展性能。 在 8k 70/30 工作负载中,美光 P420m 落后于 Virident FlashMAX II,从 21.7T/2Q 的 2k IOPS 到 115.9T/16Q 的 16k IOPS,尽管远低于 1.2TB ES3000,后者从 28.9k 扩展到 276.7 IOPS。
凭借我们在 Linux 中的 8k 70/30 工作负载的强大性能,Micron P420m 在 Windows Server 中获得了一点动力,从 22.8T/2Q 的 2k IOPS 扩展到 117.8T/16Q 的 16k IOPS。
在我们的 CentOS 6.3 环境中,Micron P420m 提供的平均延迟范围从 0.17T/2Q 的 2 毫秒到 2.2T/16Q 的 16 毫秒不等。
在 Windows Server 2008 R2 中,美光 P420m 提供的平均延迟在 0.17T/2Q 时低至 2 毫秒,在 2.16T/16Q 时增加到 16 毫秒。
美光 P420m 在我们的 8k 70/30 工作负载中将延迟峰值保持在最低水平,在有效队列深度分别为 70 和 140 时仅显示两个峰值,分别为 128 毫秒和 256 毫秒。
虽然 Linux 环境在高队列深度处显示出两个峰值延迟峰值,但 P420m 在我们的 Windows Server 环境中保持稳定,高达 13.94 毫秒。
比较我们增加的 8k 70/30 工作负载中的延迟一致性,美光 P420m 在 MLC 包中名列前茅,落后于华为 ES3000。 基于 SLC 的美光 P320h 仍然提供了该组中最低的标准偏差,主要针对繁重的写入工作负载。
与我们在 P420m 的 Linux 环境中注意到的紧密延迟一致性相似,Windows Server 环境也不例外,在更高的有效队列深度下显示出进一步的收益。
总结
美光 P420m 应用加速器建立在 美光 P320h PCIe,而不是针对更多的读取密集型用例,而其兄弟则适用于更密集的写入密集型应用程序。 这两款卡均采用相同的定制 Micron/IDT ASIC 控制器,可帮助 P420m 驱动顺序性能高达 3.3GB/s 读取和 630MB/s 写入,随机读取和写入分别高达 750,000 IOPS 和 95,000 IOPS。 另一个共同特点是 P420m 还提供两种外形尺寸,HHHL PCIe 和 2.5",这使 OEM 和客户能够灵活地将最佳版本与给定应用配对。除了选定的功能外,P420m 还增加了电源故障电容器以确保数据完整性,即使在出现意外断电时也是如此。
P420m 以多种方式在日益拥挤的空间中脱颖而出。 除了 Micron 引用的可预测性能数据外,该驱动器还是一种通用外形规格 (PCIe),非常适合标准服务器部署。 当然,它还提供独特的 2.5" PCIe 外形尺寸,戴尔已在其整个产品中采用 PowerEdge 12G 服务器线. 不过归根结底,标准 PCIe 卡的部署非常简单,符合 PCIe 规范(并非所有卡都符合),并且使用具有单个控制器和更少故障点的基本架构。 采用新电容器提供电源故障保护,该解决方案可靠且兼容,建立在经过验证的架构之上。
着眼于性能,Micron P420m 在写入或混合读/写测试中处于中间位置,与 Fusion ioDrive2 单盘、Intel SSD 910 和 LSI Nytro WarpDrive 系列竞争得很好。 与 Virident FlashMAX II、华为 ES3000 或 Fusion ioDrive2 等高端多控制器 PCIe 应用加速器相比,美光 P420m 在我们的综合基准测试中落后。 鉴于美光 P420m 的设计差异以及最大功率限制和更低的冷却要求,这并不令人感到意外。 在我们的应用程序测试中,P420m 在我们衡量 MySQL 性能的 Sysbench 基准测试中表现出色,但在我们的 MarkLogic NoSQL 测试中垫底。 对于准备繁重的安装,P420m 表现出色,在 Linux 中提供超过 587k IOPS 4k 读取,在 Windows 中提供超过 636k IOPS 读取。 总体而言,P420m 达到了 Micron 的目标,设计了一款性能强大的单控制器 PCIe SSD,旨在以多种形式提供读取密集型安装。
优点
- 在我们的随机 636k 读取测试中,出色的读取性能超过 4k IOPS
- 基于经过验证的架构构建,并添加了电源故障保护
- 提供适用于不同服务器应用的通用 HHHL 外形尺寸和 2.5"
缺点
- 与高端多控制器 PCIe 应用加速器相比,性能落后
底线
美光 P420m PCIe 应用加速器为组织提供了灵活性,以 2.5" 和 HHHL PCIe 外形提供,它还提供可预测的读取性能,标准 PCIe 外形的容量范围高达 1.4TB。这要归功于美光的 25nm MLC NAND , 与 SLC 模型相比,美光可以降低成本,使该卡更实惠,同时仍以可普遍部署的外形提供强大的性能。