首页 企业 Intel Optane SSD DC P4800X 评测

Intel Optane SSD DC P4800X 评测

by 布赖恩·比勒

英特尔傲腾 SSD DC P4800X 系列 于 2017 年 XNUMX 月推出 承诺将名为 3D XPoint(英特尔品牌为 Optane)的新型存储级内存 (SCM) 媒体推向市场。 P4800X 作为传统的 2.5 英寸 NVMe 驱动器 (U.2) 和 PCIe 附加卡推出。 初始容量从 375GB 开始,计划到 1.5 年底达到 2017TB。容量目标没有实现,但英特尔确实推出了 750 月的 XNUMXGB Optane 型号. 无论容量如何,P4800X 都有一项工作,那就是为数据中心中对延迟敏感的应用程序提供尽可能高速的存储。


英特尔傲腾 SSD DC P4800X 系列 于 2017 年 XNUMX 月推出 承诺将名为 3D XPoint(英特尔品牌为 Optane)的新型存储级内存 (SCM) 媒体推向市场。 P4800X 作为传统的 2.5 英寸 NVMe 驱动器 (U.2) 和 PCIe 附加卡推出。 初始容量从 375GB 开始,计划到 1.5 年底达到 2017TB。容量目标没有实现,但英特尔确实推出了 750 月的 XNUMXGB Optane 型号. 无论容量如何,P4800X 都有一项工作,那就是为数据中心中对延迟敏感的应用程序提供尽可能高速的存储。

鉴于驱动器的容量较小,企业不太可能将 JBOD 装满 P4800X SSD 用于主存储。 尽管对于可以从更快的存储中受益的应用程序(如小型分析数据集和 BI 用例)来说,这当然是可能的。 企业阵列供应商也没有急于在他们的系统设计中大量采用 Optane,这主要也是因为容量限制。 然而,HPE 探索了使用 Optane 作为 3PAR 系统的缓存,而其他人当然希望随着技术的成熟将此类存储集成到他们的系统中。 然而,在软件定义存储领域,基于 Optane 的 SSD 有一组直接的优秀用例,在这些领域中,设计具有更大的灵活性来考虑这种新型存储。

VMware vSAN 可能是这个领域中最引人注目的,因为他们提供 P0X 的第 4800 天支持 并在 HCI 领域处于领先地位。 vSAN 还具有得天独厚的优势,可以利用这些较小的驱动器,因为它们在两层架构中运行。 vSAN 存储被协调到磁盘组中,具有一个用于所有传入写入活动的层以及一个面向容量的读取层。 目前,vSAN 在写入层中每个驱动器最多只能利用 600GB,因此 P4800X 的较小容量并不是真正的限制。 对于 vSAN 用户,这意味着对于将 P4800X 用作缓存驱动器的部署,写入将以最快的速度写入 vSAN 集群。

这篇评论是针对 4800GB U.375 外形规格的 P2X。 虽然主要作为我们的磁盘组的一部分工作 即将进行的 vSAN 审核,我们能够运行正常企业级 SSD 测试的子集,以更全面地了解 P4800X 的性能概况。

Intel Optane SSD DC P4800X 规格

外形尺寸 AIC HHHL,U.2
容量 375GB,750GB
接口 PCIe 3×4,NVMe
潜伏 <10微秒
服务质量
4KB 随机,队列深度 1,读/写 <60/100μs
4KB 随机,队列深度 16,读/写 <150/200μs
生产能力
4KB 随机,队列深度 16,读/写 高达 550/500K IOPS
4KB 随机,队列深度 16,混合 70/30 R/W 高达 500K IOPS
耐力
DWPD  30
PB 写入
375GB 20.5体重体重
750GB 41体重体重

性能

测试平台

我们的企业级 SSD 评测利用 Lenovo ThinkSystem SR850 进行应用程序测试和 戴尔 PowerEdge R740xd 用于综合基准。 ThinkSystem SR850 是一个装备精良的四 CPU 平台,提供的 CPU 能力远远超过对高性能本地存储施加压力所需的能力。 不需要大量 CPU 资源的综合测试使用更传统的双处理器服务器。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。

联想 ThinkSystem SR850

  • 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 内存
  • 2 个 RAID 930-8i 12Gb/s RAID 卡
  • 8 个 NVMe 托架
  • VMware ESXI 6.5

戴尔 PowerEdge R740xd

  • 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
  • 16 x 16GB DDR4-2666MHz ECC 内存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 适配器
  • Ubuntu-16.04.3-桌面-amd64

测试背景和比较

这款 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。

我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 和 其网络功能的概述 在这些相应的页面上可用。

本次审查的可比性:

SideFX 的胡迪尼

Houdini 测试专门用于评估与 CGI 渲染相关的存储性能。 此应用程序的测试台是核心的变体 戴尔 PowerEdge R740xd 我们在实验室中使用的服务器类型具有双 Intel 6130 CPU 和 64GB DRAM。 在这种情况下,我们安装了运行裸机的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基准测试的输出以秒为单位来衡量,越少越好。

Maelstrom 演示代表了渲染管线的一部分,它通过演示其有效使用交换文件作为扩展内存形式的能力来突出存储的性能。 测试不会写出结果数据或处理点,以隔离延迟对底层存储组件的影响。 测试本身由五个阶段组成,我们将其中三个阶段作为基准测试的一部分运行,如下所示:

  1. 从磁盘加载打包点。 这是从磁盘读取的时间。 这是单线程的,可能会限制整体吞吐量。
  2. 将点解压缩到一个平面数组中,以便对其进行处理。 如果这些点不依赖于其他点,则可以调整工作集以保留在核心中。 这一步是多线程的。
  3. (未运行)处理点。
  4. 将它们重新打包成适合存储回磁盘的分桶块。 这一步是多线程的。
  5. (未运行)将分桶块写回磁盘。

英特尔傲腾固态硬盘 DC P4800X 以 1,520.4 秒的成绩在 Houdini 测试中名列榜首。 P4800X 拥有所有傲腾驱动器中最好的性能,也是最好的整体性能。

VDBench 工作负载分析

在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备设定基准,从而可以轻松地在竞争解决方案之间进行“同类”比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,64 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

对于 4K 峰值随机性能,Intel Optane SSD DC P4800X(以下简称 P4800X)以比其他驱动器低得多的延迟开始,然后在 500K IOPS 后突然上升,最后以 585,754 IOPS 结束,延迟为 213μs .

凭借 4K 峰值写入性能,P4800X 表现更佳,以大约 554K IOPS 的峰值性能和仅 155μs 的延迟排名第二。

切换到顺序工作负载,在我们的 64K 读取中,我们看到了与 4K 读取类似的模式。 P4800X 开始时的延迟比其他驱动器低得多,然后以约 35K IOPS 的速度飙升,并以 40,558μs 的延迟达到 2.53 IOPS 或 394GB/s 的峰值。 这使该驱动器总体排名第四。

对于 64K 写入,P4800X 位居第二,峰值性能约为 34,700 IOPS 或 2.17GB/s,延迟为 380μs,然后略有下降。

对于我们的 SQL 工作负载,我们看到 P4800X 以 286,548 IOPS 的峰值得分大幅跃居前列,延迟仅为 111 微秒。

在我们的 SQL90-10 中,P4800X 以 276,530 IOPS 的最高分和 114 微秒的延迟继续其统治地位。

在 SQL 80-20 中保持第一名的 P4800X 在大约 266K IOPS 时达到峰值,延迟大约为 111μs,然后出现小幅下降。

转到我们的 Oracle 工作负载,P4800X 以接近 248K IOPS 的峰值得分和 127μs 的延迟位居第二。

在 Oracle 90-10 中,P4800X 以 276,703 IOPS 的峰值性能和仅 79 微秒的延迟击败了其他驱动器。

同样在 Oracle 80-20 中,我们看到 P4800X 以 265,769 IOPS 和仅 82 微秒的延迟领先。

接下来,我们切换到 VDI 克隆测试、完整克隆 (FC) 和链接克隆 (LC)。 对于 VDI FC Boot,P4800X 起步非常强劲,随后以 167,856 IOPS 的峰值性能和 199μs 的延迟跃居第三。

在 VDI FC Initial Login 中,P4800X 以 108,159 IOPS 和 274μs 的延迟再次排名第三。

对于 VDI FC Monday Login,P4800X 以 97,198 IOPS 的峰值性能和 163μs 的延迟跃居第二。

接下来是 VDI LC Boot,P4800X 以 93,095 IOPS 的分数和 171μs 的延迟位居榜首。

VDI LC Initial Login 以 4800 IOPS 的得分和 66,463μs 的延迟获得了 P118X 的另一个冠军。

最后,在我们的 VDI LC 星期一登录测试中,P4800X 以 67,085 IOPS 和 235μs 的延迟位居第二。

总结

英特尔傲腾固态硬盘 DC P4800X 是另一款采用英特尔 3D XPoint 技术发布的驱动器。 顾名思义,该驱动器专为数据中心设计,采用常见的 U.2 和 AIC HHHL 外形规格。 立即变得明显的缺点之一是该驱动器仅提供 375GB 和 750GB 容量。 这一方面限制了它的用例,但另一方面,它的用例主要面向低延迟比容量更重要的工作负载和应用程序。 在这方面,Optane 技术已证明自己在企业和最终用户工作负载方面处于行业领先地位。

P4800X 的小容量是我们在正常的基准测试中出现小漏洞的原因。 驱动器容量不够大,无法运行 SQL 或 Sysbench,因此它们没有出现在单驱动器评测中。 在我们能够运行的第一个应用程序分析工作负载(SideFX 的 Houdini)中,P4800X 以 1,520.4 秒的总成绩名列前茅。 在我们的 VDBench 中,P4800X 在队列深度较低的情况下全面占据主导地位。 高端性能更多地与 P4800X 混合在一起,一些传统的 NVMe 产品在性能上超过了它。 然而,它确实在 SQL 和 Oracle 90-10 和 80-20 等领域击败了其他人。 P4800X 的亮点包括在两个 4K 测试中均超过 2.53 万次 IOPS,在 64K 读取中为 2.17GB/s,在 64K 写入中为 4800GB/s。 在所有三个 SQL 测试中,P250X 的 IOPS 超过 4800 万,在我们的 Oracle 测试中达到或超过 4800K IOPS。 但撇开峰值性能不谈,英特尔傲腾 P79X 的延迟极低。 在每项测试中,延迟开始时都非常低,通常比所有其他驱动器低得多。 在少数情况下,P90X 具有峰值性能,Oracle 10-82 中的延迟低至 80μs,Oracle 20-XNUMX 中的延迟低至 XNUMXμs。

对于低延迟工作负载,目前没有什么能比得上英特尔傲腾固态盘 DC P4800X。 虽然传统 NVMe 产品在某些方面可以在总带宽和 IOPS 方面超越它,但一般来说,P4800X 不适合基于其价格/容量指标的这些用例。 不过,一旦企业驱动器达到更高的容量点,想想英特尔傲腾技术的可能性是令人兴奋的; 尤其是 2TB 级别的产品,它仍然是阵列供应商的最爱,尽管 30TB SAS SSD 很常见。 在我们围绕 vSAN 的特定用例中,P4800X 为写入缓存层提供了最快的性能。 对于想要充分利用 vSAN 的任何人来说,P4800X 是事实上的标准。

英特尔 P4800X 产品页面

讨论这篇评论

注册 StorageReview 时事通讯