英特尔傲腾固态硬盘 P5800X 扩展了英特尔最快的固态硬盘存储层。 我们已经看到 Optane SSD 在实验室中大量使用 P4800X,它是在四年前推出的。 随着时间的推移,英特尔增加了驱动器的容量(从 375GB 开始),最高可达 1.5TB。 不过,小容量还可以,因为我们主要为耐久性设计的 Optane SSD 经常用于两层架构。 在这里,SSD 可以吸收写入,这通常是 NAND SSD 失败的地方。 我们看到 Optane 在这个角色上做得很好 Azure Stack 人机交互 和 VMware vSAN, 在其他人中。 现在,我们将亲身体验最新一代英特尔傲腾固态硬盘 P5800X,了解该平台的发展情况。
英特尔傲腾固态硬盘 P5800X 扩展了英特尔最快的固态硬盘存储层。 我们已经看到 Optane SSD 在实验室中大量使用 P4800X,它是在四年前推出的。 随着时间的推移,英特尔增加了驱动器的容量(从 375GB 开始),最高可达 1.5TB。 不过,小容量还可以,因为我们主要为耐久性设计的 Optane SSD 经常用于两层架构。 在这里,SSD 可以吸收写入,这通常是 NAND SSD 失败的地方。 我们看到 Optane 在这个角色上做得很好 Azure Stack 人机交互 和 VMware vSAN, 在其他人中。 现在,我们将亲身体验最新一代英特尔傲腾固态硬盘 P5800X,了解该平台的发展情况。
英特尔傲腾固态盘 P5800X 的新功能
英特尔并没有阻止英特尔傲腾固态硬盘 P5800X 的哗众取宠。 他们将这款硬盘称为“世界上最快的数据中心 SSD”。 英特尔的数字看起来也非常好,直到您意识到它们是在与基于 P5600 NAND 的 SSD 进行比较。 不管怎样,P5800X 在重要的地方确实比 P4800X 有了很大的提升,100 DWPD 的耐用性。
由于 Intel Optane SSD P5800X 用于如此多的多层存储配置,因此驱动器的耐用性至关重要。 Optane SSD 通常设置为吸收系统中的所有写入,保护其背后更大、更慢的介质。 例如,这些可以是 QLC SSD,它们在读取繁重的工作负载方面表现良好,但耐用性或写入性能不佳。 因此,P5800X 是慢速媒体的完美伴侣。 许多软件供应商已经意识到这一点。 vSAN、Azure HCI、StorONE 和许多其他公司都擅长使多层运行良好。
正如在英特尔内存和存储活动中提到的,该公司现在正在推出其第二代 Optane 产品,这是一种介于内存和传统 NAND 之间的存储类别,通常被称为存储级内存。 P5800X 利用新媒体和 PCIe Gen4 接口(现在可以利用,这要归功于 第三代英特尔至强可扩展处理器) 以获得更高的速度。
引用的数字非常令人印象深刻,最高速度为 7.4GB/s,吞吐量高达 2 万 IOPS,所有这些都具有非常低的启动延迟。 QoS 还以极低的延迟提供可预测的性能。 可预测和低延迟使其成为金融服务(欺诈检测、分析、合规性和市场建模)以及实时投标(广告请求、投标请求、投标和广告投放)的有吸引力的选择。
Intel Optane SSD P5800X 提供五年保修,容量为 400GB、800GB 和 1.6TB。 对于我们的审查,我们正在研究 800GB 型号。
英特尔傲腾固态硬盘 P5800X 规格
容量 | 400GB,800GB,1.6TB |
外形 | U.2 和 E1.S |
媒体管理 | 第二代傲腾 |
接口 | PCIe 4.0 1×4、2×2、NVMe 1.3d |
专用集成电路/中央处理器 | 单核 1.1GHz ARM Cortex R7 |
媒体渠道 | 8-12 |
性能 | |
顺序阅读 | 高达 7.4GB/秒 |
顺序写入 | 高达 7.4GB/秒 |
随机4K阅读 | 高达 1.55 万次 IOPS |
随机 4K 写入 | 高达 1.6 万次 IOPS |
随机 4K 70/30 | 高达 2 万次 IOPS |
QoS(4KRR,QD=1,99%) | <6µs |
QoS(4GB/s 2K RW 下的 4KRR,99.999%) | <66µs |
耐力 | 100 DWPD |
保修政策 | 5的一年 |
英特尔傲腾固态盘 P5800X 性能
测试平台
我们新的 PCIe Gen4 Enterprise SSD 评测利用了 联想 ThinkSystem SR635 用于应用程序测试和综合基准。 ThinkSystem SR635 是一个装备精良的单 CPU AMD 平台,提供的 CPU 能力远远超过强调高性能本地存储所需的能力。 它也是我们实验室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市场上为数不多的平台之一)。 综合测试不需要大量 CPU 资源,但仍利用相同的 Lenovo 平台。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。
PCIe Gen4综合及应用平台(Lenovo ThinkSystem SR635)
- 1 个 AMD 7742(2.25GHz x 64 核)
- 8 x 64GB DDR4-3200MHz ECC DRAM(1 x 64GB 用于 Houdini)
- CentOS 7.7 1908
- Ubuntu 20.10-桌面
- ESXi 6.7u3
PCIe Gen3 综合平台 (戴尔 PowerEdge R740xd)
- 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
- 4 x 16GB DDR4-2666MHz ECC 内存
- 1x PERC 730 2GB 12Gb/s RAID 卡
- 附加 NVMe 适配器
- Ubuntu-16.04.3-桌面-amd64
测试背景和比较
这款 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。
我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 以及其网络功能的概述可在这些相应页面上找到。
SideFX 的胡迪尼
Houdini 测试专门用于评估与 CGI 渲染相关的存储性能。 此应用程序的 Gen3 测试台是我们在实验室中使用的核心 Dell PowerEdge R740xd 服务器类型的变体,具有双 Intel 6130 CPU 和 64GB DRAM。 对于 Gen4 设备,我们使用配备 635 核 64 CPU 和降低至 7742GB 的 DRAM 的 Lenovo ThinkSystem SR64。 在 Gen3 平台上,我们安装了运行裸机的 Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64),而我们较新的 Gen4 平台则使用 Ubuntu 20.10-desktop。 基准测试的输出以秒为单位来衡量,越少越好。
Maelstrom 演示代表了渲染管线的一部分,它通过演示其有效使用交换文件作为扩展内存形式的能力来突出存储的性能。 测试不会写出结果数据或处理点,以隔离延迟对底层存储组件的影响。 测试本身由五个阶段组成,我们将其中三个阶段作为基准测试的一部分运行,如下所示:
- 从磁盘加载打包点。 这是从磁盘读取的时间。 这是单线程的,可能会限制整体吞吐量。
- 将点解压缩到一个平面数组中,以便对其进行处理。 如果这些点不依赖于其他点,则可以调整工作集以保留在核心中。 这一步是多线程的。
- (未运行)处理点。
- 将它们重新打包成适合存储回磁盘的分桶块。 这一步是多线程的。
- (未运行)将分桶块写回磁盘。
在这里,P5800X 仅用了 1,799.5 秒就在测试的驱动器中名列前茅。 这也使它进入了我们所见过的前四名结果。
VDBench 工作负载分析
在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这与使用 100% 的驱动器并使它们进入稳定状态的全熵测试不同。 因此,这些数字将反映更高的持续写入速度。
简介:
- 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
- 4K 随机写入:100% 写入,64 线程,0-120% iorate
- 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
- 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
- 综合数据库:SQL 和 Oracle
- VDI 完整克隆和链接克隆跟踪
可比物:
在我们的第一个 VDBench 工作负载分析随机 4K 读取中,P5800X 完胜其他驱动器并达到 1,416,092 IOPS 的峰值和仅 85.5µs 的延迟。
4K 随机写入显示了另一个令人印象深刻的性能显示,并且始终保持在 100µs 以下,峰值为 1,328,538 IOPS,延迟仅为 90.3µs。
在读取方面切换到顺序工作负载,特别是我们的 64K 工作负载,没有真正的竞争。 P5800X 在 112,979µs 的延迟下达到了 7.1 IOPS 或 281GB/s 的峰值。
凭借 64K 顺序写入,P5800X 以 93,579 IOPS 或 5.85GB/s 的峰值和 161µs 的延迟继续其统治地位。
我们的下一组测试是我们的 SQL 工作负载:SQL、SQL 90-10 和 SQL 80-20。 从 SQL 开始,英特尔傲腾固态盘 P5800X 保持了令人印象深刻的速度,将下一个放置驱动器的性能提高了一倍多,峰值为 828,464 IOPS,延迟为 37.6µs。
SQL 90-10 以 5800 IOPS 的峰值和 808,476µs 的延迟首先击中了 P38.3X。 同样,DapuStor 的性能翻倍,延迟减半。
对于 SQL 80-20,P5800X 再次具有真正的高性能,峰值为 778,015 IOPS,延迟为 39.5µs。
接下来是我们的 Oracle 工作负载:Oracle、Oracle 90-10 和 Oracle 80-20。 从 Oracle 开始,Intel Optane SSD P5800X 的性能继续比最接近的驱动器高出一倍以上,并且延迟非常低。 在 Oracle 中,新的 Optane 达到 697,772 IOPS 的峰值,延迟为 48.5µs。
在 Oracle 90-10 中,P5800X 以 748,100 IOPS 和仅 28µs 的延迟位居榜首。
Oracle 80-20 P5800X 的峰值为 726,162 IOPS,延迟为 28.8µs,令人印象深刻。
接下来,我们切换到我们的 VDI 克隆测试,完整和链接。 对于 VDI Full Clone (FC) Boot,P5800X 以 481,166 IOPS 的峰值性能和 70.4µs 的延迟轻松拿下榜首。
VDI FC 初始登录看到 P5800X 达到 274,042 IOPS 的峰值和 105.3µs 的延迟。
VDI FC Monday Login 再次见证了 P5800X 以 232,343 IOPS 的性能和 65.5µs 的延迟领先。
对于 VDI 链接克隆 (LC) 引导,英特尔傲腾固态盘 P5800X 具有令人印象深刻的 247,127 IOPS 和 63.6µs 的峰值。
VDI LC 初始登录在早期看到了延迟的跳跃,但 P5800X 仍然表现出色,达到 134,846 IOPS 和 55.6µs 的延迟。
最后,在 VDI LC Monday Login 中,P5800X 以较高的延迟开始,但很快下降并以 168,481 IOPS 和 91.1µs 的延迟结束。
总结
Intel Optane SSD P5800X 是该公司首款使用第二代 Optane 的企业级 SSD。 我相信这是英特尔第一个充分利用 PCIe Gen4 的驱动器。 与 P5800X 相比,P4800X 有了巨大的进步。 它一开始就提供更高的容量,高达 1.6TB,这是我们在第一代驱动器上不得不等待的。 P5800X 的耐用等级为 100 DWPD,引用速度为 7.4GB/s,吞吐量高达 2 万 IOPS。 引用的性能与 Optane 常见的超低延迟相结合,使其成为 FSI 和实时竞价等用例的理想选择。
为了提高性能,我们运行了应用程序工作负载分析和 VDBench 基准测试。 我们将 P5800X 与 Intel P4800X 进行了比较,以了解该技术的发展程度,并将 Dapustor H3900 与其他存储级内存进行了比较。 这是 PCIe Gen3 与 Gen4 的比较,但目前我们的实验室中没有其他 Gen4 存储类内存驱动器。 在 Houdini 中,P5800X 的渲染时间为 1,799.5 秒,位居榜首。
在 VDBench 中,P5800X 在每项测试中都遥遥领先。 在几乎每次测试中,新的 Optane 也将峰值延迟保持在 100µs 以下。 亮点包括 1.4K 读取 4 万 IOPS、1.3K 写入 4 万 IOPS、7.1K 读取 64GB/s 和 5.85K 写入 64GB/s。
在 SQL Server 中,我们看到峰值为 828K IOPS,SQL 808-90 为 10K IOPS,SQL 778-80 为 20K IOPS。 在 Oracle 中,我们看到了 698K IOPS 的峰值,Oracle 748-90 中的 10K IOPS 和 Oracle 726-80 中的 20K IOPS。 在我们的 VDI 克隆测试中,我们看到完整克隆结果为引导 481K IOPS、初始登录 274K IOPS 和星期一登录 232K IOPS。 使用 VDI LC,我们看到启动时为 247K IOPS,初始登录时为 135K IOPS,星期一登录时为 168K IOPS。
英特尔傲腾固态硬盘 P5800X 是我们在测试中从未见过的最令人印象深刻的存储级内存固态硬盘。 它不仅在我们所有测试中名列前茅,而且延迟低至 28µs。 虽然容量有限,但 P5800X 仍将在很大程度上用作专家角色。 也就是说,在系统中提供一个非常灵敏的存储层,其架构旨在智能地利用各种存储选项。 但这没关系,因为考虑到单个驱动器的绝对性能时,P5800X 令人印象深刻。
参与 StorageReview
电子报 | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS订阅