主页 Enterprise 三星 983 DCT NVMe SSD 评测

三星 983 DCT NVMe SSD 评测

by 亚当·阿姆斯特朗

三星 983 DCT 是该公司最新的数据中心 SSD。 983 DCT 采用 NVMe 接口,有两种外形尺寸:2.5 英寸和 M.2。 该驱动器由久经考验的三星组件及其久经考验的 V-NAND 构建而成。 该驱动器专门针对性能而设计,还提供端到端数据保护、通过 Samsung SSD Toolkit 软件进行更高效的管理以及 5 年保修。


三星 983 DCT 是该公司最新的数据中心 SSD。 983 DCT 采用 NVMe 接口,有两种外形尺寸:2.5 英寸和 M.2。 该驱动器由久经考验的三星组件及其久经考验的 V-NAND 构建而成。 该驱动器专门针对性能而设计,还提供端到端数据保护、通过 Samsung SSD Toolkit 软件进行更高效的管理以及 5 年保修。

该公司最近更新了其数据中心驱动器,其中 983 DCT 是旨在实现高速和高响应能力的驱动器。 三星表示将通过 NVMe 技术及其 Phoenix 控制器实现这一目标。 对于 2.5 英寸版本,该公司表示 983 DCT 可以达到高达 3,400MB/s 的顺序速度,以及高达 580,000 IOPS 的随机吞吐量。 

如前所述,三星 983 DCT 具有 M.2 和 2.5 英寸两种外形规格。 对于本次审查,我们关注的是 1.92TB、2.5 英寸的外形规格。 

三星 983 DCT 规格

外形 2.5“
容量 960GB 1.92TB
接口 PCIe Gen 3 x4,NVMe 1.2b
NAND闪存 三星V-NAND
控制器 三星凤凰
加密方式 AES 256位
性能 
顺序阅读 高达 3.3GB/秒 高达 3.4GB/秒
顺序写入 高达 1.3GB/秒 高达 2.2GB/秒
随机读取(4K,QD32) 440K IOPS 580K IOPS
随机写入(4K,QD32) 46K IOPS 52K IOPS
QoS 读取(99.99%,4KB,QD1) 最高0.13ms
QoS 写入(99.99%,4KB,QD1) 最高0.09ms
能量消耗
主动阅读 最高为8.7W
主动写入 最高为10.6W
空闲 最高为4.0W
耐力
平均无故障时间 2.0万小时
优步5 每 1^10 位读取 17 个扇区
震动 1500G,持续时间 0.5 毫秒,半正弦波
环境
允许电压 12.0V±8%
工作温度 0 70°C
物理
尺寸 (WxHxD) 最大。 100.2 x 69.85 x 6.8(毫米)
最大重量 70g
保修政策 5 年或 0.8 DWPD

性能

测试平台

我们的企业级 SSD 评测利用 Lenovo ThinkSystem SR850 进行应用程序测试和 戴尔 PowerEdge R740xd 用于综合基准。 ThinkSystem SR850 是一个装备精良的四 CPU 平台,提供的 CPU 能力远远超过对高性能本地存储施加压力所需的能力。 不需要大量 CPU 资源的综合测试使用更传统的双处理器服务器。 在这两种情况下,目的都是以尽可能符合存储供应商最大驱动器规格的最佳方式展示本地存储。

联想 ThinkSystem SR850

  • 4 个 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 内存
  • 2 个 RAID 930-8i 12Gb/s RAID 卡
  • 8 个 NVMe 托架
  • VMware ESXI 6.5

戴尔 PowerEdge R740xd

  • 2 个英特尔金牌 6130 CPU(2.1GHz x 16 核)
  • 16 x 16GB DDR4-2666MHz ECC 内存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 适配器
  • Ubuntu-16.04.3-桌面-amd64

测试背景和比较

特 StorageReview 企业测试实验室 提供了一个灵活的架构,用于在与管理员在实际部署中遇到的环境相当的环境中对企业存储设备进行基准测试。 企业测试实验室结合了各种服务器、网络、电源调节和其他网络基础设施,使我们的员工能够建立真实世界的条件,以便在我们的审查期间准确地衡量性能。

我们将这些关于实验室环境和协议的详细信息纳入审查,以便 IT 专业人员和负责存储采购的人员能够了解我们取得以下成果的条件。 我们的评论都不是由我们正在测试的设备制造商支付或监督的。 有关的其他详细信息 StorageReview 企业测试实验室 以及其网络功能的概述可在这些相应页面上找到。

本次审查的主要比较:

应用程序工作负载分析

为了了解企业存储设备的性能特征,必须对实时生产环境中的基础架构和应用程序工作负载进行建模。 因此,我们对三星 983 DCT 的基准测试是 通过 SysBench 的 MySQL OLTP 性能. 对于我们的应用程序工作负载,每个驱动器将运行 2-4 个配置相同的虚拟机。 请注意: 1.92TB 模型对于我们的 SQL 应用程序工作负载来说不够大,因此未包含在本次审查中。

系统性能

下一个应用程序基准包括 Percona MySQL OLTP 数据库 通过 SysBench 测量。 该测试测量平均 TPS(每秒事务数)、平均延迟和平均 99% 延迟。

每 系统平台 VM 配置了三个虚拟磁盘:一个用于引导 (~92GB),一个用于预建数据库 (~447GB),第三个用于测试中的数据库 (270GB)。 从系统资源的角度来看,我们为每个虚拟机配置了 16 个 vCPU、60GB DRAM 并利用了 LSI Logic SAS SCSI 控制器。

Sysbench 测试配置(每个虚拟机)

  • CentOS 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 数据库表:100
    • 数据库大小:10,000,000
    • 数据库线程:32
    • 内存缓冲区:24GB
  • 测试时长:3 小时
    • 2 小时预处理 32 个线程
    • 1 小时 32 个线程

在 Sysbench 事务基准测试中,三星 983 DCT(在其余性能部分中称为三星)以 6,159.4 TPS 排在最后。

对于 Sysbench 平均延迟,三星再次以 20.8 毫秒排在最后。 

对于我们最坏情况下的延迟(第 99 个百分位数),三星以 38.6 毫秒排在最后。 

SideFX 的胡迪尼

Houdini 测试专门用于评估与 CGI 渲染相关的存储性能。 此应用程序的测试台是核心的变体 戴尔 PowerEdge R740xd 我们在实验室中使用的服务器类型具有双 Intel 6130 CPU 和 64GB DRAM。 在这种情况下,我们安装了运行裸机的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基准测试的输出以秒为单位来衡量,越少越好。

Maelstrom 演示代表了渲染管线的一部分,它通过演示其有效使用交换文件作为扩展内存形式的能力来突出存储的性能。 测试不会写出结果数据或处理点,以隔离延迟对底层存储组件的影响。 测试本身由五个阶段组成,我们将其中三个阶段作为基准测试的一部分运行,如下所示:

  1. 从磁盘加载打包点。 这是从磁盘读取的时间。 这是单线程的,可能会限制整体吞吐量。
  2. 将点解压缩到一个平面数组中,以便对其进行处理。 如果这些点不依赖于其他点,则可以调整工作集以保留在核心中。 这一步是多线程的。
  3. (不运行)处理点。
  4. 将它们重新打包成适合存储回磁盘的分桶块。 这一步是多线程的。
  5. (未运行)将分桶块写回磁盘。

通过 Houdini 测试,三星以 2,634.2 秒的成绩大致位于我们非 Optane 驱动器的中间位置。

VDBench 工作负载分析

在对存储设备进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,从“四个角”测试、常见的数据库传输大小测试到来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。 我们针对这些基准测试的测试过程用数据填充整个驱动器表面,然后将驱动器部分分区为驱动器容量的 25%,以模拟驱动器如何响应应用程序工作负载。 这不同于使用 100% 的驱动器并使它们进入稳定状态的全熵测试。 因此,这些数字将反映更高的持续写入速度。

简介:

  • 4K 随机读取:100% 读取,128 个线程,0-120% 重复率
  • 4K 随机写入:100% 写入,64 线程,0-120% iorate
  • 64K 顺序读取:100% 读取,16 线程,0-120% 迭代
  • 64K 顺序写入:100% 写入,8 个线程,0-120% 迭代
  • 综合数据库:SQL 和 Oracle
  • VDI 完整克隆和链接克隆跟踪

在我们的第一个 VDBench 工作负载分析,随机 4K 读取中,三星在 82.1 IOPS 时以 59,187μs 的延迟开始。 三星保持在 100μs 以下,直到大约 300K IOPS,然后在 591,839μs 时达到最低峰值性能,为 215.2 IOPS。

在 4K 随机写入方面,三星远远落后于所有其他驱动器。 它以 20.2 IOPS 的速度从 35,420μs 开始,并以 52,822 毫秒的延迟迅速达到 2.42 IOPS 的峰值。 

切换到顺序工作,在我们的 64K 读取中,三星以最低延迟 (187.8μs) 开始并保持较低的延迟,直到大约 32K IOPS 或 2.1GB/s,并以 36,389 IOPS 或 2.27 的组中最低性能达到峰值GB/秒。

对于 64K 写入,我们看到三星的另一个糟糕性能从只有 67.3μs 的延迟开始,驱动器迅速上升并在 3,299ms 的延迟下达到 206 IOPS 或 4.84MB/s 的峰值。 

我们的下一批基准测试专注于 SQL 工作负载。 对于第一个基准测试,三星以 82μs 和 21,107 IOPS 的最低延迟开始。 该驱动器保持最低延迟直到大约 150K IOPS,然后以 210,323 IOPS 和 149.5μs 延迟获得第二个整体峰值性能。

对于 SQL 90-10,三星再次以 18,589 IOPS 的强势开局,延迟仅为 82.5 微秒。 该驱动器保持在 100μs 以下,直到略低于 90K IOPS,然后以 184,773 IOPS 的峰值得分和 172.3μs 的延迟保持在第二位。

SQL 80-20 看到驱动器打滑了一点。 虽然仍然以最低延迟 (86.8μs) 开始,但该驱动器的峰值性能最弱,约为 132K IOPS 和 233μs 的延迟。

转到 Oracle Workloads,我们看到三星起步错误。 同样,该驱动器以最低延迟 (82.7μs) 进入,但迅速上升并达到 95,205 IOPS 的峰值,延迟为 418.9μs,远远落后于其他驱动器。 

随着 Oracle 90-10,三星得到了改进。 从 15,515 IOPS 和 82.5μs 的延迟开始,驱动器保持在 100μs 以下,直到大约 72K IOPS,然后在 159,976μs 达到峰值 139.6 IOPS。

Oracle 80-20 让三星保持低于 100 微秒的延迟,从 12,687 IOPS 到大约 60K IOPS,峰值性能为 130,766 IOPS 和 166.5 微秒的延迟。 

接下来,我们继续我们的 VDI 克隆测试,完整和链接。 对于 VDI Full Clone Boot,三星的启动时间不到 100 微秒,但很快就超过了它,并以 123,613 IOPS 的峰值性能和 279.4 微秒的延迟排名第三。

VDI FC 初始登录让三星以 3,987μs 的 72.7 IOPS 开始。 延迟保持很低,实际上它下降得如此之低,以至于它在我们的图表上看起来好像为零,直到大约 12K IOPS,它迅速上升到 15,845 IOPS 的峰值,延迟为 1.9 毫秒。 

在 VDI Monday Login 中,三星保持在最后一个开始时间不到 100 微秒,然后以 17,810 微秒的延迟跃升至 895 IOPS 的峰值。

对于 VDI 链接克隆 (LC),我们再次从启动测试开始。 在这里,三星在我们与 Memblaze PBlaze5 910 并驾齐驱的克隆测试中展示了其最强性能。然而,三星仍然以 64,503 IOPS 的峰值性能和 248.8μs 的延迟排在最后。

VDI LC Initial Login 让三星启动仅超过 100 微秒,并迅速飙升至 9,959 IOPS 的峰值,延迟为 799.4 微秒,远远落后于其他两个驱动器。

最后,VDI LC Monday Login 显示三星继续表现不佳,开始超过 100μs,并迅速飙升至 10,410 IOPS,延迟为 1.52ms。 

结论 

三星 983 DCT 是该公司数据中心更新的读取重点 NVMe 版本。 983 DCT 有两种外形尺寸,2.5 英寸和 M.2,以及两种容量,960GB 和 1.92TB。 983 DCT 被指定为三星的高性能数据中心驱动器,在这两种情况下均具有高达 3.4GB/s 的连续读取速度和 580K IOPS 随机读取速度。 该驱动器利用 V-NAND、NVMe 接口和该公司的 Phoenix 控制器来达到这些数字。 

虽然读取密集型类别中的其他产品提供 1 DWPD,但三星 983 DCT 更轻一些,仅为 0.8 DWPD。 在这种情况下,看到 983 DCT 在这一类别中低于其他在写入性能方面提供小优势的产品也就不足为奇了。 在我们的应用程序工作负载分析中,三星 983 DCT 在所有三项 Sysbench 测试中名列最后,TPS 为 6,159.4,平均延迟为 20.8 毫秒,最坏情况下的延迟为 38.6 毫秒。 Houdini 看到该驱动器以 2,634.2 秒大致位于传统 NVMe 驱动器的中间位置。 由于其容量较小(本次评测中为 1.92TB),我们无法运行 SQL Server 应用程序测试。 

继续 VDBench 测试三星 983 DCT 的新功能,我们可以更清楚地了解驱动器如何对读写工作负载做出反应。 该驱动器在 4K 和 592K IOPS 下具有不错的读取性能,在 64K 下达到 2.27GB/s。 在这两种情况下,三星的延迟最低,比其他两个驱动器更长。 对于 Writes 来说,这是一个鲜明的对比。 4K 写入的峰值仅为 53K IOPS,延迟为 2.42 毫秒。 64K 写入只有 206MB/s 的峰值和 4.84ms 的延迟。 SQL 和 Oracle 发现 Samsung 的性能和放置有所改善,通常延迟时间最低的驱动器最长。 亮点包括 SQL 的 210K IOPS、SQL 185-90 的 10K IOPS、Oracle 160-90 的 10K IOP 和 Oracle 131-80 的 20K IOPS。 除了 VDI 完整克隆启动测试外,三星在我们的 VDI 克隆测试中表现出整体表现不佳。

随着 SSD 市场寻求进一步细分产品,三星 983 DCT 作为一款 NVMe 产品出现,提供 0.8 DWPD,略低于竞争产品,后者专注于读取密集型驱动器中的 1 DWPD 标记。 因此,看到 983 DCT 的写入性能较低并不令人震惊。 相反,驱动器更加强调读取性能。 在这里,它能够在小型和大型块传输中提供较低的初始延迟。 总体而言,983 DCT 将在倾向于更注重价值的 NVMe 驱动器的读取密集型环境中表现出色。

三星 983 DCT

讨论这篇评论

注册 StorageReview 时事通讯