华为Tecal ES3000是全高半长企业应用加速器系列,采用MLC NAND,容量高达2.4TB,支持PCIe接口(2.0 x8)。 从表面上看,华为卡与市场上的许多其他产品相似,但更深入的观察揭示了独特的三重控制器设计,将两个 PCB 连接在一起,形成令人印象深刻的产品。 在性能规模的顶端,这意味着 3.2GB/s 的最大读取带宽和 2.8GB/s 的写入。 从延迟角度来看,所有这些容量都可以驱动 49µs 和 8µs 的写入延迟。 这些卡还有许多附加功能,包括增强的错误检查、电源故障保护和在其整个生命周期内提高耐用性的机制。
华为Tecal ES3000是全高半长企业应用加速器系列,采用MLC NAND,容量高达2.4TB,支持PCIe接口(2.0 x8)。 从表面上看,华为卡与市场上的许多其他产品相似,但更深入的观察揭示了独特的三重控制器设计,将两个 PCB 连接在一起,形成令人印象深刻的产品。 在性能规模的顶端,这意味着 3.2GB/s 的最大读取带宽和 2.8GB/s 的写入。 从延迟角度来看,所有这些容量都可以驱动 49µs 和 8µs 的写入延迟。 这些卡还有许多附加功能,包括增强的错误检查、电源故障保护和在其整个生命周期内提高耐用性的机制。
华为的解决方案在市场上是独一无二的。 虽然大多数企业 PCIe 应用程序加速器只有一个 ASIC 或 FPGA,而一些更大容量的驱动器有两个,但 Tecal ES3000 在两个板上组合了三个 FPGA。 主板包含 PCIe 接口和一个带有 NAND 池的控制器,而子板则添加了第二个和第三个控制器以及相关的 NAND。 驱动器本身作为单个池呈现给主机,类似于 Virident 解决方案,因此如果用户想要利用整个可用容量,则无需利用软件 RAID。
除了创新的硬件设计外,华为还拥有多项嵌入式软件功能,可提供长期可靠的运行。 除了 ECC 之外,华为还使用他们的 RAID5 引擎来纠正基于通道的错误。 此外,动态 RAID 算法会在通道因多个坏块而发生故障时即时调整。 在正常操作中,每个控制器都以 16+1 通道配置运行,但当其中一个控制器出现故障时,它可以调整为 15+1 或 14+1 以在 SSD 老化和磨损时保持运行。 为了帮助提高耐用性,这些卡使用读取重试; 当无法检查和更正数据时,控制器会即时检查和调整闪存级别以保护数据,据称可将闪存的使用寿命延长多达 300%。 最后,ES3000 提供了一个板载超级电容器,可以提供将近 1 秒的放电时间,这比断电时从缓冲区刷新数据所需的 10 毫秒大约长 80 倍。
华为 Tecal ES3000 卡提供 800GB、1.2TB 和 2.4TB 容量。 华为对这三种容量的评分分别为6.4PB、9.5PB和19.1PB。 我们的评测样本包括 1.2TB 和 2.4TB 容量的卡。
华为Tecal ES3000规格
- 容量
- 800GB、1.2TB、2.4TB
- 性能
- 800GB
- 最大读取带宽:2.2GB/s
- 读取 IOPS 4K 最大值:600,000
- 读取 IOPS 4K 稳定:570,000
- 读取延迟:49µs
- 最大写入带宽:1.2GB/s
- 读取 IOPS 4K 最大值:330,000
- 读取 IOPS 4K 稳定:120,000
- 写入延迟:8µs
- 混合 IOPS 70/30 R/W 4K:260,000
- 续航力:6.4PB
- 1.2TB
- 最大读取带宽:3.2GB/s
- 读取 IOPS 4K 最大值:770,000
- 读取 IOPS 4K 稳定:760,000
- 读取延迟:49µs
- 最大写入带宽:1.8GB/s
- 读取 IOPS 4K 最大值:480,000
- 读取 IOPS 4K 稳定:180,000
- 写入延迟:8µs
- 混合 IOPS 70/30 R/W 4K:400,000
- 续航力:9.5PB
- 2.4TB
- 最大读取带宽:3.2GB/s
- 读取 IOPS 4K 最大值:770,000
- 读取 IOPS 4K 稳定:760,000
- 读取延迟:49µs
- 最大写入带宽:2.8GB/s
- 读取 IOPS 4K 最大值:630,000
- 读取 IOPS 4K 稳定:240,000
- 写入延迟:8µs
- 混合 IOPS 70/30 R/W 4K:430,000
- 续航力:19.1PB
- 800GB
- 外形:FHHL
- 总线:PCIe 2.0 x8
- 能量消耗
- 800GB:20-35W
- 1.2TB:25-50W
- 2.4TB:25-60W
- 工作温度:0-55°C
- 气流:1.5m/s (300LFM)
- 功耗:20-35W (800GB)、25-50W (1.2TB)、25-60W (2.4TB)
- 支持的操作系统
- 微软视窗服务器 2003 SP2/2008 R2 64 位
- RHEL 5.0/5.1/5.2/5.3/5.4/5.5/5.6/5.7/5.8 64-bit
- RHEL 6.0/6.1/6.2/6.3 64-bit
- SLES 11 SP1/SP2 64 位
- 中央操作系统 5/6
- Ubuntu 10 / 11
- VMware ESX 4.1/ESXi 5.0
影片总览
设计与建造
华为 Tecal ES3000 作为全高半长 (FHHL) x1.2 PCI-Express 2.4 卡提供 8TB 和 2.0TB 产品。 独特的是,华为实施了三 FPGA 控制器配置,其中一个控制器直接连接到主板,两个控制器连接到子板。 该设备的顶部具有非常突出的特征。 右侧是四个大型电源故障电容器,用于在断电时保护飞行中的数据。 电路板的其余部分主要由两个散热器覆盖。 两者中较大的黑色散热器覆盖子板,被动冷却组件以防止它们过热。
如上所述,华为 Tecal ES3000 上有三个控制器,每个控制器都有自己的 DRAM 和 NAND 池。 我们的测试 ES3000 采用美光 MLC NAND,尽管华为与 NAND 制造商无关。 就构建质量而言,华为 Tecal ES3000 感觉坚固并且能够承受将安装它的大多数环境。
虽然 Tecal ES3000 PCIe SSD 的功耗高达 60W,具体取决于容量,但所有电源均通过 PCIe 插槽引入,无需外部电源连接。
最后要注意的是外形尺寸。 华为 Tecal ES3000 是一款 FHHL 外形应用加速器。 我们正在对其进行测试的两个比较对象是半高半长 (HHHL) 卡,由于它们的尺寸更小,因此能够“适合”更多的应用程序。 这些卡是 Micron P320h 700GB SLC 和 Virident FlashMAX II 2.2TB。
测试背景和比较
华为 Tecal ES3000 使用三个专有的 FPGA 控制器和带有 PCIe 2.0 x8 接口的 MLC NAND。 在本次审查中,我们展示了广告容量的“库存”性能,以及 PCIe SSD 过度配置到其广告容量的 80% 的“高性能”数据。 综合基准显示股票和 HP 数据,而所有应用程序基准都是通过过度配置的驱动器收集的。
本次审查的可比性:
- Fusion-io ioDrive2 Duo (1.2TB,2 x Xilinx Virtex-6 FPGA 控制器,SLC NAND,PCIe 2.0 x4)
- LSI Nytro WarpDrive BLP4-400 (400GB,SandForce SF-2500 控制器,东芝 eMLC NAND,PCIe 2.0 x8)
- 美光P320h (700GB,IDT 控制器,SLC NAND,PCIe 2.0 x8)
- Virident FlashMAX II (2.2TB,2 个专有 FPGA 控制器,eMLC NAND,PCIe 2.0 x8)
所有 PCIe 应用加速器都在我们的第二代企业测试平台上进行了基准测试,该平台基于 联想ThinkServer RD630. 对于综合基准测试,我们使用适用于 Linux 的 FIO 2.0.10 版和适用于 Windows 的 2.0.12.2 版。 由于华为 Tecal ES3000 利用主机端资源,更快的服务器时钟速度使其能够产生更高的性能。 在我们的综合测试环境中,我们使用时钟速度为 2.0GHz 的主流服务器配置,尽管具有更强大处理器的服务器配置可以产生更高的性能。
- 2 x Intel Xeon E5-2620(2.0GHz,15MB 缓存,6 核)
- 英特尔 C602 芯片组
- 内存 – 16GB (2 x 8GB) 1333Mhz DDR3 Registered RDIMM
- Windows Server 2008 R2 SP1 64 位、Windows Server 2012 Standard、CentOS 6.3 64 位
- 100GB 美光 RealSSD P400e 启动固态硬盘
- LSI 9211-4i SAS/SATA 6.0Gb/s HBA(用于启动 SSD)
- LSI 9207-8i SAS/SATA 6.0Gb/s HBA(用于基准测试 SSD 或 HDD)
应用性能分析
在企业市场中,产品声称在纸面上的表现与它们在生产环境中的表现之间存在巨大差异。 我们了解评估存储作为大型系统组件的重要性,最重要的是存储在与关键企业应用程序交互时的响应速度。 为此,我们推出了我们的第一个应用程序测试,包括我们专有的 MarkLogic NoSQL 数据库存储基准 和 通过 SysBench 的 MySQL 性能.
在我们的 MarkLogic NoSQL 数据库环境中,我们针对可用容量大于或等于 200GB 的单个 PCIe 应用程序加速器测试了四个 SATA 或 SAS SSD 组。 我们的 NoSQL 数据库需要大约 650GB 的可用空间才能使用,平均分配给四个数据库节点。 在我们的测试环境中,我们使用 SCST 主机并在 JBOD 中呈现每个单独的 SSD,每个数据库节点分配一个。 该测试以 24 个间隔重复进行,对于此类 SSD 总共需要 30-36 小时。 测量 MarkLogic 软件看到的内部延迟,我们记录了总平均延迟以及每个 SSD 的间隔延迟。
对于我们在 MarkLogic NoSQL 数据库基准测试中的总体平均延迟排名,3000TB 和 1.2TB 容量的华为 Tecal ES2.4 提供了最佳响应时间。 ES3000 1.2TB 测试为 1.43ms,2.4TB 为 1.31ms。 美光 P320h 的表现次之,但被淘汰出局。 其响应时间为 1.49 毫秒。
华为 ES3000 2.4TB HP 提供了迄今为止整个 PCIe 应用加速器组中最好的延迟,峰值测量范围为 3-6 毫秒。
华为 ES3000 1.2TB HP 提供了该组中第二好的延迟,尽管峰值延迟略微增加到 3.5-9.9 毫秒。
美光 P320h 700GB HP SLC 在该组中排名第三,峰值测量值在 12-17.7 毫秒之间。
Fusion-io ioDrive2 Duo 1.2TB SLC HP 在整体平均延迟方面排名第四,并且在我们的测试过程中深入研究性能,我们注意到峰值测量值在 18-31 毫秒之间。
Virident FlashMAX II 2.2TB HP 在我们的 MarkLogic NoSQL 测试中垫底,尽管它没有最高的延迟峰值,测得为 16-26 毫秒。
我们的下一个应用程序测试包括通过 SysBench 进行的 Percona MySQL 数据库测试,它测量 OLTP 活动的性能。 在此测试配置中,我们使用一组 Lenovo ThinkServer RD630 并将数据库环境加载到单个 SATA、SAS 或 PCIe 驱动器上。 该测试测量平均 TPS(每秒事务数)、平均延迟以及 99 到 2 个线程范围内的平均 32% 延迟。 Percona 和 MariaDB 在其最新版本的数据库中使用 Fusion-io 闪存感知应用程序 API,尽管为了进行比较,我们在其“传统”块存储模式下测试了每个设备。
在我们的 SysBench 测试中,华为 Tecal ES3000 1.2TB 和 2.4TB 提供了最高级别的每秒 I/O。 ES3000 2.4TB 将平均 TPS 从 356 线程时的大约 2 TPS 扩展到 2,735 线程时的 32 TPS。
华为 Tecal ES3000 2.4TB 在 SysBench 中的平均延迟从 5.61 线程时的 2 毫秒扩展到 11.7 线程时的 32 毫秒。
在我们的 SysBench 测试中比较第 99 个百分位的延迟,华为 Tecal ES3000 2.4TB 再次提供了最好的分数,在整个测试中延迟更好,从未超过 20 毫秒的响应时间阈值。 精确数字从 12.25 个线程的 2 毫秒缩放到 19.84 个线程的 32 毫秒。
企业综合工作负载分析
闪存性能在每个存储设备的整个预处理阶段各不相同。 我们的综合企业存储基准流程从分析驱动器在彻底的预处理阶段的运行方式开始。 每个可比较的驱动器都使用供应商的工具进行安全擦除,在 16 个线程的重负载下使用相同的工作负载预处理到稳定状态,每个线程有 16 个未完成队列,然后按设定的时间间隔进行测试在多个线程/队列深度配置文件中显示轻度和重度使用情况下的性能。
预处理和初级稳态测试:
- 吞吐量(读+写 IOPS 聚合)
- 平均延迟(读+写延迟一起平均)
- 最大延迟(峰值读取或写入延迟)
- 延迟标准偏差(读+写标准偏差一起平均)
我们的企业综合工作负载分析包括两个基于实际任务的配置文件。 开发这些配置文件是为了更容易与我们过去的基准测试以及广泛发布的值(例如最大 4k 读写速度和 8k 70/30,通常用于企业硬件)进行比较。
- 4k
- 100% 读取或 100% 写入
- 100% 万
- fio –filename=/dev/sdx –direct=1 –rw=randrw –refill_buffers –norandommap –randrepeat=0 –ioengine=libaio –bs=4k –rwmixread=100 –iodepth=16 –numjobs=16 –runtime=60 –group_reporting –名称=4ktest
- 8k 70/30
- 70% 读取,30% 写入
- 100% 万
- fio –filename=/dev/sdx –direct=1 –rw=randrw –refill_buffers –norandommap –randrepeat=0 –ioengine=libaio –bs=8k –rwmixread=70 –iodepth=16 –numjobs=16 –runtime=60 –group_reporting –名称=8k7030test
对于华为 Tecal ES3000 应用加速器,我们测试了 1.2TB 和 2.4TB 的容量,并分别在 Linux 和 Windows 上进行了测试。 下面的图表将显示每个操作系统的每个容量的数据。 首先,我们将显示在 Linux 中测试的 1.2TB 和 2.4TB 结果,然后我们将提供 1.2TB 和 2.4TB Windows 结果。 需要注意的一点是,我们将 Tecal ES3000 的过度配置功能用于高性能 (HP) 测试模式,您将在图表和数据中看到这种模式,并与库存结果形成对比。
我们的第一个测试测量 100% 4k 随机写入性能,负载为 16T/16Q。 在此设置下,Huawei Tecal ES3000 1.2TB Linux 的爆发特性在 481,000 IOPS 下测试,然后稳定在接近稳态的 171,000 IOPS 水平。 在 HP 模式下,华为 Tecal ES3000 产生了大致相同的突发速度,但在稳态下保持了同类最佳的 260,000-280,000 IOPS。
继续使用 Huawei Tecal ES3000 2.4TB Linux 进行测试,测试的突发速度高达 640,000 IOPS,尽管它们在 250,000 和 640,000 IOPS 之间大幅波动。 HP 模式下的性能稳定在接近稳定状态的同类最佳 250,000-400,000 IOPS 速率和库存 230,000 IOPS。
在 16T/16Q 负载很重的情况下,Huawei Tecal ES3000 1.2TB Linux 的突发时间为 0.53-0.95ms,并在接近稳态时扩大到 1.4-1.5ms 左右。 突发库存数量相似,但在稳定状态下,HP 模式平均保持 1 毫秒。 这些 HP 数据是同类产品中最好的,而库存数据仅略高于 FlashMAX II HP。
Huawei Tecal ES3000 2.4TB Linux 测得的突发时间为 0.4-1ms,并在接近稳态时扩大到大约 1.14ms(Stock)和 1ms(HP)。 HP 的数据是同类产品中最好的,尽管 Fusion ioDrive2 Duo SLC HP 确实略微超过了库存的 ES3000 2.4TB。
比较最大延迟,Huawei Tecal ES3000 1.2TB Linux 的峰值最大响应时间在 30 毫秒范围内,通常以 10-25 毫秒的峰值执行。 HP 模式产生了类似的结果。 这两个数字都不足以击败美光 P320h。
在整个测试期间,华为 Tecal ES3000 2.4TB Linux 在 Stock 和 HP 模式下的数据均保持在 45 毫秒以下。 最好的性能来自美光 P320h,它通常始终保持在 6-15 毫秒的范围内。
更仔细地观察我们 4k 随机写入工作负载的延迟一致性,华为 Tecal ES3000 1.2TB Linux 记录了 0.95 毫秒的峰值,尽管在 HP 模式下 Tecal ES3000 更胜一筹。 它通常保持在 0.4 毫秒以下。 总的来说,这些惠普数据是同类产品中最好的。
华为 Tecal ES3000 2.4TB Linux Stock 表现相当不错,设法保持在 0.81 毫秒以下,最终达到 0.692 毫秒。 在 HP 模式下,ES3000 与 Micron P320h 并列领先。
经过 6 小时的预处理后,Huawei Tecal ES3000 1.2TB Linux 提供了 4k 随机读取性能,达到了 747,000 IOPS(标准和惠普)的最佳水平,写入速度为 176,000 IOPS(标准)和 257,000 IOPS(惠普)。 库存和 HP 读取活动性能均在该组中最高,而 HP 写入性能也是最高的。
华为 Tecal ES3000 2.4TB Linux 提供 4k 随机读取性能,接近 750,000 IOPS,写入速度为 222,610 IOPS(标准)和 HP 模式下的 262,517 IOPS。 读取性能是最高的,虽然 ES3000 的写入性能仅略高于 Fusion ioDrive2 DUO SLC HP,但 ES3000 HP 的表现却名列前茅。
在 16T/16Q 的工作负载下,Huawei Tecal ES3000 1.2TB Linux 提供了平均 4k 的随机读取延迟,以 0.34ms 领先该组,而写入延迟性能达到 stock 1.45ms 和 HP 模式下的 0.99ms。 那个 HP 数字是最好的,尽管它的库存仅次于 FlashMAX II HP。
Huawei Tecal ES3000 2.4TB Linux 提供最佳平均 4k 随机读取延迟,为 0.34ms,其 HP 模式提供最佳写入性能,仅为 0.97ms。
Huawei Tecal ES3000 1.2TB Linux 的最大延迟是两种模式下读写活动的最佳延迟。 Stock 读取时间为 5.67 毫秒,写入时间为 15.04 毫秒,而 HP 模式的数据甚至更低,分别为 4.84 毫秒和 8.58 毫秒(分别)。
Huawei Tecal ES3000 2.4TB Linux 在 Stock 和 HP 模式下提供了最低的最大延迟。
比较延迟一致性,华为 Tecal ES3000 1.2TB Stock 的数据仅次于美光 P320h,但在 HP 模式下,华为在写入活动性能方面优于美光。
Huawei Tecal ES3000 2.4TB HP Linux 在读取活动的延迟一致性方面发布了稳定的 0.248 毫秒标记,在写入活动方面提供了 0.164 毫秒的最佳标记。
在我们的下一个工作负载中,我们查看具有 8/70 读/写混合比率的 30k 配置文件。 在此设置下,华为 Tecal ES3000 1.2TB Linux 实际上在大约 10 分钟后达到峰值,一路飙升至 460,000 IOPS 大关,随后减慢至 190,000 IOPS(Stock)和 280,000 IOPS(HP)左右。 爆发性能领先于竞争对手,甚至击败了 Fusion ioDrive2 Duo SLC HP。 更令人印象深刻的是华为 HP 的数据,它以大约 80,000 IOPS 的优势击败了最接近的竞争对手。
Huawei Tecal ES3000 2.4TB HP Linux 突然达到 490,000+ IOPS 范围,然后减慢到 340,000 IOPS 左右的速度。 爆发性能遥遥领先于竞争对手; 事实上,它比 Stock 版本高出 100,000 IOPS,后者也击败了竞争对手。
在我们的 3000K 1.2/0.65 预处理测试开始时,华为 Tecal ES8 70TB Linux 的平均延迟为 30 毫秒,随着接近稳定状态,库存增加到约 1.35 毫秒,惠普增加到 0.95 毫秒。 HP 模式再次展示了该组所能提供的最佳效果。
Huawei Tecal ES3000 2.4TB HP Linux 在我们的 0.65K 8/70 预处理测试开始时测得为 30ms,随着接近稳定状态,Stock 增加到 1.06ms 左右,HP 增加到 0.74ms。
在我们的 8k 70/30 测试期间,Huawei Tecal ES3000 1.2TB Linux 提供的峰值响应时间主要在低于 50 毫秒的 Stock 范围内,而在低于 40 毫秒的惠普范围内。 然而,Micron P320h 提供了最好的结果。
华为 Tecal ES3000 2.4TB Linux 提供了良好的峰值响应时间,但其最大延迟无法保持 Micron P320h 设定的低于 10 毫秒的速度。
Huawei Tecal ES3000 1.2TB Linux Stock 和 HP 延迟一致性从一小时左右开始达到最低分数,分别为 1.1 毫秒和 0.72 毫秒。
华为 Tecal ES3000 2.4TB Linux 延迟一致性在整个过程中得分最低,分别为 0.62 毫秒(HP)和 0.81 毫秒(库存)。
与我们在 16% 16k 写入测试中执行的固定 100 线程、4 队列最大工作负载相比,我们的混合工作负载配置文件可在各种线程/队列组合中扩展性能。 在这些测试中,我们将工作负载强度从 2 个线程和 2 个队列扩展到 16 个线程和 16 个队列。 在扩展的 8k 70/30 测试中,华为 Tecal ES3000 1.2TB Linux 的峰值约为 189,000 IOPS(Stock)和 277,000 IOPS(HP)——HP 的数据以显着优势位居组首。
华为 Tecal ES3000 2.4TB HP Linux 的峰值约为 341,000 IOPS,稳居组首。
Huawei Tecal ES3000 1.2TB Linux HP 的平均延迟在同类产品中处于领先地位,普通版也击败了大多数竞争对手,仅被 Fusion ioDrive2 Duo SLC HP 淘汰出局。
Huawei Tecal ES3000 2.4TB HP Linux 的平均延迟处于同类领先水平,峰值为 0.8 毫秒。
在我们可变负载 8k 70/30 测试期间,Huawei Tecal ES3000 1.2TB Linux 的最大延迟在峰值时保持在 31 毫秒(标准)和 25 毫秒(HP)以下。
在整个 8k 70/30 测试中,最大延迟一直保持较低水平,但它无法超越 Micron P320h 产生的性能。
在我们的测试环境中,与 Huawei Tecal ES3000 1.2TB Linux 的标准偏差是一流的,无论是库存模式还是 HP 模式。
美光 P320h 在大部分标准偏差测试中占据优势,但华为 Tecal ES3000 2.4TB Linux 在我们测试的终点达到最低峰值。
视窗测试
此时,我们将测试从 Linux 转移到 Windows。 鉴于不同的设备会根据它们是在基于 Linux 还是基于 Windows 的环境中运行而产生不同级别的性能,因此这是该级别测试中的必要步骤。 根据设备的体系结构、固件等,它可能在一种环境中产生比另一种环境高得多的吞吐量和低得多的延迟。
我们的第一个测试测量 100% 4k 随机写入性能,负载为 16T/16Q。 在此设置下,Huawei Tecal ES3000 1.2TB Windows 的爆发特性在 483,000 IOPS 下测试,然后稳定在接近稳定状态的 179,000 IOPS(标准)和同类最佳 279,000 IOPS (HP)。
Huawei Tecal ES3000 2.4TB HP Windows 测试了 582,000 IOPS(562,000 库存),然后分别稳定在 392,000 和 225,000 IOPS 附近的稳定状态。
在 16T/16Q 负载很重的情况下,华为 Tecal ES3000 1.2TB Windows 的突发时间为 0.5-1 毫秒,并在接近稳态时扩大到大约 1.4 毫秒(Stock)和 0.9 毫秒(HP)。
Huawei Tecal ES3000 2.4TB Windows 测得的突发时间为 0.44-0.9ms,在接近稳定状态时分别增加到 0.65ms 和 1.13ms(HP 和 Stock)。
比较最大延迟,华为 Tecal ES3000 1.2TB Windows 在 Stock 和 HP 模式下产生的最大延迟数据低于 15 毫秒,始终保持最一致的性能。
华为 Tecal ES3000 2.4TB Windows 在我们的最大延迟测试过程中提供了更高的一致性,尽管美光 P320h 的得分最低。
进一步观察我们 4k 随机写入工作负载的延迟一致性,华为 Tecal ES3000 1.2TB Windows 被美光 P320h 淘汰。
Huawei Tecal ES3000 2.4TB HP Windows 位于 Micron P320h 的正上方,耗时大约为 0.7ms(而 Micron 约为 0.5ms)。
经过 6 小时的预调后,华为 Tecal ES3000 1.2TB Windows 提供了最佳的 4k 随机读取性能,分别为 580,000 IOPS (Stock) 和 597,000 IOPS (HP),均为组内最佳。 ES3000 的读取活动性能在 HP 模式下也是最好的,测得 277,000 IOPS,Stock 为 177,000 IOPS。
Huawei Tecal ES3000 2.4TB HP Windows 在读取活动中提供 590,000 IOPS,在写入活动中提供 387,000 IOPS。 这两个数字都处于领先地位,其次是 ES3000 股票。
在 16T/16Q 的工作负载下,华为 Tecal ES3000 1.2TB HP Windows 提供了平均 4k 的随机读取延迟,以 0.43ms 领先该组,它还获得了最佳写入延迟性能的称号,为 0.92ms。
Huawei Tecal ES3000 2.4TB Stock 和 HP Windows 均提供了最低的平均延迟数据。 在 HP 模式下,ES3000 2.4TB 读取活动耗时 0.43 毫秒,写入活动耗时 0.66 毫秒。
Huawei Tecal ES3000 1.2TB Windows 的最大延迟是读取活动组中最高的,分别为 48.81 毫秒 (HP) 和 124.38 毫秒 (Stock),尽管其写入活动最大值是该组中最低的,两种模式均仅为 14 毫秒左右.
与 1.2TB 一样,Huawei Tecal ES3000 2.4TB Windows 的读取活动最大延迟性能位于该组的后面,尽管其写入活动性能是该组中最好的。
延迟一致性方面,华为Tecal ES3000 1.2TB Windows在4k随机读写一致性方面的数据接近全组靠后。
Huawei Tecal ES3000 2.4TB Windows 也贴出了组图。
在我们的下一个工作负载中,我们查看具有 8/70 读/写混合比率的 30k 配置文件。 在此设置中,Huawei Tecal ES3000 1.2TB Windows 开始时约为 380,000 IOPS,突发速度峰值为 450-470,000 IOPS,然后降至 192,000 IOPS(标准)和 274,000 IOPS(HP)左右。 HP 的性能轻而易举地击败了竞争对手,而即使在 Stock 中,ES3000 的表现也优于 Fusion ioDrive2 Duo SLC HP 之外的竞争对手,它与之来回纠缠。
Huawei Tecal ES3000 2.4TB HP Windows 爆发时达到 494,000 IOPS 的峰值,然后减慢到 342,000 IOPS 左右的速度。 这里的吞吐量再次被证明是华为的另一个亮点。
在我们的 3000K 1.2/0.65 预处理测试开始时,Huawei Tecal ES8 70TB Windows 的平均延迟为 30ms,随着 ES0.93 接近稳定状态,HP 增加到 1.33ms,Stock 增加到 3000ms。 HP 再次超越竞争对手,在吞吐量排名之后,Fusion HP 和 Huawei Stock 并驾齐驱。
华为 Tecal ES3000 2.4TB HP Windows 在我们的 0.65K 8/70 预处理测试开始时测量为 30ms,增加到 0.75ms(1.06ms Stock)。
在我们的 8k 70/30 测试期间,华为 Tecal ES3000 1.2TB Windows 提供了出色的峰值响应时间,在 HP 模式下保持在 10ms 以下,在 Stock 模式下保持在 15ms 以下。 然而,美光 P320h 是同类产品中最好的,因为大部分测试是低于 8 毫秒的数字。
Huawei Tecal ES3000 2.4TB Windows 提供了出色的峰值响应时间,在大部分测试中最大延迟低于 10 毫秒。 尽管差距很小,但美光 P320h 确实提供了最好的结果。
Huawei Tecal ES3000 1.2TB Windows 延迟一致性从一小时开始就取得了最低分。
华为 Tecal ES3000 2.4TB Windows 的延迟一致性得分最低。
与我们在 16% 16k 写入测试中执行的固定 100 线程、4 队列最大工作负载相比,我们的混合工作负载配置文件可在各种线程/队列组合中扩展性能。 在这些测试中,我们将工作负载强度从 2 个线程和 2 个队列扩展到 16 个线程和 16 个队列。 在扩展的8k 70/30测试中,华为Tecal ES3000 1.2TB HP Windows的峰值约为275,000 IOPS,位居小组首位。 事实上,这个数字比最接近的竞争对手高出近 100,000 IOPS。
华为 Tecal ES3000 2.4TB HP Windows 的峰值约为 337,000 IOPS,以显着优势位居组首。
Huawei Tecal ES3000 1.2TB HP Windows 的平均延迟在同类产品中处于领先地位,Stock 版本仅略微被 Fusion ioDrive2 Duo SLC HP 领先。
华为 Tecal ES3000 2.4TB Windows 在平均延迟方面处于同类领先地位,在 Stock 和 HP 模式下均保持在 1 毫秒以下。
在我们的可变负载 8k 70/30 测试期间,大部分测试的最大延迟保持在 15 毫秒以下,尽管美光 P320h 是这里表现最好的。
华为 Tecal ES3000 2.4TB Windows 在最大延迟方面表现出色,但美光 P320h 再次在此类别中胜出。
在我们的测试环境中,与华为 Tecal ES3000 1.2TB Windows 的标准偏差在 HP 和 Stock 模式下都是一流的。
在大多数测试中,华为 Tecal ES3000 2.4TB Windows 在 HP 和 Stock 模式下仅落后于 Micron P320h,尽管它们在最后设定了最佳速度。
总结
当我们评估华为Tecal ES3000应用加速器的性能时,我们在3000TB和1.2TB容量下测试了ES2.4。 此外,显然不同的环境经历不同的工作负载,因此选择作为 Linux 商店或 Windows 商店运营。 为此,我们在 Linux 和 Windows 中测试了 ES3000。 仅此一项就为 ES3000 带来了强劲的结果,因为它在两种操作系统上保持了相似的性能,使其成为具有任一偏好的组织的最佳选择。 除此之外,我们还在过度配置的 HP(高性能)模式和 Stock 模式下测试了 ES3000,以衡量性能对我们的推动程度。 有了这个,我们显然期望 HP 模式提供更大的吞吐量和更少的延迟,它确实做到了,当我们将 1.2TB 和 2.4TB 相互比较时,我们也期望相同。
具体分解数据,华为 Tecal ES3000 是一款性能最佳的 PCIe 应用程序加速器,在我们测试过的该类别中的所有其他产品中占据主导地位。 ES3000 是一款基于 MLC NAND 的设备,而其中两个同类产品(Fusion ioDrive2 Duo SLC 和 Micron P320h)是基于 SLC 的,因此这一声明更具说服力。 对于 ES3000 来说,提供更大的吞吐量无疑是巨大的,但同时提供更低、更一致的响应时间是一个更大的成就。
从我们专有的 MarkLogic NoSQL 数据库环境开始,华为 Tecal ES3000 2.4TB 提供了 1.31 毫秒的极低平均延迟,峰值仅达到 3-6 毫秒的范围。 这是迄今为止我们测试过的所有 PCIe 应用程序加速器的最低分数。 可比对象的峰值范围至少为 18 毫秒。 然后,我们通过测量 OLTP 活动的 SysBench 继续进行 Percona MySQL 数据库测试。 ES3000 2.4TB 再次表现出色。 在终端队列深度,它产生了 2,735 TPS,QD11.7 的平均延迟为 32 毫秒,QD99 的第 32 个百分位平均值为 19.84 毫秒。 这些数字明显好于可比公司的标示。
然后,我们换档进入我们的企业综合工作负载分析,涵盖 4k 和 8k 随机工作负载,HP 模式下的 ES3000 在 Windows 和 Linux 中提供了最大的吞吐量。 这证明了华为精心设计的驱动程序改进水平。 在 Windows 中,吞吐量最高为 750,000k 读取的 4 IOPS 和 250,000k 写入的 4 IOPS。 对于 Linux,4k 性能在读取活动方面略低,但在写入方面表现更好——分别约为 600,000 IOPS 和 390,000 IOPS。 值得注意的是,在我们的预调节中,ES3000 在 Windows 中要稳定得多,突发速度的变化更小。 转向我们的 8k 70/30 测试,各操作系统的性能相似,达到 325,000 IOPS。 ES3000 还提供了出色的延迟数据,提供同类最佳的平均延迟。 它还在最大延迟和标准偏差方面与 Micron P320h 并驾齐驱,两者交换了第一和第二的位置。
优点
- 在综合和应用程序工作负载中全面表现出色
- 在 Windows 和 Linux 环境中提供强大的性能
- 优于利用 MLC NAND 的 SLC 级性能
缺点
- FHHL 外形可能会限制某些应用
- 冷却要求要求服务器环境内的高流量风扇设置
底线
华为 Tecal ES3000 应用加速器是一项非凡的工程壮举,明确确立了其作为最高层级企业 PCIe 闪存的同类最佳性能者的地位。 虽然华为在美国企业市场上可能不是一个知名品牌,但他们很快就会凭借 ES3000 等产品撼动市场。