首頁 Enterprise Memblaze PBlaze5 910 U.2 NVMe SSD 評測

Memblaze PBlaze5 910 U.2 NVMe SSD 評測

by 亞當·阿姆斯特朗

在北京舉行的 Step Ahead 活動期間,Memblaze 推出了新系列的 500 NVME 驅動器,並將其 900 系列擴展為 910 和 916。我們將在本次評測中關注 910 系列。 新的 910 驅動器提供兩種外形規格,並利用 64 層 3D NAND,這使得驅動器的容量高達 16TB。 這種更高的密度可以導致數據中心中更密集的機架或機架整合。


在北京舉行的 Step Ahead 活動期間,Memblaze 推出了新系列的 500 NVME 驅動器,並將其 900 系列擴展為 910 和 916。我們將在本次評測中關注 910 系列。 新的 910 驅動器提供兩種外形規格,並利用 64 層 3D NAND,這使得驅動器的容量高達 16TB。 這種更高的密度可以導致數據中心中更密集的機架或機架整合。

Memblaze PBlaze64 5 除了利用 910 層來達到更高的容量外,還聲稱比以前的型號具有更高的性能。 該公司表示,該驅動器可以實現高達 3.5GB/s 的順序讀取和高達 835K IOPS 的吞吐量,同時具有亞毫秒級延遲。 該驅動器還具有內置的高可用性,是雙端口的,因此消除了單一故障路徑。 910 具有 1 DWPD 的耐力以及 XNUMX 萬小時的 MTBF。 理想的用例包括:數據庫、搜索、索引、CDN、雲和超大規模、SDS、深度學習和大數據分析、ERP、SAP HANA、BOSS、銀行、稅務、高頻交易和在線支付。

對於本次審查,我們將查看 PBlaze3.84 2 的 5TB U.910。

Memblaze PBlaze5 910 NVMe SSD 規格

外形尺寸 U.2
容量 3.84TB 7.68TB 15.36TB
NAND閃存 3D薄層色譜
介面 PCIe 3.0 x 4
協議 NVMe 1.2a
性能
順序讀取 (128KB) 3.5GB /秒 3.5GB /秒 3.3GB /秒
順序寫入 (128KB) 3.1GB /秒 3.5GB /秒 3.3GB /秒
持續隨機讀取 (4KB) 835K IOPS 830K IOPS 826K IOPS
持續隨機寫入 (4KB) 99K IOPS 135K IOPS 150K IOPS
延遲讀/寫 87 /12μs
DWPD 1
UBER <10^-17
平均無故障時間 2萬小時
能量消耗  7〜25W

性能

試驗台

我們的企業級 SSD 評測利用 Lenovo ThinkSystem SR850 進行應用程序測試和 戴爾 PowerEdge R740xd 用於綜合基準。 ThinkSystem SR850 是一個裝備精良的四 CPU 平台,提供的 CPU 能力遠遠超過對高性能本地存儲施加壓力所需的能力。 不需要大量 CPU 資源的綜合測試使用更傳統的雙處理器服務器。 在這兩種情況下,目的都是以盡可能符合存儲供應商最大驅動器規格的最佳方式展示本地存儲。

聯想 ThinkSystem SR850

  • 4 個 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 內存
  • 2 個 RAID 930-8i 12Gb/s RAID 卡
  • 8 個 NVMe 托架
  • VMware ESXI 6.5

戴爾 PowerEdge R740xd

  • 2 個英特爾金牌 6130 CPU(2.1GHz x 16 核)
  • 16 x 16GB DDR4-2666MHz ECC 內存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 適配器
  • Ubuntu-16.04.3-桌面-amd64

測試背景和比較

 StorageReview 企業測試實驗室 提供了一個靈活的架構,用於在與管理員在實際部署中遇到的環境相當的環境中對企業存儲設備進行基準測試。 企業測試實驗室結合了各種服務器、網絡、電源調節和其他網絡基礎設施,使我們的員工能夠建立真實世界的條件,以便在我們的審查期間準確地衡量性能。

我們將這些關於實驗室環境和協議的詳細信息納入審查,以便 IT 專業人員和負責存儲采購的人員能夠了解我們取得以下成果的條件。 我們的評論都不是由我們正在測試的設備製造商支付或監督的。 有關的其他詳細信息 StorageReview 企業測試實驗室   其網絡功能的概述 在這些相應的頁面上可用。

本次審查的可比性:

應用程序工作負載分析

為了了解企業存儲設備的性能特徵,必須對實時生產環境中的基礎架構和應用程序工作負載進行建模。 因此,我們對 Memblaze PBlaze5 910 的基準測試是 通過 SysBench 的 MySQL OLTP 性能   Microsoft SQL Server OLTP 性能 具有模擬的 TCP-C 工作負載。 對於我們的應用程序工作負載,每個驅動器將運行 2-4 個配置相同的虛擬機。

SQL Server 性能

每個 SQL Server VM 都配置有兩個虛擬磁盤:100GB 卷用於啟動,500GB 卷用於數據庫和日誌文件。 從系統資源的角度來看,我們為每個 VM 配置了 16 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。 雖然我們之前測試的 Sysbench 工作負載在存儲 I/O 和容量方面使平台飽和,但 SQL 測試正在尋找延遲性能。

此測試使用在 Windows Server 2014 R2012 來賓虛擬機上運行的 SQL Server 2,並由 Quest 的數據庫基準工廠進行壓力測試。 存儲評論的 Microsoft SQL Server OLTP 測試協議 採用事務處理性能委員會基準 C (TPC-C) 的當前草案,這是一種在線事務處理基準,可模擬複雜應用程序環境中的活動。 TPC-C 基準比綜合性能基準更接近於衡量數據庫環境中存儲基礎設施的性能優勢和瓶頸。 我們用於本次審核的 SQL Server VM 的每個實例都使用 333GB(1,500 規模)的 SQL Server 數據庫,並測量 15,000 個虛擬用戶負載下的事務性能和延遲。

SQL Server 測試配置(每個虛擬機)

  • 在Windows Server 2012 R2
  • 存儲空間:分配 600GB,使用 500GB
  • SQL Server 2014的
    • 數據庫大小:1,500 規模
    • 虛擬客戶端負載:15,000
    • 內存緩衝區:48GB
  • 測試時長:3 小時
    • 2.5 小時預處理
    • 30分鐘採樣期

對於我們的 SQL Server 事務基準測試,Memblaze PBlaze5 910 U.2 以 12,546.5 TPS 墊底,低於其他三個 PBlaze 驅動器。 

令人驚訝的是,910 的延遲也最高,為 38.8 毫秒。 

系統性能

下一個應用程序基準包括 Percona MySQL OLTP 數據庫 通過 SysBench 測量。 該測試測量平均 TPS(每秒事務數)、平均延遲和平均 99% 延遲。

每 系統平台 VM 配置了三個虛擬磁盤:一個用於引導 (~92GB),一個用於預建數據庫 (~447GB),第三個用於測試中的數據庫 (270GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU、60GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。

Sysbench 測試配置(每個虛擬機)

  • 中央操作系統 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 數據庫表:100
    • 數據庫大小:10,000,000
    • 數據庫線程:32
    • 內存緩衝區:24GB
  • 測試時長:3 小時
    • 2 小時預處理 32 個線程
    • 1 小時 32 個線程

在 Sysbench 事務基準測試中,U.2 910 的表現更好,達到了 6,664.6 TPS,處於測試包的中間位置。 

憑藉 Sysbench 平均延遲,U.2 910 再次以 19.2 毫秒的延遲處於中間位置。 

在我們最壞情況下的延遲基準測試中,U.2 910 以 37.8 毫秒再次落在中間附近。

SideFX 的胡迪尼

Houdini 測試專門用於評估與 CGI 渲染相關的存儲性能。 此應用程序的測試台是核心的變體 戴爾 PowerEdge R740xd 我們在實驗室中使用的服務器類型具有雙 Intel 6130 CPU 和 64GB DRAM。 在這種情況下,我們安裝了運行裸機的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基準測試的輸出以秒為單位來衡量,越少越好。

Maelstrom 演示代表了渲染管線的一部分,它通過演示其有效使用交換文件作為擴展內存形式的能力來突出存儲的性能。 測試不會寫出結果數據或處理點,以隔離延遲對底層存儲組件的影響。 測試本身由五個階段組成,我們將其中三個階段作為基準測試的一部分運行,如下所示:

  1. 從磁盤加載打包點。 這是從磁盤讀取的時間。 這是單線程的,可能會限制整體吞吐量。
  2. 將點解壓縮到一個平面數組中,以便對其進行處理。 如果這些點不依賴於其他點,則可以調整工作集以保留在核心中。 這一步是多線程的。
  3. (不運行)處理點。
  4. 將它們重新打包成適合存儲回磁盤的分桶塊。 這一步是多線程的。
  5. (未運行)將分桶塊寫回磁盤。

在 Houdini 測試中,910 U.2 處於中低端,但與其他 Memblaze 產品一致,得分為 3,093.8 秒。

VDBench 工作負載分析

在對存儲設備進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備建立基線,從而可以輕鬆地在競爭解決方案之間進行同類比較。 這些工作負載提供了一系列不同的測試配置文件,從“四個角”測試、常見的數據庫傳輸大小測試到來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。 我們針對這些基準測試的測試過程用數據填充整個驅動器表面,然後將驅動器部分分區為驅動器容量的 25%,以模擬驅動器如何響應應用程序工作負載。 這與使用 100% 的驅動器並使它們進入穩定狀態的全熵測試不同。 因此,這些數字將反映更高的持續寫入速度。

簡介:

  • 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
  • 4K 隨機寫入:100% 寫入,64 線程,0-120% iorate
  • 64K 順序讀取:100% 讀取,16 線程,0-120% 迭代
  • 64K 順序寫入:100% 寫入,8 個線程,0-120% 迭代
  • 綜合數據庫:SQL 和 Oracle
  • VDI 完整克隆和鏈接克隆跟踪

在我們的第一個 VDBench 工作負載分析隨機 4K 讀取中,Memblaze PBlaze5 910 U.2 能夠始終保持在 1 毫秒以下,峰值為 665,679 IOPS,延遲為 191.3 微秒,驅動器大致處於中間位置。 

4K 隨機寫入再次出現亞毫秒級延遲。 910 U.2 以 296,639 IOPS 的峰值性能和 429.6μs 的延遲排名倒數第二。

切換到順序工作負載後,910 U.2 再次在 64K 順序讀取中排名倒數第二,峰值得分為 38,472 IOPS 或 2.4GB/s,延遲為 415.3μs。

910 U.2 排在倒數第二位,在 18K 順序寫入中以約 1.1K IOPS 或 870GB/s 的延遲達到約 64μs 的峰值。 

轉到 SQL 工作負載,910 U.2 的峰值為 243,228 IOPS,延遲僅為 130.4μs,總體排名第四。

SQL 90-10 看到 910 以 232,061 IOPS 的峰值得分和 136.5μs 的延遲保持第四名。

910 U.2 仍然排名第四,在 SQL 220,195-144.6 基準測試中達到 80 IOPS 的峰值,延遲為 20μs。

對於我們的 Oracle 工作負載,910 U.2 以 212,052 IOPS 的峰值得分和 168.5 微秒的延遲繼續保持在第四位。

對於 Oracle 90-10,910 U.2 以 180,723 IOPS 的峰值和 121.1μs 的延遲排在第三位。

在 Oracle 80-20 中,910 幾乎與 900 並列第三,峰值性能為 177,143 IOPS,延遲為 123.5μs。

接下來,我們繼續我們的 VDI 克隆測試,完整和鏈接。 對於 VDI Full Clone Boot,910 U.2 以 176,239 IOPS 的峰值性能和 197.9μs 的延遲排名第四。

VDI FC Initial Login 看到 910 U.2 仍然排在第四位,但遠遠落後於前三名,峰值性能為 66,925 IOPS,延遲為 445.1μs。

在 VDI FC Monday Login 中,910 U.2 以 67,309 IOPS 和 235.7μs 的延遲位居第四。

切換到鏈接克隆 (LC),我們首先查看啟動測試。 在這裡,910 U.2 以 83,210 IOPS 和 191.2μs 的延遲排名第四。

VDI LC Initial Login 的 910 U.2 以 40,035 IOPS 和 197.4μs 的延遲穩居第四。

最後,VDI LC Monday Login 的 910 U.2 峰值為 45,349 IOPS,延遲為 349μs,再次位居第四。

結論

Memblaze PBlaze5 910 是該公司採用 64 層 3D NAND 的新型 NVMe 數據中心驅動器。 該驅動器有兩種外形尺寸(本次評測為 U.2),容量為 3.84TB、7.68TB 和 15.36TB。 Memblaze 聲稱讀取速度高達 3.5GB/s,寫入速度高達 3.5GB/s,吞吐量高達 835K IOPS 讀取和 150K IOPS 寫入。 該驅動器滿足大量用例的標準,並配備 AES 256 數據加密等安全選項,並支持高達 8TB/s 的 TRIM 功能。 

在應用程序工作負載分析性能方面,910 U.2 在我們的 SQL Server 基準測試中排名最後,為 12,546.5 TPS,平均延遲為 38.8 毫秒。 在 Sysbench 中,該驅動器以 6,664.6 TPS 的平均延遲為 19.2 毫秒,在最壞情況下的延遲為 37.8 毫秒,在中間位置的表現稍好一些。 在我們的 SideFX Houdini 基準測試中,910 U.2 的得分為 3,093.8 秒,處於該領域的低端,但與其他 Memblaze 產品一致。 

對於 VDBench,Memblaze PBlaze5 910 U.2 在所有測試中都有亞毫秒級延遲。 在所有測試中,該驅動器往往落在包裝的中間到中間底部。 主要結果包括 666K 讀取時 4K IOPS、297K 寫入時 4K IOPS、2.4K 讀取時 64GB/s 和 1.1K 寫入時 64GB/s。 SQL 結果保持大約 177 萬次 IOPS,而 Oracle 測試運行在 212K IOPS 和 XNUMXK IOPS 之間。 

總體而言,它表現不錯,但與上一代 PBlaze5 900 相比,性能確實開始下滑。

記憶 PBlaze5 910

討論這篇評論

註冊 StorageReview 時事通訊