首頁 Enterprise 鎧俠 CM6 PCIe 4.0 SSD 評測

鎧俠 CM6 PCIe 4.0 SSD 評測

by 亞當·阿姆斯特朗

NVMe SSD 已成為全面的最佳表現者。 他們一開始在 SAS 和 SATA 驅動器上取得了巨大的飛躍和突破,但近年來在每次迭代中都在慢慢地提高性能。 PCIe 3.0 有一個上限,當前的驅動器正在達到上限。 但現在有了第二代 AMD EPYC 7002 CPU,PCIe 4.0 就在這裡,鎧俠將它與 CM6 SSD 結合使用。

NVMe SSD 已成為全面的最佳表現者。 他們一開始在 SAS 和 SATA 驅動器上取得了巨大的飛躍和突破,但近年來在每次迭代中都在慢慢地提高性能。 PCIe 3.0 有一個上限,當前的驅動器正在達到上限。 但是現在有了二代 AMD 霄龍 7002 CPU, PCIe 4.0 就在這裡,鎧俠將它與 CM6 SSD 結合使用。

鎧俠CM6

KIOXIA 在上屆閃存峰會上發布了新的 PCIe 4.0 驅動器 CM6 和 CD6 作為演示,回到了早已被遺忘的物理事件時代。 當時,它們是第一款 PCIe 4.0 SSD,截至撰寫本文時,CM6 SSD 系列可能仍然是為數不多的企業級 PCIe 4.0 SSD 之一。 新驅動器的重要之處在於更高的性能:據稱達到 6.9GB/s 和 1.4 萬次 IOPS 讀取。 這些是一些令人印象深刻的理論數字。 這些驅動器還帶有帶內 NVMe-MI、持久事件日誌和命名空間粒度。

鎧俠CM6底

KIOXIA CM6 是 U.3 外形尺寸,符合 SFF-TA-1001 標準,允許它們用於支持三模的背板。 CM6 提供從 800GB 到 30.72TB 的各種容量。 根據用戶的需求,這些驅動器分為讀取密集型 (CM6-R) 和混合使用型 (CM6-V)。 除了用例特定模型之外,還有各種安全版本,包括 Sanitize Instat Erase (SIE)、自加密驅動器 (SED) 和 FIPS 140-2(2 級)模型。 該驅動器是雙端口的,以提供高可用性。

鎧俠CM6側面

對於本次評測,我們正在研究容量為 6TB 的鎧俠 CM6.4-V。

鎧俠 CM6 PCIe 4.0 規格

型號 CM6-R(精讀) CM6-V(混合用途)
外形 2.5 英寸 15 毫米 Z 軸高度
容量1 960GB、1.92TB、3.84TB、7.68TB、15.36TB、30.72TB 800GB、1.6TB、3.2TB、6.4TB、12.8TB
介面 PCIe Gen3 / 4、1×4 和 2×2
法規守則 PCIe 4.0 和 NVMe 1.4
NAND型 KIOXIA BiCS FLASH96層3D TLC
順序閱讀 Gen3 = 高達 3,500MB/s
Gen4 = 高達 6,900MB/s
Gen3 = 高達 3,500MB/s
Gen4 = 高達 6,900MB/s
順序寫入 Gen3 = 高達 3,100MB/s
Gen4 = 高達 4,200MB/s
Gen3 = 高達 3,100MB/s
Gen4 = 高達 4,200MB/s
隨機閱讀 Gen3 = 高達 800K IOPS
Gen4 = 高達 1.4M IOPS
Gen3 = 高達 800K IOPS
Gen4 = 高達 1.4M IOPS
隨機寫入 Gen3 = 高達 155K IOPS
Gen4 = 高達 170K IOPS
Gen3 = 高達 290K IOPS
Gen4 = 高達 350K IOPS
電源消耗功率 有源:20W; 閒置:<5W
耐力 1 DWPD 5 年 3 DWPD 5 年
不可糾正的誤碼率 每 1^10 位讀取 17 個扇區
平均無故障時間/平均故障率 2.5 萬小時 / 0.35%
工作溫度 0至70C

性能

試驗台

我們新的 PCIe Gen4 Enterprise SSD 評測利用了 聯想 ThinkSystem SR635 用於應用程序測試和綜合基準。 ThinkSystem SR635 是一個裝備精良的單 CPU AMD 平台,提供的 CPU 能力遠遠超過強調高性能本地存儲所需的能力。 它也是我們實驗室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市場上為數不多的平台之一)。 綜合測試不需要大量 CPU 資源,但仍利用相同的 Lenovo 平台。 在這兩種情況下,目的都是以盡可能符合存儲供應商最大驅動器規格的最佳方式展示本地存儲。

PCIe Gen4綜合及應用平台(Lenovo ThinkSystem SR635)

  • 1 個 AMD 7452(2.35GHz x 32 核)
  • 8 x 64GB DDR4-3200MHz ECC 內存
  • CentOS的7.7 1908
  • ESXi 6.7u3

PCIe Gen3 應用平台 (聯想 ThinkSystem SR850)

  • 4 個 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 內存
  • 2 個 RAID 930-8i 12Gb/s RAID 卡
  • 8 個 NVMe 托架
  • VMware ESXI 6.7u3

PCIe Gen3 綜合平台 (戴爾 PowerEdge R740xd)

  • 2 個英特爾金牌 6130 CPU(2.1GHz x 16 核)
  • 4 x 16GB DDR4-2666MHz ECC 內存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 適配器
  • Ubuntu-16.04.3-桌面-amd64

作為新平台上的第一組評論,我們包括了過去的驅動結果,這些結果很接近但不是 100% 的同類比較,因為它們是在舊平台上進行測試的。 我們的綜合測試差異不會在結果上產生太大偏差,但在單 CPU AMD 平台與四 CPU Intel 平台上運行的應用程序工作負載可能在某種程度上存在差異。 在我們的 MySQL 測試中,一款新的 Gen4 KIOXIA 產品確實領先,但在 SQL Server 中延遲是平均水平。 只有兩個 Gen4 驅動器,我們已經能夠發布我們沒有大量的可比較數據,但在查看這些結果時需要注意。 我們還加強了綜合測試以利用更快的 SSD,現在顯示的測試結果具有更高的峰值線程數。

測試背景和比較

 StorageReview 企業測試實驗室 提供了一個靈活的架構,用於在與管理員在實際部署中遇到的環境相當的環境中對企業存儲設備進行基準測試。 企業測試實驗室結合了各種服務器、網絡、電源調節和其他網絡基礎設施,使我們的員工能夠建立真實世界的條件,以便在我們的審查期間準確地衡量性能。

我們將這些關於實驗室環境和協議的詳細信息納入審查,以便 IT 專業人員和負責存儲采購的人員能夠了解我們取得以下成果的條件。 我們的評論都不是由我們正在測試的設備製造商支付或監督的。 有關的其他詳細信息 StorageReview 企業測試實驗室 以及其網絡功能的概述可在這些相應頁面上找到。

應用程序工作負載分析

為了了解企業存儲設備的性能特徵,必須對實時生產環境中的基礎架構和應用程序工作負載進行建模。 因此,我們對鎧俠 CM6 的基準測試是 通過 SysBench 的 MySQL OLTP 性能   Microsoft SQL Server OLTP 性能 具有模擬的 TCP-C 工作負載。 對於我們的應用程序工作負載,每個驅動器將運行 4 個配置相同的虛擬機。

SQL Server 性能

每個 SQL Server VM 都配置有兩個虛擬磁盤:100GB 卷用於啟動,500GB 卷用於數據庫和日誌文件。 從系統資源的角度來看,我們為每個虛擬機配置了 8 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。 雖然我們之前測試的 Sysbench 工作負載在存儲 I/O 和容量方面使平台飽和,但 SQL 測試正在尋找延遲性能。

此測試使用在 Windows Server 2014 R2012 來賓虛擬機上運行的 SQL Server 2,並由 Quest 的數據庫基準工廠進行壓力測試。 存儲評論的 Microsoft SQL Server OLTP 測試協議 採用事務處理性能委員會基準 C (TPC-C) 的當前草案,這是一種在線事務處理基準,可模擬複雜應用程序環境中的活動。 TPC-C 基準比綜合性能基準更接近於衡量數據庫環境中存儲基礎設施的性能優勢和瓶頸。 我們用於本次審核的 SQL Server VM 的每個實例都使用 333GB(1,500 規模)的 SQL Server 數據庫,並測量 15,000 個虛擬用戶負載下的事務性能和延遲。

SQL Server 測試配置(每個虛擬機)

  • 在Windows Server 2012 R2
  • 存儲空間:分配 600GB,使用 500GB
  • SQL Server 2014的
    • 數據庫大小:1,500 規模
    • 虛擬客戶端負載:15,000
    • 內存緩衝區:48GB
  • 測試時長:3 小時
    • 2.5 小時預處理
    • 30分鐘採樣期

在我們的 SQL Server 事務基準測試中,KIOXIA CM6 以 12,633.6 TPS 的總成績排名第四,儘管它僅比表現最佳者低 10.6 TPS。

鎧俠 CM6 SQL TPS

對於 SQL Server 平均延遲,CM6 的平均延遲為 5.5 毫秒,與其同類 CD6 SSD 相同。

系統性能

下一個應用程序基準包括 Percona MySQL OLTP 數據庫 通過 SysBench 測量。 該測試測量平均 TPS(每秒事務數)、平均延遲和平均 99% 延遲。

每 系統平台 VM 配置了三個虛擬磁盤:一個用於引導 (~92GB),一個用於預建數據庫 (~447GB),第三個用於測試中的數據庫 (270GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 8 個 vCPU、60GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。

Sysbench 測試配置(每個虛擬機)

  • 中央操作系統 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 數據庫表:100
    • 數據庫大小:10,000,000
    • 數據庫線程:32
    • 內存緩衝區:24GB
  • 測試時長:3 小時
    • 2 小時預處理 32 個線程
    • 1 小時 32 個線程

查看我們的 Sysbench 事務基準,KIOXIA CM6 的 TPS 為 8,632 TPS,再次在我們的同類產品中排名第四。

鎧俠 CM6 Sysbench TPS

在 Sysbench 平均延遲方面,CM6 以 14.82 毫秒再次排名第四。

對於我們最壞情況下的延遲(第 99 個百分位數),CM6 保持在舒適的位置,排在第四位,為 29.86 毫秒。

VDBench 工作負載分析

在對存儲設備進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備建立基線,從而可以輕鬆地在競爭解決方案之間進行同類比較。 這些工作負載提供了一系列不同的測試配置文件,從“四個角”測試、常見的數據庫傳輸大小測試到來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。 我們針對這些基準測試的測試過程用數據填充整個驅動器表面,然後將驅動器部分分區為驅動器容量的 25%,以模擬驅動器如何響應應用程序工作負載。 這與使用 100% 的驅動器並使它們進入穩定狀態的全熵測試不同。 因此,這些數字將反映更高的持續寫入速度。

簡介:

  • 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
  • 4K 隨機寫入:100% 寫入,128 線程,0-120% iorate
  • 4K 隨機讀取(高負載):100% 讀取,512 線程,0-120% 迭代
  • 4K 隨機寫入(高負載):100% 寫入,512 線程,0-120% iorate
  • 64K 順序讀取:100% 讀取,32 線程,0-120% 迭代
  • 64K 順序寫入:100% 寫入,16 個線程,0-120% 迭代
  • 64K 順序讀取(高負載):100% 讀取,64 線程,0-120% iorate
  • 64K 順序寫入(高負載):100% 寫入,64 個線程,0-120% iorate
  • 綜合數據庫:SQL 和 Oracle
  • VDI 完整克隆和鏈接克隆跟踪

比較:

在我們的第一個 VDBench 工作負載分析,隨機 4K 讀取中,KIOXIA CM6 在 846,288µs 的延遲下以 150 IOPS 的峰值性能表現令人印象深刻。 這使驅動器處於首位。

鎧俠CM6 4K讀取

新的 PCIe 4.0 驅動器可以承受更高的負載,如果我們不更努力地推動它們看看它們能做什麼,我們就是失職了。 因此,在隨機 4K 讀取高負載下,CM6 能夠以 1,507,564µs 的延遲達到 337.9 IOPS 的峰值。 比它的 CD6 對應物好得多。

鎧俠CM6 4K讀高

對於隨機 4K 寫入,總體排名第三。 它以低於 100µs 的延遲運行,直到大約 490K IOPS,並在 548,169µs 的延遲下達到 226.4 IOPS 的峰值。

隨機 4K 寫入高負載看到 CM6 繼續達到 549,103 IOPS 的峰值,這次延遲為 922µs,落後於 CD6。

切換到順序工作負載後,CM6 有機會再次大放異彩,以 64 IOPS 或 97,779GB/s 的峰值得分和僅 6.11µs 的延遲在 325K 讀取中名列前茅。

鎧俠CM6 64k讀取高負載 64K 順序讀取類似於 4K 讀取中的放置,CM6 峰值為 101,018 IOPS 或 6.3GB/s,延遲為 629µs。

鎧俠CM6 64K讀高64K 寫入顯示 CM6 的峰值得分很高,但在達到峰值後性能有所下降,排在第三位。 峰值性能約為 49K IOPS 或 3.1GB/s,延遲約為 50µs。

高負載 64K 順序寫入看到 CM6 有更高的峰值,但隨後性能下降。 CM6 的峰值約為 49K IOPs 或 3.1GB/s,延遲非常低,我們在下降之前幾乎看不到它。

我們的下一組測試是我們的 SQL 工作負載:SQL、SQL 90-10 和 SQL 80-20。 從 SQL 開始,KIOXIA CM6 以 266,458 IOPS 的峰值和 119µs 的延遲位居第二。

 

對於 SQL 90-10,CM6 再次獲得第二名,峰值性能為 265,276 IOPS,延遲為 119.2µs。

SQL 80-20 以 6 IOPS 263,819µs 的峰值性能位居第一,讓 CM119.4 有機會炫耀。

接下來是我們的 Oracle 工作負載:Oracle、Oracle 90-10 和 Oracle 80-20。 從 Oracle 開始,CM6 再次獲得第一,峰值性能為 271,230 IOPS,延遲為 128.6µs。

Oracle 90-10 的 CM6 位居第二,峰值性能為 202,341 IOPS,延遲僅為 107.4µs。

CM6 以 80 IOPS 的峰值和 20µs 的低延遲在 Oracle 206,733-104.7 中再次獲得第一名。

接下來,我們切換到我們的 VDI 克隆測試,完整和鏈接。 對於 VDI 完整克隆 (FC) 啟動,CM6 以 223,668 IOPS 和 153.5µs 的延遲位居榜首。

對於 VDI FC 初始登錄,CM6 以 154,836 IOPS 的峰值性能下滑至第三位,延遲為 189µs。

在我們的 VDI FC Monday Login 基準測試中,CM6 以 98,867 IOPS 的峰值和 158.4µs 的延遲排在第三位。

對於 VDI 鏈接克隆 (LC) 引導,鎧俠 CM6 以 115,058 IOPS 的峰值得分重回榜首,延遲為 137.7µs。

VDI LC 初始登錄在圖表中有點難以閱讀,但 CM6 以 38,848 IOPS 的峰值處於中間位置,延遲為 202.4µs,然後有所下降。

最後,VDI LC Monday Login 讓 CM6 再次表現最佳,峰值得分為 96,008 IOPS,延遲為 162.5µs。

結論

KIOXIA CM6 即使不是第一款面向企業的 PCIe 4.0 SSD 也是其中之一。 新驅動器承諾具有更高的性能,在這種情況下高達 6.9GB/s 和高達 1.4 萬次 IOPS。 CM6 是雙端口的,為驅動器增加了一個級別的高可用性。 該驅動器的容量範圍很廣,從 800GB 到高達 30.72TB,中間有 9 種容量選項。 CM6 具有讀取密集型和混合使用模型,分別具有 1 和 3 DWPD。 SSD 附帶多種安全型號選項。

對於性能,我們運行了我們通常的應用程序工作負載分析和 VDBench,但有一些例外。 我們不得不跳過 Houdini 測試,因為測試平台是英特爾,而 KIOXIA 驅動器會受到 Gen3 端口的阻礙。 在 VDBench 上,我們添加了更高的負載測試,以對新驅動器施加更多壓力,因為它們旨在處理它。

在我們的應用程序工作負載分析中,我們運行了 SQL Server 和 Sysbench。 對於 SQL Server,CM6 在 TPS 和平均延遲方面均排名第四,為 12,633.6 TPS 和 5.5ms,仍然是非常好的分數。 在 Sysbench 中,該驅動器以 8,632 TPS、14.82 毫秒的平均延遲和我們最壞情況下的 29.86 毫秒再次全面排名第四。

在 VDBench 中,驅動器真的很閃耀。 CM6 在我們的幾個基準測試中表現最好。 基本亮點包括846K讀取4K IOPS,1.5K讀取高負載4萬I​​OPS,548K寫入4K IOPS,549K寫入高負載4K IOPS,6.1K讀取64GB/s,6.3K讀取高負載64GB/s,在 3.1K 寫入和 64K 寫入高負載下均為 64GB/s。 SQL 的峰值為 266K IOPS,SQL 265-90 為 10K IOPS,SQL 264-80 為 20K IOPS。 Oracle 在 Oracle 271-202 中為我們提供了 90K IOPS、10K IOPS 和 Oracle 207-80 中的 20K IOPS 峰值。 VDI FC 為我們提供了 224K IOPS 啟動、155K IOPS 初始登錄和 99K IOPS 星期一登錄。 VDI LC 看到 115K IOPS 啟動、39K IOPS 初始登錄和 96K IOPS 星期一登錄。

這篇評論和 CD6 的評論具體審視了 PCIe 4.0 和更多存儲設備進入市場的未來。 為 PCIe 4.0 提供前端到後端支持的服務器供應商並不多,在撰寫本文時,聯想是我們實驗室中的唯一一家。 聯想迅速抓住了第二代 AMD EPYC 2 處理器提供的所有優勢,期待 KIOXIA CM7002 等存儲產品。 但對於鎧俠來說,這讓他們處於領先於其他人的有趣位置,但他們的驅動器的全部潛力只有在更新的、基於 AMD 的服務器上才能發揮出來(直到英特爾決定也加入遊戲)。 目前,CM6 仍將在傳統設備中工作,並準備好在公司升級時釋放更多性能。

鎧俠企業級固態硬盤

在 Reddit 上討論

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱