首頁 Enterprise 鎧俠 CD6 PCIe 4.0 SSD 評測

鎧俠 CD6 PCIe 4.0 SSD 評測

by 萊爾·史密斯
鎧俠CD6前視圖

NVMe 接口,特別是 PCIe 3.0 NVMe 1.3,一段時間以來一直是幾乎所有用例的首選 SSD 接口。 隨著供應商不斷提高每一代產品的性能,此接口已被反複使用。 PCIe 現已進入 4.0,帶來了順序和隨機性能的巨大提升。 KIOXIA CD6 是最新上市的 SSD(也是首批面向企業的 PCIe 4.0 之一),專注於在苛刻的 24×7 環境中保持一致的性能。 這使其成為具有混合使用和讀取密集型耐用性需求的數據中心的理想選擇。 KIOXIA CD6 SSD 也符合 SFF-TA-1001 標準,允許在同一背板上連接 SAS、SATA 和 NVMe 驅動器(以及三模控制器)。 KIOXIA 系列的容量從 800GB 到 15.36TB 不等,並提供多種不同的安全性和耐用性選項。

NVMe 接口,特別是 PCIe 3.0 NVMe 1.3,一段時間以來一直是幾乎所有用例的首選 SSD 接口。 隨著供應商不斷提高每一代產品的性能,此接口已被反複使用。 PCIe 現已進入 4.0,帶來了順序和隨機性能的巨大提升。 KIOXIA CD6 是最新上市的 SSD(也是首批面向企業的 PCIe 4.0 之一),專注於在苛刻的 24×7 環境中保持一致的性能。 這使其成為具有混合使用和讀取密集型耐用性需求的數據中心的理想選擇。 KIOXIA CD6 SSD 也符合 SFF-TA-1001 標準,允許在同一背板上連接 SAS、SATA 和 NVMe 驅動器(以及三模控制器)。 KIOXIA 系列的容量從 800GB 到 15.36TB 不等,並提供多種不同的安全性和耐用性選項。 CD6 還採用 2.5 英寸、15 毫米 Z 高度外形尺寸,並由鎧俠的專有控制器、固件和 BiCS FLASH 96 層 3D TLC 內存提供支持。 它採用單端口設計(即從主機到SSD只有一條數據路徑)。

4 年 2 月 22 日更新 – 我們重新審查了 鎧俠CD6 固件更成熟

鎧俠CD6前視圖

PCIe 4.0 的性能有可能達到一些相當令人難以置信的數字,鎧俠 CD6 當然也不例外。 KIOXIA 引用了他們的新驅動器系列,分別提供高達 6.2GB/s 和 4.0GB/s 的讀取和寫入順序性能,而隨機性能有可能達到高達 250,000 萬次讀取 IOPS 和 XNUMX 次寫入 IOPS。 這些至少可以說是令人印象深刻的數字。

鎧俠CD6後視圖

它還具有一系列內置可靠性功能,包括第 6 代驅動器故障恢復、雙奇偶校驗保護、斷電保護 (PLP)、端到端數據校正以提供額外的可靠性。 KIOXIA CD6 符合 NVMe 1.4 標準,為驅動器帶來了一些重要功能。 這包括持久事件日誌、清理改進和命名空間粒度以及命名空間寫保護。

KIOXIA CD6 端口/側視圖

鎧俠 CD6 規格

規範 CM6-R(精讀) CM6-V(混合用途)
外形

2.5 英寸 15 毫米 Z 軸高度

容量[1][2] 960GB、1.92TB、3.84TB、 7.68TB, 15.36TB 800GB、1.6TB、3.2TB、6.4TB、12.8TB
介面 PCIe Gen3/4,1×4
法規守則 PCIe 4.0 和 NVMe 1.4
NAND型 KIOXIA BiCS FLASH 96 層 3D TLC
順序閱讀 Gen3 = 高達 3,500MB/s; Gen4 = 高達 6,200MB/s Gen3 = 高達 3,500MB/s; Gen4 = 高達 6,200MB/s
順序寫入 Gen3 = 高達 2,350MB/s; Gen4 = 高達 4,000MB/s Gen3 = 高達 2,350MB/s; Gen4 = 高達 4,000MB/s
隨機閱讀 Gen3 = 高達 770K IOPS; Gen4 = 高達 1.0M IOPS Gen3 = 高達 770K IOPS; Gen4 = 高達 1.0M IOPS
隨機寫入 Gen3 = 高達 75K IOPS; Gen4 = 高達 85K IOPS Gen3 = 高達 165K IOPS; Gen4 = 高達 250K IOPS
電源消耗功率

有源:20W; 閒置:<5W

耐力 1 DWPD 5 年 3 DWPD 5 年
不可糾正的誤碼率

每 1^10 位讀取 17 個扇區

平均無故障時間/平均故障率

2.5 萬小時 / 0.35%

工作溫度

0至70C

鎧俠 CD6 性能

試驗台

我們新的 PCIe Gen4 Enterprise SSD 評測利用了 聯想 ThinkSystem SR635 用於應用程序測試和綜合基準。 ThinkSystem SR635 是一個裝備精良的單 CPU AMD 平台,提供的 CPU 能力遠遠超過強調高性能本地存儲所需的能力。 它也是我們實驗室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市場上為數不多的平台之一)。 綜合測試不需要大量 CPU 資源,但仍利用相同的 Lenovo 平台。 在這兩種情況下,目的都是以盡可能符合存儲供應商最大驅動器規格的最佳方式展示本地存儲。

PCIe Gen4綜合及應用平台(Lenovo ThinkSystem SR635)

  • 1 個 AMD 7452(2.35GHz x 32 核)
  • 8 x 64GB DDR4-3200MHz ECC 內存
  • CentOS的7.7 1908
  • ESXi 6.7u3

PCIe Gen3 應用平台 (聯想 ThinkSystem SR850)

  • 4 個 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 內存
  • 2 個 RAID 930-8i 12Gb/s RAID 卡
  • 8 個 NVMe 托架
  • VMware ESXI 6.7u3

PCIe Gen3 綜合平台 (戴爾 PowerEdge R740xd)

  • 2 個英特爾金牌 6130 CPU(2.1GHz x 16 核)
  • 4 x 16GB DDR4-2666MHz ECC 內存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 適配器
  • Ubuntu-16.04.3-桌面-amd64

作為新平台上的第一組評論,我們包括了過去的驅動結果,這些結果很接近但不是 100% 的同類比較,因為它們是在舊平台上進行測試的。 我們的綜合測試差異不會在結果上產生太大偏差,但在單 CPU AMD 平台與四 CPU Intel 平台上運行的應用程序工作負載可能在某種程度上存在差異。 在我們的 MySQL 測試中,一款新的 Gen4 KIOXIA 產品確實領先,但在 SQL Server 中延遲是平均水平。 只有兩個 Gen4 驅動器,我們已經能夠發布我們沒有大量的可比較數據,但在查看這些結果時需要注意。 我們還加強了綜合測試以利用更快的 SSD,現在顯示的測試結果具有更高的峰值線程數。

測試背景和比較

 StorageReview 企業測試實驗室 提供了一個靈活的架構,用於在與管理員在實際部署中遇到的環境相當的環境中對企業存儲設備進行基準測試。 企業測試實驗室結合了各種服務器、網絡、電源調節和其他網絡基礎設施,使我們的員工能夠建立真實世界的條件,以便在我們的審查期間準確地衡量性能。

我們將這些關於實驗室環境和協議的詳細信息納入審查,以便 IT 專業人員和負責存儲采購的人員能夠了解我們取得以下成果的條件。 我們的評論都不是由我們正在測試的設備製造商支付或監督的。 有關的其他詳細信息 StorageReview 企業測試實驗室   其網絡功能的概述 在這些相應的頁面上可用。

應用程序工作負載分析

為了了解企業存儲設備的性能特徵,必須對實時生產環境中的基礎架構和應用程序工作負載進行建模。 因此,我們對 Kioxia CD6 的基準測試是 通過 SysBench 的 MySQL OLTP 性能   Microsoft SQL Server OLTP 性能 具有模擬的 TCP-C 工作負載。 對於我們的應用程序工作負載,每個驅動器將運行 4 個配置相同的虛擬機。

SQL Server 性能

每個 SQL Server VM 都配置有兩個虛擬磁盤:100GB 卷用於啟動,500GB 卷用於數據庫和日誌文件。 從系統資源的角度來看,我們為每個虛擬機配置了 8 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。 雖然我們之前測試的 Sysbench 工作負載在存儲 I/O 和容量方面使平台飽和,但 SQL 測試正在尋找延遲性能。

此測試使用在 Windows Server 2014 R2012 來賓虛擬機上運行的 SQL Server 2,並由 Quest 的數據庫基準工廠進行壓力測試。 存儲評論的 Microsoft SQL Server OLTP 測試協議 採用事務處理性能委員會基準 C (TPC-C) 的當前草案,這是一種在線事務處理基準,可模擬複雜應用程序環境中的活動。 TPC-C 基準比綜合性能基準更接近於衡量數據庫環境中存儲基礎設施的性能優勢和瓶頸。 我們用於本次審核的 SQL Server VM 的每個實例都使用 333GB(1,500 規模)的 SQL Server 數據庫,並測量 15,000 個虛擬用戶負載下的事務性能和延遲。

SQL Server 測試配置(每個虛擬機)

  • 在Windows Server 2012 R2
  • 存儲空間:分配 600GB,使用 500GB
  • SQL Server 2014的
    • 數據庫大小:1,500 規模
    • 虛擬客戶端負載:15,000
    • 內存緩衝區:48GB
  • 測試時長:3 小時
    • 2.5 小時預處理
    • 30分鐘採樣期

對於我們的 SQL Server 事務基準測試,鎧俠 CD6 在 12,633.7 個虛擬機上的得分為 4 TPS。

KIOXIA CD6 在 5.5VM 時的平均延遲為 4 毫秒(與 CD6 相同),略微落後於華為和 Memblaze 驅動器。

系統性能

下一個應用程序基準包括 Percona MySQL OLTP 數據庫 通過 SysBench 測量。 該測試測量平均 TPS(每秒事務數)、平均延遲和平均 99% 延遲。

每 系統平台 VM 配置了三個虛擬磁盤:一個用於引導 (~92GB),一個用於預建數據庫 (~447GB),第三個用於測試中的數據庫 (270GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 8 個 vCPU、60GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。

Sysbench 測試配置(每個虛擬機)

  • 中央操作系統 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 數據庫表:100
    • 數據庫大小:10,000,000
    • 數據庫線程:32
    • 內存緩衝區:24GB
  • 測試時長:3 小時
    • 2 小時預處理 32 個線程
    • 1 小時 32 個線程

轉到 Sysbench 事務基準測試,KIOXIA 在 9,333VMs 上發布了 4 TPS 的領先分數。

在 Sysbench 平均延遲中,我們看到 CD6 在 13.71 個 VM 時的延遲僅為 4 毫秒,再次領先。

對於我們最壞情況下的延遲(第 99 個百分位數),CD6 在 27.48 個虛擬機上達到 4 毫秒,這次僅落後於華為(27.22 毫秒)。

VDBench 工作負載分析

在對存儲設備進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備建立基線,從而可以輕鬆地在競爭解決方案之間進行同類比較。 這些工作負載提供了一系列不同的測試配置文件,從“四個角”測試、常見的數據庫傳輸大小測試到來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。 我們針對這些基準測試的測試過程用數據填充整個驅動器表面,然後將驅動器部分分區為驅動器容量的 25%,以模擬驅動器如何響應應用程序工作負載。 這與使用 100% 的驅動器並使它們進入穩定狀態的全熵測試不同。 因此,這些數字將反映更高的持續寫入速度。

簡介:

  • 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
  • 4K 隨機寫入:100% 寫入,128 線程,0-120% iorate
  • 4K 隨機讀取(高負載):100% 讀取,512 線程,0-120% 迭代
  • 4K 隨機寫入(高負載):100% 寫入,512 線程,0-120% iorate
  • 64K 順序讀取:100% 讀取,32 線程,0-120% 迭代
  • 64K 順序寫入:100% 寫入,16 個線程,0-120% 迭代
  • 64K 順序讀取(高負載):100% 讀取,64 線程,0-120% iorate
  • 64K 順序寫入(高負載):100% 寫入,64 個線程,0-120% iorate
  • 綜合數據庫:SQL 和 Oracle
  • VDI 完整克隆和鏈接克隆跟踪

比較:

在我們的第一個 VDBench 工作負載分析隨機 4K 讀取中,KIOXIA CD6 的峰值得分為 760,160 IOPS,延遲為 165.5µsKIOXIA CD6 4K 隨機讀取性能在隨機 4K 讀取的高負載期間,我們看到 KIOXIA CD6 在接近 1 萬 IOPS 大關時有所放緩,最終在 1,067,840 µs 時達到 472 IOPS 的峰值。

KIOXIA CD6 4K 隨機讀取性能(高負載)

對於 4K 隨機寫入,CD6 表現最佳,峰值為 579,919 IOPS,延遲為 211.1µs。

4K 隨機寫入性能在高寫入負載下,鎧俠 CD6 表現出令人印象深刻的 709,547 IOPS 峰值和 713.3µs 的延遲。

KIOXIA CD6 4K 隨機寫入性能(高負載)切換到順序工作負載後,CD6 顯示出可靠的結果,在 68,413 µs 時達到 4.28 IOPS(或 465.6GB/s)的峰值(另一款 KIOXIA 預計是讀取方面最好的驅動器)。 KIOXIA CD6 64K 順序讀取性能在順序讀取的高負載期間,CD6 達到 75,598 IOPS (4.72GB/s) 的峰值,然後減速達到高達 843.5 毫秒的延遲。

鎧俠CD6 64K讀高對於 64K 順序寫入,鎧俠 CD6 再次顯示出它是寫入的強大力量,峰值為 53,402 IOPS(或 3.33GB/s),延遲為 291.6 毫秒,最後略有下降。

鎧俠CD6 64K寫入在高寫入負載下,鎧俠 CD6 達到 42,299 IOPS(或 2.58GB/s)的峰值,延遲僅為 65.1 毫秒。

鎧俠CD6 64K寫高我們的下一組測試是我們的 SQL 工作負載:SQL、SQL 90-10 和 SQL 80-20。 從 SQL 開始,鎧俠 CD6 的穩定峰值為 241,700 IOPS,延遲為 131.1 毫秒。  在 SQL 90-10 中,CD6 的性能與 Memblaze 驅動器幾乎相同,峰值為 243,292 IOPS 和 129.9 毫秒的延遲。在 SQL 80-20 中,頂級性能驅動器擁有非常相似的性能,CD6 的峰值為 244,857 IOPS,延遲為 128.3 毫秒。

接下來是我們的 Oracle 工作負載:Oracle、Oracle 90-10 和 Oracle 80-20。 從 Oracle 開始,KIOXIA CD6 以穩定的 253,635 IOPS 和 137.5µs 的延遲位居第三。 

Oracle 90-10 向我們展示了更多上述內容,CD6 的峰值為 168,000 IOPS,延遲為 116.8µs。對於 Oracle 80-20,前 4 個驅動器表現出非常相似的性能,因為 CD6 峰值為 192,663,延遲為 112.3 毫秒。接下來,我們切換到我們的 VDI 克隆測試,完整和鏈接。 對於 VDI 完整克隆 (FC) 啟動,KIOXIA CD6 的峰值為 196,584 IOPS,延遲為 172.3µs,位居第三。  VDI FC 初始登錄,鎧俠 CD6 的性能最好,在 169,412 毫秒時達到 172.6 IOPS 的峰值。

VDI FC Monday Login,CD6 以 109,488 IOPS 的峰值在 142.7 毫秒再次表現出最佳性能。

對於 VDI 鏈接克隆 (LC) 引導,CD6 在 100,678 毫秒的延遲下表現出令人印象深刻的 157 IOPS,僅次於鎧俠 CM6。  VDI LC 初始登錄在初始登錄配置文件中顯示出不均勻的數字,在性能大幅下降之前達到 25,235 IOPS 的峰值和 313.8 毫秒的延遲。最後,借助 VDI LC Monday Login,KIOXIA CD6 以另一項出色的性能結束了我們的測試,在 84,903 毫秒時達到 184.3 IOPS。

結論

KIOXIA CD6 是最新上市的高性能數據中心 SSD,採用新的 PCIe 4.0 接口。 它專為苛刻的 24×7 環境而設計,特別是那些具有混合使用和讀取密集型耐用性需求的環境。 全新鎧俠硬盤採用 2.5 英寸 15 毫米 Z 軸高度外形,採用鎧俠 BiCS FLASH 96 層 3D TLC,提供從 960GB 到 15.36TB 的各種容量。 它還帶有一系列安全選項。

對於性能,我們將 CD6 與其他同類固態硬盤(包括鎧俠 CM6)進行了比較。 對於應用程序工作負載分析,我們看到 CD6 在 SQL Server 中達到 12,633.7 TPS,平均延遲為 5.5 毫秒,僅次於 Memblaze 和華為驅動器。 對於 Sysbench,該驅動器達到了 9,333 TPS、13.71 毫秒的平均延遲和 27.48 米的最壞情況延遲。

在我們的 VDbench 測試中,鎧俠的性能更加穩定。 然而,在大多數情況下,它落後於 CM6 驅動器。 亮點包括:760,160K 讀取 4 IOPS(1,067,840 IOPS 高負載)、579,919K 寫入 4 IOPS(709,547 IOPS 高負載)、4.28K 讀取 64GB/s(4.72GB/s 高負載)和 3.33K 64GB/s寫入(2.58GB/s 高負載)。 SQL 工作負載的 IOPS 為 242K,SQL 243-90 為 10K IOPS,SQL 245-80 為 20K IOPS。 在 Oracle 中,性能最好的驅動器的性能非常相似(其中的 CD6),發布的工作負載為 254 IOPS,Oracle 168-90 為 10K IOPS,Oracle 192-80 為 20K IOPS。 在我們的 VDI 克隆測試中,CD6 表現出令人印象深刻的全面性能,突出體現在我們的 VDI FC 星期一登錄和 VDI FC 初始登錄測試中的頂級性能。

這篇評論的重點是 CD6 的性能,它匯集了令人印象深刻的記分卡。 也許更大的故事是 PCIe Gen4 的未來。 聯想率先推出一款從前到後都支持 PCIe Gen4 的服務器。 大多數其他服務器僅在後端支持 Gen4,這是一個基本的設計決策。 跳過前托架更容易也更快。 聯想採取了更全面的方式,開發了他們的 Rome 服務器,以便能夠利用 AMD 必須提供的一切。 最終結果是,聯想可以利用新技術,例如 KIOXIA 的 CD6,而大多數其他公司無法做到這一點。 這使 KIOXIA 處於先有雞還是先有蛋的局面,至少在英特爾推出下一代服務器 CPU 之前是這樣。 可以說在這種情況下領先於 IT 曲線是可以的,CD6 可以很好地與舊平台一起工作,準備好在 PCIe Gen4 系統可用時提供更多。 目前,期待看到大量的基準測試宣揚 AMD 服務器的優勢,尤其是在聯想雙 CPU 系統進入市場時。

4 年 2 月 22 日更新 – 我們重新審查了 鎧俠CD6 固件更成熟

鎧俠固態硬盤

在 Reddit 上討論

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱