大約兩年前,我們進行了一次正面交鋒 攤牌 在兩種流行的企業級 SSD 之間:Intel P5510 與 Samsung PM9A3——兩者在數據中心都有堅實的追隨者。 從那以後,英特爾將其 SSD 業務剝離給了一家名為 Solidigm 的新公司,這家公司得到了 SK 海力士的支持。 現在,我們正在重新審視 Solidigm P5520,以更新我們面對面的主流企業 SSD 攤牌。
大約兩年前,我們進行了一次正面交鋒 攤牌 在兩種流行的企業級 SSD 之間:Intel P5510 與 Samsung PM9A3——兩者在數據中心都有堅實的追隨者。 從那以後,英特爾將其 SSD 業務剝離給了一家名為 Solidigm 的新公司,這家公司得到了 SK 海力士的支持。 現在,我們正在重新審視 Solidigm P5520,以更新我們面對面的主流企業 SSD 攤牌。
從歷史上看,我們發現單個企業 SSD 的規格表並不是很有幫助,因為它們側重於針對非常小且特定的工作負載的單驅動器性能。 正因為如此,我們決定集中精力對決 表演 具有多個驅動器的系統而不是單個驅動器的帶寬。
最終,P5510 在我們的真實測試場景中擊敗了三星 PM9A3。 考慮到這一點,我們想為這兩個驅動器提供重新匹配測試,但這次使用的是 P5510 的後繼產品:Solidigm P5520。 這一次,我們還包括了 Micron 7400 Pro 和 Kioxia CD6,以獲得更全面的數據集。
我們已經單獨審查了所有這些驅動器,因此在本報告中,我們不會深入探討單個驅動器的性能。 相反,我們將專注於此設備的企業部署,其中多個驅動器相互結合使用。 我們的測試包括混合工作負載、嘈雜的鄰居情況和高寫入工作負載。
如上文所述,2020 年,備受尊敬的韓國半導體存儲器和設備製造商 SK 海力士宣布,他們將以 9 億美元的價格收購英特爾的 NAND 業務。 通過此次收購,SK 海力士創建了 Solidigm,這是一家由 SK 海力士全資擁有的美國新公司。 我們認為這對兩家公司來說都是一個勝利,因為它讓每家公司都能專注於自己的核心業務,而 SK 海力士的額外好處是增加了備受推崇的現有產品線,並為其產品組合增加了忠實的追隨者。
Solidigm P5520 與 P5510
當 P5520 與 P5510 進行比較時, 規格表 僅顯示 P5520 的連續性能略有提高。 但是,我們發現規格表只顯示了部分情況,這就是我們進行這些測試的原因。
然而,性能數據只是故事的一部分; 今天的超大規模和數據中心要求密度和功率效率。 與上一代 P44 設備相比,Solidigm 的總功耗降低了 5510%,這兩種性能均得到肯定。 這要歸功於最大容量從 P7.68 的 5510TB 增加到相同 15.36" 5520mm 驅動器尺寸的 P2.5 的 15TB。 在一個完全填充的服務器中,這些收益加起來非常快。
P5520 實現了客戶要求的許多功能,包括多扇區大小、OPAL 2.0、可配置命名空間鎖定、安全擦除、改進的遙測日誌、動態多命名空間和設備自測試。
在我們的測試中,我們使用了 U.2 外形尺寸的 7.68TB 驅動器,這是企業使用的流行容量點。 P5520 的可用容量從 1.92TB 到 15.36TB 不等。 有趣的是,P5520 可用於 統治者 (E1.S 和 E1.L)格式,在超大規模應用程序和一些服務器中很流行。 我們有點驚訝它沒有出現在 E3.S 中,這是一種我們期望服務器 OEM 在其下一代更新中利用的新格式。 也就是說,P5520 已經開發了很長時間,而且 Solidigm 很可能會在 P3 或此類 SSD 的下一步中包含 E5540.S 變體。
Solidigm P5520 性能
為了進行比較,我們選擇了一台英特爾 OEM 服務器,該服務器在此配置中支持八個 NVMe SSD。 所有批次的 SSD 在同一台服務器上進行了相同的測試。
被測硬盤,容量均為 7.68TB:
高級規範包括:
- 2 個英特爾可擴展 Gen3 8380
- 32 個 32GB DDR4 3200MHz
- Ubuntu 20.04.2 實時服務器(合成工作負載)
- VMware ESXi 7.0u2(應用程序工作負載)
- 8 個 PCI Gen4 U.2 NVMe 托架
基準測試使用 VDbench 和 FIO 進行綜合基準測試,Percona Sysbench 和 Benchmark Factory 用於 SQL Server。
VD基準:對每組 8 個 NVMe SSD 進行安全擦除,然後使用 64K 寫入操作寫入整個磁盤表面,然後進行一小時的 64K 順序預處理工作負載。 完成後,每個驅動器都會分配一個佔磁盤表面 25% 的分區(2TB SSD 的分區為 8TB)。
然後,我們專注於一組由常見混合工作負載組成的常見工作負載配置文件。 我們還使用我們的 I/O 模式來複製 SQL、Oracle 和 VDI 工作負載。 在隨機 I/O 模式開始之前,我們執行了額外一小時的 4K 隨機寫入活動。
工作負載配置文件
- 綜合數據庫:SQL 和 Oracle
- VDI 完整克隆和鏈接克隆跟踪
在我們的 SQL 工作負載中,Solidigm P5520 在最低延遲方面遙遙領先,並以最高性能和最低延遲結束。 我們測得 P2.36 在 105 微秒時達到 5520M IOPS 的峰值,緊隨其後的競爭對手 (PM9A3) 在 1.95 微秒時測得 127M IOPS。
隨著我們 SQL 90-10 工作負載中寫入百分比的增加,P5520 再次在競爭性 SSD 面前提供了強大的領先優勢。 在這裡,我們在 2.23 微秒時測得 111 萬 IOPS 的峰值,PM9A3 緊隨其後,在 1.89 微秒時達到 129 萬 IOPS。
在我們的 SQL 10-20 工作負載中將寫入百分比從 80% 增加到 20% 之後,我們看到 SSD 在分組中變得更接近了。 在這裡,P5520 在 1.99 微秒時達到 122M IOPS 的最高值,而 PM9A3 在 1.79 微秒時以 135M IOPS 落後。
切換到我們的 Oracle 工作負載後,Solidigm P5520 保持領先優勢,在 1.9 微秒時達到 127 萬 IOPS。 總體而言,這與 PM1.68A143 在 9 微秒時的 3M IOPS、1.66 Pro 在 147 微秒時的 7400M IOPS 或 CD1.59 在 6 微秒時的 157M IOPS 相比。
在我們的 Oracle 90-10 工作負載中,P5520 在 1.7 微秒時達到 99 萬 IOPS,PM9A3 緊隨其後,在 1.54 微秒時測得 110 萬 IOPS。
在我們具有 80-20 R/W 混合的最終 Oracle 工作負載中,Solidigm P5520 仍然以 1.63 微秒的 103M IOPS 保持領先。 三星 PM9A3 仍然以 2 微秒的 1.5M IOPS 速度排名第二。
從合成數據庫轉向 VDI,我們從完整克隆啟動工作負載開始。 在這裡,Solidigm P5520 開始時略有優勢,隨著工作負載達到頂峰,它變成了顯著的領先優勢。 P5520 在 1.79 微秒的峰值時測得 137M IOPS,其後的 PM9A3 在 1.51 微秒時測得 160M IOPS。
在我們的 VDI 完整克隆初始登錄工作負載中,P5520 提供了延遲優勢,儘管峰值吞吐量來自 Micron 7400 Pro。 在這裡,P5520 在 909 微秒時以 201k IOPS 最高,而 7400 Pro 在 959 微秒時以 213k IOPS 領先。
在 VDI Full Clone Monday Login 中,Solidigm P5520 開始時的響應時間略有延長。 然而,隨著工作量的增加,它提供了比組中其他人更高的性能配置文件。 在這裡,P5520 在 634 微秒時測得 156k IOPS,其後的 7400 Pro 在 606 微秒時測得 166k IOPS。
我們最後一組綜合工作負載配置文件側重於 VDI 鏈接克隆性能,從 Boot 開始。 在此測試中,我們看到三星 PM9A3 位居榜首,在 696 微秒時測得 149k IOPS,而 P5520 在 534 微秒時測得 196k IOPS。
在 VDI 鏈接克隆初始登錄配置文件中,Solidigm P5520 排在 PM9A3 之後。 P5520 在 312 微秒時測得 148k IOPS,而 PM9A3 在 325 微秒時測得 140k IOPS。
最後,在我們的 VDI 鏈接克隆星期一登錄工作負載中,我們看到 Solidigm P5520 與 Micron 7400 Pro 相比在延遲方面略有領先。 在這裡,P5520 在 485 微秒時測得 198k IOP,而 487 Pro 在 205 微秒時測得 7400k IOPS。
FIO 寫入壓力測試
存儲工作負載變得越來越複雜,因為 SSD 在峰值使用水平上跟上並發讀/寫請求。 在並發寫入壓力下為 IO 提供服務的能力變得比在不存在寫入的情況下進行讀取更有趣。 供應商可以將背景活動保持在足夠低的水平,以顯示“基準”,例如在卸載條件下的讀取響應。 但這不是現實世界中 IO 的工作方式。
此工作負載演示了 SSD 如何在其核心固件和 NAND 組件級別暫停或暫存寫入並優先讀取。 讀取優先級可以推動特定應用產品的 SLA 要求。 因此,寫入壓力測試的動機是由測試並發 IO 以及 SSD 產品的彈性和 QoS 的需要驅動的。
在我們的寫入壓力測試中,我們在 Solidigm P5520、三星 PM9A3、Kioxia CD6 和 Micron 7400 Pro 測試組中的八個驅動器上運行了工作負載。 在測試閃存設備時,我們看到許多情況下,單獨的驅動器測試並不總是反映該驅動器在更活躍的系統中的響應方式。 為了顯示性能是如何反映的,我們從每個組中的單個驅動器中提取結果,在這種情況下對應於每個組中的一個驅動器。 測試分為 8K 塊大小和 16K 塊大小工作負載。 在每個測試中,我們都關注 clat(完成延遲)、第 99 個百分點延遲和第 99.99 個百分點延遲。
從 8K 塊大小開始,我們查看了四個 SSD 組中每個組的完成延遲,我們發現開始時形成了巨大差異。 看看 100MB/s 到 700MB/s 的範圍,Kioxia CD6 脫穎而出,一條線在 350MB/s 時下降。 這是因為在那之後,由於測試需要更高的帶寬,它的上限為 350MB/s,而其他驅動器則不斷攀升。 如果我們看一下 350MB/s 的速率,5520 測量為 122 微秒,PM9A3 測量為 135,CD6 為 157,而 7400 Pro 測量為 192。
在第 99 個百分位數組中,Solidigm P5520 繼續遙遙領先。 在 350MB/s 標記處,我們測得 P424 為 5520 微秒,CD627 為 6 微秒,PM668A9 為 3 微秒,742 Pro 為 7400 微秒。
在第 99.9 個百分位,我們看到該組中企業級 SSD 之間的分離更為明顯。 P5520 的起步明顯低於組中的其他產品,並在整個測試環節保持領先。 如果我們查看 350MB/s 點,我們測得 P578 為 5520 微秒,CD922 為 6 微秒,PM1,074A9 為 3 微秒,1,254 Pro 為 7400 微秒。
移動到第 99.99 個百分點的延遲,保持 350MB/s 標記作為比較每個驅動器的標記,Solidigm P5520 繼續領先。 它提供了 717 微秒的低延遲,而 PM9A3 為 1,336 微秒,CD6 為 1,369 微秒。 7400 Pro 以 2,311 顯著落後。
在我們的寫入壓力測試中將塊大小增加到 16K,我們再次看到該類別中的四個 SSD 在響應時間方面存在顯著差異。 測試開始時,從完成延遲來看,Solidigm P5520 和三星 PM9A3 非常接近,但隨著寫入工作負載的增加,路徑有所不同。 我們再次看到 Kioxia CD6 達到了 350MB/s 的最高速度,我們將把它用作整個驅動器組的比較點。 此處 P5520 測得 139.7 微秒,而 PM141A9 為 3 微秒。 CD6 在這一階段測得 174,其上方的 7400 Pro 測得 216.5。
在第 99 個百分位測量中,隨著帶寬的增加,每個 SSD 之間的差異變得更加明顯。 在 350MB/s 標記處,P5520 測量為 445 微秒,PM9A3 測量為 668,CD6 為 685,而 7400 Pro 為 824。
移動到 99.9 個百分點的延遲時,P5520 保持領先,同時我們從 CD6 看到了一些有趣的行為。 CD9 最初以 3MB/s 的速度低於 PM300A6,但在達到飽和之前延遲出現峰值。 按照相同的 350MB/s 採樣點,我們測得 P5520 為 603 微秒,CD6 為 1,037,PM9A3 為 1,074,而 7400 Pro 為 1,418。
最後,當我們進入 99.99K 塊大小寫入壓力測試的 16 個百分點部分時,我們看到 Solidigm P5520 的延遲最低,而 Micron 7400 Pro 的響應時間幾乎是其三倍。 關注350MB/s指標點,P5520測得734微秒,PM9A3為1,319,緊隨其後的CD6為1,565,7400 Pro最高為2,606。
FIO 嘈雜鄰居測試
傳統上,要了解 SSD 如何在不同的並發工作負載下運行,您需要同時向設備應用讀取和寫入工作負載。 這些工作負載還可以包括不同的塊大小和其他元素。 NVMe SSD 帶來了一個新概念,它們可以提供多租戶命名空間配置而不是通用分區。
當多個租戶都將其預配的命名空間用於不同的工作負載時,延遲不得增加到存儲不再響應每個租戶的程度。 在嘈雜的鄰居測試中,我們將混合寫入工作負載應用於六個已配置命名空間中的三個,並跟踪其餘三個命名空間的讀取延遲,以查看每個驅動器如何處理並發寫入和讀取活動。
隨著現場設備的增多,Solidigm P5520 在完成延遲以及 99.99 個百分點和 99.9999 個百分點的延遲方面處於領先地位。 從完成延遲 (clat) 開始,命名空間 5520-4 的 P6 平均時間為 141 微秒,緊隨其後的是三星 PM9A3,為 157,其次是美光 7400 Pro,為 166,最後是鎧俠 CD6,為177.
不過,這一差距有所擴大,達到 99.99 個百分點,我們開始看到競爭驅動器的響應時間急劇增加。 在這裡,Solidigm P5520 測量為 769 微秒,三星 PM9A3 測量為 1,049,Kioxia CD6 為 1,576,Micron 7400 Pro 為 2,281。
轉向六個 9 或 99.9999 延遲測量,P5520 繼續領先於該組,測量為 1,123 微秒。 三星 PM9A3 仍然位居第二,得分為 1,494,Kioxia CD6 躍升至 2,748,美光 7400 Pro 得分達到驚人的 3,796。
Sysbench MySQL 性能
我們的 Sysbench 測試利用 Percona 將 I/O 驅動到 MySQL OLTP 數據庫。 此測試還測量平均 TPS(每秒事務數)、平均延遲和平均 99% 延遲。 每個 Sysbench VM 配置了三個虛擬磁盤:一個用於啟動 (~92GB),一個用於預構建數據庫 (~447GB),第三個用於測試中的數據庫 (270GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU 和 60GB 的 DRAM,並利用了 LSI Logic SAS SCSI 控制器。
Sysbench 測試配置(每個虛擬機)
- 中央操作系統 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
- 數據庫表:100
- 數據庫大小:10,000,000
- 數據庫線程:32
- 內存緩衝區:24GB
- 測試時長:3 小時
- 2 小時預處理 32 個線程
- 1 小時 32 個線程
對於 16VM 負載(每個 SSD 8 個 VM),我們將存儲作為 MySQL 性能的主要約束,留有一些 CPU 空間。 在性能方面,Solidigm P5520 名列前茅,測得 28,455 TPS,其次是 7400 Pro 26,397 TPS,PM9A3 26,312,CD6 25,628。
從平均延遲來看,P5520 以 18.02ms 領先,其次是 7400 Pro 19.46ms,PM9A3 19.59ms,CD6 19.98ms。 重要的是要注意這是數據庫響應時間,而不是存儲延遲,因此數字高於 NVMe I/O 層。
在最後一部分,我們測量了 Sysbench 工作負載期間的第 99 個百分位延遲,P5520 測量為 31.84 毫秒,PM9A3 為 34.37 毫秒,7400 Pro 為 35.44 毫秒,CD6 為 36.56 毫秒。
結論
在我們之前深入研究 P5510 時,我們將其與 PM93A 進行了正面比較。 在那輪測試中,P5510 表現非常出色,優於三星驅動器。 這一次,Solidigm 帶著更新的企業級 SSD 回來了,所以我們再次運行測試,將 Solidigm P5520 與 PM9A3 進行對比。 此外,我們還擴大了範圍,將來自美光和鎧俠的備受推崇的企業級 SSD 納入了對決。
查看驅動器的規格表,很難破譯這些批次的 SSD 在我們的測試中表現如此不同,但它們確實如此,而且以最引人注目的方式。 這方面的一個例子是我們的 FIO 嘈雜鄰居測試,在 99.99 百分位數測試中,P5520 比最接近的競爭對手高出 36%!
在廣泛的測試中很容易看出的主要趨勢是 Solidigm P5520 全面提供卓越的性能和極低的延遲。 與鎧俠 CD6、美光 7400 Pro 和三星 PM9A3 相比,它在許多方面都處於領先地位。 這在寫入壓力測試中最為明顯,其中 CD6 等 SSD 完全飽和,遠低於同類產品。
完成此練習後,我們剩下的 P5520 與 P5510 的情況差不多——這是一件非常好的事情。 P5520 在我們投入的工作負載中表現出色,在極端寫入壓力和嘈雜的鄰居場景等最密集的工作負載中表現出色。 Solidigm 工程再次證明,在這個主流的企業級 SSD 類別中,存在相當大的鴻溝,對閃存進行正確的投資對於應用程序性能極為重要。
Solidigm 贊助了這份報告。 本報告中表達的所有觀點和意見均基於我們對所考慮產品的公正看法。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱