顯然,最新的 Gen5 SSD(例如 Western Digital SN861)正在影響業務成果。如果您需要證據,只需看看它們對人工智慧革命的影響。
由西部數據贊助
Western Digital Ultrastar® DC SN861 SSD 旨在滿足超大規模資料中心和企業環境的高效能需求。 SN861 支援 PCIe® Gen5 接口,並具有多種外形尺寸,包括 U.2 和 E1.S,使其能夠適應多種部署場景。不過,這並不像製作不同外形尺寸的 SN861 那麼簡單; Western Digital 明智地設計了 SN861 功能集,以適應其目標市場。
Gen5 介面使 SN861 比上一代產品的效能立即提升 SN655。新驅動器的優勢更加深遠,具有 E1.S 外形尺寸中的靈活資料放置 (FDP) 等功能。 FDP 減少寫入放大並優化資料放置。 SN861 包括先進的安全功能,例如端對端資料保護、AES-XTS 加密和 TCG OPAL 2.01。該控制器還有助於降低 SSD 功耗,空閒時平均功耗低於 5 瓦。此外,此驅動器支援 NVMe® 2.0 和 OCP Cloud Spec 2.0 等多種標準。
雖然安全性和效率特性至關重要,但每一代更新都會帶來顯著的效能飛躍,SN861 也不例外。該驅動器的順序讀取速度高達 13,700 MB/s,隨機讀取 IOPS 高達 3.3 萬次,這對於 AI/ML 和大數據分析等應用至關重要。 SN861 的兩個版本在運作期間的平均功耗為 20 瓦,閒置時的功耗低於 5 瓦。功率是可調的,因此可以輕鬆調整驅動器的功率配置檔案以匹配預期的工作負載。例如,超大規模企業通常在低得多的功耗狀態下運行 E1.S 驅動器。
有趣的是,雖然 SN861 的兩種外形尺寸在技術設計上非常相似,但 Western Digital 已針對特定工作負載調整了每種驅動器。例如,在 E1.S 版本中,這意味著 FDP 等功能以及針對雲端工作負載進行效能調整的功能。另一方面,U.2 驅動器將找到進入高效能企業工作負載的方法,毫無疑問,人工智慧等新興工作負載可以從驅動器效能的大幅提升中受益。
EDSFF 和 FDP
FDP 透過優化 CacheLib 等工作負載中 SSD 的效能和可靠性,為 Meta 等超大規模企業提供了顯著的優勢。 FDP 降低了寫入放大係數 (WAF),從而提高寫入速度並延長 SSD 使用壽命,這對於處理大量資料處理任務至關重要。
該技術透過智慧地將相似數據分組、最大限度地減少過度配置並減少密集垃圾收集的需要來增強數據組織。 FDP 還支援多個命名空間,確保不同工作負載之間的效能一致。這種優化提高了應用程式效能和耐用性,並顯著降低了大規模儲存基礎設施的總擁有成本 (TCO)。
Ultrastar SN1 的 E861.S 版本對 FDP 的支援證實了該驅動器已準備好滿足超大規模企業的需求,但 FDP 只是其中的一部分。 E1.S 版本的磁碟機需要滿足超大規模效能要求,特別是圍繞讀取效能的 QoS。
U.2 企業版
正如 E1.S 驅動器對於超大規模用例而言令人興奮一樣,U.2 SN861 是大多數企業都會採用的驅動器。我們對硬碟進行了一系列測試,以衡量標準測試套件中的整體性能。
西部數據 Ultrastar DC SN861 SSD 數據表
1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB | |
---|---|---|---|---|---|---|
耐力 | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD |
安全性 | ||||||
外形 | ||||||
介面 | ||||||
NVMe規格 | ||||||
性能(預計) | 1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB |
讀取吞吐量(最大 MB/秒,Seq 128KiB) | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 |
寫入吞吐量(最大 GB/秒,Seq 256KiB) | 3,600 | 3,600 | 7,200 | 7,200 | 7,500 | 7,500 |
讀取 IOPS(最大,Rnd 4KiB) | 2,100K | 2,100K | 3,300K | 3,300K | 3,300K | 3,300K |
寫入 IOPS(最大,Rnd 4KiB) | 350K | 165K | 665K | 330K | 800K | 430K |
讀取延遲 (μS) | 65 | 65 | 65 | 65 | 65 | 65 |
寫入延遲 (µS) | 8 | 8 | 8 | 8 | 8 | 8 |
可靠性 | ||||||
MTTF(小時,預計) | ||||||
不可糾正的誤碼率 (UBER) | ||||||
年故障率(AFR,預計) | ||||||
有限保修(年) | ||||||
電源管理(預計) | ||||||
要求(DC,+/- 10%) | ||||||
操作模式(平均、最大) | ||||||
空閒(平均) | ||||||
物理尺寸 | ||||||
z-高度 (mm) | ||||||
尺寸(寬 x 長,mm) | ||||||
環境建議 | ||||||
工作溫度(環境) | ||||||
非工作溫度 |
為了測量本次比較中使用的企業級 NVMe® Gen5 SSD 的效能,我們利用 fio 測試套件來測量四個角落的工作負載,並使用 Vdbench 來測量混合工作負載。我們利用的 fio 腳本套件是一個自動化腳本,設定為以一致的方式進行預處理和輕微測試驅動器, 在 github 上找到的。我們用它來執行 256K 順序讀寫峰值頻寬測試和 4K 隨機讀寫峰值吞吐量測試。
峰值吞吐量和頻寬 |
西部數據 SN861 7.68TB | 鎧俠 CM7-R 7.68TB | 三星 PM1743 7.68TB | 三星 PM9A3 7.68TB |
256K順序讀取(1T/64Q) | 13,283MB /秒 | 12,092MB /秒 | 14,495MB /秒 | 6,751MB /秒 |
256K順序寫入(1T/64Q) | 7,696MB /秒 | 5,796MB /秒 | 6,052MB /秒 | 4,055MB /秒 |
4K隨機讀取(8T/32Q) | 2,108,065 IOPS | 1,963,066 IOPS | 1,900,838 IOPS | 1,068,508 IOPS |
4K隨機寫入(8T/32Q) | 473,658 IOPS | 301,061 IOPS | 319,758 IOPS | 206,660 IOPS |
當我們查看 Western Digital SN861 的頂級效能資料時,它充分利用了 Gen5 介面。在順序讀取方面,它的速度為 13.3GB/s,位居第二,而三星 PM1743 的速度為 14.5GB/s。在順序寫入方面,SN861位居第一,以5GB/s的速度橫掃其他兩款同類Gen7.7型號,其次是三星PM6.1的1743GB/s。
隨機 4K 讀取性能非常強勁,測量結果為 2.11 萬 IOPS,緊隨其後的是鎧俠 CM1.96-R 的 7 萬 IOPS。當我們查看隨機 4K 寫入效能時,西部資料 SN861 也位居第一,速度為 474K IOPS,其次是三星 PM1743,速度為 320K IOPS。在我們的四角工作負荷中,西部數據 SN861 在四項測試中的三項中名列前茅。
為了測試 SN861 Gen5 SSD,我們利用 戴爾® PowerEdge® R760 在我們的測試實驗室。它是一款高度通用的 2U 機架式伺服器,支援兩個第四代 Intel Xeon 處理器,並具有支援多達 4 個 NVMe 驅動器的配置。此伺服器適用於混合工作負載、資料庫和 VDI。應該指出的是,我們在本次評測中測試的 CM24-R 版本來自具有戴爾韌體版本的戴爾伺服器。該驅動器在使用 KIOXIA 的庫存韌體時可能會有不同的表現。
戴爾 PowerEdge R760 配置:
- 雙 Intel® Xeon® Gold 6430(32 核心/64 線程,1.9GHz 基礎)
- 1TB DDR5 內存
- Ubuntu的22.04
為了獲得最大的靈活性,我們也與 Serial Cables 合作,他們為我們提供了 8 個插槽 PCIe Gen5 JBOF,用於 U.2/U.3、M.2 和 EDSFF SSD 測試。這使我們能夠在同一測試硬體上測試所有當前和新興的驅動器類型。也利用 VDbench 來比較不同工作負載類型中我們選擇的 SSD 的擴展效能。我們對這些基準測試的測試過程會用資料填充整個驅動器表面,然後對相當於驅動器容量 25% 的驅動器部分進行分區,以模擬驅動器如何響應應用程式工作負載。這與完全熵測試不同,後者使用 100% 的驅動器並使它們進入穩定狀態。因此,這些數字將反映更高的持續寫入速度。
簡介:
- 16K 順序讀取:100% 讀取,32 線程,0-120% 迭代
- 16K 順序寫入:100% 寫入,16 個線程,0-120% 迭代
- 4K、8K 和 16K 70R/30W 隨機混合,64 線程,0-120% 迭代
- 綜合數據庫:SQL 和 Oracle
- VDI 完整克隆和鏈接克隆跟踪
我們的第一個 Vdbench 測試測量了 16 執行緒負載下的順序 32K 讀取效能。在這裡,我們測量了 Western Digital SN325 在 5.1 μs 時的峰值吞吐量為 98K IOPS 和 861GB/s,它與 KIOXIA CM7-R 並駕齊驅,測量了 329K IOPS。 PCIe Gen5三星PM1743測得289K IOPS,我們帶來的作為參考的三星PM9A3 Gen4 SSD測得227K IOPS。將我們的重點轉移到相同 16K 順序工作負載的寫入效能上,西部資料 SN861 與我們比較的其他 U.2 PCIe Gen5 SSD 相比具有強大的領先優勢。 SN861 在 200 μs 時測得峰值為 3.1K IOPS 和 78GB/s,明顯領先鎧俠 CM7-R 和三星 PM1743。與 Gen4 相比,所有這些都遠遠領先三星 PM9A3,後者測得 131K IOPS。
我們接下來的三個測試著眼於在 70/30 R/W 混合的隨機傳輸測試中縮放區塊大小。第一個測試測量了 4K 塊大小。在這裡,我們發現 Western Digital SN861 和 KIOXIA CM7-R 具有非常相似的性能,SN861 在 903 μs 時測量到 70K IOPS,而 CM881-R 為 7K IOPS。三星 PM1743 落後,峰值速度為 521K IOPS,Gen4 PM9A3 測量為 396K IOPS。
透過我們的 8/70 R/W 隨機測試,將區塊大小提升至 30K,Western Digital SN861 領先 KIOXA CM7-R,在 682 μs 時測得峰值 93K IOPS,而 CM7-R 為 599K IOPS。三星 PM1743 以 414K IOPS 落後,而 Gen4 PM9A3 測量為 301K IOPS。
我們最終的隨機 70/30 R/W 測試著眼於 16K 區塊大小。 Western Digital SN861 在此繼續保持強勁領先地位,在 434 μs 時測得峰值 143K IOPS,CM7-R 測得 337K IOPS。三星 PM1743 繼續落後,測量為 231K IOPS,而 Gen4 PM9A3 測量為 183K IOPS。
我們的下一組測試重點在於合成 SQL 工作負載。在第一個測試中,我們發現西部數據 SN861 領先 KIOXIA CM7-R,407 μs 的峰值速度為 78K IOPS,而 CM396-R 為 7K IOPS。三星 PM1743 的峰值為 340K IOPS,而 Gen4 PM9A3 的測量值為 310K IOPS。
在 80/20 R/W 混合的 SQL 工作負載下,西部數據 SN861 繼續領先 KIOXIA CM7-R,在 424 μs 時測得峰值 75K IOPS,而 CM407-R 為 7K。三星 PM1743 以 322K IOPS 的峰值速度落後於這兩者,而 Gen4 PM9A3 的峰值速度為 281K IOPS。
將SQL 工作負載中的讀取分佈增加到90/10 R/W 分割後,Western Digital SN861 繼續保持領先於KIOXIA CM7-R 的優勢,在411 μs 下測得77K IOPS,而CM398-R 為7K IOPS 。三星仍以 328K IOPS 的峰值速度落後於這兩者,而 Gen4 PM9A3 的測量值為 297K IOPS。
在 SQL 測試之後,我們將重點轉向合成 Oracle 工作負載。在這裡,我們的三款 Gen5 SSD 比 Gen4 Samsung PM9A3 有了顯著的改進。西部數據 SN861 在 445 μs 時以 80K IOPS 的峰值速度保持領先,領先 KIOXIA CM7-R 的 417K IOPS。三星 PM1743 排在後面,測量為 317K IOPS,PM9A3 測量為 267K IOPS。
將我們的合成 Oracle 工作負載的 R/W 分佈調整為 80/20,Western Digital SN861 和 KIOXIA CM7-R 之間的差距縮小,SN861 在 309 μs 時測量到 71K IOPS 峰值,CM7-R 測量到 304K IOPS 。三星 PM1743 測得的峰值為 252K IOPS,而 Gen4 PM9A3 的峰值為 228K IOPS。
我們最終採用 90/10 R/W 混合的綜合 Oracle 工作負載發現 Western Digital SN861 和 KIOXIA CM7-R 之間存在類似的緊密差距。 SN861 在 296 μs 時的峰值速度為 74K IOPS,而 CM7-R 測量為 292K IOPS。三星 PM1743 進一步落後,峰值速度為 250K IOPS,而 Gen4 PM9A3 測量為 231K IOPS。
我們的最後六個工作負載重點關注完整克隆和連結克隆虛擬機器的 VDI 追蹤。它們分別涵蓋三種場景:引導、初始登入和星期一登入。我們的測試涵蓋了完整克隆啟動場景,其中 Western Digital SN861 在 370 μs 下測得 94K IOPS,而 KIOXIA CM7-R 則測得 348K IOPS。三星 PM1743 以 263K IOPS 落後,Gen4 PM9A3 以 227K IOPS 落後。
在我們的初始登入場景中,KIOXIA CM7-R 領先 Western Digital SN861,在 196 μs 的時間內測得 163K IOPS,而 SN861 則為 181K IOPS。三星 PM1743 測量 157K IOPS 峰值,而 Gen4 PM9A3 則為 117K IOPS。
在周一登入設定檔中,西部數據 SN861 和鎧俠 CM7-R 並駕齊驅。 SN861 在 158 μs 時測量到峰值 99K IOPS,而 CM7-R 測量到 160K IOPS。三星 PM1743 測量為 126K IOPS,Gen4 PM9A3 測量為 83K IOPS。
在最後三個測試中,我們從引導開始,查看了 VDI 連結克隆設定中的相同設定檔。鎧俠 CM7-R 排名第一,測量結果為 161K IOPS,西部數據 SN861 在 156 μs 時測量為 102K IOPS。然後,三星 PM1743 測得 138K IOPS,Gen4 PM9A3 以 110K IOPS 落後。
在我們測量初始登入設定檔的測試中,鎧俠 CM7-R 的最高速度為 89K IOPS,西部數據 SN861 緊隨其後,以 85 μs 的速度達到 102K IOPS。三星 PM1743 以 70K IOPS 落後,其 Gen4 兄弟產品以 53K IOPS 落後。
在我們上一次涵蓋週一登入設定檔的 VDI 工作負載中,西部數據 SN861 以 122 μs 的峰值速度達到 129K IOPS,排名第一,鎧俠 CM7-R 的測量結果為 115K IOPS。三星 PM1743 測得 95K IOPS,Gen4 PM9A3 落後,峰值速度為 64K IOPS。
西部數據 SN861 和 AI
在本報告中與 SN861 的工作有些相關的路徑中,我們也一直在與上一代產品合作 西部數據 Ultrastar DC SN655 在西部資料系統集團提供的 OpenFlex™ Data24 平台內。在 FMS '24 的演示中,我們展示了使用 GPU 伺服器、Data24 NVMe-oF™ 平台和 Gen4 SN655 SSD 的 AI 演示。
我們對 NVIDIA® IndeX® 的測試重點是利用其先進的體積視覺化功能來處理高保真度的大量資料集。 IndeX 利用 GPU 加速提供 3D 體積資料的即時互動式視覺化,這對於石油和天然氣勘探、醫學成像和科學研究等行業至關重要。
為了達到最佳效能,特別是在GPU密集型環境中,需要確保GPU和儲存之間的高速資料交換。例如,為了讓 NVIDIA H100 GPU 的頻寬完全飽和,我們需要實現約 64GB/s 的吞吐量,這涉及使用高效能 NVMe 儲存解決方案和技術,例如 NVIDIA GPUDirect™。這種整合減少了延遲並最大限度地提高了資料吞吐量,確保 GPU 的高效利用,從而更快、更有效地處理大規模資料集。
當我們查看 Gen4 SN655 峰值速度為 6.8GB/s 與 SN13.7 峰值速度為 861GB/s 的頻寬差異時,很明顯可以看到遷移到 Gen5 SSD 的優勢。要使用上一代型號達到 64GB/s,您需要 861 個 SSD,而 SNXNUMX 只需 XNUMX 個即可達到該目標。這種差異可以讓您增加驅動器數量以獲得額外的頻寬或容量。
效能和容量對於儲存根據人工智慧和其他高級應用程式的需求進行擴展至關重要。在這方面,SN5 相對於Gen861 驅動器提供的Gen4 介面和整體效能提升非常引人注目,這意味著這些驅動器可以在單一儲存系統中支援更多GPU,並確保這些GPU 的傳輸速度足夠快,以確保充分利用。
結論
SN861 標誌著西部數據的重大飛躍。此驅動器的外形尺寸可支援超大規模和企業客戶,並具有針對其預期用例進行調整的 E1.S 驅動器中的 FDP 等驅動器功能。 Gen5 介面是驅動器最明顯的優勢,提供了令人印象深刻的全面性能配置。
西部數據 SN861 提供了強大的性能,在我們最初測量峰值順序頻寬和隨機吞吐量的四角工作負載中佔據了三個榜首。亮點包括 4M IOPS 的隨機 2.11K 讀取性能和 4K IOPS 的隨機 474K 寫入效能。順序讀取效能強勁,與 1743GB/s 的三星 PM13.3 相比位居第二,儘管它能夠在 7.7GB/s 的順序寫入頻寬方面取代領先地位。
在我們的 VDbench 工作負載(主要關注混合工作負載或較小區塊大小的傳輸)中,SN861 繼續表現出色。我們測量了 16K IOPS 的強勁 200K 順序寫入速度,並且在涵蓋 70K、30K 和 4K 傳輸大小的 8/16 R/W 混合測試中表現強勁。在我們的 VDI 工作負載中,SN861 與鎧俠 CM7-R 爭奪榜首,兩者在某些領域並駕齊驅。總體而言,西部數據 SN861 在我們的測試陣容中表現出色。
顯然,最新的 Gen5 SSD(例如 Western Digital SN861)正在影響業務成果。如果您需要證據,只需看看它們對人工智慧革命的影響即可。我們在測試中已經看到了這一點; AI 系統需要快速儲存來保持 GPU 正常運作,無論是在像上面的 NVIDIA IndeX 範例這樣的快取中,還是在共享儲存陣列或 GPU 伺服器中。西部數據在將 SN861 定位於這些高級工作負載方面做得非常好,同時也為超大規模企業提供支援 FDP 的 SKU。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱