美光 P420m 是一款企業應用加速器,總容量高達 1.4TB,利用 PCIe 接口,並提供獨特的半高半長 (HHHL) 和 2.5" 外形規格。美光選擇了 25nm P420m 的 MLC NAND 不僅可以滿足主流市場對性能和可靠性的要求,還可以提供比其更具成本效益和更高容量的產品 P320小時 與 SLC NAND 配對。 P420m 和 P320h 之間的另一個核心區別是美光增加了電容器以在意外斷電時保護飛行中的數據。 額外的數據保護功能可使卡保持足夠長的供電時間,以刷新對 NAND 的所有寫入,為企業提供多一層數據保護。 HHHL 卡通過 PCIe Gen2 x8 接口實現高達 3.3GB/s 的順序讀取性能和高達 630MB/s 的寫入以及高達 750,000 IOPS 的隨機讀取和 95,000 IOPS 的寫入活動。 PCIe Gen2.5 x2 上的 4" 接口分別高達 1.8GB/s 和 430,000 IOPS。
美光 P420m 是一款企業應用加速器,總容量高達 1.4TB,利用 PCIe 接口,並提供獨特的半高半長 (HHHL) 和 2.5" 外形規格。美光選擇了 25nm P420m 的 MLC NAND 不僅可以滿足主流市場對性能和可靠性的要求,還可以提供比其更具成本效益和更高容量的產品 P320小時 與 SLC NAND 配對。 P420m 和 P320h 之間的另一個核心區別是美光增加了電容器以在意外斷電時保護飛行中的數據。 額外的數據保護功能可使卡保持足夠長的供電時間,以刷新對 NAND 的所有寫入,為企業提供多一層數據保護。 HHHL 卡通過 PCIe Gen2 x8 接口實現高達 3.3GB/s 的順序讀取性能和高達 630MB/s 的寫入以及高達 750,000 IOPS 的隨機讀取和 95,000 IOPS 的寫入活動。 PCIe Gen2.5 x2 上的 4" 接口分別高達 1.8GB/s 和 430,000 IOPS。
Micron P420m 的核心是與其兄弟產品相同的定制 Micron/IDT ASIC 控制器 美光 P320h PCIe 以及相同的 RAIN 架構(獨立 NAND 的冗餘陣列)。 RAIN 提供跨閃存通道使用 RAID5 的設備集成算法,使美光能夠提供更高的性能、可靠性和數據完整性。 RAIN 還通過在檢測到故障時啟動自動後台重建,即使在發生通道故障後也能保證驅動器連續運行。 RAIN 是完全自動化的,完全在後台運行,不會降低系統級性能。
整個應用加速器市場在容量和性能方面提供了廣泛的選擇,但一個可能被忽視的特性是功耗。 一些解決方案消耗如此多的功率並排出如此多的能量,以至於主機內冷卻成為一個嚴重的問題。 另一方面,P420m 完全符合 PCIe 規格,待機時的額定功率僅為 8W(7GB 350" 為 2.5W),根據容量、外形尺寸和性能調整選項,有源功率範圍高達 30W。2.5"外形尺寸額定為 14GB 為 350W,22GB 為 700W。 HHHL 外形規格的 22GB 額定功率為 700W,而 1.4TB 型號的額定功率為 25W(開啟功率節流)和 30W(未激活)。
如前所述,美光 P420m 提供 HHHL 和 2.5" PCIe 外形尺寸。2.5" PCIe 外形尺寸仍然是美光獨有的,儘管其他人已經展示了該技術的演示。 戴爾為其創建了一個背板 12G PowerEdge 服務器 適用於允許將它們以四個一組安裝在傳統前置驅動器托架中的驅動器。 當然,能夠通過服務器前端訪問驅動器而無需關閉系統電源和取下蓋子來維修驅動器被一些人視為一個巨大的好處。 這也有助於美光的 2.5" PCIe 驅動器成為該驅動器尺寸中迄今為止速度最快的存儲,正如我們在 2.5" P320h 評測.
2.5" 提供 350GB 和 700GB 容量,而 HHHL 提供 700GB 和更高級別的 1.4TB 容量。HHHL 卡提供 5 PBW (700GB) 和 10 PBW (1.4TB) 的耐用性。我們的審查單位是四個1.4TB 容量卡。
美光 P420m 企業級 PCIe SSD 規格
- 容量
- 700GB(MTFDGAR700MAX-1AG1Z)
- 順序讀取:3.3GB/s(128KB,穩態)
- 順序寫入:600MB/s(128KB,穩態)
- 隨機讀取:750,000 IOPS(4KB,穩態)
- 隨機寫入:50,000 IOPS(4KB,穩態)
- 1.4TB (MTFDGAR1T4MAX-1AG1Z)
- 順序讀取:3.3GB/s(128KB,穩態)
- 順序寫入:630MB/s(128KB,穩態)
- 隨機讀取:750,000 IOPS(4KB,穩態)
- 隨機寫入:95,000 IOPS(4KB,穩態)
- 700GB(MTFDGAR700MAX-1AG1Z)
- 就緒延遲:<100µs
- 寫入延遲:<13µs
- 接口:PCIe Gen2 x8
- 功率:最大30W,閒置8個
- 外形:HHHL
- 尺寸:68.90mm X 167.65mm X 18.71mm
- 工作溫度:0°C 至 +50°C
- 可靠性和耐用性
- 不可糾正的誤碼率 (UBER):<1 個扇區/1017 位讀取
- MTTF:2萬小時
- PBW:5 (700GB)、10 (1.4TB)
- 操作系統兼容性
- 微軟:Windows Server 2008 R2 SP1 (x86-64)、Windows Server 2008 R2 SP1 Hyper-V (x86-64)、Windows Server 2012 (x86-64) SP128、Windows 7 (x86-64)
- Linux:RHEL Linux 5.5、5.6、5.7、5.8、6.1、6.2、6.3 (x86-64)、SLES Linux 11 SP1 和 SP2 (x86-64)
- VMware 5.0、5.1 (x86-64)
- 開源 GPL(內核版本 2.6.25+)
設計和建造
美光 P420m 是一款半高半長的 x8 PCIe 應用加速器,其特點是在主板上安裝了一個控制器,並附有子板以容納更多的 MLC NAND 和電源故障電容器。 與其頂級產品、基於 SLC NAND 的 P320h 同級產品一樣,P420m 遵循通用 HHHL 規範,幾乎可以安裝在任何開放式服務器 PCIe 插槽上。
電源故障電容器是美光 P420m 的新功能,有助於確保斷電時的數據完整性,因為美光啟用了利用 P420m 上的 DRAM 的回寫緩存。 P320h 的默認配置設置為直寫,但用戶可以(自行決定)啟用回寫緩存以提高性能。 由於更改了默認條件以幫助從新的 MLC 平台獲得更高的性能,美光選擇無論安裝環境的條件如何都確保可靠的性能。
卡的頂部有一個帶有 Micron P420m 品牌的粘性黑色板。 該板還用於保護頂層子板及其電源故障電容器,以及控制器的散熱器。 該控制器是 Micron/IDT ASIC 控制器,也可在 Micron P320h 上找到。 至於 NAND,美光包括 64 個他們自己的美光 31C12NQ314 25nm MLC NAND 封裝。 結果是 2048GB 或原始容量,然後過度配置到 1.4TB 可用。
測試背景和比較
Micron P420m Enterprise PCIe SSD 使用 Micron/IDT ASIC 控制器和帶有 PCIe 2.0 x8 接口的 Micron MLC NAND。
本次審查的可比性:
- Fusion-io ioDrive2 (1.2TB,1 x Xilinx Virtex-6 FPGA 控制器,MLC NAND,PCIe 2.0 x4)
- 華為Tecal ES3000 (1.2TB,3 個專有 FPGA 控制器,MLC NAND,PCIe 2.0 x8)
- 英特爾SSD 910 (800GB,4 個英特爾 EW29AA31AA1,MLC NAND,PCIe 2.0 x 8)
- LSI Nytro WarpDrive BLP4-400 (400GB,4 個 SandForce SF-2500 控制器,東芝 eMLC NAND,PCIe 2.0 x8)
- 美光P320h (700GB,IDT 控制器,SLC NAND,PCIe 2.0 x8)
- Virident FlashMAX II (2.2TB,2 個專有 FPGA 控制器,eMLC NAND,PCIe 2.0 x8)
所有 PCIe 應用加速器都在我們的第二代企業測試平台上進行了基準測試,該平台基於 聯想ThinkServer RD630. 對於綜合基準,我們利用 菲奧 Linux 版本 2.0.10 和 Windows 版本 2.0.12.2。 在我們的綜合測試環境中,我們使用時鐘速度為 2.0GHz 的主流服務器配置,儘管具有更強大處理器的服務器配置可以產生更高的性能。
- 2 x Intel Xeon E5-2620(2.0GHz,15MB 緩存,6 核)
- 英特爾 C602 芯片組
- 內存 – 16GB (2 x 8GB) 1333Mhz DDR3 Registered RDIMM
- Windows Server 2008 R2 SP1 64 位、Windows Server 2012 Standard、CentOS 6.3 64 位
- 100GB 美光 P400e 啟動固態硬盤
- LSI 9211-4i SAS/SATA 6.0Gb/s HBA(用於啟動 SSD)
- LSI 9207-8i SAS/SATA 6.0Gb/s HBA(用於基準測試 SSD 或 HDD)
值得注意的是,我們選擇的可比較產品主要是基於 MLC 的驅動器,SLC Micron PCIe 驅動器除外。 也就是說,並非所有 PCIe 驅動器在性能目標和價格方面都是平等的。 特定的應用程序需要特定的存儲需求,因此我們選擇在 NAND 類型而不是控制器數量等方面對組件進行標準化。
應用性能分析
在企業市場中,產品聲稱在紙面上的表現與它們在實際生產環境中的表現之間存在巨大差異。 我們了解評估存儲作為大型系統組件的重要性,最重要的是存儲在與關鍵企業應用程序交互時的響應速度。 為此,我們推出了應用程序測試,包括我們專有的 MarkLogic NoSQL 數據庫存儲基準 通過 SysBench 的 MySQL 性能.
在 MarkLogic NoSQL 數據庫環境中,我們測試了可用容量大於或等於 700GB 的單個 PCIe 應用加速器。 我們的 NoSQL 數據庫需要大約 650GB 的可用空間才能使用,平均分配給四個數據庫節點。 在我們的測試環境中,我們使用 SCST 主機並在 JBOD 中呈現每個 SSD(而一些 PCIe SSD 利用軟件 RAID0),每個數據庫節點分配一個設備或分區。 該測試以 24 個間隔重複進行,對於此類 SSD 總共需要 30-36 小時。 測量 MarkLogic 軟件看到的內部延遲,我們記錄了總平均延遲以及每個 SSD 的間隔延遲。
華為 ES3000 1.2TB HP 提供了該組中最好的延遲,峰值平均間隔延遲在 3.5-9.9 毫秒之間。
基於 SLC 的美光 P320h 700GB 在該組中排名第二,峰值測量值在 12-17.7 毫秒之間。
Virident FlashMAX II 2.2TB HP 位於我們基於 MLC 的 PCIe SSD 包的中間位置,平均延遲峰值在 16-26 毫秒之間。
與 Virident FlashMAX II 910TB 相比,英特爾 SSD 2.2 的總體平均延遲時間有所提高,峰值範圍為 6-50 毫秒。
Fusion-io ioDrive2 也落後於多控制器 PCIe 應用程序加速器,其峰值也在 6-50 毫秒範圍內。
Micron P420m 在我們的 MarkLogic NoSQL 數據庫測試中墊底,峰值在 25-74 毫秒之間。
我們的下一個應用測試包括 通過 SysBench 進行 Percona MySQL 數據庫測試,它衡量 OLTP 活動的性能。 在此測試配置中,我們使用一組 聯想 ThinkServer RD630s 並將數據庫環境加載到單個 SATA、SAS 或 PCIe 驅動器上。 該測試測量平均 TPS(每秒事務數)、平均延遲以及 99 到 2 個線程範圍內的平均 32% 延遲。 Percona 和 MariaDB 在其最新版本的數據庫中使用 Fusion-io 閃存感知應用程序 API,儘管為了進行比較,我們在其“傳統”塊存儲模式下測試了每個設備。
在我們的 SysBench 測試中,美光 P420m Enterprise PCIe SSD 在 2,361 線程下的性能接近中上,測量值為 32TPS,略微超過 Fusion ioDrive2 MLC,領先於 Virident FlashMAX II 和 LSI Nytro翹曲驅動器。
憑藉其強大的事務性能,美光 P420m 提供的平均延遲從 8.55 線程的 2 毫秒擴展到 13.55 線程的 32 毫秒。
雖然平均 TPS 或延遲很重要,但另一個有價值的考慮因素是第 99 個百分位數的延遲,它顯示了測試過程中最壞情況下的性能。 美光 P420m 排名中等,範圍從 18.8 毫秒到 25.8 毫秒。
企業綜合工作負載分析
我們的 綜合企業存儲基準 該過程首先分析驅動器在徹底預處理階段的運行方式。 每個可比較的驅動器都使用供應商的工具進行安全擦除,在 16 個線程的重負載下使用相同的工作負載預處理到穩定狀態,每個線程有 16 個未完成隊列,然後按設定的時間間隔進行測試在多個線程/隊列深度配置文件中顯示輕度和重度使用情況下的性能。
預處理和初級穩態測試:
- 吞吐量(讀+寫 IOPS 聚合)
- 平均延遲(讀+寫延遲一起平均)
- 最大延遲(峰值讀取或寫入延遲)
- 延遲標準偏差(讀+寫標準偏差一起平均)
我們的企業綜合工作負載分析包括兩個基於實際任務的配置文件。 開發這些配置文件是為了更容易與我們過去的基準測試以及廣泛發布的值(例如最大 4k 讀寫速度和 8k 70/30,通常用於企業硬件)進行比較。
- 4k
- 100% 讀取或 100% 寫入
- 100% 4k
- fio –filename=/dev/sdx –direct=1 –rw=randrw –refill_buffers –norandommap –randrepeat=0 –ioengine=libaio –bs=4k –rwmixread=100 –iodepth=16 –numjobs=16 –runtime=60 –group_reporting –名稱=4ktest
- 8k 70/30
- 70% 讀取,30% 寫入
- 100% 8k
- fio –filename=/dev/sdx –direct=1 –rw=randrw –refill_buffers –norandommap –randrepeat=0 –ioengine=libaio –bs=8k –rwmixread=70 –iodepth=16 –numjobs=16 –runtime=60 –group_reporting –名稱=8k7030test
在衡量 PCIe 應用加速器的性能時,有必要評估它們在 Linux 和 Windows 中的性能。 我們這樣做是因為有些卡更喜歡一個操作系統而不是另一個操作系統,並且組織的部署可能在很大程度上取決於在特定環境中實現真實世界的結果。 因此,我們按操作系統組織了結果; 首先顯示所有 Linux 數據和圖表,然後顯示 Windows 結果。
在我們的第一個測試中,我們在 CentOS 4 中測量了 Micron P420m 從突發到穩定狀態的 6.3K 隨機寫入性能,我們看到吞吐量峰值約為 158k IOPS,然後逐漸下降到略低於 100k IOPS。 與 Intel SSD 910 和 LSI Nytro WarpDrive 相比,這些速度是有利的,但與 ioDrive2 MLC 或多控制器 MLC 應用程序加速器(如 FlashMAX II 或華為 ES3000)相比則有所不足。
在我們的 Windows Server 2008 R2 環境中,性能幾乎與我們的 Linux 發現相同,測得 159k IOPS 突發到大約 100k IOPS 穩定狀態。
將我們的注意力轉移到平均延遲上,美光 P420m 的響應時間約為 1.6 毫秒,然後在穩態下增加到約 2.5 毫秒。
類似於我們在 4K 隨機寫入測試中的隨機 Linux 發現,我們測量的平均延遲從突發時的 1.6 毫秒到接近穩態時的 2.52 毫秒。
在我們的整個預處理過程中,美光 P420m 保持非常穩定,在大多數測試中保持其峰值低於 10 毫秒的組中最低之一。
在我們的 Windows Server 420K 隨機寫入測試中,美光 P4m 在峰值響應時間方面表現出色,在測試期間保持在 10 毫秒以下。
當談到我們 4K 隨機寫入預處理測試中的延遲一致性時,美光 P420m 幾乎名列前茅,僅次於基於 SLC 的 P420h 和華為 ES3000。
切換到我們的 Windows Server 環境後,Micron P420m 在 MLC 包中名列前茅,在延遲一致性方面僅次於基於 SLC 的 P320h。
經過 6 小時的預處理後,我們注意到美光 P420m 的讀取性能非常出色,達到 587k IOPS,在 MLC 包中名列前茅。 4K 隨機寫入性能測得 99k IOPS,排名靠後,但仍領先於 Intel SSD 910 和 Nytro WarpDrive。
與我們的 Linux 測試環境相比,Windows Server 420 R2008 中的 Micron P2m 提供了性能提升,幾乎與 P320h 相當。 寫入性能保持不變,僅提高了約 100 IOPS。
在 16T/16Q 的重負載下,我們測得 Micron P0.43m 的隨機讀取平均穩態延遲為 2.56 毫秒,隨機寫入延遲為 420 毫秒。
在我們的 Windows 測試環境中,與 CentOS 中的 420 毫秒相比,美光 P0.40m 的平均讀取延遲略低,為 0.43 毫秒。 平均寫入延遲與 Linux 的調查結果相當。
當談到 Linux 中的 4K 隨機延遲時,美光 P420m 測得非常低,讀取時間為 11.89 毫秒,寫入時間為 7.75 毫秒。
在 Windows 中達到穩定狀態後,美光 P420m 的讀取響應時間有所改善,降至僅 1.64 毫秒。 峰值寫入延遲略微上升至僅 8.64 毫秒。
就 Linux 中的延遲一致性而言,美光 P420m 在 MLC 組中提供了最佳的讀取標準偏差,在寫入標準偏差方面排名第二。
在我們的 Windows Server 環境中,P420m 的延遲一致性得到顯著改善,保持領先地位。 寫入延遲一致性也略有改善,儘管華為 ES3000 名列前茅。
在我們的下一個工作負載中,我們將查看具有 8/70 讀/寫混合比的隨機 30k 配置文件。 在我們的 Linux 環境中,美光 P420m 再次進入中間位置,性能從突發的 175k IOPS 擴展到穩定狀態下的大約 117k IOPS。
在我們的 Windows Server 環境中,Micron P420m 在我們的 8k 70/30 工作負載中表現略高,吞吐量峰值為 178k IOPS,穩定狀態下穩定至 118k IOPS。
我們在 Linux 中來自美光 P8m 的 70K 30/420 預處理工作負載的平均延遲範圍從突發的 1.46 毫秒到穩態的約 2.2 毫秒。
切換到我們的 Windows Server 環境後,我們發現 Micron P420m 的平均延遲略低,從突發狀態的 1.43 毫秒到穩定狀態下的 2.15 毫秒不等。
在具有 8k 70/30 工作負載的 Linux 環境中,美光 P420m 在大部分測試中測得大約 10 毫秒,少數峰值約為 140 毫秒。
雖然 Micron P420m 在我們的 Linux 測試環境中有一些更高的延遲峰值,但在 Windows Server 中,它在預調節期間保持在 16 毫秒以下。
比較延遲一致性,美光 P420m 在大部分測試中表現出同類產品中的佼佼者,一些尖峰使其進入基於 SLC 的 P320h 或 FlashMAX II 的範圍。
在 Windows Server 2008 R2 中,美光 P420m 能夠提供與華為 ES3000 非常接近的延遲一致性。
與我們在 16% 16k 寫入測試中執行的固定 100 線程、4 隊列最大工作負載相比,我們的混合工作負載配置文件可在各種線程/隊列組合中擴展性能。 在 8k 70/30 工作負載中,美光 P420m 落後於 Virident FlashMAX II,從 21.7T/2Q 的 2k IOPS 到 115.9T/16Q 的 16k IOPS,儘管遠低於 1.2TB ES3000,後者從 28.9k 擴展到 276.7 IOPS。
憑藉我們在 Linux 中的 8k 70/30 工作負載的強大性能,Micron P420m 在 Windows Server 中獲得了一點動力,從 22.8T/2Q 的 2k IOPS 擴展到 117.8T/16Q 的 16k IOPS。
在我們的 CentOS 6.3 環境中,Micron P420m 提供的平均延遲範圍從 0.17T/2Q 的 2 毫秒到 2.2T/16Q 的 16 毫秒不等。
在 Windows Server 2008 R2 中,美光 P420m 提供的平均延遲在 0.17T/2Q 時低至 2 毫秒,在 2.16T/16Q 時增加到 16 毫秒。
美光 P420m 在我們的 8k 70/30 工作負載中將延遲峰值保持在最低水平,在有效隊列深度分別為 70 和 140 時僅顯示兩個峰值,分別為 128 毫秒和 256 毫秒。
雖然 Linux 環境在高隊列深度處顯示出兩個峰值延遲峰值,但 P420m 在我們的 Windows Server 環境中保持穩定,高達 13.94 毫秒。
比較我們增加的 8k 70/30 工作負載中的延遲一致性,美光 P420m 在 MLC 包中名列前茅,落後於華為 ES3000。 基於 SLC 的美光 P320h 仍然提供了該組中最低的標準偏差,主要針對繁重的寫入工作負載。
與我們在 P420m 的 Linux 環境中註意到的緊密延遲一致性相似,Windows Server 環境也不例外,在更高的有效隊列深度上顯示出進一步的收益。
結論
美光 P420m 應用加速器建立在 美光 P320h PCIe,而不是針對更多的讀取密集型用例,而其兄弟則適用於更密集的寫入密集型應用程序。 這兩款卡均採用相同的定制 Micron/IDT ASIC 控制器,可幫助 P420m 驅動順序性能高達 3.3GB/s 讀取和 630MB/s 寫入,隨機讀取和寫入分別高達 750,000 IOPS 和 95,000 IOPS。 另一個共同特點是 P420m 還提供兩種外形尺寸,HHHL PCIe 和 2.5",這使 OEM 和客戶能夠靈活地將最佳版本與給定應用配對。除了選定的功能外,P420m 還增加了電源故障電容器以確保數據完整性,即使在出現意外斷電時也是如此。
P420m 以多種方式在日益擁擠的空間中脫穎而出。 除了 Micron 引用的可預測性能數據外,該驅動器還是一種通用外形規格 (PCIe),非常適合標準服務器部署。 當然,它還提供獨特的 2.5" PCIe 外形尺寸,戴爾已在其整個產品中採用 PowerEdge 12G 服務器線. 不過歸根結底,標準 PCIe 卡的部署非常簡單,符合 PCIe 規範(並非所有卡都符合),並且使用具有單個控制器和更少故障點的基本架構。 採用新電容器提供電源故障保護,該解決方案可靠且兼容,建立在經過驗證的架構之上。
著眼於性能,Micron P420m 在寫入或混合讀/寫測試中處於中間位置,與 Fusion ioDrive2 單盤、Intel SSD 910 和 LSI Nytro WarpDrive 系列競爭得很好。 與 Virident FlashMAX II、華為 ES3000 或 Fusion ioDrive2 等高端多控制器 PCIe 應用加速器相比,美光 P420m 在我們的綜合基準測試中落後。 鑑於美光 P420m 的設計差異以及最大功率限制和更低的冷卻要求,這並不令人感到意外。 在我們的應用程序測試中,P420m 在我們衡量 MySQL 性能的 Sysbench 基準測試中表現出色,但在我們的 MarkLogic NoSQL 測試中墊底。 對於準備繁重的安裝,P420m 表現出色,在 Linux 中提供超過 587k IOPS 4k 讀取,在 Windows 中提供超過 636k IOPS 讀取。 總體而言,P420m 達到了 Micron 的目標,設計了一款性能強大的單控制器 PCIe SSD,旨在以多種形式提供讀取密集型安裝。
優點
- 在我們的隨機 636k 讀取測試中,出色的讀取性能超過 4k IOPS
- 基於經過驗證的架構構建,並添加了電源故障保護
- 提供適用於不同服務器應用的通用 HHHL 外形尺寸和 2.5"
缺點
- 與高端多控制器 PCIe 應用加速器相比,性能落後
底線
美光 P420m PCIe 應用加速器為組織提供了靈活性,以 2.5" 和 HHHL PCIe 外形提供,它還提供可預測的讀取性能,標準 PCIe 外形的容量範圍高達 1.4TB。這要歸功於美光的 25nm MLC NAND , 與 SLC 模型相比,美光可以降低成本,使該卡更實惠,同時仍以可普遍部署的外形提供強大的性能。