美光 RealSSD P320h 是一款半高半長 (HHHL) 應用程序加速器,它利用 SLC NAND 和 PCIe Gen 2 x8 接口來驅動 3.2 GB/s 順序讀取和高達 785,000 隨機讀取 IOPS 的引用性能。 P320h 架構不同於我們審查過的許多其他最近的應用程序加速器,這些加速器通常將多個閃存驅動器組合在一起。 Micron 的產品有所不同,而是使用帶有自定義控制器的 RAIN(獨立 NAND 冗餘陣列),這類似於 Fusion-io 和 Virident 所採用的方法。 這種架構讓 Micron 擁有一些令人興奮的速度和延遲聲明,同時在驅動器上提供高級別的數據安全性。 在本次審查中,我們測試了一對 700GB 卡,不僅可以了解它們的運行速度,還可以了解 P320h 在 Windows Server 2012 中的擴展能力。
美光 RealSSD P320h 是一款半高半長 (HHHL) 應用程序加速器,它利用 SLC NAND 和 PCIe Gen 2 x8 接口來驅動 3.2 GB/s 順序讀取和高達 785,000 隨機讀取 IOPS 的引用性能。 P320h 架構不同於我們審查過的許多其他最近的應用程序加速器,這些加速器通常將多個閃存驅動器組合在一起。 Micron 的產品有所不同,而是使用帶有自定義控制器的 RAIN(獨立 NAND 冗餘陣列),這類似於 Fusion-io 和 Virident 所採用的方法。 這種架構讓 Micron 擁有一些令人興奮的速度和延遲聲明,同時在驅動器上提供高級別的數據安全性。 在本次審查中,我們測試了一對 700GB 卡,不僅可以了解它們的運行速度,還可以了解 P320h 在 Windows Server 2012 中的擴展能力。
如前所述,從吞吐量和延遲的角度來看,驅動器架構和 NAND 管理策略在設備性能方面起著至關重要的作用。 通過 P320h,Micron 將他們自己的 IP 與 IDT 的 ASIC 設計和製造融合在一起。 最終結果是一個 ASIC 控制器,其中包含美光圍繞 NAND 管理和控制的專有智能,其中包括 RAIN。 Micron 的 RAIN 方法在處理 NAND 方面非常高效,而這種效率最終是推動 P320h 性能和數據保護的因素。 Micron 在 RAIN 中使用相當於 7+1P RAID5 架構。 通過在 7+1 級別使用條帶化,美光能夠提供與無奇偶校驗驅動器相同的性能,同時仍提供企業所需的數據保護。
由於採用了美光 NAND 管理技術,P320h 很有趣,但它在物理上也很有趣。 HHHL PCB 全是 Micron 部件,當然包括 SLC NAND 和 DDR,它不需要外部電源連接即可達到最佳性能。 我們的 700GB 驅動器有 64 個 NAND 片夾在板上,單個控制器上的被動散熱器突出顯示了這一點。 與依賴通過硬件和軟件組合多個控制器的競爭解決方案相比,單一控制器設計具有更好的性能和可靠性。 使用專為 Micron NAND 設計的控制器為 Micron 在驅動器的互操作性、性能和支持方面提供了另一個優勢。 與其他地方報導的相反,該驅動器不支持 NVMe,但美光肯定會在未來的產品中朝著這個方向發展。
美光為 P320h 提供兩種 SLC 專用容量,350GB 和 700GB 可用容量。 一個 350GB 的驅動器以 512GB RAW 開始,但在減去 12.5% 的 RAIN 和 22% 的超額配置後,該驅動器的容量為 350GB。 P320h 為 25GB 型號提供高達 350PB 的耐用性,為 50GB 型號提供高達 700PB 的耐用性,並隨附用於驅動器管理和健康報告的軟件工具。
美光 RealSSD P320h 規格
- 容量
- 350GB(MTFDGAR350SAH-1N1AB)
- 順序讀取:3.2 GB/s(128KB,穩態)
- 順序寫入:1.9 GB/s(128KB,穩態)
- 隨機讀取:785,000 IOPS(4KB,穩態)
- 隨機寫入:175,000 IOPS(4KB,穩態)
- 700GB(MTFDGAR700SAH-1N1AB)
- 順序讀取:3.2 GB/s(128KB,穩態)
- 順序寫入:1.9 GB/s(128KB,穩態)
- 隨機讀取:785,000 IOPS(4KB,穩態)
- 隨機寫入:205,000 IOPS(4KB,穩態)
- 350GB(MTFDGAR350SAH-1N1AB)
- 就緒延遲:<42µs(512 字節)
- 寫入延遲:<9µs
- 接口:PCIe Gen2 x8
- 功率:最大 25W,閒置 10W
- 外形:HHHL
- 本機命令排隊多達 256 個命令
- 耐力:350GB – 25PB,700GB – 50PB
- 尺寸:68.90mm X 167.65mm X 18.71mm
- 工作溫度:0°C 至 +50°C
- 操作系統兼容性
- 微軟:Windows Server 2008 R2 SP1 (x86-64)、Windows Server 2008 R2 SP1 Hyper-V (x86-64)、Windows Server 2012 (x86-64) SP128、Windows Server 2012 Hyper-V (x64)
- Linux:RHEL Linux 5.5、5.6、5.7、5.8 (SP128)、6.1、6.2 (x86-64)、SLES Linux 11 SP1 和 SP2 (x86-64)
- 開源 GPL(內核版本 2.6.25+)
- 壽命終止數據保留 1 年
影片總覽
構建和設計
Micron RealSSD P320h 是一款半高半長 x8 PCI-Express 卡,在設計方面採用了市場上最基本的 PCIe AA 佈局。 它帶有一個控制器和兩個小子卡,比我們迄今為止審查過的任何其他解決方案都更纖薄,而且是迄今為止最簡單的解決方案。 這在多個方面對美光有利。 首先,該卡自動適用於市場上幾乎所有支持 PCIe 擴展卡的服務器,但在比較企業解決方案的整體可靠性時,它也發揮了作用。 使用單個控制器,甚至沒有 Fusion-io“Duo”產品上的 PCIe 開關,可能發生故障的部件更少。 這與一些將多個 SandForce 控制器 RAID 在一起的競爭解決方案中的多控制器配置形成鮮明對比。 在一個討厭平台一旦投入生產就關閉的市場中,除了最終的更換之外,知道您今天安裝的設備可以工作多年而不會引起問題是一個巨大的優勢。
Micron RealSSD P320h 的核心是定制的 Micron/IDT ASIC 控制器,這是該解決方案所獨有的。 在我們的兩個 700GB 樣本上,該控制器隨後鏈接到 1TB 的美光 SLC NAND 池,並使用 2.25GB 的美光 DDR RAM 進行緩衝。 根據您的看法,這些項目為美光提供了巨大的優勢,因為他們非常詳細地了解所有這些組件如何在核心級別上通過內部製造來工作。
Micron RealSSD P320h 在功耗方面非常靈活,PCIe 25 x2.0 總線的功耗不到 8 瓦; 無需外部電源連接。 這使 P320h 在尋找合適的安裝平台時具有更大的靈活性,無需額外的電源線或測試服務器即可通過 PCIe 規範供電。
管理軟件
雖然大多數應用程序加速器都附帶一些軟件,但這些工具的可用性和有效性參差不齊。 Micron 提供了他們的 RealSSD Manager 工具,旨在更有效地管理 P320h,包括 CLI 和 GUI。 這些工具與 Windows 和 Linux 兼容,並提供廣泛的功能。 用戶可以利用這些軟件工具來更新驅動器固件、檢查 PCIe AA 的運行狀況以及啟動設備格式。 在更高級的級別上,您可以使用內置的日誌記錄功能監控當前的驅動器使用情況和溫度。
與我們迄今看到的製造商附帶的實用程序相比,美光的在功能集和整體設計方面僅次於 Fusion-io。 與 ioSphere 相比,Micron RealSSD Manager 雖然在設計上有所縮減,但它提供了許多相同的管理和監控功能,儘管只是在本地級別。 目前它不支持遠程系統上的監控設備,但與 LSI 或 OCZ 管理工具相比,總體上在功能上有了很大的提升。
測試背景和比較
在測試企業硬件時,環境與用於評估它的測試過程一樣重要。 在 StorageReview,我們提供與許多數據中心相同的硬件和基礎設施,我們測試的設備最終將用於這些數據中心。 這包括僅使用企業服務器以及適當的基礎設施設備(如企業網絡、機架空間、電源調節/監控)和同類可比硬件進行測試,以正確評估設備的性能。 我們的評論都不是由我們正在測試的設備的製造商支付或控制的; 與我們自行決定從我們擁有的產品中挑選的相關可比對象 在我們的實驗室.
StorageReview 企業測試平台:
- 2 個英特爾至強 X5650(2.66GHz,12MB 緩存)
- Windows Server 2008 Standard Edition R2 SP1 64 位和 CentOS 6.2 64 位
- 英特爾 5500+ ICH10R 芯片組
- 內存 – 8GB (2 x 4GB) 1333Mhz DDR3 Registered RDIMM
在為本次評測選擇可比產品時,我們選擇了每個製造商的領先者,但僅限於與配備 SLC 的美光 RealSSD P320h 相比有意義的領域。 出於這個原因,我們放棄了第一代 LSI WarpDrive,因為它被第二代 Nytro WarpDrive 和 OCZ Z-Drive R4 所取代,後者遠遠超出了性能企業存儲市場需求的延遲曲線.
640GB Fusion-io ioDrive 雙核
- 發佈時間:1H2009
- NAND 類型:MLC
- 控制器:2 x 專有
- 設備可見性:JBOD、軟件 RAID 取決於操作系統
- 融合 io VSL Windows:3.1.1
- Fusion-io VSL Linux 3.1.1
200GB LSI Nytro WarpDrive WLP4-200
- 發佈時間:1H2012
- NAND 類型:SLC
- 控制器:4 x LSI SandForce SF-2500 通過 LSI SAS2008 PCIe 到 SAS 橋
- 設備可見性:固定硬件 RAID0
- 大規模集成電路視窗:2.10.51.0
- LSI Linux:原生 CentOS 6.2 驅動程序
700GB 美光 RealSSD P320h
- 發佈時間:2H2011
- NAND 類型:SLC
- 控制器:1 x 專有
- 設備可見性:單個設備
- 美光視窗:7.03.3452.00
- 美光 Linux:1.3.7-1
企業綜合工作負載分析(庫存設置)
我們看待 PCIe 存儲解決方案的方式比僅僅關注傳統的突發或穩態性能更深入。 查看長時間內的平均性能時,您會忽略設備在整個時間段內的性能背後的細節。 由於閃存性能隨時間變化很大,我們新的基準測試過程分析了每個設備整個預處理階段的總吞吐量、平均延遲、峰值延遲和標準偏差等方面的性能。 對於高端企業產品,延遲通常比吞吐量更重要。 出於這個原因,我們竭盡全力展示我們通過我們的每台設備的全部性能特徵 企業測試實驗室.
我們還添加了性能比較,以顯示每個設備如何使用 Fio 工作負載生成器在 Windows 和 Linux 操作系統的不同驅動程序集下執行。 對於 Windows,我們在最初審查時使用最新的驅動程序,然後在 64 位 Windows Server 2008 R2 環境下對每台設備進行測試。 對於 Linux,我們使用 64 位 CentOS 6.2 環境,每個 Enterprise PCIe Application Accelerator 都支持該環境。 我們進行此測試的主要目標是展示操作系統性能的差異,因為在產品表上將操作系統列為兼容並不總是意味著它們之間的性能相同。
所有經過測試的設備從頭到尾都遵循相同的測試策略。 目前,對於每個單獨的工作負載,設備都使用供應商提供的工具進行安全擦除,以相同的工作負載預處理到穩定狀態,設備將在 16 個線程的重負載下進行測試,每個線程有 16 個未完成隊列,並且然後在多個線程/隊列深度配置文件中以設定的時間間隔進行測試,以顯示輕度和重度使用情況下的性能。 對於具有 100% 讀取活動的測試,預處理使用相同的工作負載,但翻轉為 100% 寫入。
預處理和初級穩態測試:
- 吞吐量(讀+寫 IOPS 聚合)
- 平均延遲(讀+寫延遲一起平均)
- 最大延遲(峰值讀取或寫入延遲)
- 延遲標準偏差(讀+寫標準偏差一起平均)
目前,Enterprise Synthetic Workload Analysis 包括四個通用配置文件,它們可以嘗試反映真實世界的活動。 選擇這些與我們過去的基準有一些相似之處,以及與廣泛發布的值(例如最大 4K 讀寫速度)以及企業驅動器常用的 8K 70/30 進行比較的共同點。 我們還包括兩個遺留的混合工作負載,包括傳統的文件服務器和 Web 服務器,提供各種傳輸大小。 最後兩個將隨著我們網站上介紹的那些類別的應用程序基準逐步淘汰,並替換為新的合成工作負載。
- 4K
- 100% 讀取或 100% 寫入
- 100% 4K
- 8K 70/30
- 70% 讀取,30% 寫入
- 文件服務器
- 80% 讀取,20% 寫入
- 10% 512b、5% 1k、5% 2k、60% 4k、2% 8k、4% 16k、4% 32k、10% 64k
- 網絡服務器
- 100% 閱讀
- 22% 512b、15% 1k、8% 2k、23% 4k、15% 8k、2% 16k、6% 32k、7% 64k、1% 128k、1% 512k
進入我們的第一個測試,該測試涵蓋 4K 隨機寫入預處理工作負載,美光 RealSSD P320h 起步很高,在我們的 Lenovo ThinkServer 中突發速度略低於 400k IOPS。 在 200 分鐘左右,性能穩定在 80k IOPS 以上,我們的 CentOS 6.2 和 Windows Server 2008 測試環境之間的性能非常相似。
查看我們 4K 預處理測試期間的平均延遲,P320h 在 1T/16Q 負載下很快穩定在略高於 16 毫秒的延遲,遠低於配備 SLC 的 LSI Nytro WarpDrive。
在我們的預處理工作負載期間比較 Windows 和 Linux 的最大延遲時,我們發現 Linux 環境提供的高延遲峰值最少,而 Windows 驅動程序集有時會波動到 1,000 毫秒。
雖然 1,000 毫秒的尖峰可能令人不安,但比較標準偏差可以更好地了解整個測試期間的整體延遲情況。 就 P320h 而言,即使它在 Windows Server 2008 中的峰值更高,它在 Linux 中仍然僅次於它自己。
過渡出預調節階段後,我們在 4K 工作負載和 16T/16Q 負載下對每個應用程序加速器進行了更長時間的採樣。 美光 RealSSD P320h 在 4K 隨機讀取和隨機寫入方面提供了迄今為止最高的性能,其 Linux 驅動程序集具有優勢。 在 CentOS 中,我們測量了 417k IOPS 讀取,而在 Windows 中“僅”為 378k IOPS。 4K 隨機寫入速度在兩個平台上保持一致,測得超過 202k IOPS。
憑藉近乎難以置信的吞吐量,P320h 的平均延遲最低也就不足為奇了。 平均讀取延遲略高於 0.6 毫秒,寫入延遲為 1.26 毫秒。
在比較我們最終的 4K 隨機讀寫性能樣本中的峰值延遲時,美光 RealSSD P320h 在 Windows 和 Linux 中具有一些最高的 4K 隨機讀取信號。 隨機寫入性能更加分裂,Windows 端的峰值延遲更高,Linux 端的峰值延遲更低。
進一步研究整體延遲,美光 realSSD P320h 在 Linux 中提供了迄今為止最一致的隨機 4K 性能,而其 Windows 驅動程序的性能稍差。
我們的下一個測試將重點轉移到我們的 8K 70/30 工作負載上,美光 P320h 在吞吐量方面再次領先該組。 在此部分中,突發速度在 30 分鐘內轉變為測試,然後在 120 分鐘標記附近趨於穩定。
P320h 在我們的 8K 70/30 工作負載中提供了非常低的平均延遲,在預處理過程中測得的延遲約為 1.5 毫秒。 Linux 驅動程序集略有領先,但在整體方案中您很難注意到這種差異。
將焦點從平均延遲切換到峰值延遲,Windows 和 Linux 中的行為之間存在明顯差異。 Windows 驅動程序的最大響應時間在 1,000-1,200 毫秒之間波動,而 Linux 端的響應時間較低,約為 200 毫秒。
雖然峰值延遲顯示了最差的單一響應時間,但我們的下一節將著眼於標準偏差,以了解延遲的整體情況在我們的預處理階段是如何發揮作用的。 在 Linux 中,與 Windows 端相比,Micron P320h 提供了更高級別的一致性。 雖然 Windows 的性能不太穩定,但仍處於中等水平。
與我們在 16% 16K 寫入測試中執行的固定 100 線程、4 隊列最大工作負載相比,我們的混合工作負載配置文件可在各種線程/隊列組合中擴展性能。 在這些測試中,我們將工作負載強度從 2 個線程和 2 個隊列擴展到 16 個線程和 16 個隊列。 美光 P320h 在更高隊列深度方面領先該組同類產品,同時在 2T/2Q 級別僅放棄最低限度的性能。 在整個範圍內,Linux 驅動程序集在大多數領域都提供了小幅度的更高吞吐量。
Micron RealSSD P320h 在除 2T/2Q 負載之外的所有部分中提供了組中最好的響應時間,並且在除 1T/16Q 部分之外的所有部分都保持在 16ms 以下。
在測試進行到中期時,Windows 中的 P320h 開始出現更高的響應時間,並發線程數超過 4 個。 除了接近 128 毫秒的最高有效 QD256 和 QD200 測試之外,Linux 驅動程序將這些信號保留在所有測試中。
比較標準偏差,美光 RealSSD P320h 在 Linux 下提供了最穩定的性能,並且在其 Windows 驅動程序集方面排名中等。
文件服務器工作負載代表了每個特定設備的更大傳輸大小頻譜,因此驅動器必須處理從 4b 到 8K 的請求,而不是適應靜態 512k 或 64k 工作負載。 文件服務器預處理測試是美光 P320h 在突發速度方面沒有超越其他型號的第一個領域,儘管它只是在測試結束時從安全擦除狀態繼續變得更快。 雖然開始時低於 80k IOPS,但在 100 分鐘後它超過了 120k IOPS 的穩定狀態。 這遠遠超過了該細分市場中的現有模型。
查看平均延遲,當 Micron RealSSD P320h 在有效隊列深度 256 處接近穩定狀態時,它的響應時間平均為 2 毫秒。
將我們的注意力轉移到峰值響應時間上,Windows 驅動程序集再次顯示出更高的峰值響應時間,在我們的整個測試過程中徘徊在 1,000 毫秒左右。 這與 Linux 驅動程序集相比,Linux 驅動程序集保持峰值水平不超過 50 毫秒。
雖然峰值響應時間不一定看起來很好,但我們將重點轉移到標準偏差上,以更清晰地描繪美光 P320h 的整體延遲。 在此區域中,您可以在 Windows 中的 P320h 測試期間看到一些光點,但它仍然保持在該組中最低的水平。
完成預處理階段後,我們開始進行初步測試,負載在 16T/16Q 到 2T/2Q 之間變化。 美光 RealSSD P320h 起步很快,隨著有效隊列深度的增加,它以巨大的領先優勢領先群雄。 在我們的雙處理器服務器中,最終性能達到 130k IOPS 以下。
比較平均延遲,P320h 在 130T/16Q 時提供了其最高的 4k IOPS 吞吐量,平均延遲約為 0.5 毫秒,在 EQD1 和 EQD2 級別上上升到 128-256 毫秒。
在我們的文件服務器測試的主要部分中的最大延遲圖片在我們的測試的 Windows 部分中與之前的測試有相同的 1,000 ms blips,而 Linux 驅動程序提供的峰值響應時間要低得多。
比較延遲標準偏差,美光 RealSSD P320h 在 Linux 中提供了最好的延遲分佈,在 Windows 中接近中間位置。
在我們最後一個涵蓋 Web 服務器配置文件的綜合工作負載(傳統上是 100% 讀取測試)中,我們應用 100% 寫入活動以在我們的主要測試之前完全預處理每個驅動器。 在此測試中,美光 RealSSD P320h 的穩態性能最快,但此測試的新內容是 Windows 和 Linux 驅動程序之間吞吐量的明顯差異。 Linux 性能更高,並提供更好的突發性能。
將焦點轉移到平均延遲上,美光 P320h 從剛開始的 20 多分鐘開始就提供了一條平坦的曲線,Linux 性能領先近 2 毫秒。
與之前測試中顯示 P1,000h 頻繁出現 320 毫秒信號的混合讀/寫工作負載相比,相比之下,Web 服務器預處理測試要平靜得多。 話雖如此,Linux 方面仍然更加平靜,在預處理過程中沒有顯示出延遲問題。
在我們的 Web 服務器預處理階段比較延遲標準偏差,Micron RealSSD P320h 提供了迄今為止最一致的延遲,即使我們包括了 Windows 驅動程序看到的信號。 當驅動器接近穩定狀態時,觀察非常溫和的延遲斜坡,我們看到性能在 60 到 80 分鐘之間完全趨於平穩。
切換到我們具有 100% 讀取配置文件的 Web 服務器測試的主要部分,美光 P320h 仍然在所有類別中領先,除了我們測試的 2T/2Q 部分的 Windows 性能。 比較其性能的一個有趣方面是,雖然 Linux 端提供了更高的寫入性能,但 Windows 驅動程序集提供了更高的讀取性能。 這導致所有部分的 Windows 性能更高,隊列深度更重,最高速度更高(152k vs 170k IOPS)
Micron RealSSD P320h 的平均延遲在所有階段都保持在 1 毫秒以下,有效隊列深度為 256 時除外。將其峰值吞吐量與平均延遲進行比較,我們發現該卡在我們的 Web 服務器跟踪中的最佳點介於 64 的有效隊列深度之間和 128。
儘管 Windows 驅動程序最終在吞吐量和平均延遲方面佔據上風,但在測試的大部分部分中,最大響應時間仍徘徊在 1,000 毫秒附近; Linux 性能沒有任何高延遲峰值
比較這組驅動器之間的延遲標準偏差,Linux 中的 Micron RealSSD 提供了最佳的延遲分佈,而 Windows 驅動程序則處於中間位置。
企業綜合工作負載分析(多驅動器/網絡)
我們配備了兩個 700GB Micron RealSSD P320h PCIe 應用加速器,配置了一個由運行 Windows Server 2012 的高性能 Supermicro 服務器組成的測試環境。該測試平台通過兩個獨立的 PCIe 3.0 Mellanox InfiniBand 適配器連接到我們的 SX6036 IB 交換機,到兩個HP Proliant DL380p Gen8 服務器也運行 Windows Server 2012。在高性能 Supermicro 存儲服務器上,我們使用存儲空間創建了一個簡單的存儲陣列,然後通過 SMB 共享。 與我們測試整個驅動器 LBA 表面的主要基準測試不同,這些測試強調分佈在條帶捲上的兩個 50GB 段,在本地和 InfiniBand 網絡上進行基準測試。
我們在下面提供了 InfiniBand 測試的概述視頻:
StorageReview 56Gb/s 企業測試平台:
超級微電腦 超級服務器 7047R-TXRF
- 超微電腦X9DRX+-F
- 雙 Intel E5-2670 CPU(2.6GHz,20MB 緩存)
- Windows Server 2012 數據中心
- 128GB 內存(8GB x 16 Hynix DDR3,每個 CPU 64GB)
- 英特爾至強 E5-2640(6 核,2.50 GHz,15MB,95W)
- Windows Server標準2012的
- 英特爾 C600 芯片組
- 64GB (8 x 8GB) 和 16GB (4 x 4GB) 1333Mhz DDR3 Registered RDIMM
Mellanox SX6036 56Gb/s InfiniBand 交換機和硬件
- 36 個 56Gb/s FDR 端口
- 無源 QSFP 銅纜
- Mellanox ConnectX-3 VPI PCIe 3.0 雙 56Gb/s InfiniBand 適配器
我們當前的 InfiniBand 高性能互連測試基礎設施包括兩台配備 Mellanox ConnectX-380 VPI PCIe 適配器的 HP Proliant DL8p Gen3 服務器,通過 Mellanox 的 36 端口 56Gb/s IB 交換機連接。 這種環境允許我們正在測試的存儲設備成為 I/O 瓶頸,而不是網絡設備本身。
在我們的本地簡單空間和 InfiniBand 測試部分,我們縮小了有限的測試選擇範圍,而不是我們的完整套件。 為了便於比較,我們使用 8K 70/30 工作負載來顯示本地訪問與通過網絡共享時的性能差異。
在我們的主要測試中使用較小的總體佔用空間進行測試,我們發現在雙卡環境中性能擴展得非常好。 在本地,通過同時運行兩個工作負載生成器會話來模擬在網絡上運行的兩個服務器,我們在 490K 8/70 工作負載中測量了超過 30k IOPS 的性能。 在兩個共享上呈現單個條帶陣列並從我們的兩個 HP Proliant DL380p Gen8 服務器訪問它,性能下降到 402k IOPS。 我們能夠在這兩種情況下將吞吐量提高一倍以上,並且仍然保持出色的每服務器性能。
查看我們的雙 P320h 環境中的平均延遲,本地訪問與通過 InfiniBand 的遠程訪問相比,平均延遲存在一些差異,但延遲仍低於我們在主要測試台上從一個 P320h 測得的延遲。 鑑於在多個系統之間共享這種高 I/O 設備對延遲的影響很小,它確實為將昂貴的高性能資源共享給多個系統打開了大門。
與本地訪問和遠程訪問相比,峰值延遲確實沒有可測量的差異,這一點很重要,因為您知道 InfiniBand 網絡不會顯著增加 PCIe 應用程序加速器等設備的延遲。
與峰值延遲類似,我們發現在本地條帶環境或我們的 InfiniBand 網絡上看到的延遲標準偏差之間沒有明顯差異。
在看到兩個有效隊列深度為 8 的同時負載的 70K 30/256 性能與本地性能相比,每個負載在網絡上的性能都有小幅下降後,我們將重點轉移到從 2T/2Q 到 16T/16Q 的不同工作負載上. 由於這同時發生在兩台服務器或兩個本地工作負載生成器上,因此總負載將從 4T/2Q 到 32T/16Q。 對條帶化 P320h 陣列的本地和網絡訪問都對不斷增加的負載提供了相同的響應。 兩項測試在整個頻譜範圍內顯示出幾乎相同的模式,本地訪問提供了最佳性能。
條帶化 P8h 配置上 70K 30/320 工作負載主要部分的平均延遲在本地和我們的網絡上提供了出色的性能。 最令人印象深刻的是 InfiniBand 結果,其中每台服務器的延遲都低於 0.8 毫秒,網絡上的 IOPS 超過 400,000。
將 8K 70/30 工作負載中的最大延遲與我們的雙 P320h 設置進行比較顯示了本地與遠程的相似結果,在測試期間兩者都有超過 1,000 毫秒的信號。
與上面的最大延遲結果類似,本地訪問 P320h 陣列與通過我們的 InfiniBand 網絡通過 Windows 存儲空間共享它之間的差異很小。
結論
Micron RealSSD P320h 只是執行良好工程的一個很好的例子。 從電路板設計和佈局到定制控制器,一切都使 P320h 成為真正的集成單元,即使在企業存儲空間中也並非總是如此。 美光找到了在整個驅動器中增加價值的方法,從定制 ASIC 中的 NAND 管理 IP 到盡可能深入的 NAND 特性,從而實現 SLC 閃存組件的最大性能和耐用性。
當我們評估 P320h 的性能時,驅動器發出尖叫聲,在我們的 CentOS 和 Windows Server 測試環境之間保持接近對等。 就其更好的環境而言,Linux 始終具有優勢,尤其是在最佳延遲方面。 說美光 P320h 速度快有點輕描淡寫。 它大大超越了我們迄今為止測試過的任何其他解決方案,其突發速度高於大多數解決方案,穩態性能也遠高於競爭解決方案。 深入研究其響應能力,平均延遲無可挑剔,但更令人印象深刻的是其全新的完美 Linux 性能,具有非常低的峰值延遲和延遲標準偏差。 Windows 方面相距不遠,儘管相比之下其峰值延遲和延遲標準差處於中間位置。
在兼容性方面,我們發現美光 RealSSD P320h 可以在企業環境中完美運行。 對我們來說,在消費者平台上測試這個頂級企業產品是沒有意義的,因為它永遠不會被帶入在其中運行的生產環境中。 為此,在我們對其進行測試的一級服務器中,它可以在多個操作系統上正常運行。 P320h 在我們運行 Windows Server 7047 的 Supermicro SuperServer 2012R 的雙驅動器配置中也沒有遇到任何問題,如我們的視頻所示。
如果我們要抱怨很多,那就是 Windows 環境留下了一些需要改進的小區域,尤其是當我們比較所有工作負載的峰值延遲和標準偏差時。 即使有更高的延遲,它仍然超過許多(如果不是全部)我們測試過的 PCIe 應用程序加速器,但我們認為仍然有一些性能有待更完善的驅動程序擠出。 另一個引起輕微抱怨的領域是僅提供兩種功能的 SLC 產品。 競爭對手提供 MLC 或 eMLC 驅動器,這允許較低的成本切入點以及更大的容量; 在某些情況下,一張卡上的容量超過 2TB。 誠然,閱讀量大的入門級企業市場並不是 P320h 的目標,但滿足更多需求的更多品種可以使 P320h 系列更加通用。
優點
- 我們迄今為止測試過的最快的 PCIe 應用程序加速器
- 極低的平均和峰值延遲
- Windows 和 Linux 環境中的出色性能對等
缺點
- 限於SLC NAND
- 最高 700GB
底線
Micron RealSSD P320h 是一款執行良好的完整產品,適用於希望獲得 PCIe 存儲最佳性能的企業。 P320h 是同類產品中的佼佼者,由於控制器中集成了美光組件和卓越的 NAND 管理知識產權,因此可實現出色且一致的多操作系統性能。
討論這篇評論