首頁 Enterprise 英特爾傲騰固態硬盤 P5800X 評測

英特爾傲騰固態硬盤 P5800X 評測

by 布賴恩·比勒
英特爾 p5800x 設計

英特爾傲騰固態硬盤 P5800X 擴展了英特爾最快的固態硬盤存儲層。 我們已經看到 Optane SSD 在實驗室中大量使用 P4800X,它是在四年前推出的。 隨著時間的推移,英特爾增加了驅動器的容量(從 375GB 開始),最高可達 1.5TB。 不過,小容量還可以,因為我們主要為耐久性設計的 Optane SSD 經常用於兩層架構。 在這裡,SSD 可以吸收寫入,這通常是 NAND SSD 失敗的地方。 我們看到 Optane 在這個角色上做得很好 Azure Stack 人機交互 VMware vSAN, 在其他人中。 現在,我們將親身體驗最新一代英特爾傲騰固態硬盤 P5800X,了解該平台的發展情況。

英特爾傲騰固態硬盤 P5800X 擴展了英特爾最快的固態硬盤存儲層。 我們已經看到 Optane SSD 在實驗室中大量使用 P4800X,它是在四年前推出的。 隨著時間的推移,英特爾增加了驅動器的容量(從 375GB 開始),最高可達 1.5TB。 不過,小容量還可以,因為我們主要為耐久性設計的 Optane SSD 經常用於兩層架構。 在這裡,SSD 可以吸收寫入,這通常是 NAND SSD 失敗的地方。 我們看到 Optane 在這個角色上做得很好 Azure Stack 人機交互 VMware vSAN, 在其他人中。 現在,我們將親身體驗最新一代英特爾傲騰固態硬盤 P5800X,了解該平台的發展情況。

英特爾 Ice Lake Optane 驅動器 p5800x

英特爾傲騰固態盤 P5800X 的新功能

英特爾並沒有阻止英特爾傲騰固態硬盤 P5800X 的譁眾取寵。 他們將這款硬盤稱為“世界上最快的數據中心 SSD”。 英特爾的數字看起來也非常好,直到您意識到它們是在與基於 P5600 NAND 的 SSD 進行比較。 不管怎樣,P5800X 在重要的地方確實比 P4800X 有了很大的提升,100 DWPD 的耐用性。

英特爾傲騰固態硬盤 P5800X 耐久性

由於 Intel Optane SSD P5800X 用於如此多的多層存儲配置,因此驅動器的耐用性至關重要。 Optane SSD 通常設置為吸收系統中的所有寫入,保護其背後更大、更慢的介質。 例如,這些可以是 QLC SSD,它們在讀取繁重的工作負載方面表現良好,但耐用性或寫入性能不佳。 因此,P5800X 是慢速媒體的完美伴侶。 許多軟件供應商已經意識到這一點。 vSAN、Azure HCI、StorONE 和許多其他公司都擅長使多層運行良好。

英特爾 p5800x 背面

正如在英特爾內存和存儲活動中提到的,該公司現在正在推出其第二代 Optane 產品,這是一種介於內存和傳統 NAND 之間的存儲類別,通常被稱為存儲級內存。 P5800X 利用新媒體和 PCIe Gen4 接口(現在可以利用,這要歸功於 第三代英特爾至強可擴展處理器) 以獲得更高的速度。

引用的數字非常令人印象深刻,最高速度為 7.4GB/s,吞吐量高達 2 萬 IOPS,所有這些都具有非常低的啟動延遲。 QoS 還以極低的延遲提供可預測的性能。 可預測和低延遲使其成為金融服務(欺詐檢測、分析、合規性和市場建模)以及實時投標(廣告請求、投標請求、投標和廣告投放)的有吸引力的選擇。

Intel Optane SSD P5800X 提供五年保修,容量為 400GB、800GB 和 1.6TB。 對於我們的審查,我們正在研究 800GB 型號。

intel p5800x正面

英特爾傲騰固態硬盤 P5800X 規格

容量 400GB,800GB,1.6TB
外形 U.2 和 E1.S
多媒體 第二代傲騰
介面 PCIe 4.0 1×4、2×2、NVMe 1.3d
專用集成電路/中央處理器 單核 1.1GHz ARM Cortex R7
媒體渠道 8-12
性能
順序閱讀 高達 7.4GB/秒
順序寫入 高達 7.4GB/秒
隨機4K閱讀 高達 1.55 萬次 IOPS
隨機 4K 寫入 高達 1.6 萬次 IOPS
隨機 4K 70/30 高達 2 萬次 IOPS
QoS(4KRR,QD=1,99%) <6µs
QoS(4GB/s 2K RW 下的 4KRR,99.999%) <66µs
耐力 100 DWPD
商品保修條款 5的一年

英特爾傲騰固態盤 P5800X 性能

試驗台

我們新的 PCIe Gen4 Enterprise SSD 評測利用了 聯想 ThinkSystem SR635 用於應用程序測試和綜合基準。 ThinkSystem SR635 是一個裝備精良的單 CPU AMD 平台,提供的 CPU 能力遠遠超過強調高性能本地存儲所需的能力。 它也是我們實驗室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市場上為數不多的平台之一)。 綜合測試不需要大量 CPU 資源,但仍利用相同的 Lenovo 平台。 在這兩種情況下,目的都是以盡可能符合存儲供應商最大驅動器規格的最佳方式展示本地存儲。

PCIe Gen4綜合及應用平台(Lenovo ThinkSystem SR635)

  • 1 個 AMD 7742(2.25GHz x 64 核)
  • 8 x 64GB DDR4-3200MHz ECC DRAM(1 x 64GB 用於 Houdini)
  • CentOS的7.7 1908
  • Ubuntu 20.10-桌面
  • ESXi 6.7u3

PCIe Gen3 綜合平台 (戴爾 PowerEdge R740xd)

  • 2 個英特爾金牌 6130 CPU(2.1GHz x 16 核)
  • 4 x 16GB DDR4-2666MHz ECC 內存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 適配器
  • Ubuntu-16.04.3-桌面-amd64

測試背景和比較

 StorageReview 企業測試實驗室 提供了一個靈活的架構,用於在與管理員在實際部署中遇到的環境相當的環境中對企業存儲設備進行基準測試。 企業測試實驗室結合了各種服務器、網絡、電源調節和其他網絡基礎設施,使我們的員工能夠建立真實世界的條件,以便在我們的審查期間準確地衡量性能。

我們將這些關於實驗室環境和協議的詳細信息納入審查,以便 IT 專業人員和負責存儲采購的人員能夠了解我們取得以下成果的條件。 我們的評論都不是由我們正在測試的設備製造商支付或監督的。 有關的其他詳細信息 StorageReview 企業測試實驗室 以及其網絡功能的概述可在這些相應頁面上找到。

SideFX 的胡迪尼

Houdini 測試專門用於評估與 CGI 渲染相關的存儲性能。 此應用程序的 Gen3 測試台是我們在實驗室中使用的核心 Dell PowerEdge R740xd 服務器類型的變體,具有雙 Intel 6130 CPU 和 64GB DRAM。 對於 Gen4 設備,我們使用配備 635 核 64 CPU 和降低至 7742GB 的 DRAM 的 Lenovo ThinkSystem SR64。 在 Gen3 平台上,我們安裝了運行裸機的 Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64),而我們較新的 Gen4 平台則使用 Ubuntu 20.10-desktop。 基準測試的輸出以秒為單位來衡量,越少越好。

Maelstrom 演示代表了渲染管線的一部分,它通過演示其有效使用交換文件作為擴展內存形式的能力來突出存儲的性能。 測試不會寫出結果數據或處理點,以隔離延遲對底層存儲組件的影響。 測試本身由五個階段組成,我們將其中三個階段作為基準測試的一部分運行,如下所示:

  • 從磁盤加載打包點。 這是從磁盤讀取的時間。 這是單線程的,可能會限制整體吞吐量。
  • 將點解壓縮到一個平面數組中,以便對其進行處理。 如果這些點不依賴於其他點,則可以調整工作集以保留在核心中。 這一步是多線程的。
  • (未運行)處理點。
  • 將它們重新打包成適合存儲回磁盤的分桶塊。 這一步是多線程的。
  • (未運行)將分桶塊寫回磁盤。

在這裡,P5800X 僅用了 1,799.5 秒就在測試的驅動器中名列前茅。 這也使它進入了我們所見過的前四名結果。

VDBench 工作負載分析

在對存儲設備進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備建立基線,從而可以輕鬆地在競爭解決方案之間進行同類比較。 這些工作負載提供了一系列不同的測試配置文件,從“四個角”測試、常見的數據庫傳輸大小測試到來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。 我們針對這些基準測試的測試過程用數據填充整個驅動器表面,然後將驅動器部分分區為驅動器容量的 25%,以模擬驅動器如何響應應用程序工作負載。 這與使用 100% 的驅動器並使它們進入穩定狀態的全熵測試不同。 因此,這些數字將反映更高的持續寫入速度。

簡介:

  • 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
  • 4K 隨機寫入:100% 寫入,64 線程,0-120% iorate
  • 64K 順序讀取:100% 讀取,16 線程,0-120% 迭代
  • 64K 順序寫入:100% 寫入,8 個線程,0-120% 迭代
  • 綜合數據庫:SQL 和 Oracle
  • VDI 完整克隆和鏈接克隆跟踪

比較:

在我們的第一個 VDBench 工作負載分析隨機 4K 讀取中,P5800X 完胜其他驅動器並達到 1,416,092 IOPS 的峰值和僅 85.5µs 的延遲。

4K 隨機寫入顯示了另一個令人印象深刻的性能顯示,並且始終保持在 100µs 以下,峰值為 1,328,538 IOPS,延遲僅為 90.3µs。

在讀取方面切換到順序工作負載,特別是我們的 64K 工作負載,沒有真正的競爭。 P5800X 在 112,979µs 的延遲下達到了 7.1 IOPS 或 281GB/s 的峰值。

憑藉 64K 順序寫入,P5800X 以 93,579 IOPS 或 5.85GB/s 的峰值和 161µs 的延遲繼續其統治地位。

我們的下一組測試是我們的 SQL 工作負載:SQL、SQL 90-10 和 SQL 80-20。 從 SQL 開始,英特爾傲騰固態盤 P5800X 保持了令人印象深刻的速度,將下一個放置驅動器的性能提高了一倍多,峰值為 828,464 IOPS,延遲為 37.6µs。

SQL 90-10 以 5800 IOPS 的峰值和 808,476µs 的延遲首先擊中了 P38.3X。 同樣,DapuStor 的性能翻倍,延遲減半。

對於 SQL 80-20,P5800X 再次具有真正的高性能,峰值為 778,015 IOPS,延遲為 39.5µs。

接下來是我們的 Oracle 工作負載:Oracle、Oracle 90-10 和 Oracle 80-20。 從 Oracle 開始,Intel Optane SSD P5800X 的性能繼續比最接近的驅動器高出一倍以上,並且延遲非常低。 在 Oracle 中,新的 Optane 達到 697,772 IOPS 的峰值,延遲為 48.5µs。

在 Oracle 90-10 中,P5800X 以 748,100 IOPS 和僅 28µs 的延遲位居榜首。

Oracle 80-20 P5800X 的峰值為 726,162 IOPS,延遲為 28.8µs,令人印象深刻。

接下來,我們切換到我們的 VDI 克隆測試,完整和鏈接。 對於 VDI Full Clone (FC) Boot,P5800X 以 481,166 IOPS 的峰值性能和 70.4µs 的延遲輕鬆拿下榜首。

VDI FC 初始登錄看到 P5800X 達到 274,042 IOPS 的峰值和 105.3µs 的延遲。

VDI FC Monday Login 再次見證了 P5800X 以 232,343 IOPS 的性能和 65.5µs 的延遲領先。

對於 VDI 鏈接克隆 (LC) 引導,英特爾傲騰固態盤 P5800X 具有令人印象深刻的 247,127 IOPS 和 63.6µs 的峰值。

VDI LC 初始登錄在早期看到了延遲的跳躍,但 P5800X 仍然表現出色,達到 134,846 IOPS 和 55.6µs 的延遲。

最後,在 VDI LC Monday Login 中,P5800X 以較高的延遲開始,但很快下降並以 168,481 IOPS 和 91.1µs 的延遲結束。

結論

Intel Optane SSD P5800X 是該公司首款使用第二代 Optane 的企業級 SSD。 我相信這是英特爾第一個充分利用 PCIe Gen4 的驅動器。 與 P5800X 相比,P4800X 有了巨大的進步。 它一開始就提供更高的容量,高達 1.6TB,這是我們在第一代驅動器上不得不等待的。 P5800X 的耐用等級為 100 DWPD,引用速度為 7.4GB/s,吞吐量高達 2 萬 IOPS。 引用的性能與 Optane 常見的超低延遲相結合,使其成為 FSI 和實時競價等用例的理想選擇。

英特爾 p5800x 設計

為了提高性能,我們運行了應用程序工作負載分析和 VDBench 基準測試。 我們將 P5800X 與 Intel P4800X 進行了比較,以了解該技術的發展程度,並將 Dapustor H3900 與其他存儲級內存進行了比較。 這是 PCIe Gen3 與 Gen4 的比較,但目前我們的實驗室中沒有其他 Gen4 存儲類內存驅動器。 在 Houdini 中,P5800X 的渲染時間為 1,799.5 秒,位居榜首。

在 VDBench 中,P5800X 在每項測試中都遙遙領先。 在幾乎每次測試中,新的 Optane 也將峰值延遲保持在 100µs 以下。 亮點包括 1.4K 讀取 4 萬 IOPS、1.3K 寫入 4 萬 IOPS、7.1K 讀取 64GB/s 和 5.85K 寫入 64GB/s。

在 SQL Server 中,我們看到峰值為 828K IOPS,SQL 808-90 為 10K IOPS,SQL 778-80 為 20K IOPS。 在 Oracle 中,我們看到了 698K IOPS 的峰值,Oracle 748-90 中的 10K IOPS 和 Oracle 726-80 中的 20K IOPS。 在我們的 VDI 克隆測試中,我們看到完整克隆結果為引導 481K IOPS、初始登錄 274K IOPS 和星期一登錄 232K IOPS。 使用 VDI LC,我們看到啟動時為 247K IOPS,初始登錄時為 135K IOPS,星期一登錄時為​​ 168K IOPS。

英特爾傲騰固態硬盤 P5800X 是我們在測試中從未見過的最令人印象深刻的存儲類內存固態硬盤。 它不僅在我們所有測試中名列前茅,而且延遲低至 28µs。 雖然容量有限,但 P5800X 仍將在很大程度上用作專家角色。 也就是說,在系統中提供一個非常靈敏的存儲層,其架構旨在智能地利用各種存儲選項。 但這沒關係,因為考慮到單個驅動器的絕對性能時,P5800X 令人印象深刻。

英特爾Optane

參與 StorageReview

電子報 | YouTube | LinkedIn | Instagram | Twitter | Facebook | 的TikTokRSS訂閱