首頁 企業 英特爾存儲性能 – Windows 服務器

英特爾存儲性能 – Windows 服務器

by 布賴恩·比勒
Windows Server 中的英特爾存儲性能

就在上週,英特爾發布了他們的 第三代至強 CPU,它建立在他們的生態系統之上,其中包括 Optane SSD 存儲 P5800X 當然還有最新的 200 系列持久內存模塊 (下午)。 在我們對英特爾存儲進行初步審查後,我們決定重新利用實驗室中的英特爾服務器和存儲技術。 我們安裝了 Windows Server 2019 來測試 Optane PMem 200、Optane P5800X SSD 和 TLC NAND P5510 固態硬盤 頭對頭。 本次審查的目的是評估 Windows Server 中的英特爾存儲性能,以便我們可以更好地了解每種技術在裸機場景中的優勢所在。

就在上週,英特爾發布了他們的 第三代至強 CPU,它建立在他們的生態系統之上,其中包括 Optane SSD 存儲 P5800X 當然還有最新的 200 系列持久內存模塊 (下午)。 在我們對英特爾存儲進行初步審查後,我們決定重新利用實驗室中的英特爾服務器和存儲技術。 我們安裝了 Windows Server 2019 來測試 Optane PMem 200、Optane P5800X SSD 和 TLC NAND P5510 固態硬盤 頭對頭。 本次審查的目的是評估 Windows Server 中的英特爾存儲性能,以便我們可以更好地了解每種技術在裸機場景中的優勢所在。

Windows Server 中的英特爾存儲性能

Optane PMem 對比 Optane SSD 對比 NAND SSD

儘管英特爾長期青睞存儲金字塔,但關於哪種存儲技術適合特定應用程序或用例,仍然存在許多問題。 當然,DRAM 是最快的,但不幸的是,它也很昂貴。 Optane PMem 可以像 DRAM 一樣使用,提供持久存儲,不需要在重啟時重新水化。 PMem 還利用傳統的 DIMM 插槽,因此很容易插入。與傳統的 SSD 相比,PMem 還具有令人印象深刻的性能配置文件。

英特爾數據金字塔

然後當然還有 Optane SSD,它已經過優化以吸收寫入,這是傳統 SSD 難以勝任的工作。 這就是為什麼它們通常用作多層存儲架構的一部分作為緩存或分層池。 儘管 Optane SSD 比 TLC NAND SSD 更昂貴,並且在容量方面存在巨大劣勢,例如 P5800​​1.6X 的最高容量為 XNUMXTB。

向下移動我們有 TLC SSD,比如 英特爾P5510,這符合每美元性能的最佳點。 最後在閃存領域,我們有 QLC SSD。 這些提供了最大的容量和每 TB 的價值,但確實更喜歡在讀取密集型環境中,如果它們位於緩存或層後面,聚合寫入並以溫和和友好的方式將它們傳送到 QLC SSD,那就更好了。 從那裡開始,存儲金字塔變成了一堆硬盤驅動器、磁帶驅動器和雲存儲排列組合。

Intel Optane Persistent Memory 200 系列內存庫

Windows Server 中的英特爾存儲性能

為了評估這些最新的英特爾存儲技術的性能,我們需要一種開銷盡可能小的情況,同時仍能找到對 PMem 的良好支持,以及我們現有的測試方法。 第一個候選者是 Microsoft Windows Server 2019。我們正在英特爾 OEM 服務器上進行測試,該服務器旨在展示最新的平台技術,如第三代 Xeon、PMem 3 和對 PCIe Gen200 存儲的支持。

英特爾 OEM 服務器規格

  • 2 x Intel Xeon Platinum 8380 @ 2.3GHz 40 核
  • 16 個 32GB DDR4 3200MHz
  • 16 個 128GB 英特爾持久內存 200 系列
  • 引導固態硬盤:英特爾 1TB SATA
  • 操作系統:Windows Server 2019

企業綜合工作負載分析

我們的企業共享存儲基準流程將每台設備預先設置為具有相同工作負載的穩定狀態,該設備將在 16 個線程的重負載下進行測試,每個線程有 16 個未完成隊列,然後在多個線程/隊列中以設定的時間間隔進行測試深度配置文件以顯示輕度和重度使用下的性能。 由於我們在每台設備上測試 20% 的小存儲空間,我們只繪製出每個測試的主要部分。

預處理和初級穩態測試:

  • 吞吐量(讀+寫 IOPS 聚合)
  • 平均延遲(讀+寫延遲一起平均)
  • 最大延遲(峰值讀取或寫入延遲)
  • 延遲標準偏差(讀+寫標準偏差一起平均)

我們的企業綜合工作負載分析包括四個基於實際任務的配置文件,其中 1T/1Q 4K 工作負載專注於低負載性能。 開發這些配置文件是為了更容易與我們過去的基準測試以及廣泛發布的值(例如最大 4k 讀寫速度和 8k 70/30,通常用於企業驅動器)進行比較。

  • 4K 1T/1Q
    • 100% 讀取或 100% 寫入
    • 100% 4K
  • 4K 16T/16Q
    • 100% 讀取或 100% 寫入
    • 100% 4K
  • 8K 70/30
    • 70% 讀取,30% 寫入
    • 100% 8K
  • 8K(連續)
    • 100% 讀取或 100% 寫入
    • 100% 8K
  • 128K(連續)
    • 100% 讀取或 100% 寫入
    • 100% 128K

在我們的測試中,我們查看了英特爾第三代服務器平台內的三種存儲配置。 其中包括:

  • 兩個命名空間中的 16 x 128GB Intel Persistent Memory 200 系列(每個具有大約 1TB 的存儲空間)
  • 2 個 800GB 英特爾 P5800X 傲騰固態硬盤
  • 8 個 7.68TB 英特爾 P5510 固態硬盤

每個設備組或命名空間都直接使用 FIO 作業進行測試,使用 20% 的設備容量足跡來衡量持續性能。 每組的每個設備都有自己的工作,並且匯總結果。 例如,對於兩個被測試的設備,每個設備都有 1T/1Q 的工作負載,因此 1 個隊列中的兩個線程總計用於該工作負載。 八個設備將是一個隊列中的八個線程,依此類推。

在我們的第一個測試中,我們專注於單線程、單隊列深度 4K 隨機讀寫工作負載。 離線性能對於許多應用程序來說很重要,因為一些設備不需要在它們背後有大量的 I/O 隊列深度來發揮作用。

英特爾 PMem 在讀取性能方面表現出顯著優勢,與雙英特爾 P5800X 固態硬盤或八個英特爾 P5510 固態硬盤相比幾乎翻了一番。 在寫入性能方面,PMem 仍然優於 P5800X SSD,但八個 P5510 驅動器能夠提供更高的吞吐量。

接下來,我們看看 1T/1Q 4K 讀寫測試的平均延遲影響。

英特爾 PMem 在 10K 隨機讀取中測量到 4 微秒的延遲,其次是 P5800X 的 24 微秒和 P5510 SSD 的 81 微秒。 查看寫入延遲,我們發現 PMem 為 11 微秒,P23x SSD 為 5800 微秒,P27 SSD 為 5510 毫秒。

轉向更重的相同 4K 讀寫測試,我們查看每種設備類型的最高點。

八塊 Intel P5510 SSD 提供了最高的讀取吞吐量,接近 4.8 萬 IOPS,其次是 PMem,3.2 萬 IOPS,雙 P5800X 固態硬盤,1.7 萬 IOPS。 在 4K 隨機寫入中,兩個 P5800X SSD 以 1.91M IOPS 領先,其次是八個 P5510 SSD 以 1.78M IOPS 和兩個 PMem 命名空間以 1.35M IOPS。

雖然吞吐量很重要,但作為 PMem 和 SSD,Optane 最有趣的方面之一是它處理存儲延遲的能力。 我們在較重的 4K 隨機讀寫工作負載中也看到了這一點。

Intel PMem 的讀取延遲最低,為 159 微秒,其次是兩個 P5800X SSD,為 296 微秒,最後是八個 P5510 SSD,為 427 微秒。 寫入延遲有兩個 P5800X SSD 領先,為 265 微秒,PMem 以 377 微秒落後,八個傳統 P5510 SSD 為 1.147 毫秒。

將塊大小提升到我們的 8K 70/30 工作負載,我們查看三種不同的存儲類型以及它們如何響應不斷增加的線程和隊列計數。

在峰值性能方面,八塊 Intel P5510 SSD 確實發揮了作用,並提供了一些令人印象深刻的峰值數據。 在頂部,它在 4.34T/16Q 時達到 16M IOPS 的最大值,儘管有趣的是看到 PMem 和兩個 P5800X 能夠在一些較低的線程和隊列點略微領先。

 

將焦點切換到平均延遲,我們看到不同存儲類型繪製的不同圖片。 Intel PMem 雖然沒有最高的吞吐量,但在此測試中能夠以最低的平均延遲勉強通過,緊隨其後的是 P5800X SSD。 八個 P5510 SSD 的延遲水平比兩種 Optane 技術高得多(相對),儘管它們確實提供了迄今為止最高的吞吐量。

接下來,我們首先從 8K 傳輸大小開始處理順序工作負載。

八塊 Intel P5510 SSD 以 4.45 萬 IOPS 輕鬆拿下本次測試,緊隨其後的是 PMem 的 1.92 萬 IOPS,最後是兩塊 5800 萬 IOPS 的 P1.71X 固態硬盤。 在寫入方面,PMem 以 1.75 萬 IOPS 位居榜首,其次是 5510 個 1.55 萬 IOPS 的 P5800 SSD,然後是 1.18 個 XNUMX 萬 IOPS 的 PXNUMXX SSD。

在上次測試中,我們查看了三種不同存儲介質的峰值帶寬。 對於這兩種 U.2 設備類型,一些有限的高端來自每個部署的通道數量。

從讀取帶寬的頂部開始,八個 P5510 以令人印象深刻的 54GB/s 進入,其次是具有兩個命名空間的 PMem 提供 44GB/s,兩個 P5800X SSD 以 14GB/s 的讀取速度落後。 有趣的是,看看 PMem 在帶寬方面可以達到多高。 切換到大塊寫入時,八個 P5510 SSD 以 32.7GB/s 位居榜首,其次是 PMem 以 14.3GB/s,然後是兩個 P5800X SSD 以 11.1GB/s。 整體上非常令人印象深刻的數字。

結論

在過去幾年中,英特爾一直在努力與 Optane 合作,推出 PMem 和 SSD 變體。 很明顯,這種存儲技術對他們來說至關重要,因為他們將一個全面的英特爾平台故事編織在一起,努力在數據中心抵禦 AMD。 對於任務關鍵型工作負載,結果證實了這一點。 對於存儲分層,P5800X 巧妙地位於 NVMe 設備層次結構的頂部,與上一代型號相比,性能得到了巨大提升,這在很大程度上要歸功於 PCIe Gen4。 事實上,這種提升是如此之大,以至於它開始接近 PMem 提供的吞吐量,而不是帶寬。

在整個測試過程中,我們看到的正是我們期望看到的。 在低隊列深度的延遲和吞吐量方面,PMem 顯示出巨大的性能價值。 它還在讀取性能方面提供了巨大的帶寬收益。 P5800X Optane SSD,即使在兩個部署中,也開始全面接近 PMem。 這使得 P5800X 成為解決方案中 TLC 或 QLC 驅動器的絕佳配對,可以將它們用作緩存或層。

無論我們從哪裡看 Intel Gen3 Xeon 平台,在存儲方面都有很多值得喜愛的地方。 我們的發現突出體現在 PMem 的巨大讀取帶寬(最高 44GB/s 讀取)和低隊列深度 10K 隨機讀取和寫入工作負載中的 4 微秒延遲。 P5800X 提供了類似的延遲優勢,在更常見的 U.2 托架中具有更廣泛的覆蓋範圍,在低隊列和線程數下大約是英特爾 PMem 延遲的​​兩倍。 即使是 P5510 SSD 在處理更高隊列的工作負載時也顯示了它們的優勢,在順序或隨機 IO 基準測試中提供了圖表一流的數字。

最重要的是,與上一代產品相比,最新一輪的英特爾存儲設備,包括 PMem 和 SSD,都取得了實質性的進步。 現在英特爾能夠為 DRAM 和 PCIe Gen4 插槽提供更快的總線,這一點尤其正確。 通過這些裸機數據,我們可以看到每種技術的優勢所在。 了解這些數據將使系統構建者能夠智能地設計可以使任何應用程序脫穎而出的平台。

英特爾企業存儲

參與 StorageReview

電子報 | YouTube | LinkedIn | Instagram | Twitter | Facebook | 的TikTokRSS訂閱