MiTAC TYAN HG68-B8016 是一款高度靈活的平台,非常適合提供客製化伺服器配置的雲端供應商。
MiTAC TYAN HG68-B8016 是一款專為服務供應商設計的多功能 6U 五節點伺服器平台。它支援 AMD EPYC 4004 系列處理器,提供性能、能源效率和成本效益的專門組合。每個節點可容納高達 192GB 的 DDR5 記憶體、雙 M.2 SSD 插槽,並包括 PCIe Gen5 和 Gen4 擴充功能以實現可擴充性。
MiTAC伺服器的模組化設計使雲端供應商能夠有效地為其客戶分配專用資源。每個節點獨立運行,允許提供者根據特定客戶需求提供定製配置——從計算密集型應用程式到儲存密集型工作負載。這種隔離意味著更容易管理,因為可以對各個節點進行自訂、維護或重新啟動,而不會造成相鄰系統中斷的風險。簡化的設計也有助於控制平台成本。
技術規格
HG68-B8016 專為容納單一 AMD AM5 處理器而設計,支援高達 192GB 的 UDIMM/DDR5 ECC UDIMM 或非 ECC 4800 記憶體。這種配置提供了廣泛的功能和卓越的性能。
外形 | 6U機架式 |
儲存機櫃(每個刀片) | 連接器 (M.2) – (2) 2280(透過 PCIe.4 介面) |
處理器(每個刀片) | 數量/插槽類型:(1) AMD 插槽 AM5 支援的 CPU 系列:(1) AMD EPYC 4004 處理器 |
內存(每個刀片) | 支援的 DIMM:數量 (4) 個 DIMM 插槽 DIMM 類型/速度:DDR5 ECC UDIMM 和非 ECC 4800 容量:高達 192GB UDIMM |
擴充插槽(每個刀片) | (1) PCIe Gen.4 x4 插槽 / (1) PCIe Gen.4 x8 插槽(附 x4 連結)/ (1) PCIe Gen.5 x16 插槽 |
網路連接埠(每個刀片) | (2) 個千兆乙太網路埠 |
I/O 連接埠(每個刀片) | USB:(4) 個 USB3.2 Gen.1 連接埠 VGA:(2) 個顯示埠/(1) 個 D-Sub 15 針端口 RJ-45:(2) 個 GbE 端口 音訊:(1) 線路輸入/線路輸出/MIC |
AMD EPYC 4004 系列處理器提供出色的效能和能源效率,使雲端供應商能夠處理更多並髮用戶和複雜的工作負載。 HG192-B5 每個節點支援高達 68GB 的 DDR8016 內存,提供快速的資料存取和處理能力。該平台靈活的儲存和擴展選項允許進行客製化,以滿足特定的應用程式需求,並確保各種雲端服務的最佳效能。
MiTAC TYAN HG68-B8016 設計與建造
TYAN HG68-B8016 是一款 6U 機架式機箱,尺寸為 26.85 吋 x 17.60 吋 x 10.44 吋(682 毫米 x 447 毫米 x 265.3 毫米),旨在輕鬆整合到標準伺服器機架中。其堅固的結構確保了耐用性,同時優化了氣流,這對於保持資料中心的穩定運作至關重要。 6U 外形尺寸可實現高密度配置。
每個節點的前面板有兩個支援 45 Gbps 速度的 RJ1 千兆位元 LAN 連接埠(LAN2 和 LAN1)。這些連接埠提供靈活的設置,允許冗餘以確保連續的網路可用性或管理和資料的流量分離。此外,連接到底板管理控制器 (BMC) 的 D-Sub VGA 連接埠可讓管理員遠端存取系統介面。
其他連接選項包括四個 USB 3.2 Gen 1 Type-A 端口,方便外圍設備和外部儲存設備,以及兩個直接連接到 CPU 的 DisplayPort 1.2 輸出,用於高解析度視訊輸出。前面板還具有用於模擬輸入/輸出的音訊插孔,這對於需要聲音的監控任務非常有用。對於遠端管理,IPMI LAN 連接埠透過智慧平台管理介面提供專用訪問,並允許完整的系統監視和控制,而無需物理存在。最後,ID 按鈕可以讓管理員快速辨識大型伺服器機架中的節點。
後面板讓使用者可以使用一系列 PCIe 插槽,並允許他們安裝額外的組件,例如網路卡、GPU 或儲存介面。這允許根據系統需要執行的操作進行大量自訂。背面還設有兩個冗餘電源單元(PSU0 和 PSU1),這意味著即使其中一個出現故障,另一個也可以保持運行而不會中斷,從而最大限度地減少停機時間。
在底層,MiTAC S8016 伺服器主機板構成了該節點的核心。兩個 80x38mm 風扇可管理冷卻並確保 CPU 和記憶體模組上的氣流一致,以防止過熱。配電和背板管理並穩定所有組件的電力傳輸。
RAM DIMM 整齊地排列在 AMD CPU 插槽旁邊,方便存取並實現最佳氣流。它們放置在 CPU 插槽旁邊,由安裝在散熱器上的專用風扇進行冷卻,確保處理器保持在最佳溫度。
該系統的電源由 GPU 卡插槽旁的 1+1 冗餘 80 Plus Titanium 級 PSU(位於後角)提供。這些使其適用於渲染、人工智慧處理或科學運算等運算密集型任務。
總體而言,TYAN HG68-B8016 的製造品質非常適合其預期用途。機箱設計精良,一切都感覺很耐用,專為雲端環境中的長期使用而設計。另一件引人注目的事情是伺服器節點可在冷通道中維護,這意味著所有維護都可以從前端完成。
神達泰安 HG68-B8016 性能
為了測試 MiTAC TYAN HG68-B8016 系統的功能,我們使用了以下基本規格:
- 主機板: 泰安 S8016AGM2NR
- 操作系統:Windows 10 64位
- 儲存應用:掠奪者 SSD GM7 M.2 1TB
- 解析度:1024 x 768 像素
我們使用 4000 系列的兩個 AMD EPYC 處理器(EPYC 4564P 和 EPYC 4364P 型號)以及各種 RAM 配置來測試所有五個 MiTAC 伺服器節點。每個節點都可以透過 BMC 和 RDP 介面進行遠端存取。此設定允許透過 BMC 進行高效的硬體級管理,而 RDP 則為每個配置啟用基準測試操作和效能資料收集。
規範 | AMD EPYC 4564P | AMD EPYC 4364P |
核心/線程 | 16核/32線程 | 8核/16線程 |
基地時鐘 | 4.5 GHz | 4.5 GHz |
最大升壓時鐘 | Up to 5.7 GHz | Up to 5.4 GHz |
L3緩存 | 64 MB | 32 MB |
TDP(熱設計功率) | 170W | 105W |
我們的效能結果將使我們能夠檢查每個 CPU 在相同條件下的效能,並專注於 CPU 在各種現實場景(從 AI 推理任務到視訊渲染和資料壓縮)中對效能的影響。我們還將 NVIDIA A6000 GPU 整合到一個節點中,以顯示特定工作負載下的圖形效能。
攪拌機優化
首先是 Blender 基準測試,它使用開源 3D 建模和渲染應用程式來評估效能。此基準測試衡量每分鐘處理的樣本數量,分數越高表示效能越好。樣本數是每分鐘,越高越好。
在 Blender 結果中,我們測試的兩類 CPU 的效能之間存在明顯差異。配備 AMD EPYC 4564P 的節點(節點 1-3)在所有測試情境和基準測試版本中始終顯示出較高的每分鐘樣本數。例如,在 Blender OptiX 4.0 的「Monster」場景中,這些節點每分鐘可實現約 230 個樣本。相較之下,配備 AMD EPYC 4364P 的節點(節點 4-5)在同一測試中每分鐘註冊約 120 個樣本。
類別 | 節點 1(AMD EPYC 4564P、32GB RAM、5200MHz) | 節點 2(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 2(NVIDIA A6000 GPU、32GB RAM、4800MHz) | 節點 3(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 4(AMD EPYC 4364P、32GB RAM、4800MHz) | 節點 5(AMD EPYC 4364P、64GB RAM、4000MHz) |
攪拌機 OptiX 4.2 | ||||||
Monster | 223.567 | 221.099 | 2381.519 | 221.513 | 115.871 | 115.472 |
舊貨店 | 158.780 | 158.608 | 1461.651 | 158.816 | 81.232 | 81.585 |
課堂 | 111.575 | 110.718 | 1315.029 | 110.622 | 57.971 | 58.181 |
Blackmagic RAW 速度測試
我們也開始運行 Blackmagic 的 RAW 速度測試,該測試評估高解析度視訊播放中的 CPU 效能(8K 視訊處理等媒體密集型應用程式的關鍵指標)。在此測試中,AMD EPYC 4564P 節點 (1-3) 表現出強大的效能,在 91K CPU 測試中始終保持 92-8 FPS 左右。相較之下,AMD EPYC 4364P 節點(4-5)達到 57-58 FPS,效能顯著下降。
對於提供高解析度視訊播放或雲端遊戲服務的雲端供應商來說,這種差異凸顯了 4564P 能夠更有效地管理要求苛刻的視訊工作負載,確保在 8K 等更高解析度下更流暢地播放。 4364P 雖然仍然具有功能,但更適合視訊播放效能不太重要或解析度較低的場景,使其成為較輕工作負載的更具成本效益的選擇。
Blackmagic RAW 速度測試(越高越好) | 節點 1(AMD EPYC 4564P、32GB RAM、5200MHz) | 節點 2(AMD EPYC 4564P、NVIDIA A6000 32GB RAM、4800MHz) | 節點 3(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 4(AMD EPYC 4364P、32GB RAM、4800MHz) | 節點 5(AMD EPYC 4364P、64GB RAM、4000MHz) |
8K CPU | FPS 92 | FPS 91 | FPS 92 | 57 幀/秒 | 58 幀/秒 |
8K 圖形處理器 | 不適用 | 169 | 不適用 | 不適用 | 不適用 |
7-Zip 壓縮
7-Zip 基準測試衡量 CPU 處理資料壓縮和解壓縮任務的能力,這對於必須有效壓縮和傳輸大量資料的雲端環境至關重要。此基準測試受益於更高的核心數量和更好的記憶體管理,使其成為比較不同 CPU 處理能力的有價值的測試。
結果中,EPYC 4564P 節點 (1-3) 的效能明顯優於 EPYC 4364P 節點 (4-5)。例如,節點 1 的總壓縮率達到 134.461 GIPS,而節點 4 的總壓縮率達到 86.640 GIPS。同樣,在減壓方面,EPYC 4564P 以 218.800 GIPS 保持強勁領先,而 EPYC 123.568P 為 4364 GIPS。這一巨大差距凸顯出 4564P 處理器更適合需要快速資料壓縮和解壓縮的工作負載,例如雲端儲存或備援解決方案。雖然 4364P 的性能仍然不錯,但它更適合峰值性能不那麼重要的不太密集的工作負載。
7-Zip 壓縮基準(越高越好) | 節點 1(4564P、32GB RAM、5200MHz) | 節點 2(4564P、32GB RAM、4800MHz) | 節點 3(4564P、32GB RAM、4800MHz) | 節點 4(4364P、32GB RAM、4800MHz) | 節點 5(4364P、64GB RAM、4000MHz) |
壓縮 | |||||
當前 CPU 使用率 | 2584% | 2569% | 2583% | 1287% | 1285% |
電流額定值/使用 | 5.203 吉普斯 | 5.135 吉普斯 | 5.062 吉普斯 | 6.730 吉普斯 | 6.608 吉普斯 |
額定電流 | 134.461 吉普斯 | 131.947 吉普斯 | 130.764 吉普斯 | 86.640 吉普斯 | 87.502 吉普斯 |
產生的 CPU 使用率 | 2579% | 2573% | 2581% | 1299% | 1298% |
結果評級/使用 | 5.167 吉普斯 | 5.066 吉普斯 | 5.041 吉普斯 | 6.656 吉普斯 | 6.743 吉普斯 |
結果評級 | 133.242 吉普斯 | 130.375 吉普斯 | 130.086 吉普斯 | 86.460 吉普斯 | 87.495 吉普斯 |
解壓縮 | |||||
當前 CPU 使用率 | 3020% | 3008% | 3043% | 1596% | 1587% |
電流額定值/使用 | 7.245 吉普斯 | 7.156 吉普斯 | 7.167 吉普斯 | 7.741 吉普斯 | 7.761 吉普斯 |
額定電流 | 218.800 吉普斯 | 218.237 吉普斯 | 218.102 吉普斯 | 123.568 吉普斯 | 123.167 吉普斯 |
產生的 CPU 使用率 | 3055% | 3040% | 3056% | 1581% | 1582% |
結果評級/使用 | 7.249 吉普斯 | 7.122 吉普斯 | 7.178 吉普斯 | 7.717 吉普斯 | 7.714 吉普斯 |
結果評級 | 221.470 吉普斯 | 216.479 吉普斯 | 219.328 吉普斯 | 122.025 吉普斯 | 122.058 吉普斯 |
總評分 | |||||
總 CPU 使用率 | 2817% | 2806% | 2818% | 1440% | 1440% |
總評分/使用情況 | 6.208 吉普斯 | 6.094 吉普斯 | 6.109 吉普斯 | 7.186 吉普斯 | 7.229 吉普斯 |
總評分 | 177.356 吉普斯 | 173.427 吉普斯 | 174.707 吉普斯 | 104.243 吉普斯 | 104.777 吉普斯 |
UL Procyon 人工智能推理
UL Procyon AI 推理基準測試 評估 CPU 處理 AI 模型推理的速度,這對於機器學習、即時數據分析和 AI 驅動服務等任務至關重要。推理時間越短表明效能越好,這意味著處理器可以在更短的時間內處理更多與人工智慧相關的功能。
在這裡,與EPYC 4564P(節點1-3)相比,AMD EPYC 4364P(節點4-5)再次提供更快的推理時間,尤其是在YOLO V3 等模型中,其中節點1 記錄為61.66 毫秒,而節點4 記錄為107.12 毫秒。這一趨勢在 ResNet 50 和 Inception V4 等其他模型中也存在,顯示 EPYC 4564P 能夠更有效地處理複雜的 AI 任務。這使其成為專注於人工智慧工作負載的雲端供應商的理想選擇,更快的模型推理可以改善即時分析、建議和決策系統。 EPYC 4364P 仍然為其入門級產品提供了可觀的性能,但更適合較輕的 AI 任務或成本節約優先於速度的場景。
UL Procyon 平均推理時間(越低越好) | 節點 1(AMD EPYC 4564P、32GB RAM、5200MHz) | 節點 2(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 3(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 4(AMD EPYC 4364P、32GB RAM、4800MHz) | 節點 5(AMD EPYC 4364P、64GB RAM、4000MHz) |
移動網V3 | 1.20ms | 1.18ms | 1.18ms | 0.95ms | 0.91ms |
殘差網絡 50 | 8.57ms | 8.62ms | 8.72ms | 13.34ms | 13.14ms |
盜夢空間V4 | 26.55ms | 26.51ms | 26.94 | 40.46ms | 39.37ms |
深實驗室V3 | 28.97ms | 28.88ms | 29.25ms | 39.35ms | 38.55ms |
優洛V3 | 61.66ms | 61.11ms | 62.28ms | 107.12ms | 104.87ms |
真實ESRGAN | 3,217.42ms | 3,240.89ms | 3,244.35ms | 4,846.26ms | 4,751.87ms |
總體得分 | 146 | 147 | 145 | 106 | 109 |
y 粉碎機
y-cruncher 基準測試測試 CPU 計算大量 Pi 數字的效率,這對於多核心、多執行緒處理來說是一個很大的壓力測試。這使得它對於測量科學和雲端運算環境中典型的運算工作負載特別有用,在這些環境中,處理大型資料集或複雜的運算至關重要。自 2009 年推出以來,它已成為超頻玩家和硬體愛好者流行的基準測試應用程式。
在此基準測試中,AMD EPYC 4564P 節點 (1-3) 的計算速度明顯快於 EPYC 4364P 節點 (4-5)。例如,計算 1 億位數字時,節點 1 在 18.7 秒內完成任務,而節點 4 則需要 24.95 秒。這種效能差距隨著位數的增加而擴大,EPYC 4364P 計算 5 億位數需要相當長的時間。這突顯了 EPYC 4564P 對於高要求、計算密集型任務的卓越效率,使其成為科學模擬、數據分析或任何需要強大並行處理能力的應用程式等工作負載的理想選擇。同時,EPYC 4364P 雖然速度較慢,但對於不太密集的運算任務仍然表現良好,為中等工作負載提供了更具成本效益的解決方案。
y 粉碎機 (總計算時間以秒為單位;越低越好) |
節點 1(AMD EPYC 4564P、32GB RAM、5200MHz) | 節點 2(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 3(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 4(AMD EPYC 4364P、32GB RAM、4800MHz) | 節點 5(AMD EPYC 4364P、64GB RAM、4000MHz) |
十億位 | 18.703秒 | 19.202 秒 | 19.223 秒 | 24.951 秒 | 24.849 秒 |
2.5億位數字 | 50.263秒 | 51.681 秒 | 51.826 秒 | 70.750 秒 | 70.320 秒 |
5億位數字 | 109.403秒 | 112.434 秒 | 112.805 秒 | 156.884 秒 | 155.585 秒 |
10億位數字 | 不適用 | 不適用 | 不適用 | 不適用 | 339.228 秒 |
Geekbench 6
Geekbench 6 基準測試衡量不同平台上的整體系統效能,強調 CPU 效能。此基準測試提供單核心和多核心效能的單獨分數,全面了解處理器在各種工作負載下的效能。您可以在以下位置找到與任何您想要的系統的比較 Geekbench 瀏覽器.
在單核心測試中,AMD EPYC 4564P(節點 1-3)略優於 EPYC 4364P(節點 4-5)。例如,節點 1 得分為 3,041,節點 4 得分為 2,978。這種相對接近的差距表明,兩種 CPU 都能充分執行依賴單核心效能的任務,例如較輕的工作負載或未充分利用多執行緒的特定應用程式。
然而,在多核心測試中,差距大幅拉大。 EPYC 4564P 的得分為 17,888(節點 1),而 EPYC 4364P(節點 4)的得分為 14,495。這突顯了 EPYC 4564P 卓越的多核心效率,使其更適合要求更高的雲工作負載。
Geekbench 6(越高越好) | 節點 1(AMD EPYC 4564P、32GB RAM、5200MHz) | 節點 2(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 3(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 4(AMD EPYC 4364P、32GB RAM、4800MHz) | 節點 5(AMD EPYC 4364P、64GB RAM、4000MHz) |
CPU單核 | 3,041 | 3,029 | 3,019 | 2,978 | 2,977 |
CPU 多核 | 17,888 | 17,442 | 17,469 | 14,495 | 14,429 |
Maxon Cinebench 結果
- Cinebench R23: 與 R20 前身相比,它具有更長的測試時間來評估熱節流,並包括多核心和單核心分數以進行全面的 CPU 效能評估。
- Cinebench 2024 (R24): 最新版本具有要求嚴苛的渲染任務,並針對現代 CPU 和擴充負載進行了最佳化,提供多核心和單核心效能結果。
在Cinebench R23中,EPYC 4564P(Node 1)的多核心效能達到33,896分,而EPYC 4364P(Node 4)則落後於18,329分。這種巨大的差異說明了 EPYC 4564P 型號處理需要多核心效能的工作負載(例如 3D 渲染或高階視訊處理)的效率有多高。
同樣,單核分數顯示 EPYC 4564P 領先(儘管差距較小),節點 1 得分為 1,993 分,而節點 4 得分為 1,970 分。這表明兩個 CPU 對於單執行緒應用程式或任務的效能相似;然而,EPYC 4564P 仍然具有優勢。
Cinebench 2024 結果遵循類似的趨勢,因為 EPYC 4564P 在多核心任務中表現出色,但保持更接近的單核心表現。 EPYC 4564P 更適合媒體和內容密集的環境中的複雜渲染任務。
基準 | 中央處理器本體 | 節點 1(AMD EPYC 4564P、32GB RAM、5200MHz) | 節點 2(AMD EPYC 4564P、NVIDIA A6000、32GB RAM、4800MHz) | 節點 3(AMD EPYC 4564P、32GB RAM、4800MHz) | 節點 4(AMD EPYC 4364P、32GB RAM、4800MHz) | 節點 5(AMD EPYC 4364P、64GB RAM、4000MHz) |
Cinebench R23 | 多核 | 33,896 分 | 33,569 分 | 33,555 分 | 18,329 分 | 18,528點 |
Cinebench R23 | 單核 | 1,993 分 | 1,990 分 | 1,996 分 | 1,970 分 | 1,975點 |
Cinebench 2024 | 多核 | 1,889 分 | 1,849 分 | 1,847 分 | 1,035 分 | 1,059 分 |
Cinebench 2024 | 單核 | 119 分 | 118 分 | 118 分 | 117 分 | 117 分 |
Cinebench 2024 | GPU | 17,382點 |
電玩遊戲託管
雖然該伺服器平台的許多應用程式可能都是面向業務的,但我們不能忽視這樣一個事實:MiTAC TYAN HG68-B8016 的架構使其成為視訊遊戲託管的絕佳選擇。為了進行測試,我們將其中一個節點配置為 Discord 社群的 Rust 伺服器。
在運行儲存評論官方月刊等專用 Rust 伺服器時,高單執行緒效能對於保持穩定的遊戲體驗和低延遲至關重要。與許多多人線上遊戲一樣,Rust 嚴重依賴伺服器端運算來追蹤玩家的行動、互動和遊戲世界物理。這些計算必須快速處理,以確保玩家和伺服器之間的順利同步。
雖然 Rust 使用多個 CPU 核心,但遊戲中許多最重要的流程,例如處理玩家輸入、戰鬥交互和實體物理,仍然嚴重依賴單線程效能。從本質上講,即使使用現代多核心 CPU,單一核心的速度在伺服器端效能中也發揮著重要作用,特別是在管理大量玩家或複雜的遊戲內活動時。
我們運行 Storage Review Rust 伺服器整個擦除週期,持續一個月。在 Rust 中,擦除週期是指伺服器地圖和玩家進度的完全重置,通常是為了刷新遊戲世界並為所有玩家提供新的開始。
對於我們的設置,我們選擇了 AMD EPYC 4564P,這是一款基礎時脈為 16 GHz 的 4.5 核心處理器。這個選擇使我們能夠實現始終如一的高伺服器端 FPS(大約 200-250),確保即使在玩家活動高峰期間也能響應遊戲玩法。在 Rust 中管理大型地圖和大量玩家互動時,高單執行緒效能的重要性變得尤為明顯,其中處理速度的任何下降都可能導致不同步、延遲或其他遊戲問題,從而對玩家體驗產生負面影響。
結論
MiTAC TYAN HG68-B8016 是一款高度靈活的平台,非常適合提供客製化伺服器配置的雲端供應商。其獨立的節點架構允許五個節點中的每一個節點都可以根據客戶需求進行定制,從而確保最大的靈活性。
AMD EPYC 4004 CPU 提供令人印象深刻的效能和能源效率,為提供者提供經濟高效的解決方案,以平衡運算能力與營運費用。我們的測試顯示所有五個節點都具有一致的強勁性能,展示了該平台的可靠性以及毫不妥協地處理要求苛刻的工作負載的能力。對於可以受益於 GPU 的工作負載,此 MiTAC 平台也涵蓋了這些用例;我們在一個節點中測試了 A6000,結果非常出色。臨時 Rust 伺服器測試還驗證了該平台處理我們向伺服器拋出的任何內容的能力。
根據我們的測試,這種靈活性、效能和效率的結合使 HG68-B8016 成為尋求滿足不同客戶需求的服務提供者的絕佳選擇。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱