AMD Zen 5 架構採用創新的模組化設計,讓 AMD 打造適用於桌上型電腦、伺服器、用戶端和嵌入式的 CPU。
AMD 的 2024 年技術日公佈了最新進步背後的細節,並涵蓋了許多內容,特別是最新的 Zen 5 CPU 和 XDNA 以 AI 為中心的架構。這項活動強調了 AMD 徹底改變 AI 效率、功耗性能以及跨多個應用程式無縫整合的願景,重申了其在高效能運算領域的領導地位。
與 Microsoft 的策略合作為 AMD 在 AI PC 體驗方面的領導地位奠定了基礎,在各種應用程式中提供了前所未有的效率、效能和整合。第五代 EPYC CPU 擁有多達 5 個核心和 192 個線程,預計在能源效率和 AI 加速方面顯著提升。 AMD 表示,憑藉先進的分支預測、雙解碼管道和新的數學加速單元,Zen 384 的單核心 AES-XTS 性能比前代產品提高了 5%,機器學習任務提高了 35%。隨著 AMD 不斷突破處理能力和效率的界限,Zen 32 架構有望徹底改變資料中心和伺服器市場。
AMD Zen 5 架構採用創新的模組化設計,讓 AMD 打造適合桌面、伺服器、用戶端和嵌入式應用的產品。結合 4nm 和 3nm 製程技術可確保基於 Zen5 的產品能夠在不同的用例中提供最佳化的效能和功效。
AMD Zen 5
在 AMD 2024 年技術日演講中,Mark Papermaster 公佈了其 Zen 5 架構的重大進步,特別重點介紹了第五代 EPYC CPU。 EPYC 系列將於 5 年下半年發布,承諾提供無與倫比的效能和效率,將伺服器和資料中心市場的密度和效能指標推向極致。
第五代 EPYC CPU 顯著增加了核心數量和執行緒能力。這些增強功能還包括電源效率的提高,這是透過與台積電的持續合作和優化的金屬堆疊來實現的。後者顯著增強了熱性能和電性能。該架構透過引入新的數學加速單元來利用先進的人工智慧加速,與 Zen 5 相比,單核心 AES-XTS 效能提升高達 35%,單核心機器學習任務效能提升高達 32%。
Zen 5 的架構進步是全面性的。透過先進的分支預測和雙解碼管道增強了指令獲取和解碼階段,以減少延遲並提高準確性。整數執行單元得到了重大升級,具有 8 寬調度/退出功能和更統一的 ALU 調度程序,所有這些都在更大的執行視窗內。載入/儲存方面的改進包括 48KB 12 路 L1 資料緩存,L1 快取和浮點單元的最大頻寬加倍,這對於資料密集型操作至關重要。
Zen 5 架構也包含資料頻寬的顯著改善。載入/儲存方面的改進,包括 48KB 12 路 L1 資料緩存,使 L1 快取和浮點單元的最大頻寬增加了一倍,這對於資料密集型操作至關重要。該架構能夠利用 AVX-512 和完整的 512 位元資料路徑處理大量運行中的浮點指令,確保人工智慧和向量工作負載的效能大幅提升。
浮點和向量數學單元的執行也有了顯著的改善。 AVX-512 具有完整的 512 位元資料路徑和六個管道(為浮點加法操作提供兩個週期的延遲),顯著增強了管理並發浮點指令的能力。這尤其有利於向量和人工智慧工作負載,從而顯著提高機器學習和資料密集型任務的效能。這與 Zen 4 形成鮮明對比,AMD 在 Zen 256 中「雙泵」512 位元路徑以實現 XNUMX 位元性能。
與前身Zen 5 相比,Zen 16 為桌面和行動處理器帶來了4% 的平均IPC 提升。取算法。 IPC 的收益轉化為各種應用程式(從遊戲到內容創建和機器學習)的實際效能改進。
在 GPU 方面,AMD 持續優化其 RDNA 3 架構,以提高功耗效能效率。 AMD 聲稱每瓦效能比之前的 Ryzen CPU 高出 32%。這是透過更好的記憶體管理、雙倍速率常見遊戲紋理操作以及增強的電源管理功能來實現的。
AMD 的 Zen 5 架構是 Zen 架構的令人印象深刻的演變,特別是對於 EPYC 系列來說,它有望全面提升從桌上型電腦、行動裝置到伺服器和資料中心市場的效能標準。隨著某些晶片在核心數量、執行緒、能源效率和 AI 加速方面的顯著改進,第五代 EPYC CPU 能夠滿足現代以資料為中心的工作負載不斷增長的需求。
脫氧核糖核酸
人工智慧事業部高級副總裁 Vamsi Boppana 概述了 AMD 全新的以 AI 為中心的架構的變革潛力。 AI 工作負載的指數級成長和專業化需要創新的運算架構,AMD 的因應措施是推出 XDNA 2 架構。
這項創新的核心是 AMD XDNA 架構,該架構以其在各種 AI 和 DSP 應用中的傳統而聞名,涵蓋通訊、5G 部署、國防雷達訊號處理、3D 視點廣播即時 AI 處理和醫療影像處理。該架構從傳統的固定運算和基於快取的記憶體層次結構轉變為更靈活、適應性更強的模型。這種空間可重構性和平鋪資料流架構可實現高效的多工處理並確保即時效能。
該演示重點介紹了具有整合 NPU 的 AMD x86 處理器,旨在為 AI 工作負載提供高效率和高效能。第三代 AMD Ryzen AI 處理器在 NPU 功能方面取得了顯著進步,可實現高達 3 TOPS(每秒萬億次操作),並包含多達 50 個 CPU 核心和 12 個 GPU 運算單元。這些處理器將為 Adobe、Black Magic 和 Topaz Labs 等平台上的 16 多種 AI 驅動體驗提供支持,使其成為下一代 AI PC 體驗的核心。
XDNA 2 架構中的 AI 引擎增強了對 INT8 和 Block FP16 等多種資料類型的支持,確保了一系列 AI 應用的高效能和準確性。自適應人工智慧架構允許跨 AMD 產品組合進行可擴展集成,透過空間可重新配置性和平鋪資料流架構提供高效的多任務處理並保證即時效能。
尤其是 FP16 模組,可以直接取代 FP32 模型,幾乎沒有精度損失,使其能夠高效執行影像生成、語言模型以及即時音訊和視訊處理等任務。
一項突出的功能是能夠在運行時配置 XDNA 結構。這使得 NPU 的資料路徑和分段具有靈活性,可以同時運行多個不同大小的模型。它還可以靈活地提供 Copilot+ 等人工智慧驅動的體驗,以提高生產力和沈浸式協作。將統一的 AI 軟體堆疊整合到 AMD 的 CPU、GPU 和 NPU 元件中,可實現廣泛的模型支援和最佳化的效能,使開發人員能夠更輕鬆地快速有效地部署數千個 AI 模型。
AMD XDNA 2 架構展現了 AI 技術的重大飛躍。憑藉多達 XNUMX 個並發空間流,它的能源效率比前幾代產品提高了一倍。這使得 AMD 的解決方案功能強大且高效,為 PC 及其他領域的人工智慧應用新時代鋪平了道路。
第三代 AMD Ryzen AI 處理器還透過引入新的可信任 IO 功能來增強安全性。這種安全增強對於保護敏感資料和確保人工智慧驅動的應用程式的可靠性能至關重要,從而強化了 AMD 對安全高效人工智慧解決方案的承諾。
AMD Zen 5 和 XDNA 2 規格
禪宗 5 架構 | |
獨特之處 | 更多資訊 |
工藝技術 | 4nm 和 3nm |
核心計數 | 多達192個核心 |
線程計數 | 最多 384 個線程 |
快取 | 48KB 12路L1資料緩存 |
頻寬 | 將 L1 快取和浮點單元的最大頻寬加倍 |
整數執行 | 8 寬調度/退出、6 個 ALU、3 個乘法 |
浮點執行 | AVX-512 具有完整的 512 位元資料路徑、6 個管道 |
人工智能加速 | 新的數學加速單元 |
IPC提升 | 比 Zen 16 平均 IPC 提升 4% |
性能提升 | 單核心 AES-XTS 提升 35%,機器學習任務提升 32% |
電源效率 | 透過增強的金屬堆疊優化性能功耗比 |
產品應用 | 桌面、行動、伺服器和資料中心 |
XDNA 2 架構 | |
AI引擎磁貼 | 截至到32 |
人工智能性能 | 最多 50 個 TOPS |
核心計數 | 多達12個CPU內核 |
GPU計算單元 | 截至到16 |
支持的數據類型 | INT8,塊 FP16 |
效率 | 與上一代相比,電源效率提高了 2 倍 |
競爭對手流 | 截至到8 |
安全性 | 新的可信 IO 功能 |
軟件堆棧 | 跨 CPU、GPU 和 NPU 的統一 AI 軟體堆疊 |
實時性能 | 透過空間架構保證即時效能 |
應用領域 | 遊戲、娛樂、個人人工智慧輔助、內容創作、企業生產力 |
Zen 5 桌上型電腦超頻與曲線整形器
AMD 的曲線優化器是 Ryzen 7000 系列的標誌性功能,可讓使用者啟用 PMFW/PBO 感知的動態電壓調節或欠壓。這個強大的工具透過可調節的「曲線優化器」步驟動態地改變電壓曲線,在整個頻譜上提供可變電壓,並在更高的頻率上分配更多的電壓。使用者可以在每個核心、每個 CCD 或每個 CPU 的基礎上應用這種最佳化,從而可以對其 CPU 的效能和效率進行精細控制。
在 Curve Optimizer 的基礎上,AMD 推出了 Curve Shaper,這是一項複雜的增強功能,使用戶能夠重塑基礎電壓曲線,以最大限度地發揮欠壓潛力。 Curve Shaper 採用與其前身相同的步驟。儘管如此,它仍然允許用戶靈活地選擇性地添加或刪除 15 個不同頻率溫度帶(三個溫度帶和五個頻帶)中的步驟。這種微調功能允許使用者進一步降低穩定頻帶中的電壓,同時增加觀察到不穩定區域的電壓。重新整形的曲線均勻地應用於所有核心,可以使用曲線優化器進一步調整。
關閉的思考
2024 年 AMD 技術日是一次盛大的活動,我們有機會深入了解產品背後的工程師。 AMD 在 XDNA 2 架構和 Zen 5 CPU 方面的最新進展凸顯了其引領人工智慧和高效能運算革命的承諾。憑藉在核心數量、線程、能源效率和AI 加速方面的突破性改進,AMD 將重新定義行業標準,滿足現代以數據為中心的工作負載不斷增長的需求,確保桌面、移動、伺服器和數據中心應用程序的廣泛性能。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱