首頁 企業 效能數學:壓力測試硬體以改變數學結果

效能數學:壓力測試硬體以改變數學結果

by 訪客作者

我們在短短 2 小時內將 log(3) 的小數位數記錄翻了一番,達到 42.7 兆位,50 年內效率提高了約 3 倍。

以下內容來自豪爾赫·祖尼加 (Jorge Zuniga),他是一位專注於尋找數學秘訣的獨立土木工程師。 Jorge 一直與 Jordan 合作,利用我們實驗室的伺服器和儲存來實現數學方面的根本性進步。我們很高興能與 Jorge 一起參與這項研究,幾週前我們的社群媒體小預告影片獲得了巨大的支持。 

 

在Instagram上查看此帖子

 

StorageReview (@storagereview) 分享的帖子

自從該影片發布以來,我們繼續與 Jorge 合作,在工作站上驗證模型,然後在電腦上完整運行它們 超微E1.S伺服器, 洋溢著 鎧俠 XD7P E1.S 固態硬碟。該平台的密度以及將如此多的驅動器保持在靠近 CPU 的能力使其成為此類數學研究的絕佳平台。 

我們很自豪地在這裡展示豪爾赫的發現。 ——布萊恩‧比勒

透過壓力測試進行品質控制是確定給定硬體設施實際容量的健康策略。數字運算是實施這些政策的普遍做法。特別是,在以專業品質評估系統的實際性能時,可以使用多種工具來提供準確的結果。

其中一個是在奧地利開發的,也是我最喜歡的一個 馬蒂亞斯·茲羅內克 替補,其中包含針對 SSD、記憶體、GPU 和 CPU 的多項嚴苛壓力測試。其他高效能運算包,例如 Zronek 的 GPUPI,使用 GPU 計算常數 π。 π 小數位數的計算是一種標準且常見的測試,當已知小數的記錄被打破時,它經常出現在專業科學出版社和一些數學專業社交網絡中。今天, 已知 π 有 100 兆位小數 (10^14).

在 BenchMate 中,還有 Alex Yee 的 y 粉碎機,這個平台允許 CPU 多核心計算許多數學常數,包括 π,具有極高的精度,提供大量的小數位數,僅受系統容量的限制。在這種情況下,可以採取多種策略,例如選擇常數並強調系統透過記錄所花費的時間來計算足夠多的小數位數。這提供了一種很好的方法來對不同隔離設定的效能進行排名和比較。

此外,如果有足夠的安裝容量,則可以運行系統設定來打破給定常數的已知小數位數,StorageReview 所面臨的挑戰取得了巨大成功。據報道 十二月 2023 注意,我與 StorageReview 團隊合作改進了幾個數學常數的已知小數位數。我們不僅打破了這些記錄,而且是在最短的時間內完成的。從歷史上看,需要數週或數月才能完成這件事是正常的。透過與 StorageReview 合作,我們在短短幾個小時內就實現了所有常數的這一目標,在某些情況下,還透過將已知小數位數加倍來實現這一目標。 StorageReview 提供的技術使時間縮短了幾個數量級。這些結果的摘要及其詳細資訊可以找到 點擊這裡.

記錄 y-cruncher 設定的結果。有關 y-cruncher 設定的記錄的完整列表,請訪問 數位世界。

本註釋正是指這些結果。要實現小數位記錄,必須分三層進行操作。

從底部開始,第三層或最後一層是硬體設定;這意味著強大的 SSD 安裝、高效能 RAM 容量和最先進的多核心 CPU。其中許多細節和應用程式的設定可以在線查看 點擊這裡.

第二層或中間層包括軟體,即y-cruncher,構成初始層和最終層之間的連結。為了提高效能,y-cruncher 根據系統中多核心 CPU 的類型維護不同的原子可執行檔。運行時會自動選擇正確的執行原子。台架測試儀使用戶能夠選擇常數並應用相應的演算法。該演算法可以直接整合到系統中,或者如果沒有整合到系統中,則它利用自訂設定檔來實現。 y-cruncher 實作和使用的詳細資訊可以查看 數位世界。 y-cruncher 軟體不斷發展,順應新硬體技術的浪潮。

第一層或初始層是演算法,或者更確切地說是用於計算用作 y-cruncher 輸入的常數的數學公式。每個常數都可以用無數個公式表示,幾乎所有公式的表現都很差,因為許多數學運算只能提供很少的正確數字。

另一邊是高效率公式類別。其中,超幾何級數脫穎而出。在該系列中,有少數適合打破記錄,能夠在相對較短的時間內提供許多小數。事實上,計算 π 的主要公式,稱為 Chudnovsky 演算法,是超幾何公式之一。

我們也與 StorageReview 團隊密切合作,承擔了搜尋這些公式的挑戰,即作用於第一層以實現非常高效的超幾何級數,從而可以找到已知的最快公式。這是如何實現的?需要多核心設定(希望有盡可能多的實體核心)來應用分散式運算,因為該過程對 CPU 要求很高,但可以輕鬆並行化,從而大大減少計算時間。如果成功,新公式將用於打破該常數已知小數位數的記錄。

我們使用了 64 核心 AMD Theadripper PRO 5995WX,並在法國波爾多大學數論平台 PARI-GP 上編寫了程式碼腳本,並實作了搜尋演算法。目標是識別一組 64 位元整數,將其插入具有已知固定結構的特定超幾何級數的參數中時,產生我們正在尋找的常數。為此,使用了 LLL 演算法(PARI GP 的內部部分),該演算法會尋找多個精度浮點值之間的整數線性關係。更多數學細節可以在 數學溢出網.

我們先從常數 ζ(5) = 1.036927755143 開始…因為它沒有非常有效的已知公式,但事實證明它非常難以捉摸。除了獨特的超幾何級數之外,我們找不到已知的公式,順便說一句,這個公式還不夠快。幾週不成功後,我們改用超幾何級數來計算對數。

在這種情況下,我們取得了成功,我們能夠找到基本常數 log(2)、log(3) 和 log(5) 的最快已知演算法,如下所述 博客.

Log(2) 公式搜尋。所有 64 個物理核心均忙碌。


螢幕截圖。找到最快的 Log(2) 系列。


找出 Log(2) StorageReview G2 公式

發現公式後,我們為 y-cruncher 準備了腳本。 Storagereview 的 Jordan Ranous 設計的裝置旨在超越已知的小數位數。在本例中,設定基於 2 個 Intel Xeon Platinum 8460H 和 512 GB SK Hynix RAM。

此設定在短短 2 小時內將 log(3) 的小數位數記錄翻了一番,達到 42.7 兆位。第二個新演算法——下面的 G2 公式(也在 StorageReview Lab 中找到)被用來驗證小數,這花了 58.3 個小時的時間。需要注意的是,先前記錄的2021年98.9兆位元小數的計算和驗證分別耗時61.7天和1.5天。這意味著 50 年內效率提高約 3 倍。

我們已經能夠執行所有必要的步驟來產生有用的結果。使用專門定制的安裝發現了數學常數 log(2) 的新公式。然後將該公式應用於自訂設置,以打破該特定常數已知的小數位數記錄。

StorageReview 設施使得能夠涵蓋基於數值計算準備台架測試的完整過程,這些計算使系統承受巨大的壓力。這些實驗成功地將 SSD、RAM 和 CPU 測試到了極限。

——豪爾赫·祖尼加

參與 StorageReview 

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱