首页 企业版 性能数学:压力测试硬件以改变数学结果

性能数学:压力测试硬件以改变数学结果

by 访客作者

我们在短短 2 小时内将 log(3) 的小数位数记录翻了一番,达到 42.7 万亿位,50 年内效率提高了约 3 倍。

以下内容来自豪尔赫·祖尼加 (Jorge Zuniga),他是一位专注于寻找数学秘诀的独立土木工程师。 Jorge 一直与 Jordan 合作,利用我们实验室的服务器和存储来实现数学方面的根本性进步。我们很高兴能与 Jorge 一起参与这项研究,几周前我们的社交媒体小预告视频获得了巨大的支持。 

 

在Instagram上查看此帖子

 

StorageReview (@storagereview) 分享的帖子

自该视频发布以来,我们继续与 Jorge 合作,在工作站上验证模型,然后在计算机上完整运行它们 超微E1.S服务器, 洋溢着 铠侠 XD7P E1.S 固态硬盘。该平台的密度以及将如此多的驱动器保持在靠近 CPU 的能力使其成为此类数学研究的绝佳平台。 

我们很自豪地在这里展示豪尔赫的发现。 ——布莱恩·比勒

通过压力测试进行质量控制是确定给定硬件设施实际容量的健康策略。数字运算是实施这些政策的普遍做法。特别是,在以专业质量评估系统的实际性能时,可以使用多种工具来提供准确的结果。

其中一个是在奥地利开发的,也是我最喜欢的一个 马蒂亚斯·兹罗内克 替补,其中包含针对 SSD、内存、GPU 和 CPU 的多项严苛压力测试。其他高性能计算包,例如 Zronek 的 GPUPI,使用 GPU 计算常数 π。 π 小数位数的计算是一种标准且常见的测试,当已知小数的记录被打破时,它经常出现在专业科学出版社和一些数学专业社交网络中。今天, 已知 π 有 100 万亿位小数 (10^14).

在 BenchMate 中,还有 Alex Yee 的 y 粉碎机,这个平台允许 CPU 多核计算许多数学常数,包括 π,具有极高的精度,提供大量的小数位数,仅受系统容量的限制。在这种情况下,可以采取多种策略,例如选择一个常数并强调系统通过记录所花费的时间来计算足够多的小数位数。这提供了一种很好的方法来对不同隔离设置的性能进行排名和比较。

此外,如果有足够的安装容量,则可以运行系统设置来打破给定常数的已知小数位数,StorageReview 所面临的挑战取得了巨大成功。据报道 十二月 2023 注意,我与 StorageReview 团队合作改进了几个数学常量的已知小数位数。我们不仅打破了这些记录,而且是在最短的时间内完成的。从历史上看,需要数周或数月才能完成这件事是正常的。通过与 StorageReview 合作,我们在短短几个小时内就实现了所有常量的这一目标,在某些情况下,还通过将已知小数位数加倍来实现这一目标。 StorageReview 提供的技术使时间缩短了几个数量级。这些结果的摘要及其详细信息可以找到 点击这里.

记录 y-cruncher 设置的结果。有关 y-cruncher 设置的记录的完整列表,请访问 数字世界。

本注释正是指这些结果。要实现小数位记录,必须分三层进行操作。

从底部开始,第三层或最后一层是硬件设置;这意味着强大的 SSD 安装、高性能 RAM 容量和最先进的多核 CPU。其中许多细节和应用的设置可以在线查看 点击这里.

第二层或中间层包括软件,即y-cruncher,构成初始层和最终层之间的链接。为了提高性能,y-cruncher 根据系统中多核 CPU 的类型维护不同的原子可执行文件。运行时会自动选择正确的执行原子。台架测试仪使用户能够选择常数并应用相应的算法。该算法可以直接集成到系统中,或者如果没有集成到系统中,则它利用自定义配置文件来实现。 y-cruncher 实现和使用的详细信息可以查看 数字世界。 y-cruncher 软件不断发展,顺应新硬件技术的浪潮。

第一层或初始层是算法,或者更确切地说是用于计算用作 y-cruncher 输入的常数的数学公式。每个常数都可以用无数个公式表示,几乎所有公式的性能都很差,因为许多数学运算只能提供很少的正确数字。

另一边是高效公式类别。其中,超几何级数脱颖而出。在该系列中,有少数适合打破记录,能够在相对较短的时间内提供许多小数。事实上,计算 π 的主要公式,称为 Chudnovsky 算法,是超几何公式之一。

我们还与 StorageReview 团队密切合作,承担了搜索这些公式的挑战,即作用于第一层以实现非常高效的超几何级数,从而可以找到已知的最快公式。这是如何实现的?需要多核设置(希望有尽可能多的物理核心)来应用分布式计算,因为该过程对 CPU 要求很高,但可以轻松并行化,从而大大减少计算时间。如果成功,新公式将用于打破该常量已知小数位数的记录。

我们使用了 64 核 AMD Theadripper PRO 5995WX,并在法国波尔多大学数论平台 PARI-GP 上编写了代码脚本,并实现了搜索算法。目标是识别一组 64 位整数,将其插入具有已知固定结构的特定超几何级数的参数中时,产生我们正在寻找的常数。为此,使用了 LLL 算法(PARI GP 的内部部分),该算法查找多个精度浮点值之间的整数线性关系。更多数学细节可以在 数学溢出网.

我们首先从常数 ζ(5) = 1.036927755143 开始……因为它没有非常有效的已知公式,但事实证明它非常难以捉摸。除了独特的超几何级数之外,我们找不到已知的公式,顺便说一句,这个公式还不够快。几周不成功后,我们改用超几何级数来计算对数。

在这种情况下,我们取得了成功,我们能够找到基本常数 log(2)、log(3) 和 log(5) 的最快已知算法,如下所述 新闻.

Log(2) 公式搜索。所有 64 个物理核心均忙。


屏幕截图。找到最快的 Log(2) 系列。


找到 Log(2) StorageReview G2 公式

发现公式后,我们为 y-cruncher 准备了脚本。 Storagereview 的 Jordan Ranous 设计的装置旨在超越已知的小数位数。在本例中,设置基于 2 个 Intel Xeon Platinum 8460H 和 512 GB SK Hynix RAM。

此设置在短短 2 小时内将 log(3) 的小数位数记录翻了一番,达到 42.7 万亿位。第二个新算法——下面的 G2 公式(也在 StorageReview Lab 中找到)被用来验证小数,这花费了 58.3 个小时的时间。需要注意的是,此前记录的2021年98.9万亿位小数的计算和验证分别耗时61.7天和1.5天。这意味着 50 年内效率提高约 3 倍。

我们已经能够执行所有必需的步骤来产生有用的结果。使用专门定制的安装发现了数学常数 log(2) 的新公式。然后将该公式应用于定制设置,以打破该特定常数已知的小数位数记录。

StorageReview 设施使得能够涵盖基于数值计算准备台架测试的完整过程,这些计算使系统承受巨大的压力。这些实验成功地将 SSD、RAM 和 CPU 测试到了极限。

——豪尔赫·祖尼加

参与 StorageReview 

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅