新智元报道

编辑:peter东

【新智元导读】2022年,Google Cloud 将π计算到100万亿位,在2025年,高性能计算界的知名评测机构 StorageReview只用了4个月的时间,花了不到一千美元电费就将π算到314万亿位,这可不是为了炫技,而是说明高性能计算也可以很节能。

作为最有名的无理数,π可以计算到天荒地老。在当下, 针对π的计算竞赛已成为各家超算展示自身实力的方式。

2022 年,Google云首次将π计算到100万亿位,谷歌使用y-cruncher,在跨越庞大的云集群上完成计算,并在此过程中消耗了数十 PB 的 I/O 数据。

2024年,StorageReview使用单台服务器,将π计算到200万亿位,之后Linus Media Group 和 KIOXIA 使用由 2PB 闪存组成的大型 Weka 共享存储集群,实现了 300 万亿位的运行。

到了这个数量级,对Pi对计算,不再只是衡量超算CPU 浮点运算性能的方法。随着计算规模的不断扩大,任务也变得更为复杂,RAM、I/O 架构和存储系统对能否高效计算开始发挥关键作用。

2025年7月,StorageReview开始了新一轮对π对计算,这次依然是用单台超算。这次使用的计算怪兽是Dell PowerEdge R7725 服务器,搭载两颗 AMD Epyc 192核处理器(共384核),配备 1.5TB DDR5 内存。


这场计算Pi的马拉松,开始于2025年7月31日,经历了整整4个月的时间。测试结果不仅仅是打破了现有的圆周率计算记录,还在多个指标(例如计算能耗,所需机时)上彻底刷新了之前的记录。

使计算成功的是存储架构上的创新

真正使这次计算成功的,是40块美光 6550 Ion SSD(单块61.44TB),组成了惊人的 2.5PB 存储阵列。

这并不意外,计算 Pi 到如此长的位数一直以来都需要海量存储以记录中间计算结果。毕竟,你处理的是数万亿位的数字。以往的方法,例如 Google 在 2022 年创造的 100 万亿位记录,使用的是云服务器,而 Linus Media Group 和 Kioxia 2025年早些时候创造的 300 万亿位记录则使用了配备共享存储的 Weka集群作为存储。

使得单服务器计算可能的另一个因素,是第 17 代 Dell 服务器的存储背板中没有使用PCIe交换机,而是直接连接到CPU的PCIe 通道。拥有 40 个插槽,这意味着每块 SSD 可以使用 2 到 4 条通道,读写性能高达 280 GB/s,远高于StorageReview 之前实验中的数据。


表1:读写性能的提升详述

计算过程中,在存储调度时,部署 40 块 Gen5 NVMe SSD,其中 34 块用于计算中间结果,共提供约 2.1PB 空间;剩余 6 块构建 RAID10 用于最终 π 结果落盘。顺序读写性能翻倍,部分场景提升最高达 383%。

同时,该团队将服务器的标准风冷配置改为了液冷的CoolIT AHx10方案,这使 CPU 保持在更高的持续时钟频率,系统的平均系统功耗保持在约1,600W。操作系统也从Windows Server更换为 Ubuntu 24.04.2,虽然这只是一项简单的切换,却带来了更好的 I/O 性能。

在正式开始测试之前,StorageReview还进行了大量测试迭代,包括为后台系统操作保留了 4 个CPU,从而保障主业务的380线程全力冲刺。

存储决定上限,调度决定成败

这次长达4小时的计算,也是唯一一次大规模圆周率世界纪录计算没有出现任何停机时间的记录保持者。从开始到结束,整个计算过程从未需要重新启动,而之前计算300万亿次的记录花了大约 225 天完成(不含停机时间的计算天数为 175 天)。

之前Linus Media Group的300万亿的Pi计算记录利用了分布式存储集群和高速网络,这对应了更高的电力和冷却需求。StorageReview选择了不同的路径,专注于存储密度,使用单台服务器同时承担交换存储和输出存储的功能。这在很大程度上减少了电力消耗。

在314万亿(314T)运行过程中仅消耗了 4,304kWh,相当于每万亿位仅消耗 13.70 kWh。这使其成为最节能的大规模圆周率计算之一。


过去,π的计算只是被云服务厂商用来秀肌肉,但当下无论是气候建模、粒子物理、基因组海量数据组装、AI 大模型训练等现实中需要长时间运行的计算任务,都迫切需要能连续数月稳定运行、I/O 不堵、温控得当、存储不构成瓶颈的系统。

StorageReview 此次计算Pi时所用的这套“单服务器集成方案”,几乎是为上述场景量身定制的蓝本:高IO密度、高能效、高可靠三位一体。


将Pi计算到314 万亿位,它不仅仅意味着一个更大的数字,更代表了一种更加成熟的设计。

之后遇到类似需要海量计算的场景,可以不必选择高能耗的云服务器。只要单台服务器能做到均衡的输入/输出性能、可预测的散热表现、稳定的固件以及能够在长时间内保持稳定架构的硬件平台,单台服务器也能适合这样需要长时间运行的任务。

参考资料:

https://www.storagereview.com/review/storagereview-sets-new-pi-record-314-trillion-digits-on-a-dell-poweredge-r7725

https://www.tomshardware.com/pc-components/storage/pi-calculating-record-shattered-at-314-trillion-digits-with-a-four-month-run-on-a-single-server-storagereview-retakes-the-crown-thanks-to-storage-bandwidth

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!