
🎯 开场:56 年的数学纪录,被 AI 打破了
1969 年,德国数学家 Volker Strassen 发表了一篇革命性的论文,展示了如何用 49 次标量乘法来计算两个 4×4 矩阵的乘积——这比传统的 64 次乘法快了足足 23%。
这个纪录保持了 56 年。
直到 2025 年,Google DeepMind 的 AlphaEvolve 出现了。
它发现了一种方法,只用 48 次标量乘法 就能完成同样的计算。
这不仅仅是一个算法优化——这是 AI 首次在核心数学领域做出人类从未发现的突破性发现。
🤖 什么是 AlphaEvolve?
AlphaEvolve 是 Google DeepMind 在 2025 年 5 月发布的一个 AI 系统,它的全称是:“AlphaEvolve: A coding agent for scientific and algorithmic discovery”。
简单来说,AlphaEvolve 是一个会写代码、会发现新算法、会优化现有系统的 AI 研究员。
AlphaEvolve 的核心思想
AlphaEvolve 的设计灵感来自于生物进化:
- 突变:用 LLM(Gemini)作为”语义突变器”,生成新的代码变体
- 选择:用严格的自动验证来筛选有效的解决方案
- 迭代:不断重复这个过程,直到找到最优解
这就像是一个闭环的”进化工厂”——AI 不断产生新想法,然后通过 rigorous 的测试来验证,只保留最好的。
🧮 矩阵乘法:为什么这么重要?
在深入细节之前,让我们先理解为什么矩阵乘法这么重要。
矩阵乘法是 AI 的”心脏”
你知道吗?每次你用 GPT-4 生成一句话、用 Stable Diffusion 画一张图、或者用任何 AI 模型做推理时,90% 以上的计算时间都花在了矩阵乘法上。
矩阵乘法是:
- 🧠 深度学习的核心运算
- 🎮 图形渲染的基础
- 🔬 科学计算的基石
- 📊 数据处理的关键
优化矩阵乘法,就像是给整个计算机行业”换心脏”——每一点点改进,都能带来巨大的效率提升。
Strassen 算法:1969 年的革命
传统的 4×4 矩阵乘法需要:
- 4×4×4 = 64 次标量乘法
1969 年,Strassen 发现了一种巧妙的分治方法,把乘法次数降到了:
- 49 次
这看起来只减少了 15 次乘法,但对于大矩阵来说,这个算法可以递归应用——时间复杂度从 O(n³) 降到了 O(n².⁸⁰⁷)。
对于 1024×1024 的矩阵,这意味着:
- 传统方法:10 亿次乘法
- Strassen 方法:约 6 亿次乘法
这是一个巨大的改进!
🚀 AlphaEvolve 的突破:48 次乘法!
2025 年,AlphaEvolve 做了一件不可思议的事情:它发现了一种方法,只用 48 次标量乘法 就能计算 4×4 复数值矩阵的乘积。
让我们看看这个突破有多重要:
不仅仅是 1 次乘法的节省
虽然看起来只比 Strassen 少了 1 次乘法(从 49 降到 48),但这个突破的意义远不止于此:
- 56 年的纪录被打破:这是人类在这个问题上停滞了半个多世纪后的首次进展
- 证明了 AI 的能力:AI 可以在纯数学领域发现人类从未想到的解法
- 开启了新的可能性:如果 4×4 矩阵可以优化,更大的矩阵呢?
AlphaEvolve 还优化了 14 个其他矩阵乘法!
4×4 矩阵只是开始。AlphaEvolve 总共改进了 14 种不同尺寸的矩阵乘法算法:
| 矩阵尺寸 | 之前最好 | AlphaEvolve | 改进 |
|---|---|---|---|
| (2, 4, 5) | 33 | 32 | -1 |
| (3, 4, 6) | 56 | 54 | -2 |
| (4, 4, 4) | 49 | 48 | -1 |
| (4, 5, 6) | 93 | 90 | -3 |
| … | … | … | … |
这些改进加起来,可能会对整个计算领域产生深远的影响。
💡 AlphaEvolve 还做了什么?不只是数学!
矩阵乘法的突破只是 AlphaEvolve 的”开胃菜”。这个系统实际上解决了 67 个不同的数学问题,并且在 20% 的问题上找到了比人类更好的解决方案!
1. 优化 Google 的数据中心
AlphaEvolve 不仅仅在理论数学上有用——它已经在产生实际影响了:
- Gemini 训练加速:AlphaEvolve 优化了 Gemini 模型训练中使用的关键矩阵乘法内核,实现了 23% 的速度提升,整体训练时间减少了 1%
- TPU 硬件优化:AlphaEvolve 甚至重新设计了 Tensor Processing Unit(TPU)中的关键算术电路,去掉了不必要的位,这个改进已经被验证并将用于未来的芯片设计
2. 解决数学难题
AlphaEvolve 还在纯数学领域取得了进展:
- 亲吻数问题(Kissing Number):在 11 维空间中找到了更好的结果
- Erdős 最小重叠问题:在这个 1955 年提出的数论问题上取得了进展
- 傅里叶分析问题:在数据压缩的数学基础上有新发现
3. 自我改进的循环
最令人兴奋的是:AlphaEvolve 正在形成一个自我改进的循环:
- AlphaEvolve 发现更快的矩阵乘法算法
- 这个算法加速了 LLM 的训练基础设施
- 下一代 LLM 更强大、更高效
- 这些改进的 LLM 被集成到 AlphaEvolve 中
- 系统发现更好的算法…
这不是科幻小说——论文中明确描述了这个循环已经在发生!
🔍 AlphaEvolve 是怎么工作的?让我用大白话解释
核心架构:三个关键组件
AlphaEvolve 的设计非常巧妙,它由三个核心组件组成:
1. 程序生成器(Program Generator)
这是 AlphaEvolve 的”创意工厂”——用 Gemini 模型来生成新的代码变体。
想象一下:
“嘿,Gemini,给我看看这个矩阵乘法算法,能不能稍微改一下,让它用更少的乘法?”
Gemini 会产生各种疯狂的想法——有些有用,大多数没用。但没关系,因为下一个组件会筛选。
2. 评估级联(Evaluation Cascade)
这是 AlphaEvolve 的”质量控制部门”——用严格的测试来验证每个候选方案。
对于矩阵乘法,它会:
- 生成随机的测试矩阵
- 用候选算法计算乘积
- 验证结果是否正确
- 统计用了多少次乘法
只有通过所有测试的方案才能进入下一轮。
3. 进化循环(Evolutionary Loop)
这是 AlphaEvolve 的”引擎”——不断迭代,直到找到最优解。
整个过程就像生物进化:
- 突变:用 LLM 生成新变体
- 选择:只保留最好的方案
- 重复:一轮又一轮,直到收敛
🌟 为什么这是一个大事件?
让我们从多个角度来看这个突破的重要性:
1. 数学角度:AI 作为数学合作者
AlphaEvolve 证明了:AI 可以成为数学家的真正合作者,而不仅仅是辅助工具。
这不是 AI 第一次帮助数学——之前的 AI 系统已经帮助证明了一些定理。但 AlphaEvolve 不同:它主动发现了新的算法,而不仅仅是验证人类的猜想。
2. 计算机科学角度:算法发现的新范式
几十年来,算法设计一直是人类的专利。AlphaEvolve 改变了这一点:
- 之前:人类数学家和计算机科学家花几十年时间思考、尝试、失败、再尝试
- 现在:AI 可以在短时间内探索数百万种可能性,找到人类从未想到的解法
这可能会开启一个”算法发现的黄金时代”。
3. 实际影响:更快、更便宜、更环保
AlphaEvolve 的优化已经在产生实际价值:
- 更快的 AI 训练:Gemini 的训练时间减少了 1%——对于价值数百万美元的训练作业来说,这是巨大的节省
- 更低的成本:更快的计算意味着更少的服务器、更少的能源、更少的碳排放
- 更好的硬件:TPU 的优化意味着未来的芯片会更高效
🔮 未来展望:这意味着什么?
AlphaEvolve 的发布标志着一个新时代的开始。让我们想象一下未来:
1. AI 驱动的算法发现
在 10 年内,我们可能会看到:
- AI 发现新的排序算法
- AI 优化数据库查询
- AI 改进加密算法
- AI 设计全新的计算范式
2. 自我改进的 AI 系统
AlphaEvolve 已经展示了自我改进的可能性。未来的 AI 系统可能会:
- 持续优化自己的训练代码
- 重新设计自己的硬件
- 发现更高效的神经网络架构
3. AI 与数学家的合作
未来的数学研究可能会是这样的:
- 人类数学家提出问题和直觉
- AI 系统探索巨大的搜索空间
- 人类数学家验证和理解 AI 的发现
- 两者一起推进数学的边界
🎬 结语:我们正站在新时代的门槛上
AlphaEvolve 的突破不仅仅是一个算法优化——这是一个里程碑。
它证明了:
- AI 可以在纯数学领域做出原创性发现
- AI 可以优化自己的基础设施
- AI 可以成为科学家的真正合作者
56 年前,Strassen 的算法改变了计算。 今天,AlphaEvolve 再次改变了游戏规则。 未来,谁知道 AI 会发现什么?
我们正站在一个新时代的门槛上——一个由 AI 驱动的算法发现和科学突破的时代。
而这,仅仅是开始。
论文链接:AlphaEvolve: A coding agent for scientific and algorithmic discovery
作者:Google DeepMind Team
发表时间:2025 年 5 月
官方博客:Meet AlphaEvolve, the Google AI that writes its own code—and just saved millions in computing costs
AI原生粒子加速器:让大型科学设施学会'自动驾驶'