你有没有过这样的经历:看着AI技术一年比一年强大,从ChatGPT到Sora,从代码生成到视频创作,感觉AI能力正在以肉眼可见的速度爆炸式增长?
“AI能力自2019年以来一直在指数增长,每7个月翻一番。”这是2025年METR(Model Evaluation & Threat Research)一份报告的结论。这个结论像一颗炸弹扔进了AI圈——从AI安全政策到教育规划,从投资决策到职业选择,无数人在基于”AI必然指数增长”的假设做决定。
但现在,一篇新的论文直接挑战了这一主流叙事:数据并不支持指数增长,拐点可能已经过去。
三个关键发现
1. 拐点就在2025年——已经过去了
研究团队用METR公开的同一组数据,拟合了一条S曲线(sigmoid curve),结果令人惊讶:
- METR的结论:S曲线的拐点在遥远的未来
- 新论文的发现:拐点实际上在2025年6月6日
没错——拐点已经过去了。我们可能正在从”快速增长期”进入”缓慢增长期”。
2. 分解:基础能力 vs 推理能力
论文最有洞见的部分是把AI能力拆解成了两个部分:
| 能力类型 | 拐点时间 | 状态 |
|---|---|---|
| 基础能力(Base Model) | 2024年11月21日 | 已过拐点 |
| 推理能力(Reasoning) | 2026年6月6日 | 即将到来 |
这解释了为什么我们感觉AI还在快速进步:
- 2023年前:靠规模(模型大小、数据量)推动
- 2023年后:规模增长 plateau,但推理能力(o1、思维链训练)接棒
- 2024-2025:推理能力的快速进步形成了”线性增长期”
3. 为什么看起来像指数增长?
论文的理论分析揭示了一个重要真相:当多种技术以S曲线方式叠加时,整体看起来就像指数增长。
基础能力 S曲线 → plateau
↓
推理能力 S曲线 → 接棒继续增长
↓
整体看起来 → 像指数增长
但这是有前提的:需要不断有新的重大突破。
核心问题:下一个突破在哪里?
论文的观点很明确:
“除非有新的重大突破(像推理能力这样级别的),否则AI能力的增长将很快 plateau。”
这才是真正关键的问题——不是”AI会不会继续指数增长”,而是”我们能不能持续创造像推理能力这样的重大突破”?
数据说话
研究团队使用了METR的公开数据:
- 170个任务(HCAST、RE-Bench、SWAA)
- 28个模型,其中15个SOTA模型
- 使用Stan进行概率建模
模型拟合结果(MSE,越低越好):
| 模型 | MSE |
|---|---|
| Sigmoid Link | 203.69 |
| METR Exponential Curve | 339.93 |
| Exponential Link | 2874.67 |
Sigmoid模型拟合得最好。
现实影响
这篇论文不是要否定METR的工作——它的目的是提供一个同样可信的替代视角。
对政策的启示
- 如果AI能力真的即将platform,那么许多关于AI安全和劳动力市场的紧急预测可能需要重新评估
- 教育和职业规划决策不应基于”AI将在5年内取代一切”的假设
对研究的启示
- 我们需要更严谨的预测方法论
- 需要更多领域知识来判断是否会有新的突破
- 单一指数模型可能过于简化
结论
“我们的目标不是提供确凿证据证明AI能力正在platform,而是证明这是一个高度可信的替代方案。”
这篇论文的真正价值在于:它打破了”AI必然指数增长”的思维定式。
AI的未来不是注定的。它取决于我们——取决于我们能不能继续创造像推理能力这样的重大突破。
论文链接:https://arxiv.org/abs/2602.04836
代码:https://github.com/obastani/AI_Forecasting