科学突破往往来自既可行又令人惊讶的想法。但现代 AI 在这方面表现得并不理想:LLM 擅长流畅地复制和插值已知内容,但很少产生真正非显而易见的研究方向。
最新的研究给出了一个颠覆性的答案:当 AI 接近并超越人类能力时,我们不应该只关注”加速”人类的思考,而应该关注”补充”人类的思考——让 AI 去探索那些人类永远不会自然想到的研究方向。
核心数据
研究基于 7,339 篇来自 NeurIPS、ICLR、ICML 的 LLM 论文,提取出 39,028 个可重组的概念单元,构建了约 2,500 个跨论文通用的”思想原子”词汇表。
实验结果对比非常显著:
- 多样性:Alien sampler 覆盖率 28.9%,而 Claude 4.5 Opus 仅 8.1%
- 集中度:Alien sampler 前 10% 原子占比 4.7%,而 Claude 4.5 Opus 高达 35.2%
- 连贯性:Alien sampler 与真实论文的最大原子重叠为 1.66,而 LLM 基线仅约 1.1
关键洞察
作者提出了”认知可用性”(cognitive availability)这个概念,将”非显而易见”这个模糊概念变成了可计算的指标。
实证证明,当被要求产生新颖想法时,LLMs 会反复收敛到相同的狭窄原子集合(如 MCTS、过程监督等),而 Alien sampler 则能真正探索多样化的概念空间。
论文标题”Alien Science”暗示了一个深刻的问题:当 AI 的认知方式与人类根本不同时,它产生的科学发现对我们来说可能就像”外星科学”一样——既有效又可验证,但在概念上却完全陌生。
这篇论文重新定义了 AI 在科学发现中的角色:从加速器变成补充者,主动探索人类思维的盲区。