Shuxing Yang 等人发表的论文《End-to-end autonomous scientific discovery on a real optical platform》,介绍了启士发现引擎(Qiushi Discovery Engine)——首个在真实光学实验平台上实现端到端自主科学发现的 AI 代理系统。该系统在开放研究中消耗 1.46 亿 Tokens、执行 3,242 次 LLM 调用,自主提出并实验验证了光学双线性交互这一此前未被报道的物理机制:
系统架构
启士发现引擎的核心是双层架构设计,将非线性研究阶段与 Meta-Trace 记忆机制结合,以在长程研究中同时保持灵活性和稳定性。
非线性研究阶段构成引擎的动力循环。传统科研流程通常遵循假设生成、实验设计、数据采集、理论验证的线性顺序,而启士引擎允许研究路径在阶段之间非线性跳转。当实验数据偏离预期时,系统可以直接回到假设生成阶段,而非机械地推进到下一个步骤。
Meta-Trace 记忆机制负责跨长程研究的轨迹管理。在涉及数千次推理、测量和修正动作的开放研究中,系统需要维持一致的研究方向同时保持对意外发现的敏感度。Meta-Trace 通过跟踪研究轨迹的关键节点,使引擎能够在偏离当前路径时自动评估是否值得继续探索。
实验成果
论文报告了三项主要实验成果,每一项都代表了 AI 代理在真实物理系统中的重要能力。
第一项成果是传输矩阵实验的跨平台复现。启士引擎在未接触过的光学平台上,自主完成了一个已发表传输矩阵实验的复现。这要求系统不仅理解实验的理论基础,还需要将抽象的理论描述转化为对物理设备的精确控制指令。
第二项成果是相干序理论的实验观测转化。相干序理论是一个抽象的物理理论框架,启士引擎将其转化为可在光学平台上观测的具体指标,并完成了该类别相干序结构的首次实验观测。
第三项成果是光学双线性交互的发现与验证。在涉及 145.9 百万 Tokens、3,242 次 LLM 调用、1,242 次工具调用、163 条研究笔记和 44 个脚本的开放研究中,启士引擎提出了光学双线性交互假说并通过实验验证。这一物理机制在结构上类似于 Transformer 注意力机制的核心操作,为高速低能耗光学硬件中的成对计算提供了新方向。
里程碑意义
启士发现引擎的关键突破在于,这是首个 AI 代理系统自主识别并实验验证非平凡物理机制的工作。此前的自主科研系统主要局限于仿真环境或预定义的研究工作流,而启士引擎在真实物理平台上完成了从假设生成到实验验证的完整闭环。
需要指出的是,当前系统的研究规模仍然有限。145.9 百万 Tokens 的消耗和数千次 LLM 调用虽然展示了可行性,但距离高效科研还有显著差距。此外,系统在遇到完全陌生的实验设备时的适应能力仍需验证。光学双线性交互的发现虽然令人印象深刻,但其物理意义和实际应用价值需要后续独立研究来确认。