一分钟读论文：《多智能体工作流中完全循环子任务图的灵活性与成本》

By Unbug Follow Apr 29, 2026 · 1 min read

完全循环子任务图架构

论文提出的完全循环子任务图是一种刻意设计的最大灵活多智能体控制器。每个子任务节点对应一个可执行的动作子问题，所有子任务节点之间完全连接——每个子任务可以路由到任何其他子任务，没有预先剪枝。

统一的状态分析器与路由器通过自然语言标准对滚动轨迹状态进行评估，选择子任务间的转换。这种设计使得不受限制的回溯在结构上始终可用，可以在子任务层面直接分析灵活性的效果。

研究实现了两种图结构：Spec-Cyc（任务特定图）针对每个任务定制子任务节点和边；Gen-Cyc（基准通用图）在同一个基准的不同实例之间复用，测试循环回溯是否可以作为可迁移的控制策略。

论文在三个结构不同的长周期基准上进行了系统评估：

ALFWorld：部分可观察、交互密集的环境。智能体需要搜索、从不准确定位中恢复、在误导性行动后回溯到早期子任务。显式回溯在此场景中显著有益，支持恢复和探索。
TextCraft：主要是前置依赖链式的领域。一旦识别出正确的前置链，高效的顺序执行即可完成任务。额外的路由灵活性在此反而成为协调开销，简单的单智能体 ReAct 方法往往更高效。
Finance-Agent：开放世界、证据密集型的任务。所有方法的成功率都较低，表明检索、证据合成和 grounding 是主要瓶颈，工作流灵活性本身仅带来有限改善。