香港中文大学和阿里巴巴集团合作的一篇论文《Evolve as a Team: Collaborative Self-Evolution for LLM-based Multi-Agent Systems》,提出 Meta-Team 框架,让多智能体系统在执行任务后通过协作实现自我进化。在6个长程Agent基准测试上,Meta-Team 一致优于单Agent系统和手工设计的多智能体系统。
核心问题
当前基于大语言模型的多智能体系统在复杂任务中表现出色,但大多数方法将每个智能体的能力视为固定不变。任务执行结束后,智能体不会从经验中学习或改进。这种”一次性使用”的模式限制了多智能体系统的长期适应能力。
Meta-Team 的核心洞察是:让多智能体系统像人类团队一样,在执行任务后通过协作反思实现自我进化。
Meta-Team 框架
Meta-Team 的进化机制分为三个层面:
个体行为层:每个智能体保留执行任务的上下文信息,包括自己的决策过程、观察结果和最终行动。这些分布式证据构成了进化的基础材料。
团队交互层:任务完成后,所有参与智能体交换各自的执行证据。通过共享经验,智能体能够了解其他成员在任务中的表现,识别协作中的瓶颈和低效环节。
组织进化层:基于收集到的分布式证据,系统对智能体的角色分配、通信模式和协作策略进行优化调整。这种从个体到团队的自下而上改进,确保了进化方向与任务需求高度匹配。
实验结果
Meta-Team 在6个长程Agent基准测试上进行了评估,涵盖代码生成、科学发现、决策规划等不同类型的复杂任务。主要结果包括:
- 优于单Agent系统:在所有6个基准测试中,Meta-Team 的性能均显著超过同等规模的单智能体方案
- 优于手工设计MAS:与人工精心设计的多智能体架构相比,Meta-Team 通过自动进化达到了更高的性能水平
- 优于先前MAS进化方法:与已有的多智能体系统进化方法相比,Meta-Team 的协作式自我进化机制带来了更稳定的性能提升
这些结果表明,让多智能体系统具备从经验中学习和进化的能力,是提升其长期任务表现的有效途径。
意义与展望
Meta-Team 提出的”协作式自我进化”范式为多智能体系统的长期发展提供了新的思路。传统方法依赖人工设计或外部训练来改进智能体行为,而 Meta-Team 证明了系统可以在执行真实任务的过程中自主发现并修复自身的不足。
这一方向的未来研究可能包括:如何在更大规模的多智能体系统中扩展协作进化机制、如何平衡进化过程中的探索与利用、以及如何将自我进化能力与其他形式的知识迁移相结合。