[美国] 的论文《MASS-RAG: Multi-Agent Synthesis Retrieval-Augmented Generation》,提出用多个角色不同的智能体协同处理检索到的证据,让 RAG 在噪声和异构上下文下也能给出准确答案。论文被 ACL 2026 Findings 接收,共 19 页。
RAG 是让大语言模型在回答时参考外部知识的主流方案。但当检索回来的证据存在噪声大、不完整或异构等问题时,单一生成过程往往难以有效整合信息。MASS-RAG 的核心创新在于将证据处理过程分解为多个角色专用的智能体,每个智能体负责不同的任务。
多智能体协同架构
MASS-RAG 的整体流程分为四个阶段,每个阶段由专门的智能体完成:
证据摘要智能体对检索到的每个文档进行压缩和提炼,提取核心观点并去除冗余信息,输出结构化的摘要列表。
证据提取智能体从摘要中进一步提取关键事实和证据片段,建立证据与问题的映射关系,输出结构化的证据集合。
推理智能体对提取的证据进行逻辑推理,评估证据间的兼容性和一致性,形成推理链。
综合阶段整合前三步的输出,比较和融合互补信息,生成最终答案。
关键设计在于暴露多个中间证据视图,让模型在生成答案前能够比较和整合不同来源的信息,而不是直接跳到结论。
实验结果
论文在四个基准测试上对比了多种强 RAG 基线方法。主要发现:
- 在证据分散的场景下,MASS-RAG 优势最明显
- 相比单一生成过程,多智能体协同显著降低了幻觉率
- 在噪声证据较多的情况下,MASS-RAG 的鲁棒性更强
- 随着检索文档数量增加,多智能体的优势更加显著
对行业的影响
MASS-RAG 提出了一个重要的方向:多智能体协同 RAG。当前 RAG 的主流方案大多围绕”如何检索更好的证据”展开,如重排序、查询扩展等,而 MASS-RAG 从另一个角度切入:如何让多个智能体更好地处理已有证据。
这种思路可以推广到更多场景,包括多模态 RAG、领域专用 RAG 和动态 RAG 等方向。