一分钟读论文:《多智能体工作流中完全循环子任务图的灵活性与成本》
黎巴嫩美国大学研究者发表的论文《Complete Cyclic Subtask Graphs for Tool-Using LLM Agents: Flexibility, Cost, and Bottlenecks in Multi-Agent Workflows》,提出完全循环子任务图作为实验框架,系统测量多智能体工作流中灵活性与协调成本之间的权衡关系。
一分钟读论文:《自动合成多智能体漏洞发现方案》
In AI, Security, 1 min read一分钟读论文:《多智能体语言系统的端到端通信优化》
In AI, MultiAgent, 1 min read一分钟读论文:《瞬态轮次注入:暴露大语言模型的无状态多轮漏洞》
In AI, Security, 1 min read一分钟读论文:《被掏空的一天:软件工程师的日常》
作为团队的 Leader,如何通过改进流程和⼯具,并最终提⾼团队⽣产⼒呢?可以参考微软研究院和英国伦敦大学、瑞士苏黎世大学信息学系合著的论文《Today was a Good Day: The Daily Life of Software Developers》。该论文分析了微软工程师的5,971份问卷结果,发现工程师「良好」和「典型」的工作日是怎么样,并总结了使良好的工作日成为典型的建议:
Read MoreAll
一分钟读论文:《多智能体工作流中完全循环子任务图的灵活性与成本》
黎巴嫩美国大学研究者发表的论文《Complete Cyclic Subtask Graphs for Tool-Using LLM Agents: Flexibility, Cost, and Bottlenecks in Multi-Agent Workflows》,提出完全循环子任务图作为实验框架,系统测量多智能体工作流中灵活性与协调成本之间的权衡关系。
In AI, MultiAgent, 1 min read一分钟读论文:《自动合成多智能体漏洞发现方案》
加州大学圣塔芭芭拉分校等机构研究者发表的论文《Synthesizing Multi-Agent Harnesses for Vulnerability Discovery》,提出AgentFlow框架,使用类型化图DSL自动合成多智能体协作方案,在Google Chrome中发现10个未知零日漏洞。
In AI, Security, 1 min read一分钟读论文:《多智能体语言系统的端到端通信优化》
美国伊利诺伊大学香槟分校等机构的研究者发表的论文《Learning to Communicate: Toward End-to-End Optimization of Multi-Agent Language Systems》,提出 DiffMAS 框架,首次将多智能体系统中的通信机制从固定文本接口转变为可学习的隐式表示,实现了通信与推理的联合端到端优化。
In AI, MultiAgent, 1 min read一分钟读论文:《瞬态轮次注入:暴露大语言模型的无状态多轮漏洞》
孟加拉国贾加纳特大学与巴里萨尔大学合作发表的论文《Transient Turn Injection: Exposing Stateless Multi-Turn Vulnerabilities in Large Language Models》,首次提出了一种名为瞬态轮次注入(Transient Turn Injection, TTI)的新型攻击范式,揭示了当前主流大语言模型在无状态 API 交互场景下的系统性安全漏洞。论文通过系统性实验发现,攻击者可以将恶意意图分散到多个看似无害的孤立请求中,当这些请求被组合时即可逐步绕过模型的安全策略。
In AI, Security, 1 min read一分钟读论文:《用扩散语言模型统一多模态理解与生成》
蚂蚁集团 InclusionAI 的论文《LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model》,提出用离散扩散语言模型统一视觉理解和图像生成两个任务。传统AI系统存在”分裂大脑”问题——理解用VLM、生成用扩散模型,需要拼接多个专用模型。LLaDA2.0-Uni的核心思路是将图像压缩为离散语义token,让同一个MoE扩散模型同时处理文本和视觉token。
In AI, Multimodal, 1 min read一分钟读论文:《PRIME:通过迭代记忆进化实现用户中心Agent的主动推理》
Cornell 大学 Prince Zizhuang Wang 和 Shuli Jiang 的论文《PRIME: Training Free Proactive Reasoning via Iterative Memory Evolution for User-Centric Agent》,提出了一种梯度自由的学习框架,通过显式经验积累而非参数优化实现 Agent 的持续进化。该框架将多轮交互轨迹蒸馏为三语义区的结构化经验,在多个用户中心环境中达到与基于梯度方法相当的性能。
In AI, Agent, 1 min read一分钟读论文:《LLM Agent 的外化设计范式》
上海交通大学、中山大学、CMU 等机构合作的一篇论文《Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols and Harness Engineering》,系统提出了 LLM Agent 的外化设计框架,将 Agent 设计空间归纳为记忆、技能、协议、框架四个维度。论文指出,当前 Agent 系统的关键可靠性提升来自外化设计而非模型权重更新。
In AI, LLM, 1 min read一分钟读论文:《MASS-RAG:多智能体协同的检索增强生成》
[美国] 的论文《MASS-RAG: Multi-Agent Synthesis Retrieval-Augmented Generation》,提出用多个角色不同的智能体协同处理检索到的证据,让 RAG 在噪声和异构上下文下也能给出准确答案。论文被 ACL 2026 Findings 接收,共 19 页。
In AI, LLM, 1 min read一分钟读论文:《LLM 智能体在社交困境中的合作机制》
德国康斯坦茨大学和以色列魏茨曼科学研究所合作的一篇论文《CoopEval: Benchmarking Cooperation-Sustaining Mechanisms and LLM Agents in Social Dilemmas》,首次系统评估了不同合作机制对LLM智能体协作行为的影响,发现推理能力更强的LLM在社交困境中反而更少合作,而合约和调解两种机制最有效。
In AI, MultiAgent, 1 min read一分钟读论文:《归一化计算下单Agent为何优于多Agent》
斯坦福大学的论文《Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Tasks》对当前火热的多Agent系统提出了一个尖锐挑战:当计算量归一化后,单Agent系统(SAS)的表现可以匹敌甚至超越多Agent系统(MAS)。论文作者Hoang Tran和Douwe Kiela用信息论的严格论证揭示了多Agent范式的理论局限。这一发现对多Agent范式构成了基础性的质疑。
In AI, Agents, 1 min readFeatured
-
一分钟读论文:《EnAgent:三个AI智能体组队,登顶代码修复榜单》
In AI, 软件工程, -
一分钟读论文:《Specine:让大语言模型真正“读懂”你的需求》
In AI, 软件工程, -
一分钟读论文:《大语言模型代码生成的规格对齐》
In AI, 软件工程, -
一分钟读论文:《小模型团队如何超越大模型》
In AI, 软件工程, -
一分钟读论文:《从“能用”到“好用”:让AI真正学会软件工程》
In AI, 软件工程, -
一分钟读论文:《让AI像程序员一样边写代码边调试》
In AI, 软件工程, -
一分钟读论文:《CGM:让AI像程序员一样理解整个代码库》
In AI, 软件工程, -
一分钟读论文:《技术债的普遍性、原因和影响:业界系统调查》
In Engineering, Architecture, -
一分钟读论文:《玩转 GitHub 开源软件社区的必备技能树》
In OpenSource, Engineer, -
一分钟读论文:《ChatGPT 提示模式:提高代码质量、重构、需求获取和软件设计》
In AI, Engineering, Engineer, -
一分钟读论文:《用 Rust 和 WebAssembly 补充 JS 实现高性能 Node、Web 应用程序》
In Architecture, Performance, -
一分钟读论文:《通过反思性目标设定培养工程师的好习惯》
In Engineer, Productivity, -
一分钟读论文:《卓越的开源维护者是如何成就的?》
In OpenSource, Engineer, -
一分钟读论文:《我们走了多远——WebAssembly 运行时的全面特征研究》
In FrontEnd, -
一分钟读论文:《XSS 攻击22年:全面调查及系统综述》
In Security, -
一分钟读论文:《细孔沉千帆:小程序权限漏洞研究》
In Security, -
一分钟读论文:《影响大规模敏捷软件开发按时交付的因素》
In Productivity, -
一分钟读论文:《被掏空的一天:软件工程师的日常》
In Productivity, Engineer, -
一分钟读论文:《30年软件重构研究:系统性文献综述》
In Engineering, -
一分钟读论文:《要不要上 TypeScript?GitHub 上 JS 和 TS 应用软件质量的系统比较》
In FrontEnd, -
一分钟读论文:《NPM 供应链的软肋是什么?》
In Security,