超越单体智能｜多智能体系统的协作、归因与自我演化综述

IP属地中国·北京 机器之心Pro 时间：2026-05-31 20:17:09

本文由西安交通大学 MOE KLINNS Lab 联合华中师范大学、联想人工智能技术中心、悉尼大学等机构的研究者共同完成。共同第一作者为齐世豪、马杰、邢瑞、郭威、黄潇，通讯作者为来自西安交通大学网络空间安全学院的马杰特聘研究员（副教授）。
过去两年，AI 智能体正在从「会对话的模型」变成能够理解任务、拆解步骤、调用工具、维护记忆并根据反馈调整行为的系统。当任务复杂到单个智能体难以完成时，研究者开始把多个智能体组织起来，让它们分工协作。但系统规模扩大后，问题也随之复杂。
任务失败时，错误可能来自智能体能力、角色分配、通信过程、工具调用，也可能在多轮交互中被逐步放大。更进一步，系统能否根据失败经验调整角色、通信结构或协作流程，仍是当前研究面临的重要问题。
围绕这些问题，研究团队撰写了一篇系统综述，面向 LLM 多智能体系统提供了一个完整的观察框架：从单个智能体的能力基础，到多智能体协作，再到系统失败后的归因，以及基于失败经验的自我演化。

论文标题：Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems论文链接： https://arxiv.org/abs/2605.14892项目仓库： https://github.com/mira-ai-lab/awesome-mas-life

图 1：LIFE 框架总览图

一、多智能体系统，不只是「多几个 Agent」
今天的 LLM 智能体，已经不再是简单的输入输出模块。围绕大语言模型，研究者加入了推理、记忆、规划、工具使用等机制，使其能够理解任务、制定计划、调用外部工具，并根据执行结果调整后续动作。这些能力构成了多智能体系统的基础。推理能力决定智能体能否处理复杂指令，记忆能力决定它能否利用历史信息，规划能力决定它能否拆解长程任务，工具使用能力则决定它能否突破模型自身的知识和执行边界。
如果缺少稳定的单体能力，多智能体协作很容易变成多个不稳定模块的叠加。协作并不会自动带来更强的智能，反而可能放大错误、增加沟通成本，并让系统表现更难预测。

图 2：LLM-based Agent 的能力模块示意图
二、协作：让智能体从个体走向组织
多智能体系统的核心首先是协作。
在现有研究中，协作机制通常围绕角色、通信、调度和交互模式展开。角色决定不同智能体的职责，通信决定信息如何在智能体之间流动，调度决定任务如何推进，交互模式则与具体任务密切相关。代码生成、科学发现、网页操作、复杂问答、游戏环境，对协作方式的要求并不相同，很难依靠一种固定流程覆盖所有场景。
这些设计让智能体从「单点能力」进入「组织能力」。它们不再只是各自输出答案，而是通过分工、沟通和调度共同完成更复杂的目标。与此同时，协作也会放大系统的不确定性。一个早期判断可能影响后续分工，一次不完整的信息传递可能改变整个任务路径，一个工具调用错误也可能被后续智能体继续引用。多智能体系统越像一个组织，就越需要理解组织内部的问题从何而来。

图 3：多智能体协作中的角色、通信与调度结构
三、归因：理解失败，而不只是记录失败
在单智能体系统中，失败往往可以回到一个相对清晰的输入输出过程里分析。但在多智能体系统中，失败很少只来自一个孤立步骤。一个早期错误判断可能影响后续任务分解，一次不准确的工具调用也可能被后续智能体当成可靠证据继续使用。
因此，多智能体系统需要的不只是最终评测分数，还需要对失败过程的分析。故障归因要追问的是：失败发生在哪个阶段？涉及哪些智能体？错误来自能力不足、角色设计、通信机制、调度策略，还是环境交互？错误又是如何在系统内部传播的？
现有很多研究更关注如何构造协作流程、如何提高最终性能，却较少讨论系统失败之后如何诊断。但如果没有归因，多智能体系统的改进就很容易变成盲目试错。系统表现不好，并不直接说明应该改模型、改提示词、改角色分工、改通信协议，还是改整个组织结构。在这篇综述中，归因被放在协作与演化之间，作用是把系统失败转化为可诊断、可修复的问题。

图 4：多智能体系统中的错误传播与故障归因示意图
四、自我演化：从修正输出，到改进系统
如果归因关注「哪里出了问题」，自我演化关注的则是「系统如何因此变得更好」。很多智能体系统已经引入了反思机制：模型总结失败原因，修改下一轮回答，或者调整提示词。这类方法有价值，但对于多智能体系统来说还不够。
因为多智能体系统的改进对象不只是某个智能体的输出，也可能是整个系统结构。
Agentic Self-Evolution：面向单个智能体自身的演化，主要更新提示词、记忆或参数等内部组件，让智能体在后续任务中表现得更稳定。Systemic Self-Evolution：面向多智能体系统内部结构的演化，关注通信拓扑、智能体组合、共享记忆等系统级组件，让多个智能体之间的协作方式能够随任务和反馈调整。Meta Self-Evolution：面向系统设计空间的演化，通过积累历史设计经验或训练生成器，自动产生更适合不同任务的多智能体架构。
这意味着，多智能体系统的自我演化并不只是「让模型反思」一下。它更接近一种系统级调整：根据任务表现和失败反馈，持续修改自身的行为、结构和协作方式。

图 5：从失败归因到系统自我演化的闭环
五、LIFE 框架：理解多智能体系统的完整生命周期
这篇综述提出的 LIFE progression，可以理解为对 LLM 多智能体系统运行过程的一种梳理。它包含四个连续阶段：
Individual Intelligence：个体智能，关注单个智能体的推理、记忆、规划和工具使用能力；Multi-Agent Collaboration：多智能体协作，关注角色、通信、调度和交互机制；Failure Attribution：故障归因，关注系统失败后的定位、解释和诊断；Self-Evolution：自我演化，关注系统如何根据反馈持续调整自身。
以往综述往往分别讨论个体能力、多智能体协作或自我改进。LIFE 框架则把这些方向放到同一个生命周期中观察：个体能力提供协作基础，协作机制带来系统级复杂性，故障归因让失败过程变得可分析，自我演化则把诊断结果转化为后续改进。
因此，LIFE 关注的不只是「有哪些方法」，而是一个多智能体系统如何运行、如何失败，以及如何在失败之后调整。
六、未来展望
LLM 多智能体系统已经展示出处理复杂任务的潜力，但要走向长期可靠的应用，仍需要在几个关键方向上继续推进。
更全面的评测体系：现有评测仍然偏重任务成功率，而多智能体系统还需要考察通信效率、角色贡献、错误传播、环境适应性和长期稳定性。更灵活的协作结构：当前很多系统仍依赖人工设定角色、流程和通信方式。未来的系统需要根据任务需求动态调整组织方式，包括角色分配、通信路径、调度策略和协作结构。更有效的归因与修复闭环：多智能体系统的失败往往跨越多个角色和多轮交互。归因的价值不应停留在解释错误，而应进一步指导系统修复，例如调整提示词、重新分配角色、修改工具调用方式或优化整体流程。更可控的自我演化机制：当系统开始调整自身结构时，效率、安全和对齐问题会变得更加重要。未来的自我演化不能只是搜索更高性能的结构，还需要在成本、稳定性和可控性之间取得平衡。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

理想L6升级51kWh电池包：增程老将转型，纯电浪潮下如何破局突围？

2026海南欢乐节启幕！欢乐巴士、自驾、公交等多样出行攻略来啦

阿里“AI编程第一”，智谱、Kimi答应吗？

B站连续三年亮相WAIC 月均超1.9亿用户消费AI内容

华为MateBook Pro获国家级人工智能认证L3级首证

Kimi K3震荡美股，有望最快6个月内港股上市

全站最新

理想L6升级51kWh电池包：增程老将转型，纯电浪潮下如何破局突围？

2026海南欢乐节启幕！欢乐巴士、自驾、公交等多样出行攻略来啦

保时捷911 GT3测试车现身纽北，“鸭尾”设计重现经典元素引关注

智己LS9 Hyper携线控转向入场30万级市场，技术实力能否撬动销量？

热门推荐

理想L6升级51kWh电池包：增程老将转型，纯电浪潮下如何破局突围？

2026海南欢乐节启幕！欢乐巴士、自驾、公交等多样出行攻略来啦

五菱星光L上市，思行：产品外观在所有的购车因素里排名第一

阿里“AI编程第一”，智谱、Kimi答应吗？

B站连续三年亮相WAIC 月均超1.9亿用户消费AI内容

华为MateBook Pro获国家级人工智能认证L3级首证

Kimi K3震荡美股，有望最快6个月内港股上市

实测Kimi K3：强得意外，慢得着急

吉利银河同款技术下放！领克20官宣搭载全球首款16合1电驱

造车新规矩落地！工信部要求车企自查零部件供应链一致性

一只猴卖20万！净利润飙涨超1300%，“猴茅”昭衍新药赚翻了

黄牛捏造张凌赫三地见面会疯狂售票阿维塔发布严正声明

荣耀CEO李健：AI将向“伙伴型类人生命体”演进

机器人不缺表演，缺的是工作经验

网传尚界汽车脱离鸿蒙智行，官方辟谣