当前位置: 首页 » 资讯 » 科技头条 » 正文

吴恩达:并行 Agent是 Scaling laws 的新方向

IP属地 中国·北京 编辑:杨凌霄 AI寒武纪 时间:2025-08-30 00:20:57


吴恩达老师最新观点:并行 Agent是扩展 AI 的新方向

并行 Agent 正在成为扩展 AI 的一个重要新方向。AI 的能力在过去依靠更多的训练数据、训练阶段的计算量,以及推理阶段的计算量不断提升。如今,让多个 Agent 并行运行正在成长为进一步扩展和提升性能的一种方法


早期在百度的研究,以及后续 OpenAI 的工作,都证明了 AI 模型的性能会随着数据量和训练计算量的增加而稳定提升。而在推理阶段,如果通过 Agent 工作流,或是在推理模型中引入“思考、反思、迭代”的过程,性能还会进一步提高。但这类方法通常需要更长的时间来产出结果。并行 Agent 则提供了一条新的路径:在不让用户等待过久的情况下提升效果。

推理模型在生成时是顺序进行的,因此往往运行时间较长。同样,大多数 Agent 工作流在最初的实现中也是串行的。但随着 LLM 单 token 价格的不断下降——这些技术逐渐变得更为可行——而产品团队也希望能更快地为用户提供结果,越来越多的 Agent 工作流开始实现并行化。

一些例子:

许多研究型 Agent 现在能够同时抓取多篇网页,并并行分析其内容,从而更快地生成深度研究报告

部分代码类的 Agent 框架允许用户调度多个 Agent,同时在代码库的不同部分开展工作。例如,在 Claude Code 的课程中就展示了如何使用 git worktrees 来实现这一点

一种正在快速流行的 Agent 工作流设计模式是:让一个计算量庞大的 Agent 花费数分钟甚至更长时间来完成任务,同时由另一个 Agent 负责向用户提供简短的进度更新。进一步演化后,这类前端 Agent 还能在保持用户知情的同时,将用户的异步反馈传递给后台的其他 Agent,从而形成更高效的协作

将复杂任务(如构建一个复杂的软件应用)拆解成更小的子任务,再分配给不同的工程师并行完成,本身对人类管理者来说就极具挑战,尤其在需要扩展到数以百计甚至更多工程师时更为困难。同样地,如何有效地为并行 Agent 进行任务分解,也是一个难点。

不过,随着 LLM 推理成本的不断下降,使用更多的 token 成为一种可行的选择,而并行化的方式则使得这种使用不会显著增加用户的等待时间。

越来越多关于并行 Agent 的研究也在涌现。例如:

《CodeMonkeys: Scaling Test-Time Compute for Software Engineering》展示了并行代码生成如何帮助探索更大的解法空间

Junlin Wang提出的 Mixture-of-Agents 架构,则是一种出乎意料的简洁方式来组织并行 Agent:让多个 LLM 独立生成答案,再由一个汇总 LLM 将它们整合为最终结果。

关于如何最好地利用并行 Agent,仍有大量研究与工程探索空间。但可以预见的是,能够高效并行工作的 Agent 数量会非常庞大,就像人类社会中能够高效协同的群体人数也可以非常之多一样

source:

https://www.deeplearning.ai/the-batch/issue-316/

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。