当前位置: 首页 » 资讯 » 科技头条 » 正文

彻底杀死提示词比赛,Agent Loop是什么鬼?

IP属地 中国·北京 雷科技 时间:2026-07-03 00:07:50

昨天小雷刷到吴恩达在 X 上的一篇推文,讲的是 Agent 的 Loop(循环)工程。



X

如果你最近半年用过 Claude Code、Codex、Workbuddy、Kimi Work 或者其他 Agent 产品,你可能已经感受到了那种变化——相比过去一句一句教 AI 干什么,现在你把需求扔进去,它自己会写、会跑、会报错了自己改,直到把东西做出来。

这种「自己转起来」的感觉,就是 Loop 工程在 Agent 产品上的落地。

「……你不该再给 Coding Agent 写提示词了,你应该设计 Loop。」6 月,OpenClaw(龙虾)创始人 Peter Steinberger 一条推引起大量的讨论。事实上,就在这之前不久,Google 工程负责人 Addy Osmani 系统性整理 Loop 这个概念,提出了 Loop 工程。



X

不过从公开信息来看,最早提出 Loop 的人,也是最早让它发光发热的 Claude Code 创始人 Boris Cherny。就在 6 月底,Anthropic 还发了篇博客,把 Claude Code 里的四种 loop 原语全部公开。

一个月的时间,Loop 工程基本完成了一次华丽的转身,不只是行业共识,也成为了主流的焦点。所以,到底什么是 Loop?对我们普通用户又有什么影响?

从提示词到 Harness 和 Loop,Agent 到底多了什么?

过去讲 AI 使用,绕不开提示词。你让模型写代码、改文档、做研究,提示词写得越细,结果越像样。从模型走向 Agent,模型不只要回答,还要知道什么时候读文件、什么时候跑命令、什么时候查网页、什么时候停下来问人,提示词工程、思维链根本不够用。

所以出现了 Harness 工程。它可以理解成模型外面那套运行框架,负责接工具、管权限、塞上下文、存状态。模型还是负责推理和生成,但它开始被放进一个能执行任务的环境里。

Loop 工程又往前走了一步,它关心怎么让 Agent 围绕一个目标不断「循环」运作。



「龙虾」官方文档将 Loop 视为「基础」,OpenClaw

简单来说,用户给出目标,Agent 先理解任务,再拿上下文,调用工具,观察结果,判断有没有完成;没完成,就继续改,继续跑,继续检查。这个过程看起来像人类工作的日常:先做一版,发现问题,再修一版,直到结果能交付。

所以 Loop 的重点不在「循环」这个词本身,而在循环里到底放了什么。

Claude Code 的例子最典型。它不是简单把 Claude 接到终端,而是让模型在一个 while-loop 里反复调用工具、编辑文件、运行命令、观察返回结果。真正复杂的部分反而在循环外面:权限系统、上下文压缩、插件、skills、hooks、子 Agent、会话存储。

Agent 能不能自己转起来,靠的不是模型一时兴起多想几步,而是一整套工程设计托着它往前走。

这也是吴恩达这次谈 Loop 工程的核心背景。到了 2026 年,Claude Code、Codex、ZCode、MiniMax Code,Agent 产品已经再把「写—跑—看结果—再改」变成默认能力。

Anthropic 在博客中还把 Loop 分成四种:turn-based(回合制)、goal-based(目标驱动)、time-based(定时触发)、proactive(主动式)。

- 「帮我写个登录页面」,它写、测、改,这就是goal-based loop;
- 你每发一条消息它回一条,这是 turn-based;
- time-based 是你可以让它每隔两小时自动去检查某个PR,有更新就帮你 review;
- proactive 更激进,它会自己发现问题、自己开干,比如发现测试覆盖率下降了,自己去补测试用例。



目标驱动 Loop,Anthropic

而这波讨论在 5、6 月突然变热,也和产品进展有关。OpenAI 的 Codex 已经不只是「帮你写代码」的入口,而是在独立环境里读仓库、改文件、跑测试,再把日志和结果交回来。

Anthropic 这边,Claude Code 本身几乎成了 Loop 工程最好的样板。Boris Cherny 那句「不再自己写提示词,而是让一个 Agent 去提示 Claude」,听起来有点绕,但意思其实就是人不再负责每一步怎么问模型,人负责设计让模型持续工作的机制。

这也是 Loop 工程真正值得普通用户关心的地方。Loop 工程做得越好,Agent 越像一个能接住任务的人:你给它方向,它自己往前跑;跑偏了,它能从反馈里拉回来;做完了,它还会把过程和结果交给你检查。

杀死提示词,对咱们普通人到底有什么用?

Agent Loop 对普通用户最直接的价值,就是降低提示词设计门槛。

过去用 AI,很像在和一个聪明但没经验的实习生合作。你得告诉它每一步怎么做,什么时候停,哪里需要查资料,哪里不能乱编。你指挥得越细,它表现越好;你说得越粗,它越容易跑偏。

Loop 做得好的 Agent,更像一个已经知道基本工作流程的人。你也不用每次提醒它「如果代码报错就继续修」,因为测试和返工本来就是循环的一部分。你甚至不用把所有上下文一次性塞进对话框,因为 Agent 可以通过文件系统、搜索工具、记忆和索引自己逐步拿到需要的信息。

这会改变用户和 AI 的关系。

以前用户在写提示词时,经常要扮演产品经理、项目经理、测试工程师和老师。你要给需求、拆步骤、盯进度、改错误。以后用户更像是在设目标和验收结果。

比如你让一个 Agent 做旅行计划。过去你可能要写:预算多少、天数多少、先查机票、再查酒店、注意交通、给我表格、最后总结。Loop 做好以后,你只要说「下个月去东京 5 天,预算中等,想少折腾,多看展」,Agent 就应该能自己查时间、比价格、排路线、发现冲突、给出方案,还能在你反馈「第二天太满」之后自动重排。

这就是「杀死提示词比赛」的第一层含义。普通用户不再需要把自己训练成提示词工程师,Agent 产品应该替用户吸收复杂流程。

另一方面,软件工程天然适合 Loop。目标可以写成 issue,过程可以拆成文件修改,工具可以跑测试,结果可以用 diff 和 CI 验证。一个 Agent 写错了,系统马上能看到报错;修好了,也能看到测试通过。这种反馈闭环清楚、可验证、可沉淀,所以 Claude Code、Codex、ZCode、MiniMax Code 都先从代码场景打穿。



智谱 Zcode

但代码只是开始。研究、表格、PPT、数据分析、客服工单、法务检索、招聘筛选、运营监控,都有类似特征:任务不是一句话能做完,但成功标准可以被写出来,过程可以被记录,结果可以被检查。

这就是 Loop 的第二层价值:提高复杂工作的生产力。人不再盯着每一步,而是负责定方向、看结果、改规格。吴恩达提到的 developer feedback loop,就是说 AI 可以加速内部执行循环,但人仍然要在更高一层循环里判断方向是否对。

另外,体验不好的 Agent,可能给人的第一印象就是不稳定、乱点工具、越做越偏。而从工程角度看,Loop 恰恰给了可靠性一个抓手。

在 Loop 工程设计下, Agent 为什么搜索这个页面,为什么修改这个文件,为什么调用这个工具,为什么判断任务已经完成,这些都可以被记录下来。修复可以变成 skill,项目规则可以写进 AGENTS.md、CLAUDE.md 或类似记忆文件。下一次 Agent 再做同类任务,就不必重新摸索。

不过,这里也要把话说清楚,Loop 不会自动带来可靠。事实上,一个设计很差的 Loop,只会让错误更快地自我复制。

过去三年,我们使用 AI 的方式经历了几次大的变化,但底层逻辑没变——都是人发指令,AI 执行,人再判断结果。人一直在循环里,是驱动整个系统的核心。Loop 工程第一次把人从循环的中心移到了循环的外面,人不再是司机,变成了导航。

这个变化的影响会比想象中深远。对开发者来说,核心竞争力变成了定义问题、设计验收标准的能力。对产品来说,迭代速度会进一步加快,倒逼产品团队更懂用户、更懂业务,因为技术不再是瓶颈,判断力才是。

当然,所有这些都建立在一个前提上:模型还得继续变强。Loop 能转多少圈、能处理多复杂的任务,最终还是取决于模型的基础能力。如果模型跑个三五步就跑偏了,那再精巧的 Loop 设计也没用。

好在从今年的情况看,模型进步的速度还没慢下来。GPT-5.5、Claude 5、GLM-5.2、M3、K2.6、DeepSeek V4,半年时间各家都更新了一代,而且每一代都在 Agent 能力上有明显提升。

模型越来越强,Loop 越转越顺,人越来越往外退。这个趋势已经很清晰了。

这件事听起来好像只是效率提升,但仔细想想,它可能是 AI 更进一步从「工具」变成「协作者」的关键一步。工具是你用它,你得知道怎么用、每一步怎么操作。协作者是你告诉它目标,它自己想办法,你们一起把事情做成。

我们现在可能正站在这个分界点上。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。