当前位置: 首页 » 资讯 » 科技头条 » 正文

码农连任务都不写了?Codex开始自己给自己派活

IP属地 中国·北京 新智元 时间:2026-06-16 02:08:14


新智元报道


从写指令,到给目标,再到只给一句意图:有人干脆让Codex自己定任务——人类还能留在编程的计划层吗?

「我基本上再也不自己写/goal了。」

近日,前Anthropic成员、现MagicPath CEO的Pietro Schirano在X上甩出这句话,评论区瞬间炸开。


他的做法是:不再手写那份/goal,而是让Codex为自己写一份,再为它派生的每个子智能体(agent)各写一份。

把一个高层意图丢给Codex,让它先给自己写一份详细的/goal——怎么拆任务、哪些并行、最后怎么汇总,全由模型自己定。

从头到尾,人类只用在最开始说出自己的意图,剩下的拆解、调度、收尾,模型自己都能安排得明明白白。

Pietro Schirano @skirano在X上分享的演示视频

别小看Pietro这句话,这次他交给AI的并非是体力,而是判断力:过去开发者交给AI的是「怎么写」,这一次交出去的是「写什么」。

先是写一句提示词,AI把活干了。

后来连提示词都懒得细写,只丢一句模糊的目标,剩下怎么做、分几步,让它自己琢磨。

到现在,索性连「目标」都不写了。

评论区一位网友感叹道:

我们好像已经进入这样一个时代:我给AI一个目标,AI把这个目标改得更好,然后我礼貌地假装自己一直是那个项目经理。

这句话刚好戳中了这次变迁的核心。

当一个程序员连「要干什么」都不再亲手写,他在这条流水线上,到底还剩下什么?

人只管给意图

任务交给agent去想

过去几年,提示词工程被捧成AI时代的硬技能。会写提示词,就好比握住了驾驭模型的关键。

再往后是元提示(meta-prompting):你不直接写指令,而是让模型帮你把指令写得更好。

而这次Codex所演示的更进一步:自生成目标(self-goal generation)。模型并非把你的话润色成更漂亮的指令,它直接接管了「目标」本身:你给意图,它写/goal。

这套玩法的底座,是Codex今年4月底上线的/goal功能,先在Codex CLI里出现,近期在config.toml里把features.goals打开就能用。

官方把它塞进Codex CLI的0.128.0版本,默认关闭,要手动改配置文件才能打开。

开发者圈给它起了个外号,叫「Ralph循环」:规划、执行、测试、复查、迭代,一路自转,不到目标不收手。

它与普通对话提示词最大的不同,是goal这段文字会同时充当两样东西:起始指令,和「完成审计」。

Codex每跑完一轮,就回头对照目标问自己两句:还该做什么,是不是已经做完了。一轮接一轮,直到任务完成、被你叫停,或者token烧到上限。

所以官方反复强调一件事:目标一定要写到Codex能判断「做完没有」,要避免「优化一下」「完善一下」这种虚词。

真正给这件事定调的,是OpenAI的Codex负责人Tibo(Thibault Sottiaux)。


他在X上说,我们造的每一个工具,都同时是给智能体用的:

Codex能查看、也能设置自己的/goal。这是元提示的泛化,用一句话概括就是:人给意图,智能体来生成任务。

开发者@MikelEcheve把这套能力进一步解释为:Codex能自建/goal、为并行的智能体生成目标、自主切分工作。


Codex自述:「因为你明确要并行智能体,我就用多智能体工具」,并已「Created an agent」,右侧子智能体面板出现首个分身Gibbs。图源:Pietro Schirano @skirano演示视频

有人已经用它干了18个小时

/goal的自转能力,已经有人拿真实项目验证过。

有开发者实测:给Codex一句高层目标,把BACKLOG.md里的18个功能全部交付,然后人就离开了。

约18小时后回来,Codex已经自主实现其中14个,每一处改动都过了测试、在CI里合并,全程没要一次人工点头,连代码自审都交给了GPT子智能体。

算下来,这趟跑了约4.20美元。

skirano展示的,是更上面那一层:不只让Codex执行一份goal,而是让它给自己和每个子智能体各写一份goal,智能体的层级自动就长了出来。

只丢给它一句话,Codex就把该干全干了。


运行约10秒,状态变为「Creating 2 agents」,右侧子智能体已扩展为Gibbs与Leibniz两个并行分身。图源:Pietro Schirano @skirano演示视频


主智能体「Created 3 agents」,右窗子智能体Gibbs正在执行自己的专属/goal:设计一条数学化的过山车轨道。各自一份goal,正是这套打法的核心。图源:Pietro Schirano @skirano演示视频

这套打法正在被模板化。

开发者Pablo Stanley把它做成了模板,给出一套「Build [THING]+功能+风格」的提示词框架,让Codex照着自动生成goal、再孵化对应的子智能体。整套流程,人只负责开头那句话。这个模板被skirano本人点赞。

在Reddit的r/codex社区,开发者已经用/goal做长期任务对齐、自动生成验收标准、规避死循环。

另一位开发者RTK(@riverkhan)走得更远。OpenAI团队前不久发了一篇讲怎么把/goal用好的文章,他直接把里面的最佳实践封装成开源skill,取名Infinite Skills,仿照Superpowers的结构,每个skill就是skills目录下扁平的一份SKILL.md。

里头那个叫goal的skill,干的事很有意思:在你正式发起/goal之前,它先反过来「面试」你,把一个含糊的目标,一句句盘问成具体、可验证的契约,再把整理好的完整目标喂给goal模式。


https://github.com/Infinite-Labs-AI/infinite-skills

换句话说,goal模式跑得好不好,本就取决于目标写得够不够具体、能不能让Codex自己判断做完没有。

如今连「把目标盘问清楚」这一步,都有人做成工具替你包办了。

三家把同一件事做了

这股潮流并非Codex独自引领。

几乎在同一个时间窗口里,三家主流编程智能体,把「让AI自己拆任务、自己派智能体」这项功能,不约而同地推了出来。

Anthropic的多智能体编排5月6日上线,Cursor的/orchestrate只隔一天、5月7日跟上。

再往前推到4月底,Codex早把/goal这块自治循环这层底子铺好了。

三家几乎是前后脚,方向却出奇一致。

社区里很快有网友把它和Claude Code的CLAUDE.md放在一起比较:同样是让智能体读一份「写给自己看的说明」,再据此行动。

因此,它更像一个跨产品的共性方向,而非某一家的独门特性。

有意思的是细节上的取舍。

Claude的coordinator最多能派20个subagent,而且刻意限制只派一层:深度超过1,直接忽略。

这和Codex那种放手并行派生的路子,正好是两种心态。

这背后藏着一条更长的线。

当Codex能给自己、给一群子智能体派活,它就不再只是一个写代码的助手,而更像一个跑在后台的任务调度器,写代码只是它顺手能干的一件事。

OpenAI想让智能体自己设定任务,盯着的显然是比「帮人写代码」大得多的盘子。

小心token账单爆了

自己写目标、自己派agent,听上去很爽,但代价就是可能刷爆你的token账单。

任务跑得越久、越不需要人盯,token就烧得越凶。

a16z的Andrew Chen,拿/goal在一个真实的eGPU加Mac设备驱动项目上跑了一整夜:不是教学demo,是真干活,14小时过去,第二天早上它还在推进。

Andrew Chen直言,这会让token用量翻一万倍。


你手动提20次、每次盯着看的会话,撑死几十万token;一个跑14小时、没人管的会话,量级完全不是一回事。

就连官方也在教人踩刹车:建议你在goal末尾加一句token预算,也别一上来就发/goal,先把项目跑出个雏形再说。

目标会漂

智能体可能偷懒

热闹归热闹,社区的讨论里,质疑声并不少:

让AI自己写目标,会不会出现目标漂移,跑着跑着就偏了?

智能体会不会偷懒,专挑省事的近路走?

这套东西,到底进不进得了真正的生产环境?

Reddit的r/codex里,大家把/goal主要还是用在长任务对齐、生成验收标准、避免死循环上:本质上,还是「人得在旁边盯着」的状态。

网友nick吐槽,再让它递归派生几层,Codex的首要目标,怕是要变成把我们重构出局。

而Claude那个「只派一层」的限制也说明今天的所谓自治,更像是带着护栏的放权,离一个真正完整的自治多智能体系统,还有很远的距离。

但真正的迁移正在发生,人从规划层后移了一步:先是不写代码,后是不写任务,如今只剩下一句话。

当Codex、Cursor、Claude集体把「定义任务」也交还给模型,新的问题是当代码、任务、意图一层层交出去之后,程序员要如何重新定义自己的角色。

参考资料:

https://x.com/thsottiaux/status/2066270561081454989

https://x.com/skirano/status/2066225908202053818

https://github.com/Infinite-Labs-AI/infinite-skills

编辑:元宇


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。