码农连任务都不写了？Codex开始自己给自己派活

IP属地中国·北京 新智元 时间：2026-06-16 02:08:14

新智元报道

从写指令，到给目标，再到只给一句意图：有人干脆让Codex自己定任务——人类还能留在编程的计划层吗？
「我基本上再也不自己写/goal了。」
近日，前Anthropic成员、现MagicPath CEO的Pietro Schirano在X上甩出这句话，评论区瞬间炸开。

他的做法是：不再手写那份/goal，而是让Codex为自己写一份，再为它派生的每个子智能体（agent）各写一份。
把一个高层意图丢给Codex，让它先给自己写一份详细的/goal——怎么拆任务、哪些并行、最后怎么汇总，全由模型自己定。
从头到尾，人类只用在最开始说出自己的意图，剩下的拆解、调度、收尾，模型自己都能安排得明明白白。
Pietro Schirano @skirano在X上分享的演示视频
别小看Pietro这句话，这次他交给AI的并非是体力，而是判断力：过去开发者交给AI的是「怎么写」，这一次交出去的是「写什么」。
先是写一句提示词，AI把活干了。
后来连提示词都懒得细写，只丢一句模糊的目标，剩下怎么做、分几步，让它自己琢磨。
到现在，索性连「目标」都不写了。
评论区一位网友感叹道：
我们好像已经进入这样一个时代：我给AI一个目标，AI把这个目标改得更好，然后我礼貌地假装自己一直是那个项目经理。
这句话刚好戳中了这次变迁的核心。
当一个程序员连「要干什么」都不再亲手写，他在这条流水线上，到底还剩下什么？
人只管给意图
任务交给agent去想
过去几年，提示词工程被捧成AI时代的硬技能。会写提示词，就好比握住了驾驭模型的关键。
再往后是元提示（meta-prompting）：你不直接写指令，而是让模型帮你把指令写得更好。
而这次Codex所演示的更进一步：自生成目标（self-goal generation）。模型并非把你的话润色成更漂亮的指令，它直接接管了「目标」本身：你给意图，它写/goal。
这套玩法的底座，是Codex今年4月底上线的/goal功能，先在Codex CLI里出现，近期在config.toml里把features.goals打开就能用。
官方把它塞进Codex CLI的0.128.0版本，默认关闭，要手动改配置文件才能打开。
开发者圈给它起了个外号，叫「Ralph循环」：规划、执行、测试、复查、迭代，一路自转，不到目标不收手。
它与普通对话提示词最大的不同，是goal这段文字会同时充当两样东西：起始指令，和「完成审计」。
Codex每跑完一轮，就回头对照目标问自己两句：还该做什么，是不是已经做完了。一轮接一轮，直到任务完成、被你叫停，或者token烧到上限。
所以官方反复强调一件事：目标一定要写到Codex能判断「做完没有」，要避免「优化一下」「完善一下」这种虚词。
真正给这件事定调的，是OpenAI的Codex负责人Tibo（Thibault Sottiaux）。

他在X上说，我们造的每一个工具，都同时是给智能体用的：
Codex能查看、也能设置自己的/goal。这是元提示的泛化，用一句话概括就是：人给意图，智能体来生成任务。
开发者@MikelEcheve把这套能力进一步解释为：Codex能自建/goal、为并行的智能体生成目标、自主切分工作。

Codex自述：「因为你明确要并行智能体，我就用多智能体工具」，并已「Created an agent」，右侧子智能体面板出现首个分身Gibbs。图源：Pietro Schirano @skirano演示视频
有人已经用它干了18个小时
/goal的自转能力，已经有人拿真实项目验证过。
有开发者实测：给Codex一句高层目标，把BACKLOG.md里的18个功能全部交付，然后人就离开了。
约18小时后回来，Codex已经自主实现其中14个，每一处改动都过了测试、在CI里合并，全程没要一次人工点头，连代码自审都交给了GPT子智能体。
算下来，这趟跑了约4.20美元。
skirano展示的，是更上面那一层：不只让Codex执行一份goal，而是让它给自己和每个子智能体各写一份goal，智能体的层级自动就长了出来。
只丢给它一句话，Codex就把该干全干了。

运行约10秒，状态变为「Creating 2 agents」，右侧子智能体已扩展为Gibbs与Leibniz两个并行分身。图源：Pietro Schirano @skirano演示视频

主智能体「Created 3 agents」，右窗子智能体Gibbs正在执行自己的专属/goal：设计一条数学化的过山车轨道。各自一份goal，正是这套打法的核心。图源：Pietro Schirano @skirano演示视频
这套打法正在被模板化。
开发者Pablo Stanley把它做成了模板，给出一套「Build [THING]＋功能＋风格」的提示词框架，让Codex照着自动生成goal、再孵化对应的子智能体。整套流程，人只负责开头那句话。这个模板被skirano本人点赞。
在Reddit的r/codex社区，开发者已经用/goal做长期任务对齐、自动生成验收标准、规避死循环。
另一位开发者RTK（@riverkhan）走得更远。OpenAI团队前不久发了一篇讲怎么把/goal用好的文章，他直接把里面的最佳实践封装成开源skill，取名Infinite Skills，仿照Superpowers的结构，每个skill就是skills目录下扁平的一份SKILL.md。
里头那个叫goal的skill，干的事很有意思：在你正式发起/goal之前，它先反过来「面试」你，把一个含糊的目标，一句句盘问成具体、可验证的契约，再把整理好的完整目标喂给goal模式。

https://github.com/Infinite-Labs-AI/infinite-skills
换句话说，goal模式跑得好不好，本就取决于目标写得够不够具体、能不能让Codex自己判断做完没有。
如今连「把目标盘问清楚」这一步，都有人做成工具替你包办了。
三家把同一件事做了
这股潮流并非Codex独自引领。
几乎在同一个时间窗口里，三家主流编程智能体，把「让AI自己拆任务、自己派智能体」这项功能，不约而同地推了出来。
Anthropic的多智能体编排5月6日上线，Cursor的/orchestrate只隔一天、5月7日跟上。
再往前推到4月底，Codex早把/goal这块自治循环这层底子铺好了。
三家几乎是前后脚，方向却出奇一致。
社区里很快有网友把它和Claude Code的CLAUDE.md放在一起比较：同样是让智能体读一份「写给自己看的说明」，再据此行动。
因此，它更像一个跨产品的共性方向，而非某一家的独门特性。
有意思的是细节上的取舍。
Claude的coordinator最多能派20个subagent，而且刻意限制只派一层：深度超过1，直接忽略。
这和Codex那种放手并行派生的路子，正好是两种心态。
这背后藏着一条更长的线。
当Codex能给自己、给一群子智能体派活，它就不再只是一个写代码的助手，而更像一个跑在后台的任务调度器，写代码只是它顺手能干的一件事。
OpenAI想让智能体自己设定任务，盯着的显然是比「帮人写代码」大得多的盘子。
小心token账单爆了
自己写目标、自己派agent，听上去很爽，但代价就是可能刷爆你的token账单。
任务跑得越久、越不需要人盯，token就烧得越凶。
a16z的Andrew Chen，拿/goal在一个真实的eGPU加Mac设备驱动项目上跑了一整夜：不是教学demo，是真干活，14小时过去，第二天早上它还在推进。
Andrew Chen直言，这会让token用量翻一万倍。

你手动提20次、每次盯着看的会话，撑死几十万token；一个跑14小时、没人管的会话，量级完全不是一回事。
就连官方也在教人踩刹车：建议你在goal末尾加一句token预算，也别一上来就发/goal，先把项目跑出个雏形再说。
目标会漂
智能体可能偷懒
热闹归热闹，社区的讨论里，质疑声并不少：
让AI自己写目标，会不会出现目标漂移，跑着跑着就偏了？
智能体会不会偷懒，专挑省事的近路走？
这套东西，到底进不进得了真正的生产环境？
Reddit的r/codex里，大家把/goal主要还是用在长任务对齐、生成验收标准、避免死循环上：本质上，还是「人得在旁边盯着」的状态。
网友nick吐槽，再让它递归派生几层，Codex的首要目标，怕是要变成把我们重构出局。
而Claude那个「只派一层」的限制也说明今天的所谓自治，更像是带着护栏的放权，离一个真正完整的自治多智能体系统，还有很远的距离。
但真正的迁移正在发生，人从规划层后移了一步：先是不写代码，后是不写任务，如今只剩下一句话。
当Codex、Cursor、Claude集体把「定义任务」也交还给模型，新的问题是当代码、任务、意图一层层交出去之后，程序员要如何重新定义自己的角色。
参考资料：
https://x.com/thsottiaux/status/2066270561081454989
https://x.com/skirano/status/2066225908202053818
https://github.com/Infinite-Labs-AI/infinite-skills
编辑：元宇

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

还在用嘴硬的AI看病？阿福已经能叫来真人医生了

码农连任务都不写了？Codex开始自己给自己派活

华为鸿蒙HarmonyOS 7 Developer Beta版开启推送

理想L8定位为何要改成五座SUV 官方：让五座用户体验看齐9系旗舰

活力中国调研行｜脑机海河实验室常务副主任：消费级产品将成为未来产业增长点

vivo T5 Lite 5G手机规格曝光，搭载6.74英寸720P 120Hz LCD屏

全站最新

还在用嘴硬的AI看病？阿福已经能叫来真人医生了

码农连任务都不写了？Codex开始自己给自己派活

华为鸿蒙HarmonyOS 7 Developer Beta版开启推送

理想L8定位为何要改成五座SUV 官方：让五座用户体验看齐9系旗舰

热门推荐

还在用嘴硬的AI看病？阿福已经能叫来真人医生了

码农连任务都不写了？Codex开始自己给自己派活

华为鸿蒙HarmonyOS 7 Developer Beta版开启推送

理想L8定位为何要改成五座SUV 官方：让五座用户体验看齐9系旗舰

活力中国调研行｜脑机海河实验室常务副主任：消费级产品将成为未来产业增长点

vivo T5 Lite 5G手机规格曝光，搭载6.74英寸720P 120Hz LCD屏

纯电存量厮杀，乐道肩扛上量重任

豆包会做任务了，成功帮我薅了瑞幸的羊毛

华为方向对了！首创阔折叠形态：苹果三星等主流品牌集体抄作业

燧原科技“豪华朋友圈”：与腾讯绑定，国家产投基金、国资加持丨智享解读

打破行业壁垒，传统光学巨头与AI科技新贵将同台亮相

下一个戴森，正在天猫悄悄长出来

APEC架起交流桥华强北“AI八骏”走进韩国

数学家集体“抗议”AI，人类数学家护城河在哪里？

联想ThinkPad P14s AI 2026笔记本上架，17999元起