![]()
新智元报道
![]()
5 月 19 日,OpenAI 联合创始人、「Vibe Coding」之父 Andrej Karpathy 宣布加入 Anthropic 预训练团队。他将组建新团队,用 Claude 加速预训练研究。一个做过Hinton和李飞飞学生、奥特曼同事、马斯克直属下属的人,为什么甘愿做 Dario Amodei 的「-2」?Anthropic 又为什么非要招他?
5 月 19 日晚上 11 点,Andrej Karpathy 亲自官宣加入了 Anthropic。
![]()
这个名字的分量不需要多解释。
OpenAI 联合创始人,特斯拉前 AI 总监,「Vibe Coding」之父,全球最有影响力的 AI 教育者。
他在 AI 领域的地位,大概相当于篮球界的詹姆斯,到哪支队伍都是头条。
他在 X 上只发了三句话。
![]()
https://x.com/karpathy/status/2056753169888334312
第一句说 LLM 前沿的未来几年「尤其具有塑造性」。第三句说他仍然热爱教育。中间那句最关键,五个词,「回归研发」。
这是两年内第三位从 OpenAI 阵营投奔 Anthropic 的核心人物。
也是一个即将 40 岁、功成名就、财务自由的人,主动选择去给别人的下属当下属。
为什么走?为什么是 Anthropic?Anthropic 又为什么非要招他?
每一个问题背后都有一层值得拆开看的东西。
他去做什么
Karpathy 本周已经开始工作,进入了 Anthropic 预训练团队。
这个团队由 Nick Joseph 领导,负责 Claude 所有大规模训练运行。
Anthropic 发言人向 TechCrunch 确认,Karpathy 将组建一个新的子团队,专注于用 Claude 自身来加速预训练研究。
Nick Joseph 也在 X 上补充了背景,「他将建立一个团队,专注于用 Claude 加速预训练研究本身。」
![]()
https://x.com/nickevanjoseph/status/2056760504949842219
TechCrunch 评价称,「Karpathy 是少数能在 LLM 理论与大规模训练实践之间架起桥梁的研究者之一。」
Axios 则把这件事定性为「Anthropic 在人才争夺中的重大胜利」。
同日宣布加入 Anthropic 的还有网络安全专家 Chris Rohlf,此前 xAI 创始成员 Ross Nordeen 也于本月早些时候加入。人才流向的方向性越来越明显。
![]()
https://x.com/chrisrohlf/status/2056744653165092983
在 Polymarket 的数据可以作为市场情绪的旁证——交易者给 Anthropic 在 6 月底拥有最佳 AI 模型的概率定价为 65%,而 OpenAI 为 4%。
![]()
https://polymarket.com/event/which-company-has-best-ai-model-end-of-june
Karpathy 的加入进一步强化了这个判断。
定义者 Karpathy
要理解这次加入的重量,需要理解 Karpathy 这个人的稀缺性。
他的稀缺不在于技术能力,顶级研究者有一批。
他的稀缺,在于他能用一个词改变整个行业理解某件事的方式。
1986 年生于斯洛伐克,15 岁移民加拿大多伦多。
在多伦多大学读本科时选修了 Geoffrey Hinton 的课程并参加了他的读书会。
Hinton 是深度学习复兴运动的精神领袖,2018 年图灵奖得主,2024 年诺贝尔物理学奖得主。
![]()
Karpathy 是最早被这把火点燃的年轻人之一。
之后在 Stanford 师从另一位传奇人物李飞飞,博士期间创建了 CS231n 课程。
![]()
这门课从 2015 年的 150 名学生涨到 2017 年的 750 人,全部视频讲义公开上网,成为全球无数工程师自学深度学习的第一站,更是计算机视觉第一神课,没有之一。
![]()
2015 年,他成为 OpenAI 的创始研究科学家。
![]()
2017 年被马斯克招至特斯拉担任 AI 高级总监,推动自动驾驶走向纯视觉方案。
在这次挖角中,马斯克承受了巨大的压力。
![]()
https://www.cnbc.com/2026/05/19/anthropic-hires-openai-cofounder-andrej-karpathy-former-tesla-ai-lead.html
同年,Karpathy 在 Medium 上发表了一篇文章,提出了「Software 2.0」概念,主张神经网络权重就是新的代码,数据集就是新的源代码,梯度下降就是新的编译器。
这个框架重塑了整个行业对「什么是编程」的认知。
2022 年离开特斯拉后,他在 YouTube 上创建了「Neural Networks: Zero to Hero」系列课程,频道突破百万订阅。
同期的开源项目 micrograd、nanoGPT、nanochat,代码量极少但精准击中核心概念,被称为「可运行的教科书」。
2025 年 2 月,他造出了「Vibe Coding」一词,被柯林斯词典选为年度词汇。
![]()
https://x.com/karpathy/status/1886192184808149383
6 月在 YC AI Startup School 演讲中提出「Software 3.0」和「Agent 的十年」框架,成为当年讨论最广的 AI 演讲之一。
TIME 在 2024 年将他列入「AI 领域最具影响力 100 人」。
从 Hinton,到李飞飞,到奥特曼,再到马斯克,他在每个节点都站在最前沿。
但他留下的最持久的东西不是任何一个产品或论文,而是那些概念框架。
Software 2.0、Vibe Coding、LLM OS。这些词改变了人们思考 AI 的方式。
![]()
为什么甘愿做「-2」
Karpathy 的职业生涯有一条清晰的线索,他追逐的从来不是头衔。
他做过Hinton和李飞飞的学生、奥特曼的同事、马斯克的直接下属。
每一段经历里,他的组织架构位置都是高层。
现在他加入 Anthropic,直接上司是 Nick Joseph,预训练负责人。
![]()
Nick Joseph 汇报给 Dario Amodei。
Karpathy 在组织架构中排到了第三层。
Nick Joseph 是 Anthropic 创始 11 人之一,此前在 Vicarious 和 OpenAI 工作。
在 OpenAI 期间,他在安全团队做代码模型,看到 GPT-3 微调之后能写代码,意识到 AI 可以自我改进,于是跟着安全团队的领导一起离开,创建了 Anthropic。
他的团队训出了 Claude 全系列模型,包括 Mythos。
Karpathy 愿意在 Nick Joseph 下面做研究,原因很简单,这个位置离他想做的事最近。
回溯他的每一次职业变动,驱动力都是同一个,「此刻最大的实验在哪里」。
2017 年去 Tesla,因为自动驾驶是 Software 2.0 最大的实验场。
2022 年离开,因为架构已定,剩下的是工程优化。
2023 年回 OpenAI,因为 ChatGPT 随着 GPT-4 发布带来的爆发期是最刺激的前沿。
2024 年创办 Eureka Labs,想验证 AI 原生教育的假设。
2026 年加入 Anthropic,因为「用 AI 研究 AI」的预训练革命正在这里发生。
每一次离开都不是出于不满,而是当下的位置不再是最大的实验所在。
为什么不回 OpenAI?人才流向给出了答案。
Jan Leike,OpenAI 前对齐负责人,2024 年 5 月加入 Anthropic。
![]()
OpenAI 联合创始人 John Schulman,同年 8 月跟进。
![]()
现在轮到了 Karpathy。
两年三人,全部单向流动,没有任何可比的反向案例。
OpenAI 的战略重心已经从纯研究转向了平台化和收购。Chat.com、io Products、Windsurf、TBPN,收购间隔越来越短,金额越来越大。
这是一家正在变成「AI 时代消费巨头」的公司。
对一个想「回归研发」的研究者来说,Anthropic「以研究质量取胜」的路线更有吸引力。
Anthropic 为什么如此想要他
Anthropic 的招聘动机可以分成几层。
最表层是技术需求。
Anthropic 的算力预算再大,也比不过微软撑腰的 OpenAI 和坐拥 TPU 的谷歌。
纯堆算力的竞赛,Anthropic 赢不了。
它必须找到一种用更少算力训出更好模型的方法。
「用 Claude 加速预训练研究」就是这条路线,而 Karpathy 同时具备预训练理论深度、大规模工程经验、和对 AI 辅助研究的直觉,三者兼备的人极少。
再往下是人才信号。
两年三位 OpenAI 核心人物单向流入 Anthropic,「一线研究者用脚投票」的叙事已经成型。
每一个 Karpathy 级别的加入,都在降低下一个顶级人才加入的心理门槛。人才吸引人才,飞轮自转。
还有 IPO 前的品牌镀金。
Anthropic 正在以 9000 亿美元估值谈 300 亿美元融资,IPO 准备也在推进。
Karpathy 是 AI 领域公众辨识度最高的技术人物之一,百万 YouTube 订阅,年度词汇造词者,22 万 GitHub 星标的 CLAUDE.md 仓库。
他的名字出现在 Anthropic 的员工名单上,直接给了投行一句可以写进招股书的话。
但最有意思的一层可能是 Anthropic 没有明确作为招聘动机、却注定会收获最大回报的东西,Karpathy 定义范式的能力。
他在 Anthropic 做的任何技术探索都会被他公开谈论,推文、博客、YouTube 视频。
当他用他特有的方式给正在发生的事情命名时,Anthropic 就自然成为那个范式的原产地。
招了一个顶级预训练研究者,附带获得了行业最有影响力的技术叙事者。
飞轮的临界点
把这件人事变动放到更大的背景下看,它标记的是一个技术拐点。
2026 年 4 月,Anthropic 发布了 Mythos Preview,迄今最强大的 AI 模型。
![]()
Mythos 过于强大,仅能通过 Project Glasswing 受邀内测
Mythos 在没有被专门训练网络安全的情况下,自主发现并利用了 FreeBSD 中一个存在 17 年的远程代码执行漏洞,找到了 OpenBSD 中 27 年的漏洞和 FFmpeg 中 16 年的缺陷。
英国 AI 安全研究所的独立评估确认,它是第一个能从头到尾完成 32 步企业网络攻击模拟的模型。
Anthropic 自己也承认,这些能力不是刻意训练的结果,是通用推理和软件工程能力提升的「下游涌现」。
预训练做得越好,涌现出的能力越超出预期。
Mythos 是当前最强大的模型,也是当前最强大的工具。
Karpathy 来 Anthropic 要做的,就是拿这把最强的锤子,去改进锤子本身的制造方式。
用 Mythos / Claude 来发现更优的训练架构、数据配比、实验方向,让模型改进的速度脱离人类研究者的线性节奏,转起「AI 改进 AI」的进化飞轮。
这也是 Anthropic 最期望的结局。
当这个飞轮真正转起来,「AI 自我改进预训练」就不再只是一个研究方向,而是通往 AGI 乃至 ASI 的加速通道。
目前所有关于算力军备竞赛、数据壁垒、人才争夺的竞争维度,都可能被这一个变量改写。
三年内,OpenAI 失去三位核心人物给同一个竞争对手。
这个事实的影响可能比任何融资数字都大。
算力可以用钱买,数据可以用时间积累,但能让 AI 进化飞轮转起来的人,全世界一只手数得过来。
Karpathy 选择在这个时刻放下自由身份回到一线。他认为窗口就在眼前。
参考资料:
https://x.com/karpathy/status/2056753169888334312
编辑:马可 摩西





京公网安备 11011402013531号