当前位置: 首页 » 资讯 » 科技头条 » 正文

“OpenAI联创”Karpathy官宣加入,Anthropic获得“人才争夺战”重大胜利

IP属地 中国·北京 华尔街见闻官方 时间:2026-05-20 10:27:39

AI圈最知名的技术布道者,“Vibe Coding之父”,选择了OpenAI最强劲的对手。

5月19日深夜11点,Andrej Karpathy在X上发了四句话,宣告了AI人才格局的又一次重新洗牌。

这条帖子一小时内浏览量接近300万。Karpathy写道:

个人动态:我已加入Anthropic。我认为未来几年大语言模型的前沿发展将尤为重要。很高兴能加入这个团队,重返研发工作。同时,我依然对教育事业充满热忱,计划适时恢复相关工作的推进。


Karpathy本周已正式入职,加入Anthropic预训练团队,该团队由另一位前OpenAI员工Nicholas Joseph领导,负责Claude所有大规模训练运行。Anthropic发言人向TechCrunch确认,Karpathy将在该团队下组建新的子团队,专注于用Claude自身来加速预训练研究。

美媒Axios将此次招募定性为“Anthropic在人才争夺中的重大胜利”。

Karpathy是谁:一个能用一个词改变行业的人

要理解这次加入的分量,先要理解Karpathy的稀缺性在哪里。

1986年生于斯洛伐克,15岁移民加拿大。本科在多伦多大学选修了深度学习之父Geoffrey Hinton的课程,随后在斯坦福师从李飞飞攻读博士,期间创建了计算机视觉课程CS231n——从2015年的150名学生增长到2017年的750人,全部视频公开上网,成为全球工程师自学深度学习的入门首选。

2015年,他成为OpenAI创始研究科学家。2017年被马斯克挖至特斯拉担任AI高级总监,主导自动驾驶纯视觉方案。同年他在Medium发表“Software 2.0”,提出神经网络权重就是新的代码、数据集就是新的源代码——这个框架重塑了整个行业对“什么是编程”的认知。

2022年离开特斯拉后,他在YouTube创建“Neural Networks: Zero to Hero”系列,频道突破百万订阅。开源项目micrograd、nanoGPT代码量极少,却被称为“可运行的教科书”。

2025年2月,他在X上造出了“Vibe Coding”一词——“完全顺应直觉,拥抱指数级增长,忘掉代码本身的存在”——随后被柯林斯词典选为年度词汇,引发了关于SaaS公司生死存亡的广泛讨论,数百亿美元市值随之蒸发。

TIME在2024年将他列入“AI领域最具影响力100人”。他在X上拥有250万粉丝。

正如X用户@sa_vatsa所评论的:

Andrej给人的感觉从来不像一个AI网红,更像是这个领域的公共解读者。他翻译现实,而不是兜售立场。


他去做什么:用最强的锤子改进锤子本身

Karpathy加入Anthropic的具体任务,指向一个明确方向:用Claude加速预训练研究本身。

预训练是大模型获得核心知识和能力的基础阶段,也是算力消耗最密集的环节。据Anthropic向TechCrunch确认,Karpathy将组建团队,探索让Claude自主发现更优训练架构、数据配比和实验方向的方法——也就是“AI改进AI”的路线。

这并非凭空而来。今年3月,Karpathy曾做过一个实验:将一个AI编程智能体接入一个小型语言模型,让它无监督运行两天,自主测试和调整训练代码。经过700次实验、20项自主发现的优化后,他表示同样的调整应用到更大模型上,训练时间缩短了11%。他将这个方法称为“autoresearch”,该项目随后成为GitHub热门项目,这套方法也被称为“Karpathy Loop”。

他在Anthropic要做的,正是将这套思路系统化、规模化。

Nicholas Joseph在X上写道:

他将建立一个团队,专注于用Claude加速预训练研究本身。我想不出还有谁比他更适合做这件事——期待我们一起构建的东西!!

TechCrunch评价称,“Karpathy是少数能在LLM理论与大规模训练实践之间架起桥梁的研究者之一。”

为什么是Anthropic,而不是回OpenAI

Karpathy的职业轨迹有一条清晰的逻辑:哪里是当下最大的实验,他就去哪里。

2017年去特斯拉,因为自动驾驶是Software 2.0最大的实验场。2022年离开,因为架构已定,剩下的是工程优化。2023年回OpenAI,因为GPT-4带来的爆发期是最刺激的前沿。2024年创办AI教育公司Eureka Labs,想验证AI原生教育的假设。

这一次选择Anthropic,他的判断是:“用AI研究AI”的预训练革命正在这里发生。

而他没有回OpenAI,背后有一个不可忽视的结构性信号:

2024年5月,OpenAI前对齐负责人Jan Leike加入Anthropic;

2024年8月,OpenAI联合创始人John Schulman跟进;

2026年5月,Karpathy加入。

三年,三位OpenAI核心人物,全部单向流入Anthropic,没有任何可比的反向案例。

与此同时,OpenAI的战略重心已明显转向平台化——相继收购Chat.com、io Products、Windsurf等,节奏越来越快,金额越来越大。对于一个想”回归研发“的研究者而言,Anthropic”以研究质量取胜“的路线,显然更有吸引力。

据Business Insider报道,Anthropic的估值在二级市场近期已超过1万亿美元,超越OpenAI。Anthropic目前正在以约9000亿美元估值洽谈300亿美元新一轮融资。据新智元援引Polymarket数据,交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%,而OpenAI为4%。

“Anthropic正在赢得AI竞赛”

对于这则重磅人事变动,X用户@Shashank评论道:

Anthropic开始看起来像2000年代中期的皇家马德里,把所有AI传奇人物和CTO都招进来当技术成员。Anthropic正在打造一支绝对的超级战队。


X用户@Balu0X表示:

天哪,太疯狂了,完全没想到。Anthropic正在赢得AI竞赛。


@HegsethWarDesk用户表示,

Anthropic发展势头良好,我认为在未来三四年内他们会超越OpenAI。




Anthropic为什么非要招他

Anthropic的招募动机可以分几层来看。

技术层面:Anthropic的算力预算无法与微软支持的OpenAI或坐拥TPU的谷歌正面竞争。它必须找到用更少算力训出更好模型的方法。Karpathy同时具备预训练理论深度、大规模工程经验和对AI辅助研究的直觉,三者兼备的人极少。

人才信号层面:每一个Karpathy级别的加入,都在降低下一个顶级人才加入的心理门槛。人才吸引人才,飞轮自转。

IPO叙事层面:Karpathy是AI领域公众辨识度最高的技术人物之一——百万YouTube订阅,年度词汇造词者,GitHub上22万星标的CLAUDE.md仓库。他的名字出现在员工名单上,本身就是一句可以写进招股书的话。

但据新智元分析,最深层的价值可能是Anthropic没有明说的:Karpathy定义范式的能力。他在Anthropic做的任何技术探索,都会通过他的推文、博客和YouTube视频公开传播。当他用他特有的方式给正在发生的事情命名时,Anthropic就自然成为那个范式的原产地。

招了一个顶级预训练研究者,附带获得了行业最有影响力的技术叙事者。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。