![]()
新智元报道
编辑:元宇 艾伦
图灵奖大佬LeCun离职Meta后直接开怼:实锤Llama4造假传闻,炮轰原上司Alexandr Wang「不懂科研」,称Meta冲刺「超级智能」完全是被大模型洗脑。同时,他也透露自己的新公司即将在今年发布全新世界模型。
LeCun离开Meta后,直接掀桌了。
刚刚,这位图灵奖得主、Meta前首席科学家一离职,便回头投下了重磅炸弹!
![]()
图灵奖得主、Meta前首席科学家Yann LeCun
先是曝出Meta的Llama 4刷榜黑料:
Llama 4测试「被做了点手脚」,团队在不同基准上用不同模型,只为了拿到更好成绩。
紧接着,他又把矛头对准自己原上司:28岁的Alexandr Wang。
他是扎克伯格140亿美元重点押注超级智能的核心人物。
Meta曾向Scale AI投资140亿美元,并将其创始人Alexandr Wang挖来领导「超级智能实验室」。
但LeCun对他的评价,几乎相当于当众拆台:「他没有研究经验,也不知道如何进行研究。」
他认为Alexandr Wang并不真正理解科研,不知道科研人员「喜欢什么、不喜欢什么」,因此预言Meta AI将会有更多员工离职。
炮轰28岁上司 ,预言新一轮离职潮
扎克伯格之所以重金引入Alexandr Wang等人组建「超级智能实验室」,是因为被逼急了。
ChatGPT引爆浪潮后,也让Meta陷入了一场手忙脚乱的应对。
扎克伯格决定把筹码押在Llama大模型上,并重组组织架构,成立生成式 AI(GenAI)部门,要求加速把研究变为产品。
在这个过程中LeCun坚持开源,让Llama 2以「开放权重」成为开源大模型的标杆,甚至被他称为「分水岭」。
扎克伯格决定给GenAI更大压力,认为要加速AI的开发与部署,如果按照原有的方法搞,很可能就会落后。
特别是在去年4月,当Llama 4翻车,公司还被指控「刷榜」,扎克伯格的情绪彻底炸裂。
LeCun称「马克非常沮丧,基本上对所有参与此事的人都失去了信心……所以基本上把整个GenAI组织边缘化了。」
![]()
Meta首席AI官、超级实验室领导者Alexandr Wang
于是,Alexandr Wang被推到台前,成了Meta新AI赌注的领军者。
可LeCun对这位年轻上司的不足却直言不讳:认为他年轻、缺乏经验。
他学得很快,知道自己不知道什么……但他没有科研经验,不知道如何进行科研,也不知道科研人员会喜欢什么或不喜欢什么。
当被问起怎么会接受自己的上级突然变成一个28岁的人时,LeCun表示他习惯和年轻人共事。
当时Facebook的工程师平均年龄27岁,他的年龄是他们的两倍。
但他同时也提到Alexandr Wang并没有指挥自己做事:
你不能告诉研究人员该怎么做。你当然不能告诉像我这样的研究人员该怎么做。
意思很明显:研究这件事,不是组织架构图上的任命所能够命令和约束的,而且外行不能指导内行。
Llama 4风波
一次基准测试引爆组织内斗
2025年4月发布的Llama 4翻车后,Meta被指控操纵基准测试成绩。
这次是LeCun首次站出来实锤外界以往的猜测,他指出团队为了美化数据,对基准测试结果进行了「捏造(Fudged)」,「篡改」了部分测试结果。
他还特意指出,在不同基准上用了不同模型,以获得更好成绩。
对扎克伯格来说,这比一次技术失败更难接受。
这一丑闻也直接导致他对原AI团队失去信心,转而重金挖角,开始组建超级智能实验室团队。
Meta开始在人才争夺战里下重注,甚至还因为试图用1亿美元签约奖金挖人上过头条。
激进的人才战略,也导致了整个GenAI组织被边缘化,以及新旧团队、研究与产品、开源与商业之间的结构性摩擦。
由此,也带来了Meta内部一波波的离职潮和裁员潮。
路线之争
LeCun坚持LLM 是条「死路」
真正让LeCun最难忍受的,并不是他口中「不懂管理的上级」,或者是刷榜事件,而是他认为Meta正在集体沉迷于一条错误的方向!
LeCun直言,那批公司为了冲刺新一轮「超级智能」而招来的人「完全被大语言模型洗脑了(completely LLM-pilled)」。
虽然,扎克伯格仍然支持他对AI未来的看法,但公司的大规模招聘主要集中在LLM开发上。
但LeCun的立场是:LLM虽然有用,但从根源上受限,语言本身就是束缚。
要实现人类水平智能,必须理解物理世界的运作方式。
因此,他才会抛出那个让所有大模型路线的追随者们感到「刺耳」的观点:
我确信Meta公司里很多人,包括Alex在内,都不希望我告诉世人,LLM在超级智能领域基本上是一条死路。
然后他拒绝为此妥协:
我不会因为某些人认为我错了就改变我的想法。我没错。作为一名科学家,我的职业操守不允许我这样做。
在一家公司里,你可以跟同事、上司甚至老板争论。
但如果公开挑战组织方向,站出来说「这条路基本是死路」,你就会变成一个天然的异类。
这正像LeCun自己所承认的那样:留下来在「政治上」变得很难。
他在Meta的位置,已经不再适合继续做他想做的研究。
离开是不可避免的结局。
世界模型
下一代新范式
LeCun的新公司叫AdvancedMachine IntelligenceLabs(AMI Labs),专注于用世界模型实现ASI。
![]()
V-JEPA世界模型
给AI装个「脑内物理沙盒」
LeCun想做的V-JEPA世界模型,可以理解为:让AI不是只会「说得像」,而是能在脑子里搭一个粗粒度的世界模拟器——看见一段视频后,知道哪些东西是物体、它们怎么动、接下来可能发生什么,甚至为行动做准备。
![]()
JEPA的关键
不抠像素细节,预测「抽象状态」
传统生成式训练常逼模型还原每个像素/词。
JEPA的思路更「务实」:把世界压缩成一串表示(embedding),训练目标是从可见的上下文去预测被遮住部分的表示,而不是把遮住的区域逐像素画回去。
I-JEPA论文把这称为non-generative的自监督学习路径。
![]()
V-JEPA
把JEPA从图片升级到视频 学「运动规律」
V-JEPA就是视频版JEPA:把视频切成时空块,遮住一部分,让模型用剩下的内容去预测「被遮住那块在表示空间里应该长什么样」。
直觉上,它更容易学到「谁在动、怎么动、动的规则」,而不是纠结纹理噪点。
![]()
V-JEPA 2
从「看懂」走向「能规划」
V-JEPA 2的路线很明确:
先用超过100万小时互联网视频做大规模自监督预训练;
再用少量机器人交互轨迹,让模型学会「如果我这么做(动作),世界会怎么变」,从而更接近可用于预测与规划的世界模型。
![]()
AMI Labs需攻坚的难点
想做好世界模型,有三大难点:
其一是长时程预测,越往后未来分叉越多。
其二是不确定性,同一个场景可能有多种合理下一步。
其三是从表征到行动,学到「状态」还要能服务决策与控制。
而AMI Labs,正是LeCun为了攻克世界模型的难题而成立。
LeCun的新计划
去年11月,当媒体曝出LeCun即将离职Meta,开启新创业计划的消息后,他的日程表就一直处在疯狂状态。
他直言,这个决定使自己的日程表被迫加速了,居于日程表核心位置的,就是去做他口中更接近下一代AI的东西:世界模型(world model)。
LeCun的新创公司AMI Labs总部位于巴黎。
据LeCun称,马克龙还向他发了一条WhatsApp,暗示对他的新创业计划会与法国保持紧密联系感到高兴。
AMI Labs将由法国医疗AI初创公司Nabla的联合创始人兼CEO Alex LeBrun领导,LeCun担任执行主席。
提到这样的安排,LeCun坦诚表示自己当不了CEO:
我是科学家,我挺擅长判断什么技术行得通、什么行不通。但我当不了CEO,一方面我太不擅长组织管理了,另一方面我也太老了!
这种安排可以让他像在Meta时那样,保有做研究的自由。
在LeCun对技术的描述中,有一个特别的观点:
他认为模型依赖「情绪」,也就是过往经历与评价来引导预测,这非常像是把「人的本能」装进机器:
如果我掐你一下,你会感觉到疼……下一次当我把胳膊靠近你时,你会往后缩。这就是你的预测,而它唤起的情绪是恐惧,或者说对疼痛的回避。
LeCun还给出了他所计划打造的「世界模型」的时间表:
预计12个月内将推出具备初步物理直觉的「婴儿级」模型。几年内会在更大规模上出现。
LeCun认为它还不是超级智能,也许还存在没看到的障碍,但它至少还有希望是一条通往超级智能的路径。
提到对未来的愿景,LeCun直言希望为世界留下更多智能。
「这才是我们应该拥有更多的东西……我们饱受愚蠢之苦。」
LeCun的智能之路
生于1960的LeCun自幼在巴黎郊区长大。
从小的他就着迷于一个问题:人类智能到底是怎么出现的。
在他八九岁的时候,看了电影《2001:太空漫游》,整个人被深深震撼,这促使他走上了探索人工智能之路。
LeCun的「顿悟时刻」发生在1980年代。
他在一本书中读到了语言学家Noam Chomsky与心理学家Jean Piaget之间关于「先天与后天」的争论。
其中,Chomsky认为人类有天生的语言能力,而Piaget则认为确实存在某种结构,但大部分是后天学来的。
LeCun并不认同Chomsky的说法,在他看来,我们什么都是学来的,而且他认为所谓智能主要就是关于学习。
当时关于AI和神经网络(neural networks)的研究几乎是一片空白,但LeCun还是去找同样在研究神经网络的人,并与当时担任卡内基梅隆大学的教员Geoffrey Hinton成为智识上的「灵魂伴侣」。
后来,LeCun去多伦多大学加入Hinton的团队做博士后研究。
两人再加上Yoshua Bengio,共同为深度学习和现代AI奠定了基础,并于2018年获得计算机科学界最负盛名的图灵奖。
![]()
Geoffrey Hinton、Yoshua Bengio、Yann LeCun被称作「深度学习」三巨头
LeCun是许多重要早期AI技术背后的大脑。
20世纪80年代末到90年代,他在新泽西的AT&T贝尔实验室(Bell Labs)做研究,并在那里开发了卷积神经网络(convolutional neural networks),这种架构用于图像识别技术。
他还把它做进一个系统里,银行曾广泛用它来识别支票。
这项研究的想法他在多伦多时就已经有了,但之所以能在现实世界落地,是因为贝尔实验室有近乎无限的资金,以及最前沿的技术条件。
LeCun讲起他刚加入时老板Larry Jackel对他说过的话:
在贝尔实验室,你不会因为省钱而出名。
结束了贝尔实验室的狂欢后,LeCun回到学界,在纽约大学(NYU)启动了一个研究神经网络的新项目。
到2013 年,深度学习已经明显会成功,谷歌刚刚启动Google Brain,一年后又收购了英国AI实验室DeepMind。
正是那个时候,扎克伯格打来电话,他想在Facebook建一个AI团队,为了挖LeCun,甚至邀请他去加州家里吃晚饭。
LeCun同意加入,但提出了三个条件:他不必辞掉NYU的工作,不搬去加州,新实验室的研究成果必须对外公开发布。
扎克伯格都答应了,于是LeCun加入了Facebook,建立一个专注基础研究的全新AI研究实验室Facebook Artificial Intelligence Research(FAIR)。
小彩蛋
《金融时报》也公布了和Yann LeCun本次访谈的菜单。
这家位于巴黎香榭丽舍大街的米其林一星餐厅Pavyllon Paris,是Yann LeCun这位老法国人的心头好。
![]()
在采访中,LeCun对这家餐厅的菜品赞不绝口。
![]()
图灵奖得主青睐的米其林餐厅,路过巴黎值得一尝。
![]()
参考资料:
https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!
![]()





京公网安备 11011402013531号