当前位置: 首页 » 资讯 » 科技头条 » 正文

Meta炸了!LeCun炮轰28岁上司不懂行,实锤Llama 4刷榜丑闻

IP属地 中国·北京 新智元 时间:2026-01-03 18:13:12


新智元报道

编辑:元宇 艾伦

图灵奖大佬LeCun离职Meta后直接开怼:实锤Llama4造假传闻,炮轰原上司Alexandr Wang「不懂科研」,称Meta冲刺「超级智能」完全是被大模型洗脑。同时,他也透露自己的新公司即将在今年发布全新世界模型。

LeCun离开Meta后,直接掀桌了。

刚刚,这位图灵奖得主、Meta前首席科学家一离职,便回头投下了重磅炸弹!


图灵奖得主、Meta前首席科学家Yann LeCun

先是曝出Meta的Llama 4刷榜黑料:

Llama 4测试「被做了点手脚」,团队在不同基准上用不同模型,只为了拿到更好成绩。

紧接着,他又把矛头对准自己原上司:28岁的Alexandr Wang。

他是扎克伯格140亿美元重点押注超级智能的核心人物。

Meta曾向Scale AI投资140亿美元,并将其创始人Alexandr Wang挖来领导「超级智能实验室」。

但LeCun对他的评价,几乎相当于当众拆台:「他没有研究经验,也不知道如何进行研究。」

他认为Alexandr Wang并不真正理解科研,不知道科研人员「喜欢什么、不喜欢什么」,因此预言Meta AI将会有更多员工离职。

炮轰28岁上司 ,预言新一轮离职潮

扎克伯格之所以重金引入Alexandr Wang等人组建「超级智能实验室」,是因为被逼急了。

ChatGPT引爆浪潮后,也让Meta陷入了一场手忙脚乱的应对。

扎克伯格决定把筹码押在Llama大模型上,并重组组织架构,成立生成式 AI(GenAI)部门,要求加速把研究变为产品。

在这个过程中LeCun坚持开源,让Llama 2以「开放权重」成为开源大模型的标杆,甚至被他称为「分水岭」。

扎克伯格决定给GenAI更大压力,认为要加速AI的开发与部署,如果按照原有的方法搞,很可能就会落后。

特别是在去年4月,当Llama 4翻车,公司还被指控「刷榜」,扎克伯格的情绪彻底炸裂。

LeCun称「马克非常沮丧,基本上对所有参与此事的人都失去了信心……所以基本上把整个GenAI组织边缘化了。」


Meta首席AI官、超级实验室领导者Alexandr Wang

于是,Alexandr Wang被推到台前,成了Meta新AI赌注的领军者。

可LeCun对这位年轻上司的不足却直言不讳:认为他年轻、缺乏经验。

他学得很快,知道自己不知道什么……但他没有科研经验,不知道如何进行科研,也不知道科研人员会喜欢什么或不喜欢什么。

当被问起怎么会接受自己的上级突然变成一个28岁的人时,LeCun表示他习惯和年轻人共事。

当时Facebook的工程师平均年龄27岁,他的年龄是他们的两倍。

但他同时也提到Alexandr Wang并没有指挥自己做事:

你不能告诉研究人员该怎么做。你当然不能告诉像我这样的研究人员该怎么做。

意思很明显:研究这件事,不是组织架构图上的任命所能够命令和约束的,而且外行不能指导内行。

Llama 4风波

一次基准测试引爆组织内斗

2025年4月发布的Llama 4翻车后,Meta被指控操纵基准测试成绩。

这次是LeCun首次站出来实锤外界以往的猜测,他指出团队为了美化数据,对基准测试结果进行了「捏造(Fudged)」,「篡改」了部分测试结果。

他还特意指出,在不同基准上用了不同模型,以获得更好成绩。

对扎克伯格来说,这比一次技术失败更难接受。

这一丑闻也直接导致他对原AI团队失去信心,转而重金挖角,开始组建超级智能实验室团队。

Meta开始在人才争夺战里下重注,甚至还因为试图用1亿美元签约奖金挖人上过头条。

激进的人才战略,也导致了整个GenAI组织被边缘化,以及新旧团队、研究与产品、开源与商业之间的结构性摩擦。

由此,也带来了Meta内部一波波的离职潮和裁员潮。

路线之争

LeCun坚持LLM 是条「死路」

真正让LeCun最难忍受的,并不是他口中「不懂管理的上级」,或者是刷榜事件,而是他认为Meta正在集体沉迷于一条错误的方向!

LeCun直言,那批公司为了冲刺新一轮「超级智能」而招来的人「完全被大语言模型洗脑了(completely LLM-pilled)」。

虽然,扎克伯格仍然支持他对AI未来的看法,但公司的大规模招聘主要集中在LLM开发上。

但LeCun的立场是:LLM虽然有用,但从根源上受限,语言本身就是束缚。

要实现人类水平智能,必须理解物理世界的运作方式。

因此,他才会抛出那个让所有大模型路线的追随者们感到「刺耳」的观点:

我确信Meta公司里很多人,包括Alex在内,都不希望我告诉世人,LLM在超级智能领域基本上是一条死路。

然后他拒绝为此妥协:

我不会因为某些人认为我错了就改变我的想法。我没错。作为一名科学家,我的职业操守不允许我这样做。

在一家公司里,你可以跟同事、上司甚至老板争论。

但如果公开挑战组织方向,站出来说「这条路基本是死路」,你就会变成一个天然的异类。

这正像LeCun自己所承认的那样:留下来在「政治上」变得很难。

他在Meta的位置,已经不再适合继续做他想做的研究。

离开是不可避免的结局。

世界模型

下一代新范式

LeCun的新公司叫AdvancedMachine IntelligenceLabs(AMI Labs),专注于用世界模型实现ASI。


V-JEPA世界模型

给AI装个「脑内物理沙盒」

LeCun想做的V-JEPA世界模型,可以理解为:让AI不是只会「说得像」,而是能在脑子里搭一个粗粒度的世界模拟器——看见一段视频后,知道哪些东西是物体、它们怎么动、接下来可能发生什么,甚至为行动做准备。


JEPA的关键

不抠像素细节,预测「抽象状态」

传统生成式训练常逼模型还原每个像素/词。

JEPA的思路更「务实」:把世界压缩成一串表示(embedding),训练目标是从可见的上下文去预测被遮住部分的表示,而不是把遮住的区域逐像素画回去。

I-JEPA论文把这称为non-generative的自监督学习路径。


V-JEPA

把JEPA从图片升级到视频 学「运动规律」

V-JEPA就是视频版JEPA:把视频切成时空块,遮住一部分,让模型用剩下的内容去预测「被遮住那块在表示空间里应该长什么样」。

直觉上,它更容易学到「谁在动、怎么动、动的规则」,而不是纠结纹理噪点。


V-JEPA 2

从「看懂」走向「能规划」

V-JEPA 2的路线很明确:

先用超过100万小时互联网视频做大规模自监督预训练;

再用少量机器人交互轨迹,让模型学会「如果我这么做(动作),世界会怎么变」,从而更接近可用于预测与规划的世界模型。


AMI Labs需攻坚的难点

想做好世界模型,有三大难点:

其一是长时程预测,越往后未来分叉越多。

其二是不确定性,同一个场景可能有多种合理下一步。

其三是从表征到行动,学到「状态」还要能服务决策与控制。

而AMI Labs,正是LeCun为了攻克世界模型的难题而成立。

LeCun的新计划

去年11月,当媒体曝出LeCun即将离职Meta,开启新创业计划的消息后,他的日程表就一直处在疯狂状态。

他直言,这个决定使自己的日程表被迫加速了,居于日程表核心位置的,就是去做他口中更接近下一代AI的东西:世界模型(world model)。

LeCun的新创公司AMI Labs总部位于巴黎。

据LeCun称,马克龙还向他发了一条WhatsApp,暗示对他的新创业计划会与法国保持紧密联系感到高兴。

AMI Labs将由法国医疗AI初创公司Nabla的联合创始人兼CEO Alex LeBrun领导,LeCun担任执行主席。

提到这样的安排,LeCun坦诚表示自己当不了CEO:

我是科学家,我挺擅长判断什么技术行得通、什么行不通。但我当不了CEO,一方面我太不擅长组织管理了,另一方面我也太老了!

这种安排可以让他像在Meta时那样,保有做研究的自由。

在LeCun对技术的描述中,有一个特别的观点:

他认为模型依赖「情绪」,也就是过往经历与评价来引导预测,这非常像是把「人的本能」装进机器:

如果我掐你一下,你会感觉到疼……下一次当我把胳膊靠近你时,你会往后缩。这就是你的预测,而它唤起的情绪是恐惧,或者说对疼痛的回避。

LeCun还给出了他所计划打造的「世界模型」的时间表:

预计12个月内将推出具备初步物理直觉的「婴儿级」模型。几年内会在更大规模上出现。

LeCun认为它还不是超级智能,也许还存在没看到的障碍,但它至少还有希望是一条通往超级智能的路径。

提到对未来的愿景,LeCun直言希望为世界留下更多智能。

「这才是我们应该拥有更多的东西……我们饱受愚蠢之苦。

LeCun的智能之路

生于1960的LeCun自幼在巴黎郊区长大。

从小的他就着迷于一个问题:人类智能到底是怎么出现的。

在他八九岁的时候,看了电影《2001:太空漫游》,整个人被深深震撼,这促使他走上了探索人工智能之路。

LeCun的「顿悟时刻」发生在1980年代。

他在一本书中读到了语言学家Noam Chomsky与心理学家Jean Piaget之间关于「先天与后天」的争论。

其中,Chomsky认为人类有天生的语言能力,而Piaget则认为确实存在某种结构,但大部分是后天学来的。

LeCun并不认同Chomsky的说法,在他看来,我们什么都是学来的,而且他认为所谓智能主要就是关于学习。

当时关于AI和神经网络(neural networks)的研究几乎是一片空白,但LeCun还是去找同样在研究神经网络的人,并与当时担任卡内基梅隆大学的教员Geoffrey Hinton成为智识上的「灵魂伴侣」。

后来,LeCun去多伦多大学加入Hinton的团队做博士后研究。

两人再加上Yoshua Bengio,共同为深度学习和现代AI奠定了基础,并于2018年获得计算机科学界最负盛名的图灵奖。


Geoffrey Hinton、Yoshua Bengio、Yann LeCun被称作「深度学习」三巨头

LeCun是许多重要早期AI技术背后的大脑。

20世纪80年代末到90年代,他在新泽西的AT&T贝尔实验室(Bell Labs)做研究,并在那里开发了卷积神经网络(convolutional neural networks),这种架构用于图像识别技术。

他还把它做进一个系统里,银行曾广泛用它来识别支票。

这项研究的想法他在多伦多时就已经有了,但之所以能在现实世界落地,是因为贝尔实验室有近乎无限的资金,以及最前沿的技术条件。

LeCun讲起他刚加入时老板Larry Jackel对他说过的话:

在贝尔实验室,你不会因为省钱而出名。

结束了贝尔实验室的狂欢后,LeCun回到学界,在纽约大学(NYU)启动了一个研究神经网络的新项目。

到2013 年,深度学习已经明显会成功,谷歌刚刚启动Google Brain,一年后又收购了英国AI实验室DeepMind。

正是那个时候,扎克伯格打来电话,他想在Facebook建一个AI团队,为了挖LeCun,甚至邀请他去加州家里吃晚饭。

LeCun同意加入,但提出了三个条件:他不必辞掉NYU的工作,不搬去加州,新实验室的研究成果必须对外公开发布。

扎克伯格都答应了,于是LeCun加入了Facebook,建立一个专注基础研究的全新AI研究实验室Facebook Artificial Intelligence Research(FAIR)。

小彩蛋

《金融时报》也公布了和Yann LeCun本次访谈的菜单。

这家位于巴黎香榭丽舍大街的米其林一星餐厅Pavyllon Paris,是Yann LeCun这位老法国人的心头好。


在采访中,LeCun对这家餐厅的菜品赞不绝口。


图灵奖得主青睐的米其林餐厅,路过巴黎值得一尝。


参考资料:

https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。