当前位置: 首页 » 资讯 » 科技头条 » 正文

千问模型负责人林俊旸提出离职,阿里高管紧急答疑 | 智能涌现独家

IP属地 中国·北京 36氪 时间:2026-03-04 18:21:55

作者 | 邓咏仪

编辑 | 苏建勋 杨轩

“我应该要更早知道这些。”

北京时间3月4日下午约13:00,通义实验室紧急召开了All Hands会议,阿里集团CEO吴泳铭向千问员工坦诚表示了歉意。

12个小时前(北京时间3月4日凌晨0点11分),阿里千问大模型技术负责人林俊旸在X上突然宣布离职——林俊旸是阿里AI开源模型的核心推手,也是阿里最年轻的P10之一——行业一片哗然之时,据《智能涌现》独家了解,Qwen的很多成员也无法接受团队灵魂人物的突然出走,他们希望阿里集团层面给出更多解释。

“在资源远少于竞对的前提下,能取得今天的成绩,俊旸的领导力是核心因素之一。”不止一位千问成员对36氪评价。

在会上,以刘大一恒(Qwen RL leader)为代表,Qwen成员们围绕包括团队拆分、新成员周浩、对模型路线选择、资源投入等等维度,对阿里高层提出了多项疑问。

这场会议与会者包括阿里数位高管、Qwen团队以及通义实验室其他团队成员。围绕团队调整、战略方向等关键议题,包括阿里巴巴董事长兼CEO吴泳铭,阿里巴巴首席人才官蒋芳、阿里云CTO周靖人做出多个回应。

对于此次调整,阿里高层给出的核心定性是:Qwen没有收缩,这是一次团队扩张,无关任何政治斗争,反而需要投入更多资源。

“我们在快速发展,这波调整是为了扩充更多人才、提供更多资源。”阿里巴巴首席人才官蒋芳也承认沟通存在不足,“这次组织形式没沟通好,新人引入肯定会带来阵型变化,扩大过程中必然涉及到这些,我们可能没处理好。”

有传言称周浩将直接领导林俊旸及其相关团队,但据智能涌现获悉,包括周浩的接任职位,汇报线,尚在讨论中。

会上,阿里高层强调多次,千问基础模型是集团当前最重要的事情,大模型的竞争不仅仅是Qwen团队的事,而是整个阿里集团的事——无论是基础模型研发,还是底层 infra 建设,都将在集团层面统筹推进,“一定要超越”。

阿里云 CTO 周靖人则回应了包括招聘名额、算力短缺等尖锐问题:为何外部客户(如大模型创业公司)购买阿里云算力用得顺畅,内部团队反而在算力、招聘名额上捉襟见肘?

周靖人表示,团队处于“一直资源紧张”,内外差异有很多历史原因,未来正在做整体规划,但没有进一步展开说明。

关于林俊旸的动向,会上也没有更新的结论。但下午2点左右,林俊旸再度发布朋友圈,表示“qwen的兄弟们,按照原来安排继续干,没问题的”,并未明确是否回归。


林俊旸称需要休息 林俊旸个人朋友圈

而在数日前,阿里刚刚完成一轮AI战略更新,内部将AI的总称和核心品牌统一为千问,组织层面也迎来了新一轮调整。

《智能涌现》了解到,此前Qwen拥有自己的预训练、后训练、Infra团队;从模型模态上看,也有语言模型、多模态、代码等多个方向。

在过往,训单模态的模型曾是业界主流,但在DeepSeek用推理模型带动了新的技术范式之后,各个模态的融合成为趋势。

一位知情人士曾对《智能涌现》表示,从2025年开始,林俊旸就在寻求让语言、图像、视频、代码等方向的员工一起工作,以寻求提升模型训练效率。Qwen团队曾提出与万相团队合并,但没有完成,才开始做了自己的qwen-image模型。

但在这轮调整中,通义实验室希望将Qwen团队按预训练、后训练、视觉理解、图像等维度拆分,和通义实验室中的团队合并(如通义万相、通义百聆等团队),一起工作。但在没有充分信息沟通的情况下,矛盾就此爆发。

“林俊旸,他一个人就值一亿美金”

就在3月2日晚间,千问还在X上宣布开源四款Qwen 3.5小尺寸模型,马斯克点赞了这条推文,并表示“令人惊叹的智能密度。”

千问模型灵魂人物林俊旸毫无征兆地突然提出离职,让阿里AI团队陷入一片迷茫。

在前任阿里千问技术负责人周畅离职后,生于1993年的林俊旸从2022年起开始接手阿里Qwen团队,负责整体技术工作。

这几年间,阿里Qwen模型家族也在快速发展,从最开始的通义模型家族到Qwen 2.5、Qwen 3.5 Max等模型,一路成长为世界一流模型团队。在多个维度上,Qwen都是毫无疑问的开源模型第一家族。

多位前阿里模型团队的人士对《智能涌现》都曾表示,2023年国内大模型刚起步时,国内大厂对是否开源、开源力度多少也有分歧。但阿里的开源战略做得足够早,足够有战略定力,很大程度上得益于周畅、林俊旸等人的积极推动和执行。

而随着林俊旸离开,一同宣布离职的,还有多位Qwen成员,其中有负责Qwen各个模型细分方向的核心负责人,如:

惠彬原(Binyuan Hui):Qwen代码方向负责人,Qwen-Coder系列模型主理人,负责从预训练到后训练的全流程Agent训练,近期也有参与具身智能(Robotics)相关研究。

郁博文(Bowen Yu):Qwen后训练研究负责人,毕业于中国科学院大学,主导 Qwen-Instruct 系列模型的开发。

Kaixin Li:Qwen 3.5/VL/Coder的核心贡献者。

除了上述几位人员,还有不少年轻研究员,也在同一天提出了离职。

不止一位Qwen研究员在推特、小红书发布情绪低落的贴文。“Qwen is nothing without its people.” 这番发言套用了2024年OpenAI陷入CEO更换风波时,OpenAI员工在推特上的刷屏发言。


Qwen研究员在社交平台发文 X

林俊旸官宣离职在AI社区引起了巨大轰动,很多反馈来自海外开发者,均在表达对林俊旸推动Qwen开源工作的感谢。“一个时代的结束。”Hyperbolic Labs创始人兼CTO Yuchen Jin表示。


海外开发者表达对林俊旸推动Qwen开源工作的感谢 X

“如果这一批人真要是离开了,Qwen模型至少得耽误半年到1年,重组团队重新训。”一位AI方向的资深投资人对《智能涌现》表示。另一位字节AI人士则称“林俊旸至少是1亿美金以上级别的人才。”

不少传言称,林俊旸离开是“非自愿”,但经《智能涌现》确认,林俊旸在3月3日提出离职,并且还没有和阿里谈好相关的细节,Qwen团队成员在3月4日下午得到的消息。

《智能涌现》最新得到的消息是,阿里巴巴高层还和林俊旸密切沟通中,林俊旸是否确认离开阿里巴巴还未可知。

林俊旸离开后,即将接手阿里Qwen后训练工作的新成员,是来自Google DeepMind的周浩。一位Qwen团队人士对《智能涌现》称,周浩于2026年1月短暂入职夸克,而后调至通义实验室。从汇报线上看,周浩直接汇报给周靖人,不少声音称,他将接手Qwen的后训练工作。

周浩(Hao Zhou)本科毕业于中科大。此前,他在Google DeepMind担任Gemini的强化学习与自我改进团队的负责人。

阿里在开源上赢了口碑,但它还想要更多

就在3月3日,林俊旸刚刚在X(推特)上发布数款小尺寸的开源模型,这些模型适用于手机等,也贯彻了Qwen一直以来的开源路线。

很多人认为将做开源模型粗暴理解为“做慈善”,但这并不公允。

开源做得好,首先服务了整个阿里云的开发者生态。因为更早做开源,Qwen模型家族在模型发展早期能够快速得到社区反馈,成长迅速,反哺了模型训练。

Qwen全尺寸、全模态的模型路线,让很多企业、学校的技术从业者能够很快选用到合适自己的模型,建立了一波好口碑。在这些模型落到生产环境后,很多企业主也会倾向于购买Qwen的模型服务,间接转化成了阿里云的商业收入。

但这其中的商业逻辑很难论证,这也是开源长期以来面临的问题,国内外都如此——Meta花了数十亿美元训练Llama却免费开放,外界至今争论这笔账究竟怎么算,也从来无法体现在Meta财报当中。

而尽管在开源依旧维持着优秀的口碑,但在闭源旗舰模型一侧,阿里在2025年发布的Qwen 3、Qwen-3.5系列,尽管维持在第一梯队,但已有吃力之势。

林俊旸等核心成员离开,很大程度是源于阿里巴巴当前AI战略的快速变化,和基础模型团队的目标产生了差距。

追赶旗舰模型、维持开源领先地位都很重要,但阿里巴巴的基础模型团队训练资源相对有限。

如今,Qwen家族有超过百款细分模型,很难想象,支撑这些模型更新主力的Qwen团队,仅有100多人。即使是算上通义实验室整体团队,也刚刚超过600人。

作为对比,字节负责基模训练的Seed团队就已经近2000人。在各个方向上,阿里投入的绝对人数,都是友商的几分之一。不少Qwen人士都曾对36氪表示,Qwen的算力、Infra建设都长期缺乏资源和支持,这部分阻碍了模型的迭代速度。

这是如今阿里AI战略急行军的一个激烈切面。2025年11月,千问App上线,大打春节大战,只是刚刚拉开AI To C战争的序幕——字节旗下的豆包已然接近2亿日活大关,还有尚未完全发力的腾讯;同时,阿里在旗舰模型也不能掉队——这关系着阿里云的商业化闭环,以及整个阿里集团的未来。

(36氪作者周鑫雨对本文已有贡献)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新