当前位置: 首页 » 资讯 » 科技头条 » 正文

林俊旸离开千问,会改变什么?

IP属地 中国·北京 编辑:孙雅 定焦One 时间:2026-03-05 22:31:55
AI创业者比阿里更着急。

作者 | 定焦One 王汉星

春节过后,AI圈子还没等来DeepSeek V4,却先等来了千问的人事地震,千问大模型技术负责人林俊旸的离职为年后国内AI圈子投下第一颗重磅炸弹。

3月4日凌晨,林俊旸在社交媒体发文me stepping down. bye my beloved qwen.(我将辞职,再见了我亲爱的千问)推文发出后的几小时内产生了一连串连锁反应,多位千问技术团队成员陆续宣布离职,包括Qwen后训练负责人郁博文、Qwen3.5/VL/Coder核心贡献者李凯新。

大量AI从业者在社交媒体上表达了对林俊旸离开的惋惜、认可与感谢。

随之而来的是对这场突如其来分手原因的各种猜测。一位接近阿里云的人士告诉「定焦One」,林俊旸离职的根本原因并不复杂,尽管小模型好评如潮,但最新的旗舰模型Qwen3.5表现不及预期。

叠加组织架构调整,以及对林俊旸管理权限的缩减直接导致了他的出走,本质上这是一个双向选择的结果。

对于此次人事调整,阿里高层在3月4日下午的All Hands会议上给出了定性:Qwen没有收缩,这是一次团队扩张,无关任何政治斗争,反而需要投入更多资源。

当一项新的技术来临,人们往往容易在短期内高估其影响,而在长期低估。这同样适用于一个优秀人才的流失。

结合多位AI从业者和阿里云内部人士的看法,林俊旸的离开,短期内对于千问和阿里云的影响有限,但灵魂人物出走背后折射出的开源生态与商业利益之间的矛盾与平衡,是摆在阿里面前不能被低估的长期课题。

最年轻的阿里P10离开后的14个小时

林俊旸最新一则动态发布于3月4日下午2点,他在朋友圈发文:抱歉各位朋友,今天不回复消息和电话了,我真的需要休息。qwen的兄弟们,按照原来安排继续干,没问题的。

此时距离他发布离职动态已经过去了近14个小时。

林俊旸出生于1993年,本科就读北大计算机科学专业,2019年从北大语言学与应用语言学硕士毕业后以应届生的身份加入阿里达摩院,并在此后参与了阿里M6多模态预训练大语言模型的研发。

2022年年底,达摩院多个研究团队重组为通义实验室并调整并入阿里云,林俊旸开始正式出任通义千问的技术负责人。

2025年通义千问所发布的Qwen系列大语言模型凭借开源生态,在开发者社区的下载量突破10亿,成为全球顶尖的开源模型,林俊旸也在这一年被提拔为阿里最年轻的P10之一。

在刚刚结束的春节AI大战期间,阿里先后开源了Qwen3.5的旗舰模型和系列小模型,引发特斯拉CEO马斯克关注,并称赞Qwen3.5系列具备令人印象深刻的智能密度。林俊旸随后转发了马斯克的动态,并表示感谢。

提出离职时,林俊旸成为阿里P10还不满一年,无论是对于外界还是阿里云内部,这都是一个非常突然的事件。

就在离职推文发布的几天前,林俊旸还在社交媒体上为Qwen Coding Agent发布招聘相关信息。此外,有千问团队成员在社交媒体上表示,3月2日还在与林俊旸讨论关于大模型的新想法和训练计划。

作为技术负责人,林俊旸被视为千问大模型的灵魂人物,他的离开最直接的影响就是引发了千问技术团队的一波密集离职。

离职消息在AI圈子发酵半日后,为了稳定军心,3月4日下午1点,通义实验室紧急召开了一场All Hands会议,阿里巴巴董事长兼CEO吴泳铭、阿里巴巴首席人才官蒋芳、阿里云CTO、通义实验室负责人周靖人出席了这次会议。

管理层表示,林俊旸的离开是因为组织调整过程中沟通没有处理好,但这次调整本身是为了团队扩张,而非收缩,新人引入肯定会带来阵型变化,扩大过程中必然涉及到这些,我们可能没处理好。

其中提到的新人引入之一是来自Google的周浩,据多家媒体报道,周浩将接替与林俊旸同期离职的郁博文的职位,出任Qwen后训练负责人。

周浩本科毕业于中科大,此前在Google DeepMind担任Gemini强化学习与自我改进团队的负责人。

截止到3月4日下午2点林俊旸发布朋友圈,关于他是否真的会离开阿里和下一步的去向还没有最终定论,这一轮通义实验室的组织调整以及人员变动也还没有尘埃落定。

绩效考核背后,Qwen大模型真实表现如何?

作为阿里AI战略基石的千问大模型技术负责人突然离职,难免引发外界对于其背后原因的猜测,其中对于大厂嫡系文化、宫斗的猜测尤甚。

但综合多位知情人士提供的信息,林俊旸离开的原因并没有那么复杂,直接原因是最新的组织调整中管理权限被压缩,根本原因是最新发布的Qwen大模型没有达到管理层的预期。

据晚点LatePost报道,近期,通义实验室计划将Qwen团队分拆,从涵盖不同训练流程和模态的垂直整合体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。

这种部门划分方式与字节跳动Seed团队豆包主模型训练的流程划分相似。

拆分后汇报线会发生变化。比如最新加入的后训练负责人周浩将直接向通义实验室负责人周靖人汇报,而不是汇报给林俊旸,这意味着后者从之前的统筹管理基础模型研发的所有环节,变成了负责其中的一部分环节,管理权限收缩。

此外,拆分后的组织形式也与林俊旸一直推崇的垂直整合开发理念相悖。

一位阿里云内部人士告诉「定焦One」,拆分是为了各个团队未来可以更好、更灵活地服务于集团业务的需求,而非此前单纯的技术导向。

之所以会有这一次调整,主要的原因之一是Qwen3.5系列小模型与旗舰模型的割裂表现。

在开源社区,Qwen3.5系列四款开源小模型(Qwen3.5-0.8B、2B、4B、9B)表现亮眼,上线后不仅获得马斯克的点赞,也在AI开源社区与模型托管平台Hugging Face上热度飙升,包揽趋势榜单前8位。

其中Qwen3.5-4B作为一款小模型,在多个维度上的性能表现已经可以比肩许多大模型。

但旗舰模型Qwen3.5-397B的表现却不尽如人意。

在海外知名大模型盲测擂台、各家模型首发必刷榜单LMArena上,截至2026年3月3日总榜(Overall Rankings)中,Qwen3.5-397B仅排名第18。前十中则包括字节的Seed-2.0大模型。

值得注意的是,阿里在去年9月发布的Qwen3-Max Preview曾一度进入该榜单的前三,与Gemini、Claude、ChatGPT等全球顶尖闭源模型比肩,但随着各家AI厂商在去年年末和今年年初更新大模型版本,Qwen从第一梯队头部持续下滑,Qwen3.5的发布并没有扭转这一势头。

并且在专门对大模型中文能力测评的榜单SuperCLUE上,千问的排名也并不拔尖,落后于豆包、Kimi等。

至于外界盛传的由于DAU不达标导致林俊旸离职,上述阿里云内部人士告诉「定焦One」,管理层并不会以DAU来作为基础模型能力的考核标准,但会对模型在开源社区的影响力,以及模型本身的性能进行综合考核。

很显然,Qwen3.5的性能绩效并不高。

开源生态可能被影响,但对阿里影响有限

今年年初的世界政府峰会2026上,阿里巴巴集团董事会主席蔡崇信在一场圆桌论坛上提到,我们的千问大模型是开源的,同时也经营云计算业务。随着用户在我们的基础设施上进行模型训练、开发与推理,我们得以实现商业变现。

这是阿里云变现的底层逻辑。但蔡崇信随后又补充道,未来如何让消费者持续为月度订阅付费,产生经济效益,这是中国市场最大的挑战。

从蔡崇信的发言中不难看出,仅仅依靠开源模型打出影响力并通过出售阿里云算力实现收益已经无法满足阿里的商业化需求,打开C端市场同样重要。

在组织结构上,阿里采用的是与字节一样产模分离形式,产品与模型分属于不同的部门。

图源 / 阿里巴巴官网

隶属于阿里云的通义实验室主要负责基础模型的研发,技术负责人直接汇报给阿里云CTO周靖人。

产品端则是由包含千问APP、夸克在内的千问C端事业群负责,阿里副总裁吴嘉任负责人,直接向集团汇报。

在整个AI战略布局上,阿里提出基础大模型、云计算、和芯片的三位一体通云哥战略。由通义实验室负责基础模型研发,由云计算提供算力,由平头哥供应芯片。

可以看到,无论是在组织结构上还是AI战略布局上,通义实验室都是阿里AI生态的重要一环。这也注定了在AI竞争日趋白热化的今天,通义实验室不能脱离集团业务心无旁骛地做基础模型研发。

对于林俊旸的离开,一位阿里云的员工告诉「定焦One」,内部更多的人主要担心对团队士气的影响,以及对外来组织调整不确定性的担忧,但林俊旸已经带领团队完成了千问大模型从0到1的技术突破,尽管情感上难以接受,但客观来说,他的离开对阿里整体AI战略的影响有限。

过去一段时间,通义实验室的人员流动一直较为频繁,今年初Qwen Code的负责人惠彬原刚刚从阿里离职加入Meta。放眼全球AI行业,人才竞争正在变得越来越激烈。

相比于对阿里有限的影响,不少AI从业者担心如果阿里的开源战略出现转向,对于大量中小型AI创业公司会产生巨大的冲击。

千问的一系列小模型因为低成本、易部署、可选项丰富的特性,在过去很长一段时间都受到创业公司的追捧。

截至目前,千问的开源模型数量已经超过400个,衍生模型数量突破20万个,下载量超过10亿次。不仅是全球开源模型数量第一,在小模型的覆盖度、生态成熟度等方面也都是全球第一。

一位AI创业者告诉「定焦One」,Qwen小模型养活了一大批中小公司,最核心的原因就是千问的选择最多,几乎总是能在短时间内找到最适合自己的尺寸需求的小模型,并且性能还不错。

不少AI从业者将林俊旸带领下的千问大模型战略称为以小胜大小模型包围大模型,但林俊旸离开后这一战略还能否延续,将是一个未知数。

过去近一年的时间里,千问大模型凭借开源生态和丰富的小模型获得了良好的口碑,打出了知名度。但开源不是一门好生意,在免费开放的背后,是长期的训练投入、社区维护与技术支持成本。当AI战争全面爆发,阿里作为一家上市公司,商业化需求被摆上台面,开源带来的影响力,未必能在财报中直接体现,好评如潮的小模型也不足以掩盖旗舰模型的性能短板。

作为开源路线的重要推动者,林俊旸所代表的是更强调社区影响力与技术普惠的路径,而公司层面则需要一个能够跑通商业闭环的AI体系。这种路线差异,在AI投入持续攀升、回报压力加大的当下,变得越来越难以调和。

去年年底,Meta被爆出将以闭源的形式推出下一代前沿模型牛油果。在此前的一封公开信中,扎克伯格也提到未来Meta会谨慎选择开源内容。

在全球AI巨头或坚持闭源、或转向闭源大模型的背景下,阿里也需要重新审视自己在大模型生态中的站位与商业逻辑的闭环。

*题图来源于千问官方微博截图。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新