2025年11月12日,前DeepSeek研究员罗福莉通过朋友圈正式确认已加入小米。对于一直坚持“轻量化”、不走“大参数”竞赛路线的小米AI战略而言,罗福莉的加盟可谓是关键一子,她在DeepSeek时期积累的MoE(混合专家)架构等大模型训练经验,正是小米“端侧AI”与“人车家全生态”所急需的人才。而从罗福莉自己的文案来看,她在小米的工作领域应该不只是大模型开发,可能涉及大模型在手机、汽车等终端产品的落地。
罗福莉在朋友圈发文:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的 AGl。”
![]()
今年年初,随着Deepseek的爆火,罗福莉作为前DeepSeek研究员爆火,被称为“AI天才少女”,随即又传言称其将加入小米,业内不乏“雷军千万年薪挖角”的传闻,但无论小米还是罗福莉都选择了沉默。
2月,有罗福莉亲属就曾表示其已到新岗位上班,但并未透露其新的去向,今日本人官宣小米也为这场关于其职业去向的讨论暂时画下了休止符。
而在一个月前,小米发布的AI论文中就出现了罗福莉的名字,这也代表罗福莉在今日官宣之前就已经和小米AI团队进行了合作,而她本次加盟也将为小米在大模型领域按下加速键。
95后“天才少女”
罗福莉1995年出生于四川宜宾。据罗福莉此前在阿里达摩院的采访视频介绍,从小她就喜欢在村里的免费书屋读书,那里是她的“第二课堂”。她说:“小时候以为世界只有村子大,直到书带我去了更远的地方。”
2013年,罗福莉考上北京师范大学。在进入北京师范大学之前,罗福莉几乎没有接触过计算机领域,却“误打误撞”地进入了计算机专业。
其高中班主任、数学老师李波曾表示“大学期间,罗福莉就在规划自己未来的发展方向了。”最终她以优异的成绩被成功保研至北京大学计算语言学研究所。
真正让她声名鹊起的是2019年读研二期间,在人工智能领域顶级国际会议ACL上一次性发表8篇论文,其中2篇为第一作者。
研究生毕业后,罗福莉选择进入阿里达摩院做人工智能研究,从事预训练语言模型相关的研究。
在阿里达摩院,罗福莉主导开发了多语言预训练模型VECO(Versatile Encoder-Decoder for Cross-lingual Understanding and Generation),该模型同时支持多语言理解和生成,被纳入阿里达摩院深度语言模型体系AliceMind,并推动了该项目的开源工作。这段经历让她在跨语言大模型领域积累了深厚的技术功底和工程经验。
2022年,罗福莉离开阿里加入量化私募幻方量化,随后进入其研究部门DeepSeek担任深度学习研究员。在这里,她参与了MoE(混合专家)大模型DeepSeek-V2的研发工作,该模型以"性价比之王"著称,其中文水平被业界认为处于国内外闭源模型第一梯队,而价格仅为GPT-4的1/100。
在DeepSeek期间,罗福莉不仅在技术上持续深耕,更展现出对开源社区的深刻理解——她曾在知乎亲自撰写DeepSeek-V2的技术解读,以"接地气"的方式阐述模型优势。
![]()
随着今年年初DeepSeek的横空出世,罗福莉被挖掘出DeepSeek员工的身份并被冠以“天才少女”的称号,不过值得注意的是,罗福莉并没有参与今年年初让DeepSeek爆火的V3和R1模型的研发工作,并在今年被证实已经离开DeepSeek。
而在罗福莉进入大众视野之前,就已经有传闻说小米正在挖角罗福莉。
2024年12月,有传闻称小米创始人雷军亲自下场,以千万年薪级别力邀罗福莉,希望其领导小米AI实验室的大模型团队,尽管双方当事人均对此保持沉默,但是其高中班主任曾经透露,罗福莉“还没决定去小米,还在考虑”。
2月17日,有罗福莉亲属表示她已经到新岗位上班,但是没有透露具体去向。当时有小米员工证实,小米员工系统并没有罗福莉的相关信息,无法证实其是否在小米工作。而罗福莉本人则发布朋友圈驳斥“天才少女”论,但是并未透露工作去向。
![]()
而在沉寂了大半年后,罗福莉的去向终于逐渐清晰。
10月14日,小米与北京大学联合署名的论文发表于arXiv,罗福莉位列通讯作者。尽管论文没有标明她是否属于小米大模型团队,但是作为论文的主要负责人,小米和罗福莉显然已经进行了深度的合作。
![]()
而巧合的是,她于今年9月在知乎点赞了小米语音大模型Xiaomi-MiMo-Audio的开源帖子。随着她今日官宣在XiaoMi MiMo团队工作,也正式确认了她的去向揭晓了这一年的悬念。
小米的AI野心
罗福莉的加盟,是小米野心勃勃AI战略的最新落子。
小米AI实验室成立于2016年初,设立初期主要为小爱音箱等IoT产品服务,研究方向涵盖视觉、声学、语音、自然语言处理、知识图谱、机器学习和大模型等全栈技术领域。
随着2022年底ChatGPT等大语言模型引发AI热潮,2023年4月,小米AI实验室下设专门的大模型团队,由曾任东芝(中国)研究院研究员、微软小冰首席语音科学家的栾剑担任负责人,向小米技术委员会副主席、AI实验室主任王斌汇报。
尽管小米对于AI相当重视,但是其对于AI的思路则与当时的主流观点不同。
2023年11月,小米AI实验室主任曾表示:“小米不会做ChatGPT,不搞AI的军备竞赛。”
他同时还表达了对于预训练模型的谨慎:“内部认为,轻量级模型存在其市场空间,且在某些特定任务上对比千亿参数大模型有一定的优势。”
顺着这个发展思路来看,罗福莉在DeepSeek V2时期累积的自然语言处理、多模态理解、MoE架构等领域的复合经验,将为小米汽车在端侧AI、多传感器融合、拟人化交互等方面提供关键技术支持。
本次罗福莉加入的MiMo团队是小米的推理大模型团队。
今年4月,小米开源首个“为推理而生”的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立的“小米大模型 Core 团队”的初步尝试。
Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)测评中,仅用70亿参数就超越了OpenAI的闭源模型o1-mini和阿里Qwen的320亿参数开源模型QwQ-32B-Preview。这一成绩验证了小米"小参数大能量"的技术路径。
而除了大模型领域,小米对于AI的重视程度也相当之高。
早在2023年8月,雷军在年度演讲中提出小米的AI战略是轻量化+本地部署的思路,让用户在数据安全的前提下实现大模型的先进生产力,并在现场展示了MiLM-1.3B模型的性能表现,相比起当时大模型几十B起步的参数量,小米的模型可谓是相当的轻量化,这显然就和罗福莉在DeepSeek的工作非常契合。
![]()
![]()
2024年,雷军亲自推动小米 GPU 万卡集群建设,年中雷军曾透露大模型团队已经拥有6500张GPU,并表示后续将扩容至万卡规模,这也给小米训练大模型提供了必要的条件。
2025年2月,雷军宣布小米2025年研发费用将超300亿元,其中1/4(约75亿元)用于AI领域,重点投向GPU集群、大模型开发及场景落地。并表示未来五年(2026-2030年),研发投入预计超2000亿元,聚焦 AI、OS、芯片三大底层技术。而这三块的技术累计正是小米“人车家”生态的技术底座。
从行业角度看,顶尖AI研究员从DeepSeek等新锐公司流向小米等传统硬件巨头,也暗示着AI大模型竞争进入"应用深化期"。
当基础模型能力逐渐收敛,如何将AGI理想转化为手机、汽车、智能家居中的真实体验,成为新的赛点。罗福莉在声明中提到的"从语言迈向物理世界",正是这一趋势的最佳注脚。





京公网安备 11011402013531号