Kimi「熹妃回宫」,其他小龙小虎也在继续「秀操作」,这部大戏,精彩还在后头。
在许多「嬛学十级学者」来说,《甄嬛传》中最高潮的情节莫过于——熹妃回宫。
历经纯元旧衣事件、父亲流放变故后,甄嬛失去Buff,自请出宫。
当她去往甘露寺时,很多人都觉得,她的高光时刻,已经过去了。
毕竟,没有废妃回宫的先例。
但甄嬛终究是甄嬛。身着素服的她,在山寺里蛰伏蓄势,以待天时。
结局很多人都知道了,甄嬛二进宫,自己转动了自己命运的齿轮。
一出生就风华正茂但后来转入沉潜状态的月之暗面,俨然拿到了甄嬛的剧本。
借助前几天发布的Kimi K2,月之暗面又强势归来。
海外技术论坛热议,黄仁勋点赞,马斯克评论,都在为月之暗面加冕,让它又成了「AI大模型这条街上最靓的仔」。
7月底,阶跃星辰、智谱AI等AI创业公司也将发布自研的新一代基础大模型。
他们都想证明,自己仍在牌桌上。
01
2023年伊始,ChatGPT引发现象级刷屏后,国内科技巨头与AI创业企业争相入场。
大浪淘沙,「AI六小虎」很快脱颖而出,成了业内瞩目的头部玩家。2023年全年,「AI六小虎」累计融资占到了国产大模型厂商的逾50%。
细究起来:智谱AI的B端生态、阶跃星辰的多模态终端Agent、MiniMax的MoE混合专家模型……几家明星创企各擅胜场。
▲「AI六小虎」,逐梦AI圈。
而月之暗面更是在2024年3月因为长文本能力引爆概念股。长文本能力就像九阴真经,帮Kimi一战封神,在一众卷参数规模的大模型中极具辨识度的Kimi,迅速火爆出圈。
两个月后,腾讯在红杉中国、美团、阿里后的参投,将其估值推至33亿美元,月之暗面一时风头无两。
剧情到这,相当于《甄嬛传》进度条来到了第8集:在这一集,甄嬛受到「椒房贵宠」。
如果没有后来的情节,围绕Kimi的叙事还会沿着「一个天才少年带着一家明星创企会当凌绝顶」的脉络延续下去,AI创业公司们也会呈现出「张华考上了北京大学,李萍进了中等技术学校……我们都有光明的前途」的走向。
但现实没那么多「如果」。
02
进入2024年下半年,行业进入拐点。大模型厂商到了考验期。
「AI六小虎」中,曾表示底层模型将对标OpenAI的百川智能,自2024年起停止了超大规模通用模型训练,转而深耕医疗领域;号称要做「打造AI 2.0全新平台」的零一万物,2024年底对整个预训练算法团队进行了裁撤,Infra团队被阿里云接收。
背靠G端资源的智谱与阶跃星辰,越来越多地押注政企市场。Minimax发力多模态,还部分转向海外市场。
对AGI痴心不改的月之暗面,下半年的技术重心似乎完全转到了「强化学习」,陆续发了数学模型、视觉思考模型。同时采用了激进的产品推广投放策略,避免同为C端产品的Kimi在与豆包等产品的竞争中落下风。
更大的变局由DeepSeek开启。今年初DeepSeek R1的横空出世,改变了本已成型的大模型行业格局。凭着「新架构+低成本+开源生态」,DeepSeek成功登顶。
▲DeepSeek问世,带来了中国科技圈的「DeepSeek时刻」。
大模型产品市占率有幂次分布效应,舆论场有频域遮蔽效应。在DeepSeek「国运级成果」的风头下,曾稳居C位的「AI六小虎」,俨然已沦为陪衬。
多家退出「超大基模争霸赛」,大模型迭代速度放缓,开年后只有一家公布了融资消息……许多人拼凑出一堆「AI六小虎失意」的证据。
月之暗面就被「亮瑜」对比压着。Kimi1.5推理模型跟DeepSeek R1同日发布,但热度遭全面碾压。事情之后朝着「嬛嬛类卿但非卿」的方向演进:DeepSeek跟Kimi被拉来作对照后,「扬一抑一」的舆论臧否倾向就变成口水落在了二者头顶。
在那之后,月之暗面开始反思,停止激进的推广投放策略。
随之而来的,是用户留存遭遇挑战。就连搜索引擎和应用商店里检索Kimi的时候,跳出来的,都是其他几家继续投流的产品。
回看2025年上半年,国外,OpenAI 的GPT系列、Anthropic的 Claude、谷歌的Gemini和马斯克的xAI Grok你方唱罢我登场;国内,也动静不断。
可针对「AI六小虎」的讨论基调,却多倾向于「丧」。
03
但在「我和我最后的倔强,握紧双手绝对不放」的BGM中,六小虎中的部分企业继续登场。
MiniMax连续五天甩出五款产品,正冲击IPO的智谱也推出了会看「苏超」的开源视觉理解模型。
月之暗面更是憋出大招。Kimi宛如AI圈的甄嬛,当别人都觉得她已失宠时,她用「一个更强的甄嬛回来了」打了不少人的脸。
在C端用户对高专业门槛的技术革新感知偏弱的情况下,很多人未必清楚Kimi K2在代码、智能体、工具调用等测试中做到开源SOTA(表现最好)是什么概念。
在大众对AI叙事中「最强」「炸裂」之类的震惊体已免疫的背景下,很多人也未必理解Kimi K2在OpenRouter平台上上线仅两天Token消耗量就超越xAI,登顶全球API调用增长榜,在Cline、Roo Code、Kilo Code等平台的API使用量在全球开源模型中排名最高,意味着什么。
但黄仁勋受访时说「DeepSeek R1、Qwen、Kimi是全球最好的开源模型」,美国CNBC商业频道报道称,Kimi K2在基准测试中超越Claude Opus 4、优于OpenAI的GPT-4.1且成本更低。
▲《自然》杂志网站将Kimi K2发布称作「又一个DeepSeek时刻」。
《自然》杂志网站更是将Kimi K2发布称为「世界迎来又一个DeepSeek时刻」。满满的都是「Make Kimi Great Again」的既视感。
而今,其他厂家也要出牌了。看着Kimi K2在全球科技圈激起的反响,许多人已期待值拉满:你们还有多少惊喜是朕不知道的?
04
几个月前,还被困在「落寞叙事」里的六小虎们,用行动证明了两点:
1,AI竞争是马拉松比赛,是Long-term游戏。
决定企业能走多远的,不是它是否会陷入低谷,而是它陷入低谷后是否能反弹雄起。
2,产品力是最好的营销,好产品本身会说话。
Kimi K2推出后,独角兽Perplexity CEO阿拉温德在社交媒体表示,基于Kimi K2模型的出色表现,公司将会利用K2进行后训练,上一个被该公司用于技术训练的中国模型,是DeepSeek R1;全球最大开源AI社区Hugging Face联合创始人托马斯表示,不断突破极限挑战闭源的K2模型令人难以置信。
▲海外技术论坛里,对于Kimi K2的讨论很多。
这些都表明,留给AI创业公司的机会窗口,都远未关闭。
只不过,你得先「蓄势」——也就是积攒实力。
05
有意思的是,7月14日,美国知名AI研究员内森兰博特写了篇题为《Kimi K2和当DeepSeek时刻成为常态》的文章。
文中直言,Kimi K2已经能与美国领先的前沿模型竞争,「中国正在不断逼近甚至达到模型性能的绝对前沿,我们正处于‘失败’的节奏中,西方已在开源模型方面进一步落后。」
硅谷AI企业家和知名电子报《Exponential View(指数视角)》作者阿奇姆阿兹哈儿撰文《Kimi K2应该让硅谷感到担心》。
他标识,「斯普特尼克1号证明了苏联能突破地球引力,打破西方技术主导,四年后,东方1号航天器载着尤里加加林绕地球飞行一圈,证实斯普特尼克并非偶然事件。在如今的人工智能领域,DeepSeek扮演了斯普特尼克的角色,而现在,人工智能迎来了它的东方1号航天器时刻。」
话语间隐约透出,DeepSeek和Kimi就是这两颗闪耀世界的中国AI双子星,并给美国又了上一课。
从DeepSeek R1到Kimi K2的起势,不是偶然:不论DeepSeek还是月之暗面,都在持续蓄势,也数次在顶峰相会。
今年2月份,梁文锋和杨植麟二人差不多同一天发布论文,研究的都是Transformer架构最核心的注意力机制;4月份,月之暗面推出用于形式化定理证明的大模型Kimina-Prover,DeepSeek也紧接着上线了数学定理证明专用模型DeepSeek-Prover-V2力压Kimi,再到7月,Kimina-Prover-7B-Distil继续更新,实现反超。
▲今年2月,杨植麟跟梁文锋二人论文主题「撞车」。
某种程度上,从DeepSeek时刻到现在的Kimi时刻,都为中国AI创业公司崛起提供了路径指引:最关键的,还是在原始创新上蓄势。
《甄嬛传》里,甄嬛回宫前说过一句:「与其心生敬佩,不如自己便是那样的人。」「那样」指的是能掌控自己命运。
喜欢摇滚乐队平克弗洛伊德的专辑《The Dark Side of the Moon(月之暗面)》,听过他们唱的「不要坐下,挖到另一个的时间到了……只有驾驭那浪潮的时候,才能在巨浪中取得平衡」的杨植麟,用Kimi K2表明,他在努力成为「那样的人」。
接下来,更多的AI创业公司掌舵者都需要证明:自己也可以成为「那样的人」。
中国AI创业公司难免会走向分化、前景各异,但可以肯定的是——
Kimi「熹妃回宫」,其他小龙小虎也会继续「秀操作」,这部大戏,精彩还在后头。