当前位置: 首页 » 资讯 » 科技头条 » 正文

量大管饱:AI Token的中国式出海

IP属地 中国·北京 21世纪经济报道 时间:2026-03-02 16:39:36

21世纪经济报道记者 赵云帆

今年2月26日、27日,英伟达(NVDA)股价于仅两个交易日中跌去10%,其跌幅“恰好”是过去一年之最。

仿佛,去年春节 DeepSeek 横空出世给英伟达带来的“至暗时刻”,时隔一年再度重现。

准时光临的,依然是中国AI大模型这只“年兽”。而比起去年 DeepSeek 单兵出击,今年的中国AI模型掀起的,更像是一场巨型的会战。

根据全球最大的大模型API聚合平台 OpenRouter 数据,截至2月28日,该平台内前十模型总Token消耗量已突破28.7万亿,其中国产模型贡献超过14.69万亿,为历史上首次单月Token调用占比过半且超越美国产模型。

其中,国产模型 MiniMax M2.5,月之暗面的Kimi K2.5,DeepSeekV3.2,分别以5.44万亿、4.27万亿和3.09万亿Token,居调用排行榜的第一、第二和第四席位。智谱旗下 GLM 5 则以1.89万亿位居第八。

OpenRouter 2月数据以来调用数据

当然,更多诸如阿里 Qwen 系列模型也得到大量调用,但仅因不同版本模型分流,未能居于前十榜单。

以上数据似乎很容易让我们得出一个“暴论”——中国AI模型,不仅彻底实现了出海,且在智能体调用和编程这两个最重要的领域,完成了对美国的超越。

考虑英伟达芯片早已停止进口,那么一个关于英伟达的“恐怖故事”,将会呼应着中国模型出海,成为全球AI角逐下半场改天换日的序言。

超越的背后

2月26日,英伟达全方位超越市场预期的财报,最终只换回了华尔街投行的集体“用脚投票”,

在“担忧AI企业无序资本开支”的市场语境之中,英伟达头上的乌云,更来自大洋彼岸的中国。

“根据现行规定,公司无法为中国数据中心市场提供具有竞争力的产品。”英伟达财报中披露。无独有偶,2月27日,美国商务部官员在众议院外交事务委员会听证会上证实:自2025年12月特朗普政府宣布允许英伟达H200芯片对华出口以来,该款芯片的实际出口数量为零。

也就是说,除“可能通过其他途径”获得芯片之外,从去年4月开始,中国AI模型企业就一直在全球尖端算力芯片的断供状态下存活,且活得越来越好。

事实上,早在OpenRouter 数据发布之前,硅谷从业者们感官上的变化,已经佐证了以上数据的真实性。

知名硅谷投资人,Facebook 早期创始成员阿加瓦尔(Aditya Agarwal)去年11月便在社交媒体上发出过这样一个感叹:

“即便是在硅谷,大部份人都认为应用/智能体都是用诸如 Claude 或者 ChatGPT 完成的——然而事实上在表象之外,50%以上的大语言模型调用是通过廉价的开源模型完成。” 阿加瓦尔在博客中表示。

“这能有效证明中国模型,诸如Kimi,DeepSeek等,实际在支持大部分的AI应用,美国同行甚至无法替代。”阿加瓦尔表示。

同样的问题,AI和加密货币领域坐拥百万粉丝的知名博主马里奥·奈费(Mario Nawfal)则说的更为露骨:

“硅谷是否在暗中运行于中国AI之上?硅谷的AI企业们表面光鲜亮丽,直到你查看其引擎盖下的真相。忘掉炒作吧。硅谷正悄然将其最热门的初创公司构建在中国AI之上。Cursor?可能正运行于来自北京的 DeepSeek。Cognition AI?显然在使用智谱。Airbnb?跳过了OpenAI,选择了阿里的Qwen。甚至连Sam Altman的前CTO,如今也在推出基于中国模型的工具。”

马里奥·奈费所指的是米拉·穆拉蒂(Mira Murati),后者离开OpenAI后创立了 AI 初创公司 Thinking Machines Lab,并于去年10月发布了用于优化AI大模型的工具 Tinker。

Tinker 初期只针对两款开源模型,其中就有阿里巴巴的 Qwen。而这证明了 Qwen 现在已然是硅谷最主流调用工具模型之一。

便宜才是一切

“因为它们更便宜、更快、开源,而且老实说……对于想要交付可用产品的开发者来说,就是更好。”马里奥·奈费表示。

这是一个和中国制造业类似的故事——中国几乎制造了全球所有的原材料,零部件,模具。包括美国在内,任何国家都很难完全独立于中国供应链,完成哪怕是一根烧烤刷子。当然,你也可以硬着头皮选择不使用中国的供应链,但那会让产品失去价格竞争力,并且面临市场快速迭代的风险。

今年2月,月之暗面宣布完成新一轮融资。而根据澎湃新闻报道,旗下大模型 Kimi 2.5 在今年年初一经发布,20天内的调用量已经超过了去年全年。

大获成功的背后有天时佐佑。通用智能体 OpenClaw 大火之后,月之暗面顺势推出 KimiClaw 允许客户一键部署。随之而来的是智能体调用 Kimi 2.5 水涨船高。

然而真正让 Kimi 突然跻身全球顶级AI大模型的,仍然是“便宜”:基准跑分名列前茅,调用价格是Claude的八分之一,而且开源。

无独有偶,月之暗面的中国友商们也都非常默契:2月末问世的阿里 Qwen 3.5 将百万Token价格定到了0.8元人民币,仅为Gemini的1/18。至于尚未发布便赚足眼球的 DeepSeek V4,业内普遍认为,由于会优先适配国产芯片, DeepSeek V4得调用价格或许会惊掉人们的下巴。

AI的中国式出海

“Token”在AI领域被称为“词元”。但在区块链和加密货币领域,“Token”又有代币的意思。

今天,“代币”这个词,对于描述如今成本敏感的AI行业,又显得非常恰如其分。

一个简单的事实是,在模型性能领域,按照所谓的“Scaling Law(规模化法则)”,调用效果的好坏与调用资源的用量几乎成正比。但是,当中国AI模型可以用美国AI模型10%,甚至5%的价格调用时,由模型性能带来调用量差距便几乎可以被忽略不计,调用哪家的AI大模型,变成了一个简单的“成本题”。

毫无疑问,中美电价差异是成本题的终极解:中国工业用电的价格约较美国低30%~40%,中西部绿电的价格比美国电价低50%到70%。

加上中国工业用电基数大,中国AI模型可以更好的利用谷电进行训练和调用。相比之下,美国AI企业腾挪的空间就显得小得多。

再比如,对于代码(coding),智能体(Agent)等均以代码能力为主的基准场景中,中国AI模型的性能差距并不明显。任务本身的特点,也使得其不要求低延迟,快响应的就近算力配备。

这一切,都让“中国Token出海”逻辑无比顺畅,也让美国AI公司感受到了前所未有的危机。

今年2月23日,美国AI公司 Anthropic 发布所谓的官方声明,“指控”三家中国AI公司:DeepSeek、月之暗面和 MiniMax——对其Claude 模型实施了“工业级蒸馏攻击”,创建2.4万个虚假账户旨在提取 Claude 的核心能力来训练自家模型。

“巧合”的是,Anthropic “指控”的三家公司,恰好便是 OpenRouter 平台调用模型前三的中国企业。

不过,即便中国企业真的在“蒸馏”模型,即便 Anthropic 真的有办法防止所谓的虚拟账户进行 “工业级蒸馏攻击”,一些行业人士仍然认为,当前的中国企业可以通过开源,甚至“互相蒸馏”,保持大模型性能差距不被甩开。

而当中国国产芯片开始大规模对英伟达芯片进行补位,中国AI大模型产业“自主可控”,整体出海的最后一块拼图,也将正式备齐。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新