量大管饱：AI Token的中国式出海

IP属地中国·北京 21世纪经济报道 时间：2026-03-02 16:39:36

21世纪经济报道记者赵云帆
今年2月26日、27日，英伟达（NVDA）股价于仅两个交易日中跌去10%，其跌幅“恰好”是过去一年之最。
仿佛，去年春节 DeepSeek 横空出世给英伟达带来的“至暗时刻”，时隔一年再度重现。
准时光临的，依然是中国AI大模型这只“年兽”。而比起去年 DeepSeek 单兵出击，今年的中国AI模型掀起的，更像是一场巨型的会战。
根据全球最大的大模型API聚合平台 OpenRouter 数据，截至2月28日，该平台内前十模型总Token消耗量已突破28.7万亿，其中国产模型贡献超过14.69万亿，为历史上首次单月Token调用占比过半且超越美国产模型。
其中，国产模型 MiniMax M2.5，月之暗面的Kimi K2.5，DeepSeekV3.2，分别以5.44万亿、4.27万亿和3.09万亿Token，居调用排行榜的第一、第二和第四席位。智谱旗下 GLM 5 则以1.89万亿位居第八。
OpenRouter 2月数据以来调用数据
当然，更多诸如阿里 Qwen 系列模型也得到大量调用，但仅因不同版本模型分流，未能居于前十榜单。
以上数据似乎很容易让我们得出一个“暴论”——中国AI模型，不仅彻底实现了出海，且在智能体调用和编程这两个最重要的领域，完成了对美国的超越。
考虑英伟达芯片早已停止进口，那么一个关于英伟达的“恐怖故事”，将会呼应着中国模型出海，成为全球AI角逐下半场改天换日的序言。
超越的背后
2月26日，英伟达全方位超越市场预期的财报，最终只换回了华尔街投行的集体“用脚投票”，
在“担忧AI企业无序资本开支”的市场语境之中，英伟达头上的乌云，更来自大洋彼岸的中国。
“根据现行规定，公司无法为中国数据中心市场提供具有竞争力的产品。”英伟达财报中披露。无独有偶，2月27日，美国商务部官员在众议院外交事务委员会听证会上证实：自2025年12月特朗普政府宣布允许英伟达H200芯片对华出口以来，该款芯片的实际出口数量为零。
也就是说，除“可能通过其他途径”获得芯片之外，从去年4月开始，中国AI模型企业就一直在全球尖端算力芯片的断供状态下存活，且活得越来越好。
事实上，早在OpenRouter 数据发布之前，硅谷从业者们感官上的变化，已经佐证了以上数据的真实性。
知名硅谷投资人，Facebook 早期创始成员阿加瓦尔（Aditya Agarwal）去年11月便在社交媒体上发出过这样一个感叹：
“即便是在硅谷，大部份人都认为应用/智能体都是用诸如 Claude 或者 ChatGPT 完成的——然而事实上在表象之外，50%以上的大语言模型调用是通过廉价的开源模型完成。” 阿加瓦尔在博客中表示。
“这能有效证明中国模型，诸如Kimi，DeepSeek等，实际在支持大部分的AI应用，美国同行甚至无法替代。”阿加瓦尔表示。
同样的问题，AI和加密货币领域坐拥百万粉丝的知名博主马里奥·奈费（Mario Nawfal）则说的更为露骨：
“硅谷是否在暗中运行于中国AI之上？硅谷的AI企业们表面光鲜亮丽，直到你查看其引擎盖下的真相。忘掉炒作吧。硅谷正悄然将其最热门的初创公司构建在中国AI之上。Cursor？可能正运行于来自北京的 DeepSeek。Cognition AI？显然在使用智谱。Airbnb？跳过了OpenAI，选择了阿里的Qwen。甚至连Sam Altman的前CTO，如今也在推出基于中国模型的工具。”
马里奥·奈费所指的是米拉·穆拉蒂（Mira Murati），后者离开OpenAI后创立了 AI 初创公司 Thinking Machines Lab，并于去年10月发布了用于优化AI大模型的工具 Tinker。
Tinker 初期只针对两款开源模型，其中就有阿里巴巴的 Qwen。而这证明了 Qwen 现在已然是硅谷最主流调用工具模型之一。
便宜才是一切
“因为它们更便宜、更快、开源，而且老实说……对于想要交付可用产品的开发者来说，就是更好。”马里奥·奈费表示。
这是一个和中国制造业类似的故事——中国几乎制造了全球所有的原材料，零部件，模具。包括美国在内，任何国家都很难完全独立于中国供应链，完成哪怕是一根烧烤刷子。当然，你也可以硬着头皮选择不使用中国的供应链，但那会让产品失去价格竞争力，并且面临市场快速迭代的风险。
今年2月，月之暗面宣布完成新一轮融资。而根据澎湃新闻报道，旗下大模型 Kimi 2.5 在今年年初一经发布，20天内的调用量已经超过了去年全年。
大获成功的背后有天时佐佑。通用智能体 OpenClaw 大火之后，月之暗面顺势推出 KimiClaw 允许客户一键部署。随之而来的是智能体调用 Kimi 2.5 水涨船高。
然而真正让 Kimi 突然跻身全球顶级AI大模型的，仍然是“便宜”：基准跑分名列前茅，调用价格是Claude的八分之一，而且开源。
无独有偶，月之暗面的中国友商们也都非常默契：2月末问世的阿里 Qwen 3.5 将百万Token价格定到了0.8元人民币，仅为Gemini的1/18。至于尚未发布便赚足眼球的 DeepSeek V4，业内普遍认为，由于会优先适配国产芯片， DeepSeek V4得调用价格或许会惊掉人们的下巴。
AI的中国式出海
“Token”在AI领域被称为“词元”。但在区块链和加密货币领域，“Token”又有代币的意思。
今天，“代币”这个词，对于描述如今成本敏感的AI行业，又显得非常恰如其分。
一个简单的事实是，在模型性能领域，按照所谓的“Scaling Law（规模化法则）”，调用效果的好坏与调用资源的用量几乎成正比。但是，当中国AI模型可以用美国AI模型10%，甚至5%的价格调用时，由模型性能带来调用量差距便几乎可以被忽略不计，调用哪家的AI大模型，变成了一个简单的“成本题”。
毫无疑问，中美电价差异是成本题的终极解：中国工业用电的价格约较美国低30%~40%，中西部绿电的价格比美国电价低50%到70%。
加上中国工业用电基数大，中国AI模型可以更好的利用谷电进行训练和调用。相比之下，美国AI企业腾挪的空间就显得小得多。
再比如，对于代码（coding），智能体（Agent）等均以代码能力为主的基准场景中，中国AI模型的性能差距并不明显。任务本身的特点，也使得其不要求低延迟，快响应的就近算力配备。
这一切，都让“中国Token出海”逻辑无比顺畅，也让美国AI公司感受到了前所未有的危机。
今年2月23日，美国AI公司 Anthropic 发布所谓的官方声明，“指控”三家中国AI公司：DeepSeek、月之暗面和 MiniMax——对其Claude 模型实施了“工业级蒸馏攻击”，创建2.4万个虚假账户旨在提取 Claude 的核心能力来训练自家模型。
“巧合”的是，Anthropic “指控”的三家公司，恰好便是 OpenRouter 平台调用模型前三的中国企业。
不过，即便中国企业真的在“蒸馏”模型，即便 Anthropic 真的有办法防止所谓的虚拟账户进行 “工业级蒸馏攻击”，一些行业人士仍然认为，当前的中国企业可以通过开源，甚至“互相蒸馏”，保持大模型性能差距不被甩开。
而当中国国产芯片开始大规模对英伟达芯片进行补位，中国AI大模型产业“自主可控”，整体出海的最后一块拼图，也将正式备齐。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

长三角AI+联合创新中心正式启用华为参与共建

马斯克直言，一旦中国有了足够算力，很可能成为 AI 领跑者

一个中国开源模型，引发整个硅谷科技巨头地震

奔驰推出新款Marco Polo露营车：车顶可升起，内置冰箱、厨房

苹果候任CEO特努斯接棒在即：上任后将继续推动娱乐业务增长

朱一明，分给员工300亿

全站最新

极氪9X五座版上市，专属配置与全能空间开启豪华出行新体验

长三角AI+联合创新中心正式启用华为参与共建

马斯克直言，一旦中国有了足够算力，很可能成为 AI 领跑者

一个中国开源模型，引发整个硅谷科技巨头地震

热门推荐

微容科技冲刺IPO，营收狂奔难掩盈利隐忧，22亿元理财在手仍募资“补血”引争议

宁德时代旗下时代绿色能源增资至35亿增幅75%

《财富》世界500强排行榜揭晓：亚马逊成为全球最大公司

得物正式上线「租赁」服务

雷军回应小米澎程系列前景：平庸是敌，自在向前信心足

火山引擎豆包搜索服务上线，助力AI Agent实现深度信息精准查询与高效转化

企业搞AI，老板要先用！周鸿祎发布纳米Work：新一代企业智能体工作平台

AI大模型将全面拥抱IPv6，雄安新区率先试点"单栈"网络

谷歌AI搜索一年翻倍：43%搜索结果现AI概览，传统网页正被"直接给答案"取代

新华全媒头条丨轮椅上“跑出”的加速度——记国防科技大学计算机学院研究员王戟

长三角AI+联合创新中心正式启用华为参与共建

马斯克直言，一旦中国有了足够算力，很可能成为 AI 领跑者

一个中国开源模型，引发整个硅谷科技巨头地震

奔驰推出新款Marco Polo露营车：车顶可升起，内置冰箱、厨房

苹果候任CEO特努斯接棒在即：上任后将继续推动娱乐业务增长