朱兆一
每隔几十年,一种新的基础性商品会重新定义全球贸易秩序。19世纪是煤,20世纪是石油,今天,Token(AI处理文字的最小单位)正在承担这个角色。Token本是AI模型处理语言的最小单元,但它已不仅仅是技术概念——它凝结着算力、电力与算法,是智能时代国际贸易的最小结算单元。
2026年5月下旬,全球最大AI模型API聚合平台OpenRouter发布了一组数据:当周全球AI大模型总调用量达28.9万亿Token,DeepSeek-V4-Flash单周调用量3.43万亿Token,环比暴涨66%,首次登顶全球第一。若将DeepSeek旗下所有模型合并计算,中国大模型周调用量已达9.22万亿Token,美国模型为4.93万亿Token,中国整体连续数周稳居全球榜首。这组数字,是理解本文讨论核心的起点。
DeepSeek的崛起,如果只理解为“价格战”,就低估了这件事的意义。
价格只是结果,根源在于算法架构的重新设计。DeepSeek V4系列采用混合专家模型(MoE)架构,总参数约284B,但每次推理时实际激活的参数仅约13B,同等性能下计算资源消耗被大幅压缩。DeepSeek训练V3的总成本约560万美元,业界对GPT-4训练成本的估算超过1亿美元,相差约18倍。低成本训练带来的是可持续的定价能力:V4-Flash的API定价约为每百万Token输入0.1美元,同期美国头部闭源模型高出50到250倍不等。2026年5月,DeepSeek宣布将折扣价永久化,彻底打消了市场对“低价补贴换流量”的疑虑。
这种成本革命恰好遇上AI Agent的规模化落地。一个中等复杂度的Agent任务需要数十次模型调用,消耗10万Token级别的算力;复杂任务动辄百万Token起步。全球开发者很快发现,用美国高价模型跑Agent成本曲线极陡,用中国开源模型作为后端,同样的预算可以支撑多出十倍乃至二十倍的调用量。OpenRouter平台用户中,美国开发者占比约47%,中国开发者仅占6%——推动中国模型调用量飙升的主力,是海外开发者的真实市场选择。
从贸易结构看,Token出口是一种极为奇特的商品形态:生产消耗的是电力,运输走的是光纤,不需要集装箱和港口,不受海关限制,不会被霍尔木兹海峡的地缘博弈所阻断。有测算显示,中国西部一度电转化为Token服务后,市场价值可放大约22倍,增值幅度远超任何传统制造业产品。
回顾中国外贸40年,比较优势经历了从廉价劳动力、到制造业规模效应、再到供应链深度整合的三次跃迁。Token出口意味着第四次跃迁——出口的不是有形商品,也不是软件代码,而是凝结在算法与算力中的智识服务本身,边际成本几乎为零,规模效应无上限。
这种模式同时解决了中国长期存在的能源消纳难题。中国西部绿色电力单价约0.15元/度到0.28元/度,仅为欧美电价的五分之一到三分之一,但因距离东部用电中心太远,长期面临弃风弃光困境。“东数西算”工程的战略意图之一,正是将西部富余的绿电就地转化为算力,通过光纤输送出去。Token出口相当于把西部绿电装进“数字货柜”,以AI服务的形式卖给全球用户。能源消纳、外汇创收、产业升级,三个目标在同一个商业模式里同时实现。
用“技术冷战”或“脱钩”来描述中美AI关系,是一个误导性叙事。全球AI用户的需求天然是分层的,中美模型各自卡在了需求金字塔的不同位置,形成了市场自发演化出的互补格局。
一家东南亚中型电商公司,其客服机器人用中国开源模型跑,月成本可能不到100美元;同一家公司的供应链优化与市场研判,则需要调用美国闭源模型的高精度推理能力。两套Token服务同时采购、按需分配,已是普遍的工程实践。这种格局对双方都有利:美国的高溢价依托的是算法护城河,不是价格可以颠覆的;而一个被廉价中国算力养成AI使用习惯的全球开发者群体,恰恰是美国高端模型潜在用户的最大蓄水池。双方竞争愈激烈,全球AI市场扩张愈快,彼此的绝对收益也随之增大,这是一种深层的共生关系。
Token是智能文明的氧气,流经每一次人机交互、每一个被AI辅助的决策。与石油不同的是,Token不依赖特定地理,任何拥有足够电力的地方都可以生产,这决定了Token经济学天然比石油经济学更具竞争活力,也更难被单一力量垄断。真正的竞争,是谁能在这套新秩序形成的窗口期,将自己的规则写入全球Token市场的底层逻辑——即规则之争。这场博弈刚刚开始。
本版专栏文章仅代表作者个人观点





京公网安备 11011402013531号