当用户不再纠结每月是否要升级流量套餐时,或许要开始纠结每月买多少Token服务了。
Token即将像流量、宽带、短信一样,被运营商包装成标准化服务进行售卖。
日前,国内三大运营商陆续推出Token套餐产品:面向个人用户推出按月订阅制Token 方案,面向开发者和企业客户提供分层算力套餐,并宣布已将数十至数百种大模型纳入平台,“按月购买、多模型调用、话费支付”。
中国电信已推出个人及企业版Token套餐,月费最低9.9元,1000万Token使用量;上海移动、上海电信等地方运营商则推出按额度点或通用Token计费模式,上海移动1元可获得40万Tokens。
随着运营商开始售卖Token服务,用户切换大模型的成本将大幅降低,那么对于大模型企业来说,“用户粘性”将被弱化,只有“更卷”才能保住市场。
未来,豆包、千问、DeepSeek等大模型厂商,不仅要卷“价格”,“单位能耗下Token质量”,甚至卷向“更高价值的AI应用解决方案能力”。
01
什么是 Token 服务?
要理解Token服务,先理解什么是Token。
计算机无法直接识别文字,只能识别0、1代码,所以我们输入的每个单词、文字、语音、标点,都会通过特定编码机制,转换成0、1代码。
在大模型语境中,也是先识别数字编码,而每个文字转换成的数字编码位数略有差异。
Token是大模型处理信息的最小计算单位。用户输入、上下文记忆、模型输出,都以Token计算。模型调用越复杂、上下文越长、Agent执行链条越深,Token消耗越高。
通常情况下:在英文中,一个Token大约相当于4个字母;在中文中,由于汉字信息密度更高,一个汉字、一个标点符号或一个词组,往往对应1到2个Token。
由于大模型的思考和输出是逐个Token进行的,因此,行业便将大模型的调用成本、使用额度,以“每百万Token(Per Million Tokens)”或“额度点”的形式向用户进行售卖与结算。
目前大模型公司对于Token进行阶梯收费,普通用户用豆包、千问这类大模型普通模式,免费;而如果是企业级的重度使用,可以通过购买不同阶梯的API包月、计量服务。
从去年开始,运营商开起了大模型“算力超市”。模型厂商是 “入驻商户”,运营商收 “平台费+算力费+渠道费”。用户买的不是 “运营商模型”,而是:在电信平台上,用电信算力,调用任意大模型,按Token计费。
2025年7月,中国移动发布模型服务平台MoMA(Mobile Model Access);4月,中国电信发布星辰TokenHub运营服务平台,5月,“联通星罗”Token服务平台发布,这些平台把百度、阿里、字节、DeepSeek 等多家主流大模型全部接入,统一API、统一鉴权、统一计费。
运营商平台内部对多种大模型适配,用户只需要换个模型名称(Model ID)就能平滑切换。
02
运营商为何卖Token ?
Token服务的爆发并非偶然。
首先,计费模式改变。在传统的云计算时代,用户习惯于为“服务器租赁时间”或“固定带宽”买单(即IaaS层的算力付费),买的是带宽速率和时间。但是随着大模型的发展,不同大模型提供的能力,不同任务所需消耗的成本差距非常大。比如更强的模型,单个 Token 更贵;更长上下文,Token 消耗更多;推理复杂度越高,实际成本越高。按Token计费,可以对齐“用户消耗的智能程度”与“厂商付出的算力成本”。
其次,降低技术门槛与“试错成本”。大模型的研发和部署动辄需要千万乃至数亿美元的投入。对于绝大多数中小企业和个人开发者而言,自建模型并不现实。Token服务将“通用人工智能(AGI)”能力切碎、打包,开发者不需要关心底层有几万张GPU在烧电,只需要按需调用API并支付Token费用。
最后,应用层爆发带来的迫切需求。步入2026年,AI Agent(智能体)、AI辅助编程、多模态内容生成等应用层场景爆发。这些应用在日常运行中,需要频繁地与底层大模型进行“吞吐”互动。一个自动化的AI写代码工具,可能在一夜之间就要消耗数百万个Token。这种高频、海量的交互,倒逼市场必须提供更加标准化、稳定且具备价格竞争力的Token套餐服务。
过去二十年,运营商商业模式经历了三次核心计量单位变化。
第一阶段是语音时代,运营商出售的是分钟数;第二阶段是移动互联网时代,出售的是流量GB;而进入AI时代,运营商开始尝试出售Token。
Token正在经历与流量相似的演化过程。最初,只是技术指标;随后成为计费单位;最终演变为标准化商品。
运营商入局,标志着Token已开始脱离技术范畴,进入消费体系。
未来几年,用户购买AI能力的方式可能发生根本变化:个人用户购买“AI月包”、 企业采购“Token资源池”、家庭宽带附带AI额度、 政企专线集成Agent服务。Token将像电、水、流量一样成为基础资源。
但这并不意味着,运营商会替代大模型厂商。
03
Token 怎么买合适?
Token服务究竟是从原生大模型厂直接售卖,还是从运营商平台购买?目前两种商业模式都有何利弊。
第一种是原生模型厂商模式,即按百万Token计费。OpenAI、Anthropic、DeepSeek、千问等厂商普遍采用这一体系。用户按输入Token、输出Token分别付费。诸如千问等可能采用月初预购买,月底结账的形式。
第二种是运营商月费订阅Token额度。例如上海电信推出最低9.9元对应1000万Token,超额再追加,并计划将Token权益融合进家庭的“美好家”数字空间中,支持话费账单一键支付。
这种“一价全包”或“话费融合”的模式,让中国用户能够像买流量包一样购买大模型算力。
海外市场以大模型原生企业的API阶梯计价为主,国内市场将Token服务推向了类似于手机话费的“套餐化”时代。
目前来看,两种收费模式各有优势,因为从Token套餐用户群体看,主要分三个类型。
第一是独立开发者与技术发烧友(Geeks)。他们利用各家厂商提供的API接口,搭建属于自己的个性化AI应用,如效率工具、自动翻译插件、个人专属知识库等;
第二类是中小企业、初创公司与 B 端独立软件开发商(ISV),这是Token服务最核心客群。无论是给公司员工购买用于编程的Token,还是开发针对特定行业的AI Agent,还是在现有的企业ERP、CRM系统中嵌入AI辅助功能,中小企业需要订阅云厂商或运营商的“团队版Token套餐”。
第三类是“重度依赖AI”的职场人与普通家庭,他们在居家场景需要高频使用AI进行文案创作、代码编写,或者需要AI辅导孩子功课。
针对中小企业、初创公司,从技术经济学角度,原生大模型的纯Token计费模式更科学。
而运营商的套餐模式,有两个优势,一方面,独立开发者不需要绑定在某一家大模型上,可以通过平台商进行多种大模型自主选择;另一方面,Token服务或将更快走向大众消费。因为大多数人知道100GB流量意味着什么,却无法感知1000万Token代表多少。
运营商采用月费订阅,本质上是在降低认知门槛。用户不需要理解Token,只需要从普通9.9元/1000万Token开始了解自己的需求。
随着运营商开始售卖Token服务,“豆包们”即将开始向三个层次内卷。
从“拼参数”到“拼能效比”:对于大模型企业来说,将不能继续盲目追求大模型的大参数、大耗能,而是将精力投入到模型蒸馏(Distillation)、量化(Quantization)以及推断加速(Inference Optimization)等能用更小能耗、输出更高质量Token的能力。
价格竞争将进一步加剧。运营商聚合数百模型后,用户切换成本下降。如果A模型涨价,可通过平台替换B模型。模型能力差异不足时,价格将成为核心竞争因素。
大模型企业利润中心将转移。单纯卖API利润有限,未来盈利重点可能转向Agent、行业应用、企业解决方案。模型本身逐渐成为基础设施,而应用层成为价值中心。
或许,“双边市场”正在形成:运营商控制入口,模型厂商控制能力。





京公网安备 11011402013531号