![]()
当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景,一个隐秘却致命的瓶颈正在浮现:Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板,我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解?
近日,浙江大学与阿里云等机构的研究团队联合发布首篇《Token Economics for LLM Agents: A Dual-View Study from Computing and Economics》综述。
该工作首次将计算机科学与经济学深度融合,正式提出「Token 经济学(Token Economics)研究范式,将 Token 重新定义为生产要素、交换媒介与记账单位,构建了一套从单智能体到多智能体生态的完整经济分析框架,为下一代可扩展、可定价、可治理的 Agentic AI 系统奠定理论基石。
![]()
arXiv:https://arxiv.org/pdf/2605.09104GitHub 项目:https://github.com/SuDIS-ZJU/Token-Economics
论文与相关资源将持续更新,欢迎社区交流与共建。
一、 为什么我们需要 “Token 经济学”?
过去三年,Agent 技术栈经历了爆发式演进。但与传统单次 LLM 推理不同,现代 Agent 依赖 “记忆-规划-工具调用-自我修正” 的迭代循环,单次复杂任务即可消耗上千倍于普通对话的 Token。
OpenRouter 公开数据显示,2024 年 12 月至 2026 年 3 月,平台周 Token 处理量从 0.4 万亿激增至 27.0 万亿,15 个月内暴涨近 68 倍。算力需求飙升、多 Agent 协作摩擦加剧、安全防御成本隐性化…… 现有研究多局限于系统加速、架构设计或安全防御的 “技术孤岛”,缺乏统一语言来量化 “算法能力” 与 “协同开销” 之间的根本权衡。
![]()
![]()
研究团队指出:当 AI 数据中心被产业重新定义为 “AI 工厂”,Token 已不再是单纯的数据单元,而是驱动智能生产的 “基础货币”。推理加速与算法优化,必须从工程选择升维为经济命题。
二、 核心框架:四维透镜下的 Agent 资源分配
该综述首创 “计算-经济” 双重视角,将 Agent 系统架构演进与经济组织形态严格同构映射,提出四大分析维度:
![]()
①微观层(单智能体):新古典厂商理论与要素替代
将单 Agent 视为独立企业,在预算约束下动态权衡 “内部推理 Token” 与 “外部工具 Token”。研究基于 CES 生产函数建模,证明 Agent 可通过要素替代逼近帕累托最优。例如:用少量高价值 API 调用替代冗长内部幻觉推理,实现成本最小化。
![]()
②中观层(多智能体系统):交易成本与委托代理理论
MAS 的扩张如同企业层级制,专业化带来收益,但跨 Agent 状态同步、上下文传递与格式对齐会引发超线性增长的 “内部交易成本”。研究指出,通信拓扑剪枝、消息级压缩与 KV Cache 跨模型共享,是降低 “协作摩擦税” 的关键杠杆。
![]()
③宏观层(Agent 生态):机制设计与拥堵外部性
在多租户共享推理平台上,Token 成为稀缺算力资源的计价单位。研究引入拥堵定价、QoS 分层与 Prompt 缓存经济学,揭示开源模型如何通过 “可信外部选项” 打破闭源定价垄断,并指出 “杰文斯悖论”:推理成本下降反而刺激总需求扩张,使系统长期处于动态拥堵状态。
![]()
④安全层:经济约束
首次将安全风险内化为 Token 经济损耗。注入攻击、检索投毒与隐私保护不再只是 “合规外挂”,而是直接改变 Token 影子价格、抬高验证成本、放大系统福利损失的核心变量。安全机制应被视为拦截 “缺陷 Token” 的质量控制基础设施。
三、 从理论到前沿:五大演进方向
基于该框架,团队勾勒出 Token 经济学走向工程落地的五大趋势:
![]()
![]()
结语
《Token Economics for LLM Agents》不仅是一篇综述,更是一份 Agentic AI 的经济学基础设施蓝图。它打破了计算机科学与经济学的学科壁垒,清晰传递出一个信号:在智能体时代,“算得准” 不如 “算得省”,“跑得快” 不如 “协同优”。随着大模型应用向生产核心渗透,Token 经济学将成为衡量 AI 系统商业可行性、工程可持续性与生态健康度的核心标尺。
欢迎学术界与产业界同仁共同探讨、验证与拓展这一新兴交叉领域。
团队
浙江大学计算机学院 × 浙江大学经济学院 × 区块链与数据安全国家重点实验室 × 阿里云





京公网安备 11011402013531号