当前位置: 首页 » 资讯 » 科技头条 » 正文

从词元海量调用说开去(创新谈)

IP属地 中国·北京 人民网 时间:2026-05-25 08:13:27

王云杉

近来,词元(Token)一词持续刷屏科技圈、经济圈,而让它“破圈”的,是一组极具冲击力的数据——今年3月,我国日均词元调用量突破140万亿。从2024年初的1000亿,到2025年底的100万亿,再到突破140万亿,两年间增长超千倍。

这组跳跃式增长的数据,让词元这一专业术语走进大众视野,折射出我国人工智能产业的蓬勃脉动。

什么是词元?它是大模型处理信息的最小信息单元,如果说我们读书写字以“字”为单位,那么AI(人工智能)处理数据时,就会先将数据拆解成一个个可处理的词元,它可以是单个汉字、标点符号,也可以是一个词语片段。我们每一次向AI提问、使用AI生成内容,都是在调用词元。

词元调用量的持续走高,是人工智能应用走进生活、融入产业的生动见证。

技术的价值,最终要体现在应用落地与场景赋能上。如今,AI已融入我们生活的方方面面:教师用AI辅助备课提质增效,农民用AI诊断病虫害守护收成,小微企业用AI优化供应链降低成本,办公职员用AI处理文案……从“点亮”日常生活到深度赋能产业,从文本生成到智能体的广泛应用,AI越来越好用,带动词元调用量持续攀升。这背后,是亿万用户与万千企业对AI技术的认可,更是我国人工智能应用生态日趋成熟的有力证明。

词元调用量的持续走高,更藏着AI产业商业化破局的关键密码,是供给侧创新动能的集中释放。

词元的每一次调用,都离不开算力、算法、电力等产业链各环节的协同支撑,人工智能产业链的竞争力,也能通过词元这一载体得到衡量。

比如,算力越强,词元处理速度越快、单位成本越低;算法越优,模型生成的内容质量越高、词元调用频次越高;电力供给越稳定、成本越低,词元的生产与调用成本也会降低,甚至能让中国的绿电以词元形式实现价值出海……

这种全链条的价值评估能力,加上词元本身所具备的可计量、可定价、可交易的特征,使其成为连接技术供给与商业需求的“结算单位”,让人工智能产业的商业化路径愈发清晰——就像我们按流量付费使用网络,人工智能服务也可以通过“按词元计费”,进一步在产业、民生场景转化落地,成为数字经济新的增长引擎。

词元调用量的持续走高,是数据要素价值释放的鲜活注脚,离不开政策措施的有力托举。

人工智能的发展离不开数据的支撑。词元的海量调用,得益于高质量数据集的持续扩容——截至2025年底,我国已建成高质量数据集超10万个,总体量超890PB(千万亿字节),数据通过拆解为词元被AI处理、应用,最终转化为实实在在的生产力,推动模型迭代、应用落地。

这也进一步说明,随着中国数据要素市场化配置改革向纵深推进,高质量数据的供给体系正在形成,数据要素从供给到价值释放的良性循环加速成形,不断为人工智能产业注入源头活水。

一个个跳动的数字背后,是技术的迭代、应用的深化,更是产业的跃迁。随着技术的加速进化、智能经济新形态的茁壮成长,我国人工智能产业将向着更高质量、更深层次、更广领域发展,为数字中国建设注入源源不断的新动能。

《 人民日报 》( 2026年05月25日 19 版)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。