IT时报记者 郝俊慧
6月23日,亚马逊云科技中国峰会的展区中央,伫立着一座蓝色光块垒成的塔,从“数据基石”“模型服务”一直堆到顶上的“Agent应用”,这里是“Agent构建的理想之地”;展区内处处皆智能体,一块硕大的“业务智能体”招牌下,运营、销售、财务、法务等各色智能体一字排开,各类“开箱即用的Agent”、可“手搓”AI任务的Kiro……都在印证着亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松主题演讲中的那句判断——“Agentic AI爆发的拐点已然来临”。
然而,就在峰会前后,全球几家最大的科技公司,几乎同时掉头:腾讯、Meta、微软这些过去半年拼命催员工“多用AI”的大厂,开始给员工的Token用量设上限。
克制,是《IT时报》记者在这次峰会上形成的一个反常识认知。
从“TokenMaxxing”到“TokenMinimizing”(从敞开烧到省着用),大厂们只用了半年,当财务、产品、运营等非技术研发部门也都开始AI Coding,倒逼“Token工厂”必须让自己的工具满足客户对Token用量的“克制”;与此同时,那些面向终端消费者的互联网入口厂商,也必须学会“克制”对AI的使用,不是所有流程Agentic后,都会提升用户的体验。
大厂集体掉头
就在几个月前,大厂们还在比谁Token烧得多。腾讯给部分部门员工承人均约一年22万元的Token资源,Meta甚至将员工挂上Token消耗排行榜……
这几天,风向陡然掉头,有腾讯程序员四五天便用完全月额度,Uber、微软、亚马逊纷纷设限,主流编程工具也集体转向按量计费。
原因无他,“智能体太吃Token了。”哈啰首席架构师邓小白告诉《IT时报》记者,2025年下半年,哈啰集团开始自上而下将AI Coding融入实际工作,算力账单激增。
随着生成式AI技术的持续迭代,Agent的应用探索正迎来全新阶段,尤其是把模型能力转化为可以稳定交付业务结果的Agentic工程体系,几乎以三个月为单位快速演进。
最早的提示词工程(Prompt Engineering)已不再最重要,上下文工程(Context Engineering)和驾驭工程(Harness Engineering)的探索还在进行中,Loop Engineering(循环工程)又成为热门词。
“智能体未来发展核心趋势是后端技术层演进越复杂与精密,而前端应用层呈现给用户的体验会越发简单与友好。”AI Coding给哈啰带来的变化是颠覆性的,据邓小白介绍,这家累计用户达8 亿量级的出行公司已有2000多名员工在使用AI编程工具,其中研发人员只有1000多名,剩下接近一半员工来自产品、运营、财务等非技术岗位。
Agent自主能力越强,Token“燃烧”的速度就越快。以Loop Engineering为例,它设计了一套自动化循环系统,可以让AI自己驱动、评估、修正,直到完成任务,但反复循环的同时,Token总消耗也呈倍数增长。
在哈啰,一个创意从想法到落地的时间,从以天计压到了小时级,但由此而来的算力账单,倒逼企业要对Token成本精打细算。
“面对层出不穷、令人目不暇接的AI创新,企业需要一张清晰AI全景地图来明确自身需求。”储瑞松表示。
一张“用好Token”的地图
正如那座蓝色塔的展示,此次峰会上,亚马逊云科技推出了一套完整的Agentic AI技术栈,全面覆盖了从AI基础设施、模型、数据与知识、Agentic平台和Agent应用五大层面。如果换个角度来看,这正是一张“帮企业如何用好Token”的地图。
以AI基础设施层为例,亚马逊云科技提供行业最新的GPU实例及自研的Trainium AI加速芯片,并依托Amazon Sage Maker AI帮助企业快速构建、训练和部署自有AI模型。
《IT时报》记者在亚马逊云科技在2025年12月的一篇官方文章中看到,包括Anthropic、Karakuri、Metagenomi、Ricoh(理光)和Splash Music在内的客户,正通过Trainium降低训练和推理成本降低,最高降幅可达50%,而Trainium早期的测试公司Decart则以GPU一半的成本,实现了实时生成视频4倍的推理速度。
在中间模型层,Amazon Bedrock提供了包括亚马逊在内的一长串大模型厂商和模型清单,比如Anthropic、DeepSeek、Moonshot AI、OpenAI、MiniMax等厂商的100多个基础模型。
储瑞松特意提醒,企业“Agentic AI应用应根据实际需求,选择在智力水平、速度和成本上最合适的模型,切忌自我设限,不要锁死在单一供应商的模型上”。言外之意是,根据需求复杂程度的不同,企业应该选择性价比最高的模型。
与此同时,亚马逊云科技提供了多种有效工具,比如智能提示路由(Intelligent Prompt Routing)能在保持回答质量的同时把成本最高压低30%,另一个工具则是模型蒸馏(Model Distillation),通过将大模型蒸馏为一个小模型,运行速度最高可提速500%,成本最高降低75%,而准确率几乎不受影响。
数据和知识层是企业AI项目成败的关键。储瑞松坦言,很多企业AI项目失败的主要原因,是“数据还未就绪”就上Agent,但如果厘不清单项任务的实际花费,实际将“任务部署”变成了“实验”。很多时候,Token是在“空烧”。因此,多年积累的自有数据与知识,是企业真正不可复制差异化竞争壁垒,当AI进行判定的时候,数据的准确性非常重要。
亚马逊云科技在数据和知识层的核心价值,正是为用户提供Zero-ETL、Amazon S3 Vectors等一系列完整专门面向AI的数据服务,可以将过去静态存储的数据变成AI可以理解和使用的数据和知识资产,为智能体提供相关、准确、新鲜且经过治理的高质量数据支撑。
第四层是Agentic平台层,亚马逊云科技在这一层的产品是Amazon Bedrock AgentCore,它的核心价值在于提供统一智能体运行环境和开发工具,同时也提供规则、评估和治理能力。简而言之,便是支持大规模智能体的开发、部署、管理与迭代,甚至包括监控、评估、改进全过程,企业可以统一、高效地管住智能体的生命周期,而不必为每个环节各搭一套工具。
具体落到Token账单上来看,是当一个企业里成百上千个智能体同时在跑时,用户可以在这个“智能体管理空间”里清楚地看到,哪个Agent在空烧Token,哪个绕了远路,哪个任务的花费已经超过它所创造的价值……这也是企业智能体应用从概念验证走向生产的分界线。
最上面一层是智能体与应用层,在这一层,亚马逊云科技提供Kiro、Amazon Quick、Amazon Connect等一系列开箱即用的解决方案,既有软件开发、IT运维、知识工作者、客户服务等跨行业的通用场景,也有能带来最大业务价值的行业定制应用。
对企业而言,这些解决方案最直接的结果是省了“从零造轮子”的成本。众所周知,如果企业自建一个智能体,光开发和反复调试就要烧掉大量的人力和Token,而运用Kiro等工具,无需从零构建,便可以快速将Agent能力应用到实际业务中。
储瑞松进一步指出,五层技术栈的存在,最终都是为了最顶端的业务产出服务,安全、效果、性能和成本四个维度要贯穿始终,企业必须量化Agents带来的业务价值,无论是任务完成吞吐量、产出质量、每任务成本、交付周期,还是人力等效、客户满意度与营收增长等偏宏观的指标。
当Agentic AI爆发的拐点已至,一家云厂商不一味强调AI能力,鼓励客户消耗Token,而是帮助企业“以终为始”,强调可衡量的业务产出,这恰是这场峰会最克制的地方。
哈啰的账本
这种克制,在哈啰身上得到了印证。
邓小白告诉记者,选择Kiro的原因之一是“省”,目前集团并没有对员工Token使用量设限,但在使用Kiro之前,Token的消耗曲线变成了一根拉满的弓弦。
但当哈啰集团整体使用Kiro之后,不仅比以往直接使用基础模型便宜很多,整体效率也得到了大幅提升。邓小白介绍,在工程质量要求高的复杂业务场景下,开发提效约50%;而在从0到1的创新场景下,开发提效高达67%以上。
“我们曾做过测试,某些方案的Token消耗量只有其他大模型的两成左右。”一位亚马逊云科技的展台工作人员告诉记者。
作为亚马逊云科技在Agent应用层亲自下场的AI编程工具,Kiro的招牌打法“规格驱动开发”(spec-driven development)本身也是一种克制。Kiro在编码前会先加一层结构化的规划,将需求、设计、任务等梳理清楚,从而让生成代码一次成功的比例更高,也让开发者的能力边界得以进一步扩展。
在展区,《IT时报》记者看到一个只有三个按键的小方盒,这是一名开发者仅靠Kiro便“手搓”出的Agentic Coding专属键盘,不需要键盘鼠标,通过语音输入便可以让Kiro自动编程、到淘宝上购买芯片、并写入代码,最后人需要做的,只是将空盒子和芯片组装起来。
或许,Kiro对于亚马逊的意义将在Agentic AI时代逐渐显现。自2026年5月7日Kiro国际上线后,亚马逊便宣布预计将在明年停止支持原有的开发者平台Amazon Q Developer。换句话说,这家以卖底座为主的云厂商,对于Kiro成为AI时代的开发者入口,寄予厚望。
不是万物皆可Agent
如果说,克制之于成本,是将Token物尽其用,那么,当视角转向用户应用层时,问题的核心便从“如何节省”转向“是否值得”。很显然,并非所有场景都适合Agentic,在用户体验和AI浓度之间,本身便需要审慎权衡的克制。
展台上,记者看到一个“开箱即用的电商Agent”,演示的场景是:当用户提出希望知道两个产品的不同时,Agent开始思考……就像常见的ChatBot那样,罗列出整个思考过程,对比一条条异同,最后给出完善的建议。
然而,真实场景中,消费者有如此耐心吗?
“Agentic AI不仅是技术创新,更是业务变革。”储瑞松认为,开启智能体项目的企业,一定要选择合适的Agentic场景,起始场景无需过于复杂,但要对企业有切实的价值。
“必须要有非常明确的目标,不能为了用AI而去用AI。”邓小白坦承,哈啰在首页这类核心场景引入AI推荐上一直“非常克制”,只有明确痛点后,才会制定计划、设计解决方案,并最终引入AI。
大多数时候,用户的诉求是泛需求,意图并不明确,直接采用对话式推荐,“可能并非最优选择”。据记者了解,目前哈啰的做法是把搜索、推荐、筛选、对话几种形态揉在一起,由大模型动态挑出最合适的交互方式,只有识别到极其明确的意图时,比如发现用户最近频繁骑共享单车,才会触发AI推荐,比如定向推荐次卡或月卡等对应产品。
这也是为什么哈啰单车选择了亚马逊云科技的原因之一。邓小白表示,实际业务中,不可能在所有场景,或者同一个场景的所有用户请求中,都无差别地使用同款大模型。因此,在Amazon Bedrock上,哈啰建立了一套模型切换机制,对于准确率要求极高的场景,哈啰会调用性能更强、成本较高的模型;而对于标准化程度高、确定性强的场景,会切换到更具性价比的模型。
无论是成本克制,还是应用克制,当拐点来临,站在浪潮之巅的企业都在思考:AI不是用得越多越好,而是用得越对越好,而这或许才是“AI构建的理想之地”。





京公网安备 11011402013531号