亚马逊云科技峰会观察：克制的AI Agent的理想之地

IP属地中国·北京 编辑：钟景轩 IT时报 时间：2026-07-02 12:15:03

IT时报记者郝俊慧
6月23日，亚马逊云科技中国峰会的展区中央，伫立着一座蓝色光块垒成的塔，从“数据基石”“模型服务”一直堆到顶上的“Agent应用”，这里是“Agent构建的理想之地”；展区内处处皆智能体，一块硕大的“业务智能体”招牌下，运营、销售、财务、法务等各色智能体一字排开，各类“开箱即用的Agent”、可“手搓”AI任务的Kiro……都在印证着亚马逊全球副总裁、亚马逊云科技亚太区联席总裁储瑞松主题演讲中的那句判断——“Agentic AI爆发的拐点已然来临”。
然而，就在峰会前后，全球几家最大的科技公司，几乎同时掉头：腾讯、Meta、微软这些过去半年拼命催员工“多用AI”的大厂，开始给员工的Token用量设上限。
克制，是《IT时报》记者在这次峰会上形成的一个反常识认知。
从“TokenMaxxing”到“TokenMinimizing”（从敞开烧到省着用），大厂们只用了半年，当财务、产品、运营等非技术研发部门也都开始AI Coding，倒逼“Token工厂”必须让自己的工具满足客户对Token用量的“克制”；与此同时，那些面向终端消费者的互联网入口厂商，也必须学会“克制”对AI的使用，不是所有流程Agentic后，都会提升用户的体验。
大厂集体掉头
就在几个月前，大厂们还在比谁Token烧得多。腾讯给部分部门员工承人均约一年22万元的Token资源，Meta甚至将员工挂上Token消耗排行榜……
这几天，风向陡然掉头，有腾讯程序员四五天便用完全月额度，Uber、微软、亚马逊纷纷设限，主流编程工具也集体转向按量计费。
原因无他，“智能体太吃Token了。”哈啰首席架构师邓小白告诉《IT时报》记者，2025年下半年，哈啰集团开始自上而下将AI Coding融入实际工作，算力账单激增。
随着生成式AI技术的持续迭代，Agent的应用探索正迎来全新阶段，尤其是把模型能力转化为可以稳定交付业务结果的Agentic工程体系，几乎以三个月为单位快速演进。
最早的提示词工程(Prompt Engineering)已不再最重要，上下文工程(Context Engineering)和驾驭工程(Harness Engineering)的探索还在进行中，Loop Engineering（循环工程）又成为热门词。
“智能体未来发展核心趋势是后端技术层演进越复杂与精密，而前端应用层呈现给用户的体验会越发简单与友好。”AI Coding给哈啰带来的变化是颠覆性的，据邓小白介绍，这家累计用户达8 亿量级的出行公司已有2000多名员工在使用AI编程工具，其中研发人员只有1000多名，剩下接近一半员工来自产品、运营、财务等非技术岗位。
Agent自主能力越强，Token“燃烧”的速度就越快。以Loop Engineering为例，它设计了一套自动化循环系统，可以让AI自己驱动、评估、修正，直到完成任务，但反复循环的同时，Token总消耗也呈倍数增长。
在哈啰，一个创意从想法到落地的时间，从以天计压到了小时级，但由此而来的算力账单，倒逼企业要对Token成本精打细算。
“面对层出不穷、令人目不暇接的AI创新，企业需要一张清晰AI全景地图来明确自身需求。”储瑞松表示。
一张“用好Token”的地图
正如那座蓝色塔的展示，此次峰会上，亚马逊云科技推出了一套完整的Agentic AI技术栈，全面覆盖了从AI基础设施、模型、数据与知识、Agentic平台和Agent应用五大层面。如果换个角度来看，这正是一张“帮企业如何用好Token”的地图。
以AI基础设施层为例，亚马逊云科技提供行业最新的GPU实例及自研的Trainium AI加速芯片，并依托Amazon Sage Maker AI帮助企业快速构建、训练和部署自有AI模型。
《IT时报》记者在亚马逊云科技在2025年12月的一篇官方文章中看到，包括Anthropic、Karakuri、Metagenomi、Ricoh（理光）和Splash Music在内的客户，正通过Trainium降低训练和推理成本降低，最高降幅可达50%，而Trainium早期的测试公司Decart则以GPU一半的成本，实现了实时生成视频4倍的推理速度。
在中间模型层，Amazon Bedrock提供了包括亚马逊在内的一长串大模型厂商和模型清单，比如Anthropic、DeepSeek、Moonshot AI、OpenAI、MiniMax等厂商的100多个基础模型。
储瑞松特意提醒，企业“Agentic AI应用应根据实际需求，选择在智力水平、速度和成本上最合适的模型，切忌自我设限，不要锁死在单一供应商的模型上”。言外之意是，根据需求复杂程度的不同，企业应该选择性价比最高的模型。
与此同时，亚马逊云科技提供了多种有效工具，比如智能提示路由（Intelligent Prompt Routing）能在保持回答质量的同时把成本最高压低30%，另一个工具则是模型蒸馏(Model Distillation)，通过将大模型蒸馏为一个小模型，运行速度最高可提速500%，成本最高降低75%，而准确率几乎不受影响。
数据和知识层是企业AI项目成败的关键。储瑞松坦言，很多企业AI项目失败的主要原因，是“数据还未就绪”就上Agent，但如果厘不清单项任务的实际花费，实际将“任务部署”变成了“实验”。很多时候，Token是在“空烧”。因此，多年积累的自有数据与知识，是企业真正不可复制差异化竞争壁垒，当AI进行判定的时候，数据的准确性非常重要。
亚马逊云科技在数据和知识层的核心价值，正是为用户提供Zero-ETL、Amazon S3 Vectors等一系列完整专门面向AI的数据服务，可以将过去静态存储的数据变成AI可以理解和使用的数据和知识资产，为智能体提供相关、准确、新鲜且经过治理的高质量数据支撑。
第四层是Agentic平台层，亚马逊云科技在这一层的产品是Amazon Bedrock AgentCore，它的核心价值在于提供统一智能体运行环境和开发工具，同时也提供规则、评估和治理能力。简而言之，便是支持大规模智能体的开发、部署、管理与迭代，甚至包括监控、评估、改进全过程，企业可以统一、高效地管住智能体的生命周期，而不必为每个环节各搭一套工具。
具体落到Token账单上来看，是当一个企业里成百上千个智能体同时在跑时，用户可以在这个“智能体管理空间”里清楚地看到，哪个Agent在空烧Token，哪个绕了远路，哪个任务的花费已经超过它所创造的价值……这也是企业智能体应用从概念验证走向生产的分界线。
最上面一层是智能体与应用层，在这一层，亚马逊云科技提供Kiro、Amazon Quick、Amazon Connect等一系列开箱即用的解决方案，既有软件开发、IT运维、知识工作者、客户服务等跨行业的通用场景，也有能带来最大业务价值的行业定制应用。
对企业而言，这些解决方案最直接的结果是省了“从零造轮子”的成本。众所周知，如果企业自建一个智能体，光开发和反复调试就要烧掉大量的人力和Token，而运用Kiro等工具，无需从零构建，便可以快速将Agent能力应用到实际业务中。
储瑞松进一步指出，五层技术栈的存在，最终都是为了最顶端的业务产出服务，安全、效果、性能和成本四个维度要贯穿始终，企业必须量化Agents带来的业务价值，无论是任务完成吞吐量、产出质量、每任务成本、交付周期，还是人力等效、客户满意度与营收增长等偏宏观的指标。
当Agentic AI爆发的拐点已至，一家云厂商不一味强调AI能力，鼓励客户消耗Token，而是帮助企业“以终为始”，强调可衡量的业务产出，这恰是这场峰会最克制的地方。
哈啰的账本
这种克制，在哈啰身上得到了印证。
邓小白告诉记者，选择Kiro的原因之一是“省”，目前集团并没有对员工Token使用量设限，但在使用Kiro之前，Token的消耗曲线变成了一根拉满的弓弦。
但当哈啰集团整体使用Kiro之后，不仅比以往直接使用基础模型便宜很多，整体效率也得到了大幅提升。邓小白介绍，在工程质量要求高的复杂业务场景下，开发提效约50%；而在从0到1的创新场景下，开发提效高达67%以上。
“我们曾做过测试，某些方案的Token消耗量只有其他大模型的两成左右。”一位亚马逊云科技的展台工作人员告诉记者。
作为亚马逊云科技在Agent应用层亲自下场的AI编程工具，Kiro的招牌打法“规格驱动开发”（spec-driven development）本身也是一种克制。Kiro在编码前会先加一层结构化的规划，将需求、设计、任务等梳理清楚，从而让生成代码一次成功的比例更高，也让开发者的能力边界得以进一步扩展。
在展区，《IT时报》记者看到一个只有三个按键的小方盒，这是一名开发者仅靠Kiro便“手搓”出的Agentic Coding专属键盘，不需要键盘鼠标，通过语音输入便可以让Kiro自动编程、到淘宝上购买芯片、并写入代码，最后人需要做的，只是将空盒子和芯片组装起来。
或许，Kiro对于亚马逊的意义将在Agentic AI时代逐渐显现。自2026年5月7日Kiro国际上线后，亚马逊便宣布预计将在明年停止支持原有的开发者平台Amazon Q Developer。换句话说，这家以卖底座为主的云厂商，对于Kiro成为AI时代的开发者入口，寄予厚望。
不是万物皆可Agent
如果说，克制之于成本，是将Token物尽其用，那么，当视角转向用户应用层时，问题的核心便从“如何节省”转向“是否值得”。很显然，并非所有场景都适合Agentic，在用户体验和AI浓度之间，本身便需要审慎权衡的克制。
展台上，记者看到一个“开箱即用的电商Agent”，演示的场景是：当用户提出希望知道两个产品的不同时，Agent开始思考……就像常见的ChatBot那样，罗列出整个思考过程，对比一条条异同，最后给出完善的建议。
然而，真实场景中，消费者有如此耐心吗？
“Agentic AI不仅是技术创新，更是业务变革。”储瑞松认为，开启智能体项目的企业，一定要选择合适的Agentic场景，起始场景无需过于复杂，但要对企业有切实的价值。
“必须要有非常明确的目标，不能为了用AI而去用AI。”邓小白坦承，哈啰在首页这类核心场景引入AI推荐上一直“非常克制”，只有明确痛点后，才会制定计划、设计解决方案，并最终引入AI。
大多数时候，用户的诉求是泛需求，意图并不明确，直接采用对话式推荐，“可能并非最优选择”。据记者了解，目前哈啰的做法是把搜索、推荐、筛选、对话几种形态揉在一起，由大模型动态挑出最合适的交互方式，只有识别到极其明确的意图时，比如发现用户最近频繁骑共享单车，才会触发AI推荐，比如定向推荐次卡或月卡等对应产品。
这也是为什么哈啰单车选择了亚马逊云科技的原因之一。邓小白表示，实际业务中，不可能在所有场景，或者同一个场景的所有用户请求中，都无差别地使用同款大模型。因此，在Amazon Bedrock上，哈啰建立了一套模型切换机制，对于准确率要求极高的场景，哈啰会调用性能更强、成本较高的模型；而对于标准化程度高、确定性强的场景，会切换到更具性价比的模型。
无论是成本克制，还是应用克制，当拐点来临，站在浪潮之巅的企业都在思考：AI不是用得越多越好，而是用得越对越好，而这或许才是“AI构建的理想之地”。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

字节跳动CEO梁汝波的这封信，给所有管理者提了个醒

亚马逊云科技峰会观察：克制的AI Agent的理想之地

马斯克发大合照：特斯拉弗里蒙特工厂Optimus产线或已就绪

字节跳动计划巴西投资390亿美元建设数据中心综合体

违规收集个人信息，32款APP及SDK被通报

今日大厂员工事：美团限用豆包大模型；鹅厂token机制更新；百度朱广翔晋升

全站最新

海豹08登场！比亚迪以深厚技术储备，精准回应市场多元需求

上汽智己LS9 Hyper 7月16日登场，全线控转向+3秒级加速重塑大SUV体验

道奇Charger 60周年献礼，Purple Haze迷雾紫车漆引领个性新风潮

鑫源向上V6：小众品牌切入货运刚需市场，能否扛住大牌冲击？

热门推荐

0人报名、无人出价，申港证券逾9800万股股权首拍遇冷，券商牌照“不香了”？

江西生物跌破发行价：超90%收入来自单一产品，预计2026年净利润大幅下滑

雪糕夏季遇冷：批发商称销量近乎减半，现制冰激凌抢走高端市场

中集集团等在盐城成立海洋战新产业股权投资基金出资额10亿

中视新科破产清算：旗下“新科娘少女形象”等17项著作权7月5日开拍

马斯克称Optimus人形机器人初期生产缓慢，需从零构建供应链

两分钟上手生产级语音智能体：xAI 发布 Voice Agent Builder 测试版

告别“一刀切”：Cloudflare 推出精细化 AI 流量管理，筑起网站变现护城河

丰田5月在华销量暴跌超三成燃油车成最大拖累

字节跳动CEO梁汝波的这封信，给所有管理者提了个醒

亚马逊云科技峰会观察：克制的AI Agent的理想之地

马斯克发大合照：特斯拉弗里蒙特工厂Optimus产线或已就绪

字节跳动计划巴西投资390亿美元建设数据中心综合体

违规收集个人信息，32款APP及SDK被通报

今日大厂员工事：美团限用豆包大模型；鹅厂token机制更新；百度朱广翔晋升

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

亚马逊云科技峰会观察：克制的AI Agent的理想之地

大厂集体掉头

一张“用好Token”的地图

哈啰的账本

不是万物皆可Agent