智东西
作者 ZeR0
编辑 漠影
全球最大云计算巨头亚马逊云科技(AWS),刚刚掏出专为agents开发打造的秘密武器库!
智东西纽约7月16日报道,今日,亚马逊云科技纽约峰会盛大开幕。亚马逊云科技这次堪称掏家底,详解Agentic AI战略,连发五大Agentic AI开发利器,揭秘从基础设施、模型、agent框架到应用层的最新成果。
这个全球云计算“头号玩家”,给正值酷暑的纽约带来了一场干货爆棚的AI技术盛宴。智东西作为唯一受邀现场参会的中国媒体,从大会前排发来超全干货报道。
把agents门槛打下来这件事,亚马逊云科技显然动真格了。
最猛的一招,当属发布Amazon Bedrock AgentCore预览版,一次性放出7大核心AI agents服务,覆盖运行时、记忆、身份验证、网关、代码解释器、浏览器工具、可视仪表盘。
在与智东西进行深入交流时,亚马逊云科技Agentic AI部门的技术高管兼顾问Preethi CN告诉智东西,AgentCore将改变开发者的游戏规则,客户可以灵活选用这些服务,只需几行代码就可以将AgentCore集成到自家应用中。
亚马逊云科技Agentic AI副总裁Swami Sivasubramanian在会上宣布,亚马逊云科技的愿景是成为“构建全球最实用AI agents的最佳平台”,赋能组织大规模部署可靠且安全的agent。
此外,亚马逊云科技宣布三项利好AI生态的大事:
对亚马逊云科技生成式AI创新中心追加1亿美元投资,以用于未来两年建设,助力全球数千名客户提高生产力,改善客户体验。为超过6600所AWS Academy院校的学生免费提供AWS Skill Builder订阅级培训内容和AWS认证考试券,帮他们培养必备的AI技能。目标是在第一年内与全球270万名学生和早期职业人士互动。推出AWS AI League,为开发者提供高达200万美元的亚马逊云科技积分,让他们可竞相运用生成式AI解决现实世界的挑战,同时获得微调、模型定制和快速工程方面的实践经验。表现最佳的开发者将获得全额资助的AWS re:Invent大会之旅和现金奖励。
此次峰会期间,中国赞助商Zilliz和TiDB(Powered by PingCAP)亮相。亚马逊云科技承诺发挥充分发挥其全球资源与技术优势,推动中国企业迈向更广阔舞台,收获国际曝光与商业机遇。
一、AI agents正在颠覆软件,成功离不开四大要素
主题演讲刚开始,大屏幕明晃晃打出一行大字:“AI agents服务即软件。”
“这是一场多维度的重大变革,”Swami Sivasubramanian说,“它颠覆了软件的构建方式,也给软件的部署和运营带来了一系列新的挑战,而且可能最具影响力的是,它改变了软件与世界互动的方式,以及我们与软件互动的方式。”
一个成功的AI agents蓝图应该是什么样子?
Sivasubramanian提出四大要点:模型与应用能力,构建所需的工具与框架,部署和操作服务,发现、发布与获取能力。
亚马逊云科技在Agentic AI领域所做的一切遵循四大核心原则:
1、将敏捷性作为竞争优势:使构建的系统能快速适应未来变化,兼具灵活性和开放性,可随时整合新出现的模型,连接到专有数据源,并与现有工具无缝集成。
2、发展Agentic时代的基础:帮助企业构建安全、可靠、可扩展的agent架构,引入安全与信任考量,确保高度可靠和可扩展性,具备安全访问、处理和学习数据的能力,能实现跨不同环境的多agents和工具之间的无缝协调。
3、通过模型选择和数据提供出色成果:既提供模型选择自由,又能将模型与专有数据相结合,将通用AI转化成拥有深厚领域专业知识的系统。
4、部署改变体验的解决方案:提供可立即部署的Agentic解决方案。
二、模型:Amazon Nova能按需定制了!更准确、更灵活、更全面
Agent能力有多强,首先看基础模型。
说到模型,则必然绕不开亚马逊云科技的生成式AI模型“货架”——全托管生成式AI应用构建服务Amazon Bedrock。
亚马逊云科技将Amazon Bedrock称作“构建和扩展生成式AI agents最简单、最快速的方式”。
在这个平台上,用户可以选择来自不同供应商的多个领先模型,定制数据,有应用安全护栏和负责任的分析性AI检查器,能够优化成本、延迟、精度,构建和调度agents。
论创新速度,过去12个月,Amazon Bedrock已经发布超过170项功能和能力;论敏捷性,Amazon Bedrock是首个提供无服务器DeepSeek-R1的大型云服务商。
亚马逊云科技还与Meta联手,助力初创公司在Llama上构建AI应用,为30家北美创企提供每家最高20万美元的亚马逊云科技积分,以及Meta和亚马逊云科技专家的技术支持。该计划为期6个月,申请截止日期为今年8月8日。
亚马逊通用AI高级副总裁兼首席科学家Rohit Prasad谈道,其自研模型Amazon Nova系列自去年推出至今,已坐拥8款基础模型,包括:
Micro(低成本文本模型)Lite(低成本多模态模型)Pro(高性能多模态模型)Canvas(图像生成)Reel(视频生成)Act(能构建在网页浏览器中完成任务的agents)Sonic(语音转语音,能构建具备拟人语音功能的agents)Premier(最强成员,教师模型,为复杂推理任务而生,多agents协作的“超级大脑”)
超过10000名客户已使用Amazon Nova系列模型显著降本增效。
Prasad分享了“两堂课”:
第一堂课:强大的开箱即用准确性是必要的,但还不够。
亚马逊云科技推出全新Amazon Nova定制选项,以满足更精细的微调或定制需求。
Amazon Sagemaker AI为Amazon Nova模型提供了强大的自定义功能套件,并支持SageMaker HyperPod,使客户能按需调整Nova模型。
Nova模型现在提供了适用于任何专有模型系列的全面模型定制功能套件,实现在整个模型开发生命周期中定制模型的灵活性,包括预训练和后训练,包括微调和校准,并支持参数高效微调(PEFT)和完全微调。
使用监督微调(SFT)、直接偏好优化(DPO)、近端策略优化(PPO)、人类反馈强化学习(RLHF)、持续预训练(CPT)、知识蒸馏等技术,客户可以创建针对其用例优化的Nova模型。定制后,这些模型可直接部署到Amazon Bedrock,无缝集成到agent系统和其他AI应用中。
亚马逊也在训练自家模型,并针对特定的agent用例进行优化。
Nova Act是一个经过训练的AI模型,用于在Web浏览器中执行操作。客户可使用Nova Act SDK构建自己的浏览器自动化agent。Nova Act SDK的增强功能将带来额外的安全性和访问控制,帮助开发者将其原型投入生产,并构建能在Web浏览器中可靠执行操作的agent。
该SDK现已提供研究预览版,使用AgentCore Browser实现可扩展的云端浏览器执行。
Prasad说,其定制选项提供“最全面的定制和按需推理定价”。
例如,MIT CSAIL(麻省理工学院计算机科学与人工智能实验室)使用Nova定制选项,将材料生成的正确率提高94%,材料分析错误率减少95%。
第二堂课:Agentic AI需要一个全新的可靠性水平。
亚马逊云科技Amazon Nova Act模型可构建在web浏览器中执行操作的agents,为复杂的Ul交互量身定制,提供细粒度的安全和访问控制特性,任务完成率超过90%。
三、框架:Strands Agents V1.0发布, 让Agents更易协作
过去两年,出现很多帮助构建agents的开源框架,如CrewAI 、LangGraph、LlamaIndex、Strands Agents SDK等。
Strands Agents具备全环境运行能力,支持任何具备推理与工具使用能力的模型,能灵活适配从简单到复杂的agent应用场景,大幅简化agent开发流程。开发者可在Strands Agents中深度定制agent行为。
今日,AWS宣布将其开源SDK Strands Agents更新为——Strands Agents V1.0。
Strands Agents V1.0能显著简化创建AI系统的过程,让多AI agents协同工作,解决复杂问题。
它可访问本地工具,具有灵活的编排方式,支持MCP和A2A协议,并与许多亚马逊云科技服务集成,支持开发者轻松构建多agents系统,在agent对话上具有数据持久性,且数据可跨多个对话保存。
以前需要耗费几个月的复杂任务,用这项技术后能缩短到几小时。这使得企业能构建协调一致的AI助手团队,处理客户服务、数据分析和其他复杂任务。
利用这款SDK,开发者只需编写几行代码,就能快速构建并运行AI agents,并可在完成本地测试后直接部署上云。
四、Amazon Bedrock AgentCore:7个开发利器,兼顾开源灵活性和企业级安全性
将AI agents投入生产,困难重重。
对此,亚马逊云科技推出Amazon Bedrock AgentCore预览版,这是一套全面的企业级服务,采用模块化和可组合设计,可帮助开发者使用任意框架和模型,快速、安全地大规模部署和操作AI agents,从而弥合AI agents从概念验证到实际生产的关键差距。
(1)AgentCore Runtime:提供完全的会话隔离和低延迟无服务器环境,为每个会话提供专用的计算环境和内存隔离,防止agent之间的数据泄露,支持长达8小时的长时间运行工作负载,用户可使用任意框架、协议、模型,安全地运行多模态工作负载;具有高度可靠性,具备检查点和恢复功能,有助于确保在发生意外中断和故障时能够平稳恢复,并能自动处理从零到数千个并发会话的扩展,无需进行容量规划和基础设施维护。
(2)AgentCore Memory:管理会话与长期记忆,提供对AI agent记忆内容的完全控制,使开发者可以轻松构建上下文感知agent,提供业界领先的准确性,同时支持多轮对话的短期记忆和跨会话持久的长期记忆,并能在协作agent之间共享记忆存储。
(3)AgentCore Identity:提供无缝且安全的agents身份验证,支持用户通过与现有的身份提供商集成来调用agents,通过临时、细粒度的权限和基于标准的身份验证,提供跨亚马逊云科技服务以及第三方应用程序和工具的安全agent访问,与领先的身份提供商(如Amazon Cognito、Microsoft Entra ID、Okta等)以及流行的OAuth提供商(如GitHub、Google、Salesforce、Slack等)兼容。
(4)AgentCore Code Interpreter:提供安全的沙盒环境来运行agents生成的代码,支持开发者使用特定实例类型和会话属性自定义环境,以满足安全要求,使agents可跨多种语言执行代码,专为解决复杂端到端任务增强准确性。
(5)AgentCore Browser Tool:提供了快速、安全、基于云的Web浏览器实例,使agents能够大规模地与基于Web的服务交互,并执行表单填写、浏览网站等复杂Web任务。
(6)AgentCore Gateway:简化了工具集成和可发现性,使开发者能以最少代码将现有的API、Lambda函数、服务转换为与agent兼容的工具,提供跨协议(包括MCP)和运行时发现的统一访问,实现无缝集成。
(7)AgentCore Observability:通过由Amazon CloudWatch提供支持的内置仪表板和与监控堆栈集成的标准化遥测技术提供实时可见性,可实时追踪和显示端到端agents执行情况和关键运营指标,并与OpenTelemetry兼容。
这些服务可以独立使用,也可以协同组合,并可与开源或自定义AI agents框架协同工作,使开发者能灵活地维护其首选工具,同时获得企业级功能。开发人员可使用AgentCore SDK来将这些服务集成到现有代码中。
Itaú Unibanco、Innovaccer、Boomi、Box和Epsilon等客户已开始试用AgentCore。
Sivasubramanian相信,未来是建立在使所有agents和工具能够协同工作的基础上的。
五、应用:AWS Marketplace交易市场上新,推出新Agents和工具
亚马逊云科技不仅为agents开发提供利器,还使买卖交易更加方便。
会上,亚马逊云科技推出AWS Marketplace中的AI agents和工具,让客户可以便捷地查找、购买、部署和管理来自领先提供商的AI agents和工具,从而快速推进AI计划。
AWS Marketplace提供来自亚马逊云科技合作伙伴的精选agents、工具、解决方案和服务的集中目录。其全新的基于API的部署方法,可帮助用户简化与支持MCP和A2A的其他agents和工具的集成。
这些agents可在受信任的AWS服务上运行,也可以在用户的AWS环境中运行,用户可控制安全性和访问权限,亦可在AgentCore上部署精选的预构建agents和工具。
使用AI agents和工具的用户将能利用这些易于集成的解决方案更快构建,并通过专注于构建、维护和扩展agents的专业服务来制定AI战略。
六、基础设施:推云对象存储Amazon S3 Vectors,支持大规模向量查询
拥有对的模型后,需确保它可以与组织的专有数据和当前数据交互。向量已成为AI模型访问数据的主要且最快方式之一。
目前存储向量嵌入的成本迫使组织将其AI系统限制在最新数据上,限制了agents的潜力。为了改变这一点,AWS推出Amazon S3 Vectors。
Amazon S3 Vectors是首个原生支持AI工作负载向量的云对象存储,拥有Amazon S3的所有特性,可为任何对象提供相同的持久性、可扩展性和经济效益,同时原生支持大规模向量存储和查询。
与传统方法相比,客户可使用S3 Vectors将向量的存储和查询成本降低90%,以经济高效的方式保留和使用大型向量数据集来增强AI性能以及S3数据的语义搜索结果。
S3 Vectors保持亚秒级查询性能,使agent能够记住更多内容、进行更深入的推理,并从每次客户交互、文档和业务洞察中保持全面的背景信息。
它直接与Amazon Bedrock Knowledge Bases集成,以实现经济高效的RAG应用,并与Amazon OpenSearch Service集成,以实现分层向量策略,简化向量搜索操作并降低成本。
七、全新AI IDE登场,简化与Agents协作体验
亚马逊云科技还展示了一些Agentic AI解决方案。
比如前两天刚公布的全新Agentic IDE——Kiro预览版。
这是一款面向开发者的全新AI IDE,旨在简化软件开发项目中与AI agents协作的体验。Kiro擅长“氛围编程(vibe coding)”,能通过specs和hooks等功能,将原型应用到生产系统中。
无论是简单还是复杂任务,Kiro都能将提示词转化为详细的规范,再转化为可用的代码、文档和测试。其agent可帮助解决具有挑战性的问题,并自动执行生成文档和单元测试等任务。
Amazon Q Developer是亚马逊云科技三层AI架构顶层应用层中的一款全能型AI开发助手,不仅具备代码补全、agent交互式编码、MCP协议对接等基础功能,还提供/test、/doc、/review等agent能力,可帮助开发者在整个软件生命周期内自动生成测试用例、编写文档、完成代码审查等。
AWS Transform部署专门的AI agent来自动执行复杂的现代化任务,如代码分析、重构和依赖关系映射,从而显著缩短企业工作负载迁移的项目时间。其针对.net迁移、大型机、Java等场景提供定制化知识库,结合Amazon Q的MCP工具,保障安全可靠的现代化改造,帮企业实现灵活部署和降低成本。
八、参观Builder Studio:视频极速定位、创意秒成素材、机器狗秀口才
在纽约峰会前一天,智东西等少数国际媒体到曼哈顿中心参观了占地8000平方英尺的创新空间亚马逊云科技Builder Studio,了解许多有趣又有用的新兴AI应用案例。
Amazon Bedrock中最新上线的模型来自多模态基础AI模型创企TwelveLabs AI。它通过同时处理视觉、音频和文本元素,将视频库转化为可搜索、可操作的资产,以便客户通过自然语言提示近乎即时地发现和处理内容。
在参观亚马逊云科技Builder Studio期间,TwelveLabs AI展示了其进行视频搜索与分析的两个核心模型,一个模型能根据语言描述精准定位视频片段,另一个模型能快速提炼视频内容、获取有用信息。
在加速产品创意和设计流程方面,拍张玩具狗的照片,就能让AI基于这只狗的外观给汽车做个营销创意大片;或者选择“大胆”、“动感”、“高端”、“运动鞋”等提示词,在屏幕上自由绘图、涂抹颜色,点击“广告”按钮,即可基于这幅图像生成适用于不同媒介的营销素材。
手写几个关键字段,拍照上传,FormAssist就能利用文档处理和生成式AI技术,将手写内容变成一个更完整、更专业的表单,背后已经自动搭建好前端UI、数据库和整个ETL数据流。提交填写内容后,这些信息会保存到DynamoDB数据库里。
今天峰会的主角AI agents自然在演示之列。与按固定顺序执行的传统工作流不同,Agentic工作流由编排agent统一决定何时、如何使用agents和工具。在演示中,Agents完成一系列信用分析操作,并生成了一份漂亮的财务分析报告。
波士顿动力开发的仿生机器狗Spot也秀出了基于Amazon Nova Sonic模型的实时语音对话交互能力,可理解、回应、执行命令。
据工作人员透露,亚马逊云科技正在开发一种Agent控制系统,让Spot自动理解从未被编程过的新任务,通过调用SDK文档、生成代码、实时运行来完成任务。
结语:站在AI创新前沿,推动Agentic AI转型
过去,亚马逊云科技为云计算的安全性、可靠性和数据隐私树立了标杆。如今,其雄心正从生成式AI扩展向Agentic AI,通过帮助客户简化构建agents的流程,进一步巩固其作为全球最大云服务巨头在技术领先性上的主导地位。
对于所有云巨头来说,Agentic AI都是一个巨大的商机。与单个大模型相比,多agents能够执行更复杂多元的任务,会消耗远多于其他AI应用的token和计算资源。根据Gartner的预测,到2028年,15%的工作决策将由Agentic AI自主做出。有了agents,人类能减少重复性工作,更多地专注于负责任的设计、战略思考和创新创造。
AI agents的能力依赖出色的基础模型。有了基础模型,还需构建新的agents架构、软件系统,为此需要一组新的工具和框架。当前在生产中大规模部署和操作agents仍然相当困难,需要发布和获得agents的新方法,以便其他agents和其他人可以发现和使用它们。
从今日的发布来看,亚马逊云科技旨在成为构建和部署agents的最佳平台,正在扩展agents能力、深化与初创企业的合作、推进前沿工程部署、扩大合作伙伴计划,以安全、负责任和具有成本效益的方式,帮助客户将AI应用落地到生产环境中,以从中获得商业价值。