![]()
机器之心报道
编辑:泽南、陈陈
最先进的 Agentic AI,现在是做什么工作的?
在搞太空探索。
上个月,蓝色起源「新格伦」重型运载火箭首次成功实现了一级回收,在与 SpaceX 的竞争中迈出了重要一步。Agent 在其中起到了举足轻重的作用。据说,蓝色起源全员都在用生成式 AI 工具提升效率,为此他们甚至构建了一个叫 BlueGPT 的内部平台。

BlueGPT 背靠亚马逊云科技的 AI 全家桶,有了它,蓝色起源的工程师在用 Agent 写代码,新格伦火箭在用 Agent 加速火箭发射的审批流程,供应链在用 Agent 沟通物料修改,航电部门在用 Agent 开发飞控软件……总体工程速度提升了 75%。原来贝索斯的新格伦追上马斯克的猎鹰,背后原因竟是这样。
这还只是新时代的冰山一角。今天凌晨,亚马逊云科技一年一度的 re:Invent 大会上,全世界都见证了「云计算一哥」一个又一个重量级新发布,大部分都是面向 Agentic AI 的。
在昨天、今天的 Keynote 中,亚马逊云科技向全球传递了一个明确信号:AI Agent(智能体)的时代已经全面开启。现在不跟上,可就要落后了。
全流程短板补齐后
Agent 能力实现爆发
亚马逊云科技认为,Agent 的出现正在让我们的轨迹发生变化,它对业务产生的影响或许就像当年互联网和云服务出现时一样大。
Agent 与传统大模型助手的根本区别在于其具有自主行动能力。它们不仅回答问题,还能主动帮用户执行任务,让工作流程自动化,并能在复杂环境中动态推理。如今在某些任务上,已有 AI Agent 将工作效率提高了 10 倍,这就让人们有了更多的时间可以专注于创造性的工作。那么问题来了 —— 能让所有工作都获得这样的效率提升吗?Agent 又从何而来?
在当地时间周三 2025 re:Invent 的演讲中,亚马逊云科技 Agentic AI 高级副总裁 Swami Sivasubramanian 着重介绍了快速构建 Agent 的能力:
![]()
他先让我们回忆了一下:你当初写下第一行代码时是怎样的感觉?那时我们充满创作欲,仿佛能做到任何事。Agent 时代,我们正在找回这种创作的自由。
想让 Agent 真正落地到大规模生产阶段,是一件很有挑战的事。首先,如何快速、大规模地部署 Agent?
亚马逊云科技发布了开源、模型驱动的 AI Agent 框架 Strands Agents SDK 的更新。首先,Strands Agents SDK 被引入了TypeScript平台,让开发者能够使用 Amazon CDK 在 TypeScript 中构建完整的 Agent 堆栈。
Strands 同时新增了对边缘设备的支持,人们现在可以在小型设备上运行自主的 AI Agent,覆盖从汽车、游戏机到机器人等领域的大量应用场景。
全托管生成式 AI 服务 Amazon Bedrock 上,用于帮助开发者构建生产环境 Agent 的 AgentCore 新增了三大能力。
其中,Policy让开发者可以使用自然语言为 Agent 操作设定清晰的边界。Evaluations则提供 13 个预置评估器,可评估 Agent 行为的正确性和安全性等维度,并持续对实时交互进行采样,以便在性能下降时触发警报,从而简化日趋复杂的 Agent 行为监控。
如果想让 Agent 更加实用化,迈过能执行复杂工作的门槛,一个必须要解决的问题在于长期的记忆能力。如何让模型能够记住过去的交互、学到的知识?
AgentCore Memory引入了全新的情景式功能,能够帮助 Agent 从过往经验中(上下文、推理、操作和结果)学习,让 AI 随着时间的推移逐步构建对用户的连贯理解,进而输出更加智能化的决策。
![]()
随着 Agent 构建变得越来越容易,下一个重要问题将随之而来:如何让它们更高效?
解决这个问题要从构建定制化的模型开始,Swami 表示,「如今的基础 AI 模型拥有足够高的智商,能够处理复杂易用、多步骤的推理以及突发情况,但它们并非总是最高效的。而 AI 的效率有关成本、规模、延迟与敏捷性。」
在他看来,能够高效执行特定任务的定制化高质量模型将成为主流。为此,亚马逊云科技推出了一系列旨在降低 AI 模型定制的复杂性和成本,同时「无需大量博士参与」的工具。
在 Amazon Bedrock 上,亚马逊云科技提出了全新的模型定制工具,其中强化学习微调(RFT)后的模型与基础模型相比准确率可提升 66%,大幅降低了模型定制化的门槛。针对特定任务的专业化训练Model Distillation旨在创建更小更快的模型,能够带来 10 倍的速度提升,同时保留 95-98% 的性能。
![]()
无服务器模型的定制功能是 AI Agent 引导的定制体验,只需自然语言交互即可定制模型。Amazon Nova Forge 开创了「开放式训练」的先河。它让企业能够在模型训练的每个阶段直接将专有数据与 Amazon Nova 基础模型原有的数据相融合。最终生成的定制模型不仅融合了 Amazon Nova 的全部知识和推理能力,还能深入理解了每个特定业务。
![]()
接下来还要支持的基础模型还包括 DeepSeek、GPT-OSS、Llama 和千问。现在,模型定制可在数天内完成,而不再需要数月。
而 Amazon SageMaker HyperPod 则缩短了重启周期,无需人工干预,几分钟内即可从模型训练故障中恢复,在拥有数千个 AI 加速器的集群上能实现 95% 的训练集群效率。Amazon SageMaker HyperPod 则简化了模型训练和部署的基础设施管理,最多可降低 40% 的成本。
最后,在生产环境中大量部署的 Agent,如何才能减少幻觉,值得我们信任?
在 AI IDE Kiro 上,工程师们结合大语言模型和自动推理(Automated Reasoning)数学逻辑验证的方法确保了 Agent 行为的正确性。
亚马逊云科技还提出了一套用于构建和管理可靠 UI 工作流程 AI Agent 的全新服务 ——Nova Act。它由定制版 Amazon Nova 2 Lite 模型驱动,为构建和管理自动化浏览器任务的代理集群提供了最快捷、最简便的途径。Nova Act 在早期客户工作流程中实现了高达 90% 的可靠性。
借助 Nova Act,开发者可以在几分钟内通过无代码的自然语言 Prompt 快速构建 Agent 原型,然后在熟悉的 IDE(例如 VS Code)中不断完善,最后部署到云环境上。
有多可靠呢?亚马逊云科技在现场展示了人机协作的反电诈,Agent 帮你识别信用卡盗刷:

在检查信用卡交易的过程中,Agent 可以合理提出怀疑,收集证据进行推理,还能直接帮你报警。现在,你可以更加自然地相信 Agent 为你办的事了。
从易用的 Agent 工具,高效率的模型定制化,到先进的可靠性技术,亚马逊云科技提出的一系列 AI 工具已经实现了从「如何构建」到「如何快速构建」的转变,让开发者们能够把宝贵的时间用在实践想法,创造新事物上。可谓是给未来的全新生产环境打好了基础。
这样的能力背后,是从最底层硬件算力开始,打造的一整套完善且独一无二的体系。
如何构建好 Agent?
分四步走
当地时间本周二,亚马逊云科技首席执行官 Matt Garman 在 2025re:Invent 大会第一天的 Keynote 上,深入介绍了自家最近各个维度的创新突破。

在长达两个小时十分钟的 Keynote 上,Matt Garman 花费了 50% 时间都在讲一件事:如何构建好 Agent。
在他看来,想要让 Agent 形成生产力,整条技术栈主要分成四大部分:算力基础设施、推理平台、数据以及构建 Agent 的工具链。
![]()
首先是算力基础设施。要构建最强大、最具扩展性的 AI 基础设施,必须拥有高度可扩展且安全的云平台。实现这一点并不容易,意味着需要在硬件和软件的每一层持续优化,而这正是亚马逊云科技的优势。
亚马逊云科技是目前运行 NVIDIA GPU 的最佳场所,在合作过程中,亚马逊云科技积累了丰富的大规模 GPU 运行经验。
在此基础上,亚马逊云科技进一步推出了 P6e 和 P6 两个实例,其中 P6e GB200 超级服务器相比上一代 P5e,计算性能提升超过 20 倍。亚马逊云科技还宣布推出全新的 P6e GB300,以满足最苛刻的 AI 工作负载。
在芯片方面,亚马逊云科技推出了最新的 Trainium 3 (首个云端 3nm 芯片)芯片实例,Trn3 UltraServers 正式全面可用。与上一代相比,新一代在关键性能上实现大幅跃升:计算能力提升 4.4 倍、内存带宽提高 3.9 倍、每瓦可处理的 Token 数量增加 5 倍,为大规模 AI 训练与推理带来显著的效率与能效优势。
![]()
除此之外,亚马逊云科技预告了全新的 Trainium4 芯片。作为最新一代 AI 加速芯片,它在关键性能指标上实现了大幅跃升:在 FP4 精度下提升 6 倍的算力,内存带宽提升 4 倍,内存容量翻倍,并通过 NVLink Fusion 与 UALink 支持更大规模的集群互联。
第二是推理平台。Amazon Bedrock 为用户提供了丰富而多元的模型选择,覆盖开源模型、通用模型以及专用模型等多种类型。此次,Amazon Bedrock 引入了多款最新开源模型,包括谷歌的 Gemma、NVIDIA 的 Nemotron,以及来自 KIMI 和 Minimax 厂商的最新模型。Mistral AI 的两款全新开源模型 Mistral Large 3 和 Ministral 3(3B、8B、14B)也已上线 Amazon Bedrock,从而为企业构建生成式 AI 应用带来更广泛、更灵活的选择空间。
![]()
除了引入大量第三方模型外,Amazon Bedrock 还集成了自研的基础模型系列 Amazon Nova。如今,Amazon Nova 家族全线迭代至 Amazon Nova 2,在延续强大智能能力的同时,将成本效率与低延迟表现大幅提升。当前,Amazon Nova 2 已推出四个版本:
Amazon Nova 2 Lite:快速、高效、经济的推理模型,适用于多种通用工作负载;Amazon Nova 2 Pro:面向高度复杂任务,具备更强的推理能力,是迄今最智能的 Amazon Nova 推理模型,适用于高度复杂的工作负载;Amazon Nova 2 Sonic:下一代语音到语音模型,提供行业领先对话质量,改进延迟,大幅扩展语言支持;Amazon Nova 2 Omni:业界首个真正统一的多模态模型,支持文本、图像、视频、音频输入,并支持文本和图像输出。
![]()
在基准测试中,Amazon Nova 2 Lite 性能比肩 GPT-5 Mini、Claude Haiku 4.5 、Gemini Flash 2.5 等业界前沿模型。Amazon Nova 2 Pro 也表现亮眼,在指令遵循、Agentic 工具使用等基准上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5。
第三是数据。亚马逊云科技推出的全新服务Amazon Nova Forge,提出了开放训练模型的概念。
![]()
第四部分是构建 Agent 的工具链。亚马逊云科技的先进 Agentic 平台 Amazon Bedrock AgentCore,可以大规模地安全构建、部署和运行高性能 Agent。为了确保 Agent 行为的安全性与合规性,亚马逊云科技开放了Policy、Evaluations功能,可以助力开发者构建可用于生产环境的 Agent。
基础搭好了,接下来是实践。
亚马逊云科技提出,要更快地把 Agent 加入到日常工作中来。Amazon Quick作为一款面向企业的智能 Agent 应用,不仅能够帮助用户进行深度分析、数据可视化和工作流自动化,还通过企业级的安全与隐私标准确保信息的可靠性与合规性。
![]()
在人们关心的 AI 编程领域上,亚马逊云科技重点展示了构建、扩展、长期运行 Frontier Agent 能力。对此提出了三大 Agent:
Kiro Autonomous Agent:作为虚拟开发者,能够独立完成任务并在工作中持续学习;Amazon Security Agent:承担虚拟安全工程师角色,在应用设计、代码审查与渗透测试等环节充当安全顾问;Amazon DevOps Agent:帮助开发者,尤其是负责值班的工程师,主动发现系统故障或潜在缺陷。
从底层算力到推理平台,从数据到 Agent 工具链,再到面向企业实际落地的现代化与生产力产品,亚马逊云科技在今年 re:Invent 上勾勒出的,是一个面向 AI Agent 全面普及时代的完整蓝图。
数十亿 Agent 的未来
来得会比我们想象要快
作为技术全球化的推动者,亚马逊云科技每年的新发布都会受到开发者、企业的关注。在 AI 时代,其业务增长的速度也非常惊人。
2025 re:Invent 大会上,亚马逊云科技给出了一串数字:作为云基础设施的核心,Amazon S3 存储了超过 500 万亿个对象,每秒平均处理 2 亿次请求。而 AI 服务 Amazon Bedrock 目前为全球超过 10 万家企业提供 AI 推理支持。由此推动,亚马逊云科技的年收入已达 1320 亿美元,相比去年增长了 20%。
这不只是业绩展示,更是在指引 AI 时代的新方向 —— 当全球企业加速拥抱生成式 AI 时,这家云巨头已经准备好了从芯片到应用的全套工具箱。在 Matt Garman 的想象中,未来每个公司、每个行业中都会活跃着数十亿个 Agent,每个组织、每个人都能从人工智能那里获得真实的价值。
新时代的大门已经打开,门后的世界,正在被重新定义。
2025 亚马逊云科技re:Invent 中国行即将启幕!12月18日开始,北京、上海、深圳、成都四城线下巡演及线上专场将同步开启,无论你是云计算新手还是技术老兵,都将从高阶演讲、实战内容、技术分享和专家互动中受益。立即注册,抢占席位,把握Agentic AI时代的新机遇!
https://events.amazoncloud.cn/reinvent-online-20251218?trk=811631fa-539a-41c3-8fed-f23e4f9919dc&sc_channel=el





京公网安备 11011402013531号