当前位置: 首页 » 资讯 » 科技头条 » 正文

算力即收入:黄仁勋2026台北GTC演讲,完整版来了

IP属地 中国·北京 编辑:周伟 划重点KeyPoints 时间:2026-06-01 22:09:20

作者|林易

编辑|重点君

6月1日,在2026年的英伟达GTC台北大会上,黄仁勋用一句话定调了AI行业的新范式:

AI已经从单纯回答问题的大语言模型阶段,正式跨入能够自主观察、推理、规划并调用工具的Agentic AI时代。

在黄仁勋看来,智能体正在彻底改变传统的计算模式。过去我们习惯于运行传统操作系统中的软件,而现在的应用形态已经变成了由大模型、控制外壳、工具和运行时共同构成的分布式系统。

这种全新计算模式的出现,意味着从底层的云端数据中心,到用户每天面对的PC电脑,再到企业级软件和物理世界的机器人,整个科技行业的软硬件架构都需要迎来一场深度重构。

这场发布会中,英伟达的所有新品,都在为一个目标服务:让海量的智能体在云端、个人电脑、企业服务器以及机器人体内,以更低的延迟、更低的成本高效运行。

因为在智能体时代,算力即收入(Compute is Revenue)。

我们整理了本次发布会四大核心产品矩阵的关键信息,以下是重点内容:

1. RTX Spark平台与N1X芯片:重构PC,开启端侧智能体时代

在端侧,英伟达与微软联手打造RTX Spark平台,重构PC形态。

RTX Spark是兼容Windows与CUDA的全新产品线,涵盖笔记本、台式机以及工作站。对于普通用户,它将成为一台24小时在线、免调用费的私人智能中枢,随时接管人们的数字生活。

驱动这一平台的是英伟达与联发科合作打造的N1X芯片。它采用台积电3nm工艺,单芯片封装了具备6144个CUDA核心的Blackwell RTX GPU(AI算力达1 Petaflop),集成了20核定制版Grace CPU,并配备了高达128GB的统一内存。

RTX Spark与N1X芯片打通了高负载端侧AI的最后一公里。无论是高帧率完美支撑快节奏的FPS与重度开放世界生存游戏,还是在游戏后台以毫秒级响应本地Agent的推理请求(如实时自动代码检查、自动三维建模渲染等),它都能轻松胜任。

未来的PC不再是点击运行软件的机器,而是私人专属的数字机器人,在保护用户隐私的前提下,深度整合跨应用的数据和工作流程。

2. Vera CPU:为智能体打造的超算工厂大脑

传统的CPU是为人类的指令习惯设计的,而Vera CPU则是首款专为缺乏耐心、要求极低延迟的智能体打造的处理核心。

Vera CPU配备了88个Olympus核心,单核具备惊人的10条指令提取性能。搭配LPDDR5X内存(1.2 TB/s带宽),且芯片内部实现了3.6 TB/s的无损互联网络,彻底解决了AI数据中心里GPU高频闲置等待CPU处理逻辑的严重瓶颈。

包含Vera CPU的Vera Rubin多机架级(pod-scale)智能体超算平台目前已全面进入量产阶段。

极低延迟换来的极高吞吐量,直接拉高了单瓦特能够生成的Token数量。在真实业务中,Vera CPU的智能体沙盒性能是传统x86的1.8倍,SQL数据库查询速度提升3倍。这不仅是技术的胜利,更是为云厂商和AI企业构建的最低Token生产成本的护城河。正如黄仁勋所强调的,在未来,数据中心将成为生产Token的AI工厂。

3. Neotron 3 Ultra模型与NVIDIA Agent Toolkit工具包:企业级AI的操作系统

为了让企业能够安全、高效地部署智能体,英伟达发布了全新开源基础模型Neotron 3 Ultra。

Neotron 3 Ultra在业内率先采用了SSM(状态空间模型)与MoE(混合专家模型)的复合架构。在性能上,运行速度相比传统大模型直接飙升5倍,推理成本大幅压缩30%。

同时,英伟达还推出了企业级AI工具包NVIDIA Agent Toolkit。这套工具包是英伟达向企业端抛出的商业变现杀手锏。高度依赖内容分发、精准广告产运以及复杂业务流自动化的企业,现在可以在保护核心商业数据的前提下,低成本私有化部署完全懂内部业务的超级智能体矩阵。AI将真正下沉到每天的商业流水线中干活。

4. Cosmos 3模型与Isaac Groot机器人:物理AI的新突破

Cosmos 3世界模型是一款混合Transformer架构模型,能够将计算机合成的视频、动作和语言转化为机器人能直接学习的第一人称物理规律。

Isaac Groot参考设计由Jetson Thor平台驱动,拥有31个躯干自由度和双侧各25个自由度的高精度Sharpa机械手,为研究人员提供了一个开箱即用的强大平台。

通过Cosmos 3和虚拟孪生平台的大规模合成数据喂养实体躯干,人形机器人走出实验室,进入大规模应用的理论与工程基石正式成型。这将改变工业制造、物流甚至家庭服务等领域的未来图景。

从底层的Vera CPU,到端侧的N1X芯片,再到企业级的Agent Toolkit和物理世界的Cosmos 3,英伟达的2026年全线产品发布,清晰地勾勒出了一幅以Agentic AI为核心的未来蓝图。在这场算力与智能的革命中,那些能够最高效地生成和利用Token的企业,将掌握通向未来的钥匙。

以下是黄仁勋2026台北GTC演讲实录:

1. 实用AI时代开启,智能体AI重塑生产力

欢迎来到GTC Taiwan。很高兴见到大家,回家真好。我这次把父母也接回了家,请大家为我的父母,以及我们赛前表演的台湾超级巨星们鼓掌。今天现场座无虚席,我们同时正向全台湾其他70个观影派对同步直播这场主题演讲。

今天有许多内容要与大家分享,也有许多合作伙伴需要感谢。我们在台湾的生态系统规模已经发展得极其庞大,令人难以置信。人们通常认为生态系统就是我们的软件栈,或是构建在NVIDIA计算系统之上的开发者生态系统。但NVIDIA的生态系统其实向上延伸到了我们在台湾的所有供应链,那是万物起始之地,向下则一直延伸到数据中心并最终触达终端用户。

今天我们将讨论这整个生态系统。台湾拥有世界上最丰富、最顶尖的供应链生态系统。这里有非常多优秀的公司和我最喜欢的生态合作伙伴,有太多人需要感谢。非常感谢大家的光临。

今年我们的业务正在以惊人的速度共同增长,据说台湾的年度GDP也将增长近10%,这简直不可思议。两年前我在这里谈到AI将从生成式AI演进到其他形态。如今下一波浪潮智能体AI(Agentic AI)已经到来,这也标志着实用AI时代的正式开启。

这意味着什么?以GitHub为例,软件编程是智能体AI首批落地的应用领域之一。这是一个极具价值的职业,全球有三四千万名专业软件开发人员以此谋生。在GitHub上,开发者下载软件并进行修改,然后将代码推送回去(commit)。2023年的commit数量是3亿次,2024年是4亿次,2025年是5亿次。而在2026年的前几个月里,这个数字几乎增长了三倍。

这三千万软件开发人员每年约有3万亿美元的薪资支出,支撑起了全球100万亿美元规模的产业。如今这3万亿美元的薪资创造了近三倍的产出,相当于实现了9万亿美元的生产力,这种差距是惊人的,这正是AI的潜力与承诺。

有人说AI会减少工作岗位,这完全是一派胡言。实际上软件工程师的数量正在增加。原因很简单,如果聘请一名软件工程师能产生价值9万亿美元的生产力,企业当然会想要雇佣更多人。这种惊人的产出很快就会在经济中体现出来。从行业角度来看,实用AI的到来意味着当前对Token的需求量极大。因为Token现在已经成为了盈利和收入的单位,AI公司渴望生成更多的Token并建设更多的AI工厂。这正是台湾算力需求飙升的原因,也是各位业务繁荣、股价上涨的动力。

计算模式已经彻底改变。实用的AI已经到来,它现在是利润与GDP的生成器。其背后是一种全新的计算模式,不再仅仅是大语言模型,更是智能体(Agent)。

传统意义上我们在操作系统中运行应用程序和代码。而今天的新模式是运行在容器框架(Harness)中的智能体,它由一个或多个大语言模型组成。这个框架机制负责引导和编排AI开展高效的工作。

当接收到输入时,智能体必须进行理解、观察、推理和行动,并调用诸如电子表格、Web浏览器或数据处理引擎等工具。整个过程是受软件编排的,框架负责路由信息,处理上下文,理解现状,进行推理并制定执行计划。本质上这就是智能体的工作原理。它像人类一样处理短期工作记忆和长期记忆,因此内存管理系统变得极其重要。在这个新模型中,大语言模型负责思考,而外壳程序则像操作系统一样将一切连接起来。

这是一个重大的突破,大语言模型现在已经能够非常出色地进行思考、推理、规划和使用工具。结合内存管理框架和工具编排,我们现在可以成就非凡。例如给出一句提示词,AI就能生成完整的代码。我们现在使用的是Claude Code,但Codex的表现也同样出色。再比如输入“创建一个GIF在黑色散点图上显示NVIDIA绿色的点从台北101大楼变形为GTC Taipei 2026再变形为NVIDIA眼睛图标然后散射重复”,AI就能直接生成动态图。甚至当你弄丢遥控器电池盖时,只需提供图片并让AI创建一个准备好进行3D打印的CAD文件,它就能调用工具完成制作。这就是全新的计算模式。

过去我们需要启动应用程序进行点击和输入,现在只需向AI解释我们的意图和需求,AI就会自动生成代码或使用工具产生必要的输出。这是未来计算机的工作方式,即智能体AI。我们为此努力了两年,如今它终于化为现实。

现在的重大突破之一在于工具的使用。有人认为AI时代和智能体AI的到来会让所有软件公司倒闭,但事实恰恰相反。未来世界将充满智能体,不再受限于人口数量,这些智能体将比以往任何时候都更频繁地使用工具。对软件公司而言这其实是一个绝佳的时代,前提是软件必须以智能体能够调用的方式呈现。

作为NVIDIA的瑰宝,CUDA-X库正经历着属于它的美好时代。今天我们能够将这些库提供给智能体,它们的使用效率甚至超越了人类。20年前我们构建了用于加速计算的单一架构CUDA,重新发明了计算。如今上千个CUDA-X库已经成为智能体的工具,助力科学和工程领域的突破。比如用于计算光刻的cuLitho、用于决策优化的cuOpt、用于直接稀疏求解器的cuDSS、用于跨结构化和非结构化文档深度研究的AIQ、用于AI RAN的Aerial、用于可微物理的Warp,以及用于基因组学的Parabricks。这些精妙算法的基石是美丽的数学。

2. 全新计算模式:大语言模型与工具的协同编排

软件的计算模式即将改变,智能体代表着终极的解耦式分布式计算模型。为了运行智能体,数据中心内各个位置的众多计算机将被激活。智能体由模型、框架、工具、技能和运行时组成。你可以把模型想象成大脑,把框架和运行时的工具想象成身体和工作车间。这是一个在车间里熟练使用工具的工人,这一切都在极大规模下进行,分布在计算机的不同部分。大语言模型负责思考、处理上下文、观察环境、推理并制定执行计划。每当模型进行思考时,整架Grace Blackwell NVLink-72就会被激活。而每当它使用诸如C编译器、Python、JavaScript或加速计算等工具时,就会消耗CPU资源。

今天的智能体还是简单的工具使用者,但明天它们将变得非常成熟。这正是CUDA-X库备受智能体青睐的原因。我们的所有CUDA-X库现在都具备了AI可以学习并使用的技能手册。AI阅读后便能领会使用方法,其操作这些库的能力将令人惊叹。这些工具运行在CPU、GPU和大语言模型之上,而安全框架则运行在CPU和NVIDIA BlueField DPU等安全处理器上。整个工作流程的编排都由CPU完成。

其中最困难的环节之一是内存管理。工作记忆可以被简单理解为KV缓存(KV Caching)。系统不仅需要进行数据压缩,还要解决复杂的检索问题,即如何检索结构化和非结构化数据,以及如何梳理不同数据间的本体关系。这个处理过程极其复杂,AI的内存系统必将引发存储系统的彻底变革。

这种全新的智能体应用和计算模式与传统的应用程序运行方式截然不同。过去软件通常封装在单一二进制文件中并运行于操作系统内。而现在面对这种解耦的、分布式的异构计算需求,我们构建了下一代产品Vera Rubin。

Vera Rubin不仅是一颗芯片或一个GPU,它是一个令人惊叹的端到端系统。它配备了GPU和Vera Rubin NVLink-72,由Vera CPU进行编排,并拥有革命性的存储系统。结合CX9和DOCA软件栈,系统内置的安全处理器确保所有静态、传输中及使用中的数据都经过加密。由于AI模型极其珍贵,整个系统严格遵循机密计算(Confidential Computing)的标准。

Vera Rubin是我们公司历史上最宏大的事业,全公司众多部门的工程师都为此倾注了心血,在座的许多合作伙伴也参与了整个系统的创建。Vera Rubin是一个超越芯片概念的奇迹。NVIDIA早已从一家GPU公司演变成一家系统公司,设计出了史上最复杂、最彻底的系统。

但归根结底,我们的客户不仅想购买计算机,他们更想要建造AI工厂,这也是NVIDIA再次自我转型的核心原因。如今我们的技术和合作伙伴都已扩展到了基础设施层面。发电机、冷却系统和电网供应商等众多工业公司成为了我们生态系统的一部分。我们正在构建一个全栈系统,助力客户打造卓越的AI基础设施。

当前全球正竞相建设AI工厂,这是人类历史上规模最大的基础设施建设。AI工厂的每一层包括芯片、机架、网络、电力、冷却和电网,都必须进行端到端的协同设计,因为在这里算力就等于营收。

NVIDIA DSX正是用于高效、盈利地构建和运营AI工厂的蓝图与参考设计。一切从DSX SIM开始。借助DSX SIM Omniverse蓝图,合作伙伴在首个机架落地前,就能在数字孪生中规划布局、模拟电力与冷却系统、设计网络并验证所有变更,从而完成Vera Rubin AI工厂的设计与验证。

工厂启动后,DSX OS将接管并负责配置、运行、监控和修复基础设施,将硬件转化为可信、弹性且AI就绪的多租户算力资源。当前的AI工厂在电力配置上往往过度预留高达40%,而DSX Max LPS让运营商能够在同等电力预算内安全部署更多GPU,每年可增加数十亿美元的收入。突破性的45摄氏度高温液冷技术降低了水电消耗,将更多电力用于产生收入的计算。动态功率分配技术在机架间调度电力,回收闲置功率并输送至高负载区域,同时平滑技术能有效抑制峰值电流尖峰和功率浪涌。

在整个工厂中,AI智能体团队与DSX Max LPS协同工作,实时平衡冷却与功耗。此外,DSX AI工厂是能够与电网协同运行的灵活能源资产,DSX Flex可以读取实时电网信号,在电网承压时动态调整工厂功率。未来十年内,将有数百吉瓦(GW)规模的AI工厂投入运行,NVIDIA DSX AI工厂将以最高效率生成成本极低的Token,同时增强电网的稳定性。

过去的计算生态系统中,NVIDIA的软硬件计算层被集成到第三方平台中服务终端市场。但如今我们面对的是一个AI工厂生态系统。NVIDIA的业务向下游延伸到了整个基础设施生态,不仅制造GPU和系统,更致力于帮助客户建设极其复杂的AI基础设施。

一座一吉瓦(GW)规模的AI工厂,造价曾是两三百亿美元,现在已达五六百亿美元,很快就会攀升至一千亿美元。上千亿美元投入的工厂必须在初次运行就取得成功并立即见效。

面对如此高昂的资本成本和极端的复杂性,我们利用Omniverse完成了这一切。过去我们是在计算机里设计芯片和模拟系统,而现在在破土动工投入真金白银之前,我们就能在Omniverse的数字世界里构建任意规模的庞大系统。

这就是我们被称为DSX的生态系统,RTX代表GPU,DGX代表系统,而DSX则代表基础设施。凭借涵盖软硬件的全栈技术能力,我们帮助许多曾经的小公司成长为了世界级的AI云。

例如CoreWeave现在的估值已高达数百亿美元且增长迅猛,Nebius也同样保持着惊人的增速。这些云服务商拥有许多杰出的客户,如编程工具Cursor、图像生成公司Black Mountain Labs、World Labs、Revolut以及Shopify。其他区域如英国的Nscale正在服务英国电信和Google,韩国的Naver Cloud在服务韩国银行和现代汽车,印度的Yotta、新加坡的AI Singapore、印尼的Indosat,以及台湾的GMI都在为区域乃至全球客户提供卓越的AI服务。

AI将无处不在,每个地区、每家公司都将由其驱动。建立AI云不仅需要NVIDIA底层的硬件、软件、库以及全球开发者生态,更需要应对AI工厂基础设施在资金和资产层面的庞大复杂性。正因如此,NVIDIA成功转型为AI基础设施公司。

3. 构建AI工厂生态:推出端到端Vera Rubin系统

帮助客户构建和部署AI工厂至关重要,因为在今天算力就是收入,算力就是利润。一座斥资数百亿乃至上千亿美元的基础设施,其上线速度、吞吐量、可靠性和使用寿命直接决定了企业的生死存亡。

NVIDIA之所以是卓越的合作伙伴,是因为我们具备全集成的能力。我们并非纸上谈兵,而是亲自投入数十亿美元构建并连接了整个基础设施,确保一切运转良好。通过极致的协同设计与全系统模拟,我们在首个Token生成时间(Time to First Token)、首次推理时间以及训练启动速度上都处于世界领先水平。

更重要的是我们的每瓦吞吐量和每瓦Token数绝对是世界一流的。如果你的数据中心只有一吉瓦的容量,那么在功率上限锁定的情况下,每瓦特的吞吐量就等于你的直接收入,因为每一个Token都是盈利的。未来算力即收入,每瓦性能即收入。仅仅因为芯片价格便宜就选择错误的架构是毫无意义的。必须确保每瓦特营收的最大化,买得越多赚得越多。

第三是可靠性。参观数据中心会发现其中有数百万根电缆和活动部件,让这些计算机和谐运转且保持极高可靠性的概率极低,这极其困难。我们已在大规模环境下运行多时,积累了至关重要的经验,尤其是拉长中断间的平均时间。

此外系统寿命面临巨大挑战,因为软件在不断迭代。四年前的Hopper架构时代和六年前的Ampere架构时期,AI已经发生翻天覆地变化。从最初的CNN到Transformer,再到混合专家模型,如今我们步入了智能体系统时代。

软件行业每隔几个月就会涌现新技术。如果架构不够灵活生态不够丰富,就无法持久应对这种发展曲线,难以预测系统寿命。但NVIDIA的系统遍布全球,开发者从CUDA起步,使得系统生命周期和生态资产能够持续更久。长寿命资产意味着极低的总体拥有成本,这就是我们的核心优势。由于大家对盈利性AI的需求极其旺盛,算力成为目前的瓶颈。因此我们将全力以赴,帮助世界各地建立AI工厂。

我非常高兴地宣布,Vera Rubin现已全面投入产。我们为Vera Rubin建立的供应链规模是Grace Blackwell的两倍。过去组装一个Grace Blackwell机架需要两小时,现在只需五分钟。这不仅大幅提升了产能,吞吐量也显著加快,以满足庞大的市场需求。

大语言模型用于生成答案,而智能体AI处理的则是完全不同的问题。智能体需要观察推理规划并使用工具,管理海量上下文和长短期记忆,甚至能按需启动子代理。NVIDIA Vera Rubin正是专为处理智能体AI打造的多机架级系统。从第一代DGX-1到如今的Vera Rubin,我们不断挑战芯片和系统的极限。构成Vera Rubin的七颗全新芯片由TSMC采用3纳米工艺、CoWoS封装技术以及HBM4内存制造。单块计算板集成六万亿个晶体管。Vera Rubin MVL72负责推理规划和上下文理解,采用无电缆原位制造和液冷技术,实现AI工厂规模下的极高韧性。

同时推出的Vera CPU机架集成了256颗液冷CPU,专责模型编排与工具启动。在Foxconn和Quanta,具备极低延迟的Grok 3 LPX正在成型。如果说MVL72旨在实现最高吞吐量,那么Grok LPX则致力于最低延迟生成。加上处理AI存储与安全的Vera BlueField-4,以及全球首款配备共封装光学器件的以太网交换机Spectrum-X,我们与台湾供应链共同为AI时代重新定义计算。

Vera Rubin不仅仅是为运行AI而生,更是专为运行智能体系统设计的超级计算机。过去我们打造Hopper主要是为了预训练,那时人们认为推理很简单。但混合专家模型极其复杂,要在实现高吞吐量的同时保持极快响应非常困难。这就是我们创造NVLINK-72的原因,它让NVIDIA的Token生成成本降到全球最低。如今Vera Rubin超越了单纯推理,主导智能体系统中的推理任务。整个系统摒弃了繁杂电缆,可靠性达到前所未有的高度。除了强大的计算和存储托盘,Vera Rubin还配备了革命性的NVLINK交换机横向扩展的以太网交换机,如今NVIDIA已经成为全球最大的网络公司。

4. 专为智能体设计:颠覆性处理器Vera CPU

接下来我们要谈谈专为AI时代打造的Vera CPU。迄今为止的所有CPU都是为人类设计的,按秒计费按核心出租。但智能体不同于人类,它们缺乏耐心,生活在以纳秒为单位的世界里。智能体在调用工具或访问数据库时,任何等待都会阻碍下一步行动,因此极低的CPU延迟至关重要。

为实现极致交互,我们创造了Vera CPU。在Vera Rubin机架中,CPU负责编排GPU管理缓存以及处理安全隔离。智能体正以惊人速度访问内存,存储服务器和CPU已成为数据中心性能的关键瓶颈。AI工厂的核心经济价值在于不断生成Token,绝不能让CPU成为阻碍。因此我们从零开始,专为智能体构建了全新架构。Vera CPU不仅具备绝对顶尖的单线程性能,每时钟周期可执行十条指令,其数据吞吐带宽也达到世界顶级水平。

智能体系统本质上是解构且分布式的,核心与存储、GPU之间的数据传输速度是关键。Vera CPU的连接织网传输速度达到光速级,是首款支持PCIe Gen 6和LPDDR5X内存的处理器,总带宽3倍于传统CPU。未来将有数十亿智能体高频调用资源,为了不抢占生成Token所需的电力,Vera CPU在保持高性能的同时实现极高能效比。这四大属性使其在真实单线程性能上远超现有最高性能的x86处理器,实现史无前例的性能飞跃。

智能体时代彻底改变了CPU的角色。如果把GPU比作管弦乐队,CPU就是指挥家。传统的按核心切片虚拟化模式已成为限制GPU利用率的瓶颈。Vera采用NVIDIA定制的Olympus核心和可扩展一致性架构,专门针对数据中心工作负载、分支密集型Python运行和沙箱代码执行进行优化。通过神经分支预测器和大型乱序执行引擎,Vera确保指令持续高效流动。它还能在不牺牲带宽的前提下纠正多个内存错误,大幅降低延迟。

借助第二代可扩展一致性结构,Vera的核间通信速度比传统CPU快50%。它通过NVLink将GPU直接连接到网络架构,提供了近两倍于x86的智能体沙箱性能。每一家开展AI业务的公司都已对Grace进行认证并优化了软件栈,而Vera将无缝继承这一庞大生态,成为全球优化程度最高的智能体CPU。在实际性能评测中,Vera将通用数据库引擎SQL的运行速度提升了惊人的三倍。这款专为智能体时代打造的CPU,必将成为我们新增长引擎。

下一个是实时流处理。记住你的AI将不仅仅是阅读文档,它还会监测遥测数据,特别是在工厂或证券交易所内部。涌入的数据脉冲会进入CPU。

Vera CPU正在为New York Stock Exchange运行实时流处理。其主席Lynn Martin一直非常慷慨地与我们合作。Vera CPU提升了六倍的性能,全是因为单线程指令执行带宽以及核心内部和外部的带宽。Vera是彻底的革命性产品。通常X因子是讨论GPU时才会谈论的东西,很少有人会在与CPU相关的真实负载上谈论它。我为团队感到自豪,你们做得太棒了。我们即将推出一份非凡的路线图,几乎所有人都在兴奋地支持Vera。

这是Vera开放的开端,它开辟了一个全新的市场。智能体是一种全新的工作负载。过去我们为人类构建CPU,现在我们需要为智能体系统构建CPU。它们的特性截然不同,所以旧的CPU无法胜任。我们正在构建数以百万计的Era系统。台湾的ODM、所有OEM以及代理型公司等早期采用者已与我们一同进入这个以前从未存在过的新市场。它不会取代旧市场,而是一个全新的面向智能体的CPU市场。因为智能体的数量将远超人类,且它们非常不耐烦,所以这个市场肯定会比上一个更大。这就是NVIDIA Vera CPU。

5. 赋能企业AI平台:Agent Toolkit与开源模型Nemotron

核心要点在于这是未来十年的计算模式。智能体和控制框架编排着大型语言模型,每家公司都将运行这种模式并成为智能体公司。每家公司内部都将有智能体在运行,他们会意识到智能体将需要自己的操作系统。企业都在问该如何安全运行并针对自身工作负载构建智能体,因此我们推出了面向企业级AI的NVIDIA Agent Toolkit

回看我过去五年或十年的GTC演讲就能看到今天,因为我们一直在为这一刻做准备。企业要构建代理即服务或运行代理需要具备四样东西。首先是越聪明、越快、越便宜越好的大语言模型。

其次你需要一套框架来编排整个流程。第三是自带技能并供模型使用的工具,比如我展示的CUDA-X库,它们将成为未来智能体的神级工具。

最后你需要一个能将一切整合在一起的操作系统或运行时。这就是NVIDIA Toolkit for Agents。它包含你可以修改的世界级开源模型,并能运行来自任何人的惊人代码和智能体。你可以在名为Open Shell的容器中高度安全地运行它。该Shell保护智能体遵循安全策略,同时保护隐私、权利和身份。开源的NVIDIA Open Shell正被Red Hat、Canonical和Microsoft等广泛采用。

Open Shell运行时已针对无处不在的NVIDIA AI平台进行全面优化,因此你可以在任何云端、本地甚至设备端运行Open Shell。你拥有了工具、库、可修改的模型以及像Open Claw和Hermes这样的智能体框架,现在可以在任何地方本地运行。这四点代表了现代企业的操作系统。

我最喜欢的智能体用例之一是芯片设计师,这是NVIDIA所做的最重要的事情。我们理所当然地与Cadence合作,由Codex或Cloud Code编排构建了一个芯片设计超级智能体。它将RTL、架构图和规格说明作为输入。我们共同创建了针对NVIDIA运行时环境并使用Nemotron优化的超级代理。

设计芯片及其运行系统是极其艰巨的工程挑战,包含数万亿个微观三维晶体管。每一个栅极和导线必须同步至皮秒级完美协同工作。因物理原型速度慢且成本高,工程师在数字领域工作。每颗芯片始于架构规范,随后翻译成芯片设计语言RTL并在仿真中验证。单一bug能让芯片推迟数月,NVIDIA的数千名工程师每年花费数十亿计算小时运行和调试数百万个测试,该周期通常需数周。为压缩此周期双方构建了设计验证代理。Codex编排流程,Cadence Chip Stack启动RTL验证循环,由Nemotron提供动力并由NVIDIA Open Shell确保安全。它调用RTL生成、测试平台创建、回归测试及调试等专家级子代理。

系统自动运行,使用Cadence Excellium进行数百次仿真并用Jasper进行形式验证。揭示设计缺陷并修复代码bug后,原本数周的工作现在只需数小时即可完成,验证周期缩短至四十分之一以下。NVIDIA与Cadence正利用AI Agents重塑芯片设计。我们将聘请成千上万个Cadence超级代理协同工作,加速公司发展并以更快的速度创造惊人事物。包含模型的工具包利用了Cadence仿真器和形式验证系统等工具。我们正与其紧密合作在CUDA上加速所有工具,因为代理需要立即得到答案。

模型、框架、CUDA加速库、工具及运行时环境融合在一起。Cadence从卓越的模型出发,利用其专有知识进行修改和微调,创建出精通其工作流的超级代理。这个卓越的模型就是Nemotron。

NVIDIA致力于为世界构建开放模型以供大家创建专属智能体,今天我们正式发布Nemotron 3 Ultra。这款极其聪明的下一代开源模型不仅提供模型本身,还提供所有的训练数据。得益于优秀合作伙伴联盟的相互贡献,Nemotron基于全球最大规模之一的长期推理、任务解决及工具使用数据集训练而成。

训练脚本和数据已完全向您开放。作为开源模型的巅峰之作和全球领先的开源模型系统策略,我们的目标是让您全盘接收并让它为您所用。Nemotron 3 Ultra的速度快了五倍。这是全球首款基于SSM状态空间模型与混合专家模型(MoE)的混合架构模型。其极快的速度让您能快速思考,在相同成本下思考得更久。与全球最顶尖、最具性价比的开源模型相比,它价格便宜30%,总算力和总推理时间成本也低30%。它拥有前沿智能且完全开源。目前我们已在开发Nemotron 4.0。

从模型到框架、工具、技能和运行时环境的整个工具包,让全球每家企业现在都有能力创建属于自己的智能体。我们正与Cadence、CrowdStrike、Solon、Palantir、SAP及ServiceNow等众多公司合作。人们曾说智能体将颠覆这些市场,但我认为恰恰相反,Agents将为合作伙伴创造有史以来最大的机遇。我们拥有NVIDIA Agentic Toolkit for Enterprise AI来帮助他们。

总结来说Vera Rubin已全面投产,专为新一代Agent打造的Vera CPU也已问世。NVIDIA的企业级AI工具包将让每家企业和软件公司都能构建Agent。

6. 重塑个人电脑:搭载RTX Spark的PC新纪元

我在台湾的许多朋友和合作伙伴的公司都是从这里起步的,在很多方面这是现代计算机行业40年来的开端。NVIDIA成立33年,我们出现时PC行业正处于Windows 3.1时代。Windows 95将PC从企业带出,打造成人人拥有的消费电子设备。该计算平台的架构设计恰到好处,系统BIOS、开放芯片组、可连接安装的驱动程序以及带有多媒体API的抽象层,开启了PC时代,每个元素对PC普及都至关重要。40年后的今天,Microsoft和NVIDIA将重新发明新PC。

明晚我将与Satya深入探讨我们共同开展的工作。过去三年我们重塑PC工作方式就是为迎接这一时刻。智能体不仅在AI云和企业内部运行,也将运行在你的PC上。当PC拥有自主智能体时,它能帮助和理解你,你可以与它对话、让它注视你、读取文件并做研究。这个全新操作系统是旧操作系统加上大语言模型。大语言模型是现代版DirectX,它理解提示词和计算机视觉,并能生成音视频。作为PC和智能化的延伸,现代应用程序已成为一个智能体运行时。

在AI时代重构PC的想法引发了个人计算革命。我们的个人AI在安全沙箱中持续运行并完成工作,芯片和操作系统必须随之进化。隆重推出NVIDIA RTX Spark,我们将33年经验浓缩于这颗芯片中。它配备6144个CUDA核心的Blackwell RTX GPU、1Petaflop的AI性能和定制化20核Grace CPU。该芯片采用TSMC 3纳米工艺和700亿个晶体管,通过NVLINK与MediaTek合作打造,拥有128GB统一内存。结合面向智能体的Windows平台,我们正重新定义用于创作、游戏及智能体的个人电脑。游戏是我们最心系的部分,将迎来全新的《极限竞速》和007游戏,同时NVIDIA推出RTX Spark笔记本电脑

这是世界上最惊人的芯片,也是我们与MediaTek合作打造的精美芯片N1X,需耗费33年才能打造出来。因为100%的NVIDIA软件栈都运行在这里,无论是数字生物学、地震处理、天体物理还是所有CUDA相关的物理、基因组学、AI和计算机图形处理都不成问题。Microsoft和NVIDIA的细致优化使得这台电脑能运行几乎所有已创造出的程序以及智能体。

想象一下,这里的一切都将在PC上本地运行Nemotron 3 Ultra或连接云端Claude等模型,创造出惊人效果。每座房子的设计都需要大量工具和时间,现在运行在本地RTX Spark上的智能体能通过开放式Shell沙箱帮我设计。它运行Hermes框架并连接云端的Claude Sonnet。我分享概念草图、风格情绪板和提示词后,智能体便打开Rhino进行场地建模、塑造地形和建筑体量。它提出方案并针对成本与舒适度进行优化,随后生成内部布局、墙壁和动线。

我随时可介入调整,门窗和结构元素会自动放置,智能体还能检测并修复自身错误。批准后智能体将模型完整导出到Blender,并在传输中保持设计上下文完整。我微调材质后,代理使用带有Flux.1的生成式AI模型在多种光照和视角下将其渲染至照片级真实感。曾经复杂的流程在智能体引导下变得极其简单高效。在RTX Spark上进行创作,设计速度紧随想象力,这将为所有开发者打造出色的PC智能体体验。

下一个是Adobe。这是一套全球数千万人正在使用的令人惊叹的工具套件。他们重新设计了Adobe Photoshop和Premiere的核心架构,并将针对RTX Spark发布。它的速度提升了两倍,本身就已经很快了,现在速度将再提升两倍。它的设计对智能体非常友好,通过MCP服务器现在可以与笔记本电脑上的智能体交互。

众多客户和合作伙伴对将RTX Spark推向市场感到非常兴奋。这是40年来首次全产品线的PC变革,每个人都将支持RTX Spark,共同打造极其智能、强大且美观的笔记本电脑。

但这还不是全部,RTX Spark是对笔记本电脑的重塑。Microsoft和NVIDIA正在重塑整个PC领域,今天我们将发布一个涵盖台式机、笔记本电脑和工作站的全新系列,它们100%兼容Windows,100%支持CUDA,并且100%搭载NVIDIA AI Tensor Core。全球所有在NVIDIA上运行的一切都可以在这里运行,这是40年来首个完全重新设计的PC系列。

令人惊叹的还有RTX Spark笔记本电脑和台式机产品。这个智能体可以全天候免费运行,你可以下载自己的智能体并让它一直运行。它没有电量焦虑,放在家里连接着整个房屋的设备,包括笔记本电脑、显示器、摄像头、烘干机、饮水机、热水器以及安保系统等。这成为了你的个人AI代理,随着时间推移它会变得越来越聪明。今天我们有Nemotron 3 Ultra,未来会有Nemotron 4、Nemotron 5甚至6。它在家帮你处理各种事务,比如预订旅行。

如果你想要一个极其强大的系统,这里有适用于Windows的DGX station。它能运行Windows中的一切,拥有768GB内存,可以运行万亿参数模型。它具备20 petaflops算力和每秒8TB的显存带宽,就放在你的办公桌旁。如果你是大语言模型或智能体开发者,把它放在桌边就能提供所需的所有算力,部署时再放入云端。

回顾过去,15到20年前我们有电话的概念,今天我们有PC的概念。如今你想到手机时,几乎会用它做任何事情,唯一不会用它做的就是打电话。因此手机对你的意义与过去的电话截然不同。我敢肯定,十年后的PC与你今天所认为的PC将会发生巨大变化,它将不再仅仅是启动应用或打字的工具。

我完全可以想象,就像现在许多家庭拥有家庭影院、大电视、割草机或洗碗机一样,总有一天你的家里实际上会有一台AI超级计算机。它运行着你所有的代理和助手,一直为你处理各种事情。你会在家里配备辅助AI智能体计算机,随着时间推移,它们对你来说会变得更像R2D2或C-3PO,而不是一台传统PC。这次对计算机的重塑意义不亚于将电话重塑为智能手机,这是一个全新产品系列的开端。全球100%的PC行业都已加入我们共同重塑PC。

7. 迈向物理AI世界:Cosmos-3模型与人形机器人

Agentic AI就像数字机器人,能够理解、推理、规划、采取行动并使用工具,它们将在所有计算机上运行。

我们正在研发人形机器人、各种类型的机器人、自动驾驶汽车以及卫星。农业、制造和重工业设备都将实现代理化,你甚至会拥有自己的代理助手。未来的基站和无线电台也将是代理化的,它们能了解流量并与其他基站协调以减少能耗,从而提高频谱效率。未来一切都将运行智能体,将会有数千亿个智能体计算机运行在世界各地。

最大的挑战是数据,语言模型可以使用互联网上的文本,但物理AI必须具备机器人的第一人称视角,而世界上大部分视频数据是第三人称的。我们通过遥操作人类演示开始,利用Omniverse进行模拟,并结合强化学习的可验证奖励来引导物理AI模型。这样我们能从第三人称视角学习并重新投影到第一人称视角,最终拥有一个世界基础模型。

今天我们正式发布Cosmos-3,这是物理AI的前沿基础模型。当你想要创建任何涉及物理世界的机器人时,Cosmos-3可以作为伴侣。它能够理解、推理并生成动作,可以在循环中进行模拟甚至作为策略本身。

现实世界是无限且不可预测的,物理AI需要数据但现实数据无法实现规模化,因此对于物理AI而言算力即数据。Cosmos是一个面向物理AI的开放前沿全能模型,基于全新的混合Transformer架构构建。像素、动作、声音和语言流入自回归Transformer,它对扩散Transformer进行推理、规划和指令引导。开发者可以针对不同具身形态和场景对Cosmos进行后期训练。

作为视觉语言模型,Cosmos观察物理世界并理解场景;作为世界模型,它能生成符合物理规律的合成视频;作为模拟器,它为策略训练和评估实现闭环。对Cosmos进行后训练后,它便进化为世界动作模型,能为各类机器人进行感知、推理、规划并生成动作。我们开放了模型、数据甚至训练方式,让你可以自行增强并将其转化为专有模型。

AI技术栈非常复杂,包含生成器、模型、模拟器和运行时。自动驾驶汽车本质上是一个物理AI智能体机器人,今天我们宣布推出AlphaGo 2开源模型。目前正在制造NVIDIA Hyperion汽车的厂商占据了全球汽车份额的80%。

我们也已经接入了移动出行服务,世界上大约97%的移动出行服务正在与我们建立连接。当我们基于Kalos操作系统在Hyperion运行时上部署AlphaGo时,将能够连接全球的所有这些服务。AlphaGo是全球首款具备推理能力的自动驾驶汽车。它在行驶中会不断思考,实时规划路线,微调避让静止车辆,在交叉路口和停车标志前停车,并且主动礼让行人与横向车流。

我们创造的技术同样适用于人形机器人。NVIDIA ISAAC GROOT是我们的人形机器人技术栈,涵盖了模型、数据生成、仿真、运行时以及操作系统。无论是云端或PC端的智能体系统,还是自动驾驶汽车与机器人的协作系统,它们的计算模式完全相同。我们垂直且完整地构建了一切,并与共同设计相集成,然后将其完全开放供每个人使用。为了交付这些参考平台,就像我们对待PC和自动驾驶汽车那样,我们现在也要为机器人打造参考平台。

今天我们宣布推出NVIDIA ISAAC GROOT参考人形机器人该机器人拥有31个自由度,每只手拥有25个自由度,身高6英尺,体重150磅。

这个平台运行着新的Thor芯片以及我们整个数据生成和仿真软件栈,全部集成在一个专为开发者设计的机器人中。它为高等教育和大学研究人员构建,解决了他们从零开始拼凑仿真器、遥操作和数据流水线的难题。

ISAAC GROOT提供了开放模型、仿真与训练库、数据生成器和机器人计算机,全流程数小时内即可就绪。你可以使用Isaac Lab设置仿真环境,利用Omniverse和Cosmos生成合成数据,在Isaac Arena中评估策略并在Jetson Thor上部署。

在过去的六个月里,计算机行业发生了彻底的改变,智能体与最新前沿模型相融合,使得AI现在能够从事有用的工作。这种由模型构成的智能体计算模式利用技能调用工具并在运行时中执行,无论在哪种设备上模式都是相同的。关于这种智能体平台,NVIDIA拥有一套Enterprise AI Toolkit,是与AI互动的绝佳方式。

目前Vera Rubin正在全力生产中。Grace Blackwell是专门为处理AI推理而创造的,而Vera Rubin则是为了运行智能体而创造的完整解耦式、分布式智能体处理系统。

NVIDIA已经成为一家基础设施公司,致力于帮助客户实现利润最大化。用于智能体的CPU有其特殊需求,革命性的NVIDIA Vera正处于产能爬坡阶段,目前的订单量将使其成为公司历史上最快、最成功的产品发布。

NVIDIA和Microsoft创建了一个全新的PC产品线,这种代理式计算模式将在全球各地的机器人、卫星、基站、工厂以及云端和边缘设备中得到复制。

AI技术就像一块五层蛋糕,全球AI云已经构建了数吉瓦的容量,DSX保持低功耗运行以连接每一个关键节点。RTX 4终于到来,这是40年来PC领域最重大的时刻,智能体将助力所有工作流。模型在GPU上飞速运行,Cosmos构建机器人所需的世界,实用的AI时代已经到来,智能体正与你并肩协作。

标签: 智能 模型 系统 工具 机器人 数据 世界 软件 公司 全球 工厂 物理 语言 核心 芯片 技术 算力 代理 性能 框架 企业 内存 时代 模式 架构 开源 平台 电力 速度 数据中心 传统 基础设施

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。