![]()
就在昨天凌晨 2 点,英伟达召开了一年一度的 GTC ( GPU 技术大会)。
与市面上厮杀激烈的各家大模型不同,老黄根本不担心自家的显卡没人用,所以这次的大会还是那么硬核,没有太多的弯弯绕绕,只有肌肉感爆棚的性能数据。
而作为将英伟达市值推向世界第一的推手,AI 仍然是这次大会的核心。
还是两个小时拉满的时长,还是那个皮衣老黄。不过么,他已经彻底不是什么刀客了。
看完整场演讲,发现世超还是低估了英伟达的野心,老黄不止想当卖显卡的算力军火商,他还想整合出一个贯穿 AI 行业的基建——“ AI 工厂 ”。
![]()
首先,伴随着一阵强劲的音乐,老黄闪亮登场:Welcome to GTC!
虽然这次主题还是 AI,但是开头的第一个新产品居然是游戏相关的 DLSS 5。
其实也能理解,当初是 GeForce 游戏显卡一刀一刀将 AI 带给世界的,怎么着也该轮到 AI 来反哺一下游戏了。
![]()
作为之前 DLSS 4.5 的升级版,DLSS 5 引入了“实时神经渲染”,直接把 AI 接入渲染流程中,根据渲染时的运动和矢量信息,实时地给场景注入更接近真实世界的光照和材质表现。
简单点说,之前是根据画面,来生成帧插入进去,现在是直接加入渲染流程,成为渲染的一部分。
得到的效果就是让游戏视觉逼近了电影级的真实感,同时还能保持较高的帧率运行。
![]()
效果这么好,算力需求也是蹭蹭涨, DLSS 5 的秋季首发只在 50 系显卡上,不少玩家估计还得等后续的适配和优化才能体验到。
除了算力门槛,网友们对这个 AI 效果的强度其实也有点担忧,就比如下面的演示图,开启与关闭后效果差别非常大,除了细节,连风格都会受到很大影响。
所以英伟达也在博客中提到,效果的最终呈现会交给游戏开发者进行打磨,防止破坏掉原来的美术风格。
![]()
而在整整“2 分钟”的介绍落幕后,游戏玩家们就能关掉屏幕了,接下来是 AI 的主场。
老黄打造“AI 工厂”,蓝图规模相当宏大,从底层的算力芯片,到中间的大模型,乃至末端的 AI 应用,都有新产品,几乎是全产业链的覆盖。
首先当然是 CES 刚刚亮相的 Vera Rubin 新平台,作为继 Blackwell 后的新一代架构,这是未来几年英伟达 AI 算力的核心王牌。
而在这张王牌打出来前,老黄可以说是煞费苦心,铺垫了半天的“AI 工厂”建设。
先是说 Token 是新时代工业产物;接着忆往昔从 Geforce 到 CUDA,RTX 的荣耀过往;然后商务一波夸了夸 Claude Code、Codex 这类智能体工具,以及它们带来的巨量 Token 需求;最后才顺理成章的掏出了“Vera Rubin”这套 AI 工厂的标准生产设备。
不过看数据,Rubin 还是相当能打的,在主力 Vera Rubin NVL72 机柜中,单机架能塞进 72 颗 Rubin GPU + 36 颗 Vera CPU,训练 MoE 模型只需上一代 Blackwell 的 1/4 GPU 算力,效率飞升,而且已经量产,预计是下半年出货。
![]()
但话说回来,老黄也不是白铺垫的,除了 Rubin,他更想卖的其实是整合了算力产业的捆绑包,里面除了 GPU,还有英伟达自家的 CPU,用于信号传输的 NVLink 72,以及液冷机架,存储系统,网络系统,安全管控,机架级集成等配套设施。
他甚至怕你买了不会使,特地致敬了一波隔壁的 Meta,用“Omniverse”这个数字孪生技术搞了个虚拟 AI 工厂,让你先把设备,网络,运营等等全部跑通,再进入现实建设。他真的,我哭死。。。
![]()
当然,除此之外,其实最值得关注的就是推理效率极高的“LPU”(Language Processing Unit)了。
LPU是语言处理器,是专门针对AI模型推理设计的算力芯片,原本是初创公司 Groq 研发的,跟 GPU 走了不同的路子,一度威胁到了英伟达的护城河。
也正因如此,英伟达去年豪掷200亿美元买到了Groq 的核心资产,开始自己研发了。
![]()
这次老黄也没藏着,直接宣布已经把 LPU 集成到了 Vera Rubin 平台,推出了 NVIDIA Groq 3 LPX 作为推理加速器。
NVIDIA Groq 3 LPX Rack 的单机架能塞 256 颗 Groq 3 LPU,总规格炸裂,AI 推理算力能达到 315 PFLOPS,而且最为恐怖的是内存带宽,足足 40 PB/s,是这次 Rubin GPU 机柜的 25 倍,推理速度直接起飞。
这下,短板补足补成了长板。Groq 3 专攻超低延迟的推理,Rubin GPU 主打量大管饱的训练,正好拼凑出英伟达从训练到推理的生态闭环。
![]()
硬件的肌肉秀完了,显然老黄还不满足,AI 相关的应用和模型继续一个一个的往外掏。
其中就有差友们最近耳熟能详的“龙虾”产品,没错,老黄也在搞龙虾。不过是更高规格的企业级代理平台,叫做“NemoClaw”。
![]()
它被称作是 Linux 一样的“新操作系统”,内置安全层,支持自主进化和全天候运行,并用 NVIDIA Agent Toolkit 加固了安全性。
老黄说这是 Token 商品化的软件基础,推理市场万亿级需求就靠它驱动了。要世超说,还真是,要不这些天的 API 账单怎么这么长呢。。。
除了龙虾,英伟达还发布了 Agent 配套的软件设施。
![]()
比如开源分布式推理平台 Dynamo 1.0(AI 工厂分布式“操作系统”),用于统一管理 GPU/内存资源,提升 Agent 的推理效率。
接着推出了 120B 参数的混合 MoE 模型 Nemotron 3 Super ,说是 OpenClaw 的最佳开源模型,支持百万上下文和多 Agent 协作。
这次英伟达也是赶上龙虾的热度了。
![]()
当然,在此之外,老口号也是得强调的。随着老黄高声宣告“物理 AI 时代已来”,大伙儿的视角又被拉向了未来。
这次的核心产品是具身智能模型“Isaac GR00T N 系列”以及世界模型“Cosmos”。
具身智能的模型好理解,其实就是机器人的大脑。
现在的机器人,虽然看起来很灵活,但大多是提前录制的动作模组,做不到和人一样能够实时反馈。
而训练一个好用的具身智能模型可能比大语言模型还要难。
![]()
就比如宇树科技 CEO 王兴兴也在这次 GTC 发表了演讲,介绍了一下最近在具身智能方面的进展。
他表示看好在未来 2-3 年内跨过具身智能的“ChatGPT”时刻,但现在最大的瓶颈是还没有出现一个真正具备强泛化能力,在陌生场景中稳定执行任务的具身智能模型。
也就是缺一个能够灵活指挥的机器人大脑。
语言模型训练有现成的大规模数据集,但具身智能模型需要的数据是跟世界的真实交互,这些交互数据非常难采集,现有的数量还远远不够。
![]()
所以说实话,英伟达这次的 GR00T N1.7 模型算是阶段性常规发布,至于预告里更好用的 GR00T N2 预览版,虽然目前在 MolmoSpaces 和 RoboArena 基准上排名第一,但要在 2026 年底才会发布。
更有看头的是反而是后面这个世界模型“Cosmos”。
![]()
它能够以高度真实的物理模拟合成虚拟的现实世界,用于训练机器人进行时空感知。
再加上自家的软硬件组合,大规模塑造真实+模拟的数据会更加容易,这有可能是解决现实世界交互数据采集困难的一条出路。
咱也期待一手,毕竟真的物理 AI 实现了,那工作起来效率就更高了(摸起鱼来就更爽了)。
![]()
总的来说,老黄还在带领英伟达朝着他理想中的 AI 时代大步迈进,而他背后这些密密麻麻的机构名称也提醒着我们,AI 时代的下一幕可能不远了。
而在下一幕的舞台上,除了在竞技场角力的巨头们,你我的衣食住行可能都会被搬到台前。
撰文:风华
编辑:江江 & 面线
美编:素描
图片、资料来源:
NVIDIA官网,机器人前瞻
![]()





京公网安备 11011402013531号