当前位置: 首页 » 资讯 » 科技头条 » 正文

Google闭环了物理AI的要素,机器人的“安卓系统”在路上

IP属地 中国·北京 DeepTech深科技 时间:2026-02-27 20:15:49

AI 在抽象任务上进展迅速,却在模拟人类的基本感官和身体协调上屡屡受挫。这道名为“莫拉维克悖论”的鸿沟成了发展物理 AI(Physical AI)的巨大障碍。

大型语言模型可以在几秒钟内写出莎士比亚风格的戏剧,或生成上万行的复杂代码;但在物理世界的工厂车间里,为了让机械臂准确地抓取一个放置角度稍微偏移的电路板,工程师们依然需要耗费数周时间进行枯燥的底层代码调试与物理标定。

想要跨越鸿沟,单靠硬件本体的机械迭代,或是纯虚拟环境下的算法推演已无法奏效。行业逐渐达成共识:关键在于要让云端的“认知大脑”直接调度底层“运动神经”,将复杂的物理世界规则转化为大模型能够理解并输出的通用指令。

英伟达 CEO 黄仁勋曾将具身智能称为“AI 的下一波浪潮”,高通 CEO 安蒙(Cristiano Amon)也多次对端侧物理 AI 表示看好。

正当各家人工智能大厂抢滩这片高地之时,2 月 25 日,Alphabet 旗下的机器人软件公司 Intrinsic 宣布正式并入 Google。通过将 Intrinsic 的工业机器人控制平台与 Google DeepMind 的顶尖 AI 研究、Gemini 大模型以及谷歌云服务深度绑定,Google 正试图为千姿百态的工业机器人打造一个统一的、具有高度自适应能力的“安卓系统”。

工业自动化并非新生事物。自 20 世纪中叶以来,机器人已在制造业中扮演关键角色,帮助人类处理重复、危险的任务。然而,传统自动化系统往往局限于预设程序,无法应对复杂、多变的现实环境。

例如,在电子产品装配中,部件的微小差异或生产线调整就可能导致系统瘫痪。这正是物理 AI 兴起的背景:除了“思考”,AI 还要具备通过传感器、执行器与物理世界互动的能力,以此实现感知、决策和行动的闭环。

未来的工厂流水线机器人不再需要针对每一个新零件进行“硬编码”。相反,机器人将拥有“常识”和“适应性智慧”,能够利用多模态传感器数据实时感知环境,推理异常情况,并自主调整动作。

在此背景下,机器人软件已经被视为下一个“月球级”的创新机会,而 Intrinsic 的加入对谷歌而言显得尤为及时。

Intrinsic:从 X 实验室走出,再重回 Google 战略核心

作为 Alphabet 在物理 AI 领域的关键布局,Intrinsic 的起源可以追溯到 2015~2016 年左右。当时,Alphabet 的 X 实验室(前身为 Google X)启动了一个内部项目,希望开发一套软件工具,让工业机器人更易用、成本更低、更灵活,从而扩展其在制造业的应用范围。更早之前,X 实验室也曾走在浪潮之前,用同样的方式成功孵化出自动驾驶巨头 Waymo 和无人机交付公司 Wing。

Intrinsic 在 X 实验室酝酿了五年之久,专注于 AI 增强的感知、学习和自适应能力。2021 年 7 月,它正式从 X 实验室“毕业”,成为一家独立运营的子公司,从原型阶段转向产品验证和市场扩展。

独立之后,Intrinsic 瞄准的是一个极具挑战性的愿景:让工业机器人的编程和使用变得像安装智能手机 App 一样简单。

真正推动这一项目走向商业化轨道的关键人物是 Wendy Tan White。她于 2021 年出任 Intrinsic CEO,此前,她在 X 实验室担任月球工厂副总裁,负责指导多项可持续项目。

Wendy 的创业背景相当丰富:她曾担任全球首款 SaaS 网站构建平台 Moonfruit 的联合创始人兼 CEO,还参与了英国首家互联网银行 Egg.com 的创立,后来担任 BGF Ventures 合伙人和 Entrepreneur First 通用合伙人,专注 AI、机器人和生物科技投资。


(Intrinsic)

在并购方面,Intrinsic 早已展现出不输大厂的战略眼光。2022 年 4 月,其收购了专注于视觉认知的机器人软件公司 Vicarious,后者曾从杰夫·贝索斯(Jeff Bezos)等科技大佬手中狂揽约 2.5 亿美元融资。这家公司的核心技术在于基于神经科学的视觉架构,让机器人在复杂、混乱的光照和物理环境下实现精准的抓取和操控。

2022 年底,Intrinsic 再次出手,收编开源机器人中坚力量 Open Robotics 的商业部门,这是开源机器人基金会(OSRF)的营利臂膀,负责全球最受欢迎的机器人操作系统 ROS(Robot Operating System)及配套仿真软件 Gazebo 的维护工作。此举不仅吸纳了全球最顶尖的底层机器人软件工程师,也使 Intrinsic 实质性地掌握了机器人行业“通用语言”的商业化桥头堡。

时机成熟后,Intrinsic 于 2023 年 5 月 15 日推出其核心产品 Flowstate——一个基于 Web 的机器人开发环境与仿真引擎。Flowstate 对开发者相当友好,允许非专家用户通过调用“技能模块”快速构建、模拟和部署机器人工作流,还支持多机器人、多传感器集成。

其后,Intrinsic 已相继与西门子、Comau、KUKA、TRUMPF 等多家工业企业合作开发智能工业机器人。2025 年 11 月,公司宣布与电子制造巨头富士康成立合资企业,联手研发通用性智能机器人,终极目标直指电子制造的全厂自动化。


(Intrinsic)

整合大模型与物理 AI 团队,谷歌意在重塑制造业生态

Google DeepMind 在物理 AI 领域早已硕果累累。近年来,DeepMind 先后发布了 RT-1、RT-2 (Robotic Transformer) 以及 Open X-Embodiment (RT-X) 系列视觉-语言-动作(VLA)大模型。

通过对多模态推理进行扩展,包括物体检测、轨迹预测和 3D 边界框估计,在输入海量的互联网文本、图像以及真实的机器人操控数据后,这些模型能够直接控制机器人执行复杂操作,如处理物体变异、适应未知环境,响应开放式指令。最低仅需 100 次演示,它就能学习并完成长时序、高灵巧的任务,甚至适应全新机器人形态。

DeepMind 近期发布的 Genie 3 世界模型则进一步强化了模拟能力。该模型通过自回归帧生成实现动态世界建模,能从文本提示生成可交互的 3D 环境,支持实时导航和环境一致性,并维持数分钟的连贯性,从而为机器人训练提供丰富虚拟场景。

合并之前,Intrinsic 与 DeepMind 的合作已有重要产出,2025 年 9 月,DeepMind 机器人团队与 Intrinsic 和伦敦大学学院合作发表论文,提出一种强化学习(RL)框架,使用图神经网络(GNN)在共享障碍环境中协调多达 8 个机器人完成 40 项任务。

研究方法包括场景图表示(节点为机器人、任务和障碍),通过 RL 训练 GNN 策略,实现任务分配、调度和运动规划的联合优化。训练在模拟中进行,零样本泛化到未见环境,支持秒级规划和 300 倍实时速度。


(https://www.science.org/doi/10.1126/scirobotics.ads1

这一技术有望直接应用于工业:它优化了原本需数百小时的手动轨迹设计,工作单元布局的执行效率提升了 33%。结合摄像头 3D 重建等感知系统,它支持在线重规划,适应动态任务集。这与物理 AI 的核心相符:通过图结构捕捉关系物理,实现自动化系统的高效自治。

2025 年 10 月 27 日,Intrinsic 正式发布其工业级感知基础模型 Intrinsic Vision Model(IVM),这也是公司继 Flowstate 之后在 AI 视觉领域的最大突破。它被定位为“Intrinsic Intelligence”的一部分,直接嵌入 Flowstate 平台,让开发者能像搭积木一样调用最先进的视觉能力,极大降低了工业机器人对高精度感知的门槛。

对于开发者而言,IVM 还具备 CAD 原生能力:仅需提供一个零件的 CAD 文件,它就能直接理解并在真实相机画面中定位,完全不需要针对每个新零件重新训练数据。

在当年举办的国际计算机视觉大会(ICCV 2025)上,IVM 参与了 6D 物体姿态估计基准(BOP)验证,并在 11 个赛道中拿下 7 个第一,性能表现相当不俗。


(Intrinsic)

Intrinsic 并入 Google 后,IVM 将进一步获得 Gemini 和 DeepMind 底层架构的强力赋能。这不仅强化了 Alphabet 在物理 AI 的布局,还将加速工业转型。传统制造业当下面临的劳动力短缺和供应链变迁等问题,都可由物理 AI 提供灵活解决方案:中小企业可轻松部署智能机器人,处理从电子装配到物流的复杂任务。

合并公告中,公司 CEO Wendy Tan White 强调:“结合 Google 的强大 AI 和基础设施,我们将为更多制造业企业和开发者解锁物理 AI 的潜力。这将从根本上改变生产,从经济性到运营,并实现真正先进的制造。”

Google Other Bets 首席产品官 Hiroshi Lockheimer 则补充称:“在 Google,我们看到了弥合数字与物理世界鸿沟的巨大机会,尤其在制造业和物流的智能机器人领域。”

不过,要想打造一个硬件中立的软件平台,Intrinsic 就必须打通硬件壁垒。但传统机器人巨头不会轻易开放底层操作控制权,任由 Google 掏空软件利润。如果无法接入最主流的硬件,Intrinsic 的系统就只能在边缘市场或特定代工厂里打转,很难形成真正的“安卓生态”。

更何况,其最大的对手可能不是初创公司,而是英伟达。后者早在几年前就开始布局机器人软件生态:Omniverse(虚拟孪生平台)和 Isaac Sim(机器人仿真平台)。波士顿动力、宇树科技等机器人公司都与其深度绑定。近期,英伟达更是推出专为人形机器人设计的通用基础开源模型 Isaac GR00T N1,把“铲子”卖到底。

物理 AI 的黄金时代似乎即将到来,Google 此次收回 Intrinsic 这枚重要棋子,有望实现“算法-大模型-云服务-物理控制”的完整闭环。当 Intrinsic 正式成为 Google 迎战物理 AI 革命的一张底牌。这张底牌能否打赢,就看它与 DeepMind 和 Gemini 的融合到底能产生多大的化学反应了。

参考资料:

https://www.intrinsic.ai/blog/posts/intrinsic-joins-google-to-accelerate-physical-ai

https://techcrunch.com/2026/02/25/alphabet-owned-robotics-software-company-intrinsic-joins-google/

https://www.science.org/doi/10.1126/scirobotics.ads1204

https://www.intrinsic.ai/intrinsic-vision-model

运营/排版:何晨龙

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。