当前位置: 首页 » 资讯 » 科技头条 » 正文

王兴兴指出具身智能核心瓶颈 难以适应复杂多变现实场景

IP属地 中国·北京 编辑:李娜 快科技 时间:2026-03-18 08:11:05

快科技3月17日消息,据媒体报道,2026亚布力论坛年会于3月17日-19日在黑龙江亚布力举办。宇树科技创始人王兴兴表示指出,具身智能若要迎来类ChatGPT的革命性时刻,仍需攻克多项关键技术难题。

王兴兴认为,当前最核心的瓶颈在于泛化能力不足。机器人在预先训练的场景中可以实现接近100%的任务成功率,但一旦环境发生改变,其性能便会大幅下降,难以适应复杂多变的现实场景。这一问题直接制约着机器人从实验室走向真实应用的能力。

针对这一挑战,他提出了三个突破方向:首先是提升模型的表达能力,增强机器人运动指令与动作的丰富度,为泛化能力筑牢基础;其次是提高数据利用率,由于机器人领域训练数据极度稀缺,必须在有限数据中挖掘更高价值,推动行业普惠发展;第三是强化强化学习的规模效应,进一步释放算法潜力。

在技术路径的选择上,王兴兴明确表示长期看好基于视频生成的世界模型。他解释,这一路径的逻辑与人类行为高度相似:先让AI在“大脑”中想象并生成机器人执行任务的高质量视频,再将生成视频与机器人动作精准对齐,转化为实际执行指令,从而让机器人完成复杂任务。

王兴兴特别提到字节跳动的Seedance 2.0视频生成技术,认为高保真、高可控的视频生成是实现该路径的重要基础。

不过王兴兴也坦言,这一方向目前面临全球共性难题——视频生成内容与机器人实际动作难以精准对齐。这是制约机器人“大脑想象”转化为“现实行动”的关键卡点。

王兴兴相信,一旦该问题得到解决,机器人通用模型将迎来根本性突破,具身智能的“ChatGPT时刻”也将真正到来。

标签: 机器人 王兴兴 视频 智能 场景 核心 动作 技术 路径 亚布力 现实 瓶颈 任务 科技 宇树 制约 模型 算法 媒体报道 精准 行业 普惠 价值 共性 关键 逻辑 人类 潜力 想象 效应 实际 方向

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。