当前位置: 首页 » 资讯 » 科技头条 » 正文

今天,半个具身智能产业链都在亦庄

IP属地 中国·北京 机器之心Pro 时间:2026-06-16 22:09:58



机器之心编辑部

2026 年,真要成为具身智能的分水岭了。

过去两年,大家总会被机器人在舞台上的表演惊艳,看着机器人跑得更快、跳得更高、动作更流畅。这是行业最容易被看见的部分,它们证明了本体工程和运动控制的进步。

不过,从产业角度来看,真正决定机器人上限乃至具身智能上限的,并不在这些舞台表演上。

6 月 16 日,星海图在亦庄举行全球开发者大会。会上,星海图公布了模型、本体和数据三条战线的进展:G0.5 大模型稳居全球第一梯队,自研双足人形机器人 Kengo 亮相,「百万小时真实数据计划」正式启动。至此,星海图成为中国唯一同时拥有顶尖模型与顶尖本体的具身智能企业



这场半个具身智能产业链悉数到场的大会,也传递了一个信号,具身智能的竞争,正从单台产品的比拼,转向数据与生态的较量。

具身智能头部玩家

正在划分生态版图

国内具身智能行业正在出现越来越清晰的分层,不同企业基于自身能力的积累,选择了不同的发展路径。

比如,宇树科技的优势,更多体现在本体硬件、运动控制和量产交付上。其四足与人形机器人产品长期以高动态运动性能、成本控制和工程交付能力被行业关注。它代表的是一条相对典型的硬件工程路线,即先把机器人的身体做得足够稳定、灵活、可靠,再通过量产能力打开市场。

智元则更强调全链路垂直整合,打法更接近「软硬件一体化具身智能平台」。这条路线的特点是控制力强,适合在明确场景中推动规模化落地。

星海图走的是第三条路。硬件、数据,在它这里都不是终点,而是同一件事的不同入口,所有努力最终都指向一个问题:机器人如何在真实世界里真正创造生产力



换句话说,星海图做整机,是为了获得真实场景中的数据入口、执行反馈和模型闭环。没有整机,具身智能就缺少持续采集物理世界数据的载体,没有真实世界里的任务反馈,模型也很难完成有效迭代。

从这个角度看,星海图的打法可以概括为「数据 - 模型 - 整机」的飞轮。整机进入场景,带回真实数据;真实数据训练模型,提升任务泛化能力;模型能力再反向定义下一代本体、模组和场景部署方式。

星海图也没有把自己锁定在单一本体形态上。它早期就提出「一脑多形」的判断。人形只是具身智能的一种载体,未来真正有价值的是一套可迁移、可复用、可接入多种硬件形态的智能系统。

这也解释了为什么星海图反复强调「生态」。具身智能行业过去更多是在做「专用工具」,针对一个场景、流程或动作去设计机器人,能力边界清楚,复制到新场景时成本很高。星海图希望做的,是更接近「通用智能体」的底层能力,也就是同一套大脑可以适配轮式双臂、双足人形、灵巧手等不同本体,也可以进入工业、商业、科研等不同场景。

这并不意味着专用机器人没有价值。相反,专用机器人往往是具身智能最早落地的入口。但如果行业长期停留在专用工具阶段,每家公司都会在各自场景里重复造轮子,数据无法流动,模型难以泛化,生态也很难形成。星海图想解决的,正是从「单点可用」到「能力复用」的问题。

三重跃迁曲线

大会上,星海图 CEO 高继扬提出具身智能发展的「三重跃迁曲线」:本能智能、作业智能和进化智能。

本能智能解决的是机器人如何驾驭自己的身体,包括平衡、协调、运动控制和复杂地形适应。它类似动物的本能,也是机器人进入真实世界的基础。没有这一层能力,机器人很难稳定执行任务,更谈不上生产力。

作业智能更接近产业真正需要的能力。机器人不仅要能动,还要能理解任务、拆解流程、完成有序作业。在这一阶段,语言会成为非常重要的接口。因为真实世界中的生产任务,往往是一连串有上下文、有目标、有约束的流程。人类需要用语言调度机器人,机器人也需要把语言转化为可执行的动作序列。

进化智能则是更长期的判断。过去是人类根据经验设计机器人的形态、关节、传感器和任务流程;未来,AI 可能会反过来参与定义机器人应该长什么样、该采集什么数据、该进入哪些场景、该如何形成下一轮能力迭代。具身智能的终局,可能不只是让机器人模仿人类动作,还包括让 AI 参与重构机器人的设计和生产方式。

星海图认为,具身智能不存在所谓的「GPT 时刻」。大语言模型的突破发生在一个普通用户可以直接感知的界面里,每个人打开网页或手机,就能看到模型能力变化。但具身智能的进展不会如此集中,也很难由一次产品发布完成定义。它更可能从 B 端开始,在仓储、零售、工业、服务、科研等场景中逐步渗透。某个场景先跑通,某类任务先稳定,再逐步扩展到更多任务。几年后回头看,机器人可能已经进入大量生产环节,但很难说清是哪一天突然发生了质变。

在这个判断下,星海图构建了一系列支撑「作业智能」落地的硬核技术,包括 G0.5、Fast-WAM、Kengo、R1 系列、灵巧手等等,从软件到硬件。

新一代 VLA 基础模型 G0.5是这套体系的大脑。该模型采用统一自回归 VLA 架构,具备「边思考边行动」的原生动作思维能力,并沉淀了抓取、放置、推拉等可迁移基础动作单元。



评测显示,G0.5 刷新了全球 7 大权威榜单,稳居全球第一梯队,也是国内第一。

Fast-WAM 世界模型则指向动作响应效率。对于机器人来说,慢半拍就可能导致任务失败。Fast-WAM 单步推理延迟为 190 毫秒,配合 G0.5 让机器人动作响应提速 4 倍以上。

此外,星海图自研的双足人形机器人 Kengo,不仅外形科技感十足,更具备强悍的运动爆发力(单关节扭矩超 130N・m),能胜任四连踢、递物、叠衣等复杂场景动作。

双足形态的价值,在于它可以进入更多现有环境,减少场景改造成本。对一家以「具身大脑」为核心的公司来说,拥有自研双足本体,也意味着它可以在更复杂的任务中验证模型能力。

Kengo 的发布,星海图补齐了面向全身作业的最后一块拼图,成为中国唯一一家同时拥有「顶尖模型 + 顶尖本体」的具身智能企业,「整机+智能」的战略正式闭环。

真实数据,具身智能的长期壁垒

模型与本体之外,数据是制约具身智能发展的另一个核心变量,而且在很多从业者看来,它的重要性不亚于前两者。

大语言模型之所以能够出现能力跃迁,一个重要前提是互联网已经积累了海量文本、图像、代码和视频数据。而具身智能至今没有自己的「互联网」。物理世界每天都在发生大量交互,但这些交互很少被系统记录成可训练、可复用、可标注的数据。

没有足够规模、质量、多样的真实世界数据,具身智能很难真正理解物理约束,也很难在新环境中稳定执行任务。仿真数据和合成数据可以提升效率,也能补充长尾场景,但真实世界的操作数据仍不可替代。

从行业进展看,过去两年,具身智能赛道的数据积累量,基本停留在几千小时到十几万小时区间。但今年开始,行业头部企业普遍在向百万小时量级数据推进,而未来两三年,千万小时或许将成为新的竞争基准



星海图去年开源的GOD 数据集,是全球第一个开放场景具身操作数据集,下载量已突破 60 万次,在开源社区中保持着较高的使用频次。

在此基础上,星海图这次联合北京亦庄共建「亦数智能」,并启动了「100 万小时超高质量真实数据计划」,目标在 2026 年完成百万小时数据积累,未来三年迈向千万小时规模。

同时,配合由原力灵机、蚂蚁数科、百度智能云等 15 家企业参与的「数据生态联盟」,中国具身智能终于开始打造属于自己的第一条完整数据供应链。



千万小时量级的动作、视觉、力觉协同数据数据,有望打破 Corner Case 的魔咒,让 AI 开始反向定义硬件,彻底把机器人从特定场景推向真正的通用化。

掌握了真实数据,就掌握了通向物理 AI 世界的话语权。在这个逻辑下,星海图希望对行业的游戏规则进行一次底层重构。

重新定义商业终局

过去,外界看具身智能公司,最常用的标准是卖了多少台机器人、跑进了多少场景、能否形成订单。这些指标依然重要,因为它们决定了企业能否活下来。但从更长期的产业视角看,具身智能的商业模式可能会经历一次深层变化。

星海图提出,未来具身智能的商业模式会从「整机销售」,走向「方案订阅」,最终进入「Token 销售」,这也是具身智能商业模式中,最具想象力的部分。



第一阶段与智能解耦,只是单纯卖铁,而星海图追求的是智能驱动的第二乃至第三阶段的领先。

通过开放「大脑」与构筑「真实数据互联网」,星海图正在发展成为具身智能时代所有开发者都绕不开的基础设施供应商。没有任何一家公司能够独自定义这个时代,但当半个具身智能产业链今天都站在亦庄的会场里时,大幕已经拉开。

或许具身智能的确没有 GPT 3.0 时刻,但我们能够看到,它正在加速走向成熟。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。