当前位置: 首页 » 资讯 » 科技头条 » 正文

新入库高质量人形机器人数据集,OpenLoong数据生态建设进入新阶段

IP属地 中国·北京 文汇报 时间:2025-11-28 18:13:23



高质量、多模态、结构化数据已成为提升具身智能模型能力、推动产业走向规模化应用的核心要素之一。近日,国内知名的人形机器人智能开源社区OpenLoong正式获赠由乐聚智能自主构建的 LET 数据集,补充了一套覆盖真实作业场景的重要数据资源。此举不仅将为国内人形机器人研发提供有力支撑,也体现了行业对统一数据规范与开源治理模式的认可,标志着 OpenLoong 数据生态建设进入新阶段。

作为开放原子开源基金会孵化及运营的重点项目,OpenLoong 依托设立在上海的国家地方共建人形机器人创新中心(下称“国地中心”)建设经验,持续推进共享型数据框架的构建,以开源方式推动数据的规范化组织与复用,为行业提供稳定的数据底座。

LET 数据集由乐聚智能与合作团队联合构建,具有规模大、结构规范、场景丰富等特点,具备突出的工程化与研究价值,是国内少有的面向真实作业场景的全尺寸人形机器人真机数据集。


该数据集基于乐聚夸父系列全尺寸人形机器人进行统一采集,覆盖真实作业链路,规模超过 6万分钟,在场景覆盖上跨越工业、商业零售和日常生活三大领域,包含汽车工厂、快消场景、酒店服务、3C 工厂、生活服务和物流共六类真实生产与服务环境,并在此基础上构建了 31 项任务和 117 种原子技能,形成结构清晰的任务体系,适用于训练机器人在多场景、多步骤、多目标条件下进行学习与推理。

当前,人形机器人正在加速从实验室走向真实应用场景,产业链对高质量数据集的需求不断提升,但行业内存在数据来源分散、数据格式各异、数据结构不统一等共性问题。作为应对,OpenLoong 开源社区积极推进高质量数据资源的开放共享,吸引行业伙伴共同建设统一的数据体系。


作为国家级创新中心,国地中心始终致力于推动产业标准化进程,建立了一套覆盖数据采集、数据处理、数据质量审核和版本管理的标准体系,可以从源头确保数据质量与可用性,为行业提供标准化、易复用的数据资产。迄今,国地中心累计主导或参与的国际标准、国家标准和行业标准达到 60 余项,建设维护具身智能数据集开源平台,与行业共享标准化成果。2025年9月,国地中心申报的“上海虚实融合具身智能训练场标准化试点”获批公示。

OpenLoong 开源社区表示,他们将始终坚持开放共享的原则,欢迎更多行业伙伴加入数据共建,同时将持续为贡献者提供规范透明的托管环境,通过开源机制确保数据被充分利用。随着数据规模不断增长,OpenLoong 将与行业共同推动多场景、多任务、多模型的协同研究,促进形成更加开放、健康的产业生态。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新