本报记者卢晓 北京报道
具身智能市场进入数据大基建时代。4月16日,京东宣布在全球首推覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施。而在一个月前,它刚宣布将建成全球最大具身数据采集中心。
当前,具身智能产业高速发展,但高质量真实交互数据严重不足,直接影响具身模型“大脑”能力的发展。京东集团技术委员会主席、京东云总裁曹鹏当天也直言:“数据已经成为制约整个模型发展的核心瓶颈。”
加码数据基础设施
依托京东在算力基础设施、大模型技术及产业场景上的积累,京东云推出了全球首个全链路具身智能数据基础设施,打通从数据采集到模型测试的全流程闭环。
其中在数据采集设备方面,京东云自研的可穿戴式超高清采集终端JoyEgoCam受到关注。据其介绍,这款头戴式设备配备4K高清摄像头,整机仅重220克,支持60帧帧率与130度超广角拍摄,可实现毫秒级动作细节捕捉,以及极端抖动场景下的稳定追踪拍摄。
对于为何选择头戴式设备,京东集团副总裁、京东云基础云业务负责人龚义成对《华夏时报》等媒体记者指出,京东之所以选择第一视角人类视频数据路线,是因为其具备可规模化采集、真实性强、成本可控等优势,并且能够实现“一脑多形”——一个模型兼容不同机器人本体。
他进一步举例称,过去做遥控操作,A机器人公司采集的数据只能自用,B机器人公司必须自己重新做,造成了极大的浪费,“我们在推进具身数据的规模化建设时,核心要解决这个问题,另外要结合真实落地场景,还要满足成本低、跨本体复用,不能跟特定机器人深度绑定。”
据记者了解,未来京东还将进一步扩大数据采集维度。京东集团具身智能首席专家、IEEE/IAPR Fellow林倞当天在演讲中也提及,下一阶段京东会进一步把数据从手部拓展到全身,这也是推动整个具身智能模型进入“全身运控”的阶段,包含第一人称和力觉、触觉、环视感知等等。
需要提及的是,京东当天还同步上线了具身智能数据交易平台,首批定向开放2000小时高精标注数据集EgoLive。
龚义成当天在接受采访时也表示,京东并非只做数据提供商,更希望能建立一个面向具身行业的生态联盟,“京东不可能覆盖全行业的数据采集工作,还要依赖更多的合作伙伴,来跟我们一起把不同场景对具身行业有价值的数据采集到。”
数据采集瓶颈待破
当前,具身智能正加速进入工业制造、物流仓储、家庭服务、医疗康复等核心领域,但多位业内人士在跟本报记者交流时都认为,目前具身智能行业普遍面临数据采集成本高、质量差、标准不一等难题。
曹鹏当天也用一组数据说明了问题的严重性:训练一个非常好的模型,至少需要一千万小时量级的数据,而市场上能拿到的数据集基本上是几十万小时的体量。他进一步指出,即使现有的数据集也存在场景多样性不足、对本体的依赖过强等问题,没有办法做很多跨本体的迁移和操作。
据记者了解,京东目标在两年内采集超过1000万小时真实场景视频数据,以及100万小时机器人本体数据。并将为此投入超过10万员工,再联合50万外部协作人员,在宿迁就会发动10万市民共同参与。
在这背后,是京东的超级供应链能力,目前京东拥有3600多个库房,上万家线下门店,20多万药房,也是全国最大的家政服务公司,有超过5万家政人员。曹鹏当天表示,“这些场景如果能采集下来,对支撑机器人本体大脑训练有巨大价值。”
京东在具身智能领域的布局也正迅速展开。据其提供的数据,京东JoyInside附身智能已与近200个家电家居、机器人、玩具等品牌深度合作;京东零售2026年将助推机器人品牌伙伴累计销售破100亿;京东物流持续构建机器人售后维修服务生态,机器人救护车将服务中国及海外市场,专业工程师规模将拓展至超万人;京东工业打造一站式工业供应链技术与服务,将实现机器人制造物料100%覆盖。
龚义成对《华夏时报》等媒体记者强调:“今年可以称之为具身数据的元年。过去大家主要靠机器人遥控操作,数据量有限,场景也非常受限,我们现在做的事情,是从根本上解决模型训练的规模化问题。”
需要提及的是,当天在谈及“AI是否会导致岗位被替代”相关问题时,龚义成表示:“技术发展永远不可逆转,但技术发展不是为了替代人,而是让生活更美好,也会创造出更多新的岗位,比如我们在宿迁具身数据采集中心,就发动了大量的市民参与数据采集、数据标注等工作。”





京公网安备 11011402013531号