近日,人形机器人与具身智能标准化(HEIS)年会在北京举行。工业和信息化部人形机器人与具身智能标准化技术委员会副主任委员、智元机器人联合创始人、总裁兼CTO彭志辉(稚晖君)出席并发表演讲,分享了智元从“实验室炫技”到“部署态落地”的工程化实践与思考。
“整个具身智能行业目前还在共同探索,没有任何一家企业能独自给出正确答案。”彭志辉在演讲开场时指出,“我们需要协力攻破瓶颈,在正确的时间做正确的事。”
谈及产业现状,彭志辉援引工信部数据表示,国内人形机器人整机企业已超140家,发布产品达330款,行业已从实验室炫技、Demo展示,进入工程化、场景化竞争的下半场。2024年到2025年初,行业焦点还在比拼机器人走路是否自然,如今已能完成“飞檐走壁”般的高难度动作。“本体灵活性已达到实用化阶段,接下来要比的,是谁的干活能力更强。不仅在国内比,更要与海外头部企业比,看谁能在‘部署态’真正落地。”彭志辉直言。
彭志辉表示,面对物理世界的复杂约束,智元总结出一套可落地的工程范式——“一体三智”。关于“一体”,即机器人本体。“在数字世界,代码跑错了可以重启;但在物理世界,有物理成本、失效成本。因此本体设计绝非简单的硬件堆叠,而是可靠性工程、供应链工程和安全工程的综合体。”
针对核心零部件,彭志辉介绍称,关节和灵巧手决定了机器人的运动和操作能力上限,也占据了整机成本的绝大部分。如何科学做好关节系列化规划,是一个标准化流程,也是非常考验系统设计能力的一点。
目前智元机器人将所有产品线,包括五大系列、近10款产品全部规整到8款系列化关节设计上。“这8款关节用在我们所有产品上,能够满足所有部位的关节需求。这就是系列化、标准化带来的收益。”彭志辉称。
灵巧手也是一个复杂度非常高的核心零件,它的难点一方面是需要把10~20个自由度的运动部件结构,塞进比人手手掌还小的空间;另一方面是对灵巧手的高维感知能力要求非常高,最典型的就是触觉。彭志辉指出:“工业场景中接近80%人类做得很好,但自动化做不好的工序,都和触觉强相关。装配工人通过手感把零件拼起来,‘咔嚓一声’觉得装好了——这种信号如何用数字描述?这是行业面临的瓶颈之一,我们正投入大量研发精力,期待未来能够收效。”
“如果说硬件本体是机器人的躯体,AI就是它的灵魂。”在智能层面,彭志辉将其划分为运动、交互和作业三个维度。为降低应用门槛,智元推出了“灵创平台”。“我们把动作训练流程简化到像发抖音一样,用户只需上传一段视频,平台就能自动完成关键点检测、训练和部署。”他介绍,这一工具链旨在推动行业从科研人员的“开发态”走向大众的“创作态”,最终实现低成本的“部署态”。
此外,智元正致力于构建开放共享的生态。他透露,智元不仅开源了被称为“具身智能安卓”的操作系统灵渠OS,还发布了业界最大的真机数据集。“生态的力量远远大于单点突破,我们希望形成‘能力复用、数据回流、模型进化’的正向循环。”
在场景落地策略上,彭志辉提出了“沿途下蛋”的策略。他将任务维度划分为“场景复杂度”和“任务复杂度”,认为当前人形机器人的最佳切入点是“在简单场景做复杂任务”。“比如在结构化的工厂环境里,执行高自由度、高维感知的复杂操作。”他分析道,虽然自动驾驶是在复杂环境下做简单任务,但人形机器人与自动驾驶的终局是一致的,即在复杂环境下完成复杂任务,“目前我们已在文娱商演、工业制造、物流分拣、安防巡检等八大典型场景展开应用,只有真实场景才是验证可靠性、迭代系统的最有效途径”。
对于为何坚持“人形”路线的底层逻辑,彭志辉给出了一个形象的比喻:“Computer Use(电脑使用)是数字世界的人形接口,而人形机器人就是物理世界的通用接口。”他解释说,正如现有的软件系统是为鼠标键盘设计的一样,整个物理世界——从门把手高度到工具形态——都是为人类身体设计的。“既然环境是围绕人类构建的,那么AI要实现最大化的通用性和兼容性,其终端形态大概率也要长得像人。它未必是效率最高的,但一定是兼容性最强的。”他预判,未来人形机器人走进家庭时,产业规模将是“手机数量乘以汽车价格”的级别。
作为标委会副主任委员,彭志辉最后呼吁行业共建标准体系。“具身智能的终局是基础设施,而非单点产品。”他表示,“物理AI规模化的关键在于数据闭环、可靠性工程以及可运维能力的标准化。我们既要跑得快,也要跑得稳。智元愿将一线实践中的数据治理方法、评测体系和运维经验与行业共享,共同加速物理AI的系统性落地。通用能力的突破肯定来自于全行业的产业迁移与生态共建,而标准化正是这一过程的加速器。”





京公网安备 11011402013531号