当前位置: 首页 » 资讯 » 科技头条 » 正文

Dexmal原力灵机开源Dexbotic,基于PyTorch的一站式VLA代码库

IP属地 中国·北京 机器之心Pro 时间:2025-10-22 16:13:14


机器之心发布

机器之心编辑部



Dexbotic 是一套基于 PyTorch 框架开发的开源视觉-语言-动作模型(VLA)代码库,由 Dexmal 原力灵机重磅推出,主要面向对象为具身智能领域研究者;其整体架构包含 Data、Experiment、Model 三大核心组件,具备统一模块化 VLA 框架、高性能预训练基础模型、实验导向型开发框架、云端与本地一体化训练、全链路机器人训练与部署五大特征。



Dexbotic 提供了一套同时支持多个主流 VLA 算法的代码库,用户只需配置一次环境,基于所提供的预训练模型,即可在各类仿真环境中复现各类主流 VLA 算法,通过解决这一行业痛点,为具身智能领域从业者提供一站式 VLA 科研服务。同时,Dexmal 原力灵机还将持续更新和支持更多业界领先的 VLA 模型。



视频链接:https://mp.weixin.qq.com/s/lUBMDttS98v5PEuXiPHEsw

官网:https://dexbotic.com/Paper:https://dexbotic.com/dexbotic_tech_report.pdfGitHub:https://github.com/Dexmal/dexboticHugging Face:https://huggingface.co/collections/Dexmal/dexbotic-68f20493f6808a776bfc9fc4

为何需要统一的 VLA 开发平台?

具身智能中,视觉-语言-动作模型已成为连接感知、认知与行动的核心技术枢纽,发展迅猛的同时也面临多重挑战:

VLA 技术研发分散化严重,研发人员往往基于不同的深度学习框架和模型结构进行探索VLA 研发流程异常繁琐,进行算法对比评测时,需要配置多份实验环境和数据格式VLA 算法复现公平性欠缺,难以确保每个对比的算法调至最优,导致复现和比较并不公平VLA 研发无法从最新的视觉-语言大模型(VLM)受益,大多数 VLA 往往基于过时、不同期的 VLM 构建



正是洞察到这些痛点,Dexmal 原力灵机正式推出 Dexbotic —— 一套基于 PyTorch 框架的开源视觉 - 语言 - 动作模型工具箱,为具身智能研究者提供标准化、模块化、高性能的一站式科研基础设施,推动具身智能从「重复造轮子」走向「协同创新」。

整体架构



Dexbotic 代码库的整体架构主要包含三大核心层级:数据层(Data Layer)、模型层(Model Layer)和实验层 (Experiment Layer)。数据层定义了 Dexdata 统一格式以整合多源数据并优化存储空间;基于 Dexdata 格式的数据,系统将自动执行数据处理流程,提取图像、文本及状态信息用于模型训练。

模型层引入基础模型 DexboticVLM 作为开发多样化 VLA 策略的核心基础,其可直接支持离散 VLA 训练,亦可作为现有 VLA 策略的基座模型。当前版本已支持 π0、OpenVLA-OFT、CogACT、MemoryVLA 等多种 VLA 策略,用户也可便捷地自定义新的 VLA 模型。

实验层是 Dexbotic 体系中最核心的组成部分。基于模型层中的各类 VLA 模型的详细实现,Dexbotic 创新性地引入实验脚本机制,定义了基础实验脚本,用户根据自己的需求修改最少量的实验配置,即可开展新的实验,在确保系统稳定性的同时支持快速实验迭代开发。

主要特征

统一模块化 VLA 框架。Dexbotic 以 VLA 模型为核心,兼容主流大语言模型的开源接口。该框架集成了具身操作与导航功能,支持多种业界领先的具身操作与导航算法,同时预留了未来全身控制的接口扩展能力。

高性能预训练基础模型。针对 π0 和 CogACT 等主流 VLA 算法,Dexbotic 开源多个性能更强的预训练模型。这些模型在 SimplerEnv、CALVIN 等各类主流仿真器及真实物理世界任务中均能带来显著的性能提升。

实验导向型开发框架。Dexbotic 的实验框架采用「分层配置 + 工厂注册 + 入口分发」架构,用户仅需修改实验 Exp 脚本,即可轻松实现配置修改、模型更换或任务添加等需求。该设计符合开闭原则,在保证系统稳定性的同时兼具灵活性与扩展性。

云端与本地一体化训练。Dexbotic 全面满足不同高校及企业的训练需求,既支持阿里云、火山引擎等大规模云训练平台,也适配 RTX 4090 等消费级显卡的本地训练环境。

全链路机器人训练与部署。针对 UR5、Franka 和 ALOHA 等主流机器人,Dexbotic 提供统一的训练数据格式,并开源通用部署脚本支持用户定制化部署。未来将持续扩展更多主流机器人平台的支持。

开源硬件



具身智能的研究发展离不开开源硬件的支撑。有鉴于此,Dexmal 原力灵机也推出了其首款开源硬件产品 ——Dexbotic Open Source - W1(DOS-W1)

该产品采用完全开源的硬件设计,即将开源所有的文档、BOM、设计图纸、组装方案、相关代码;采用大量的快拆结构与可替换模块,这极大地降低了机器人的使用门槛、改造便利性和维护便利性;同时,其符合人体工学的抗疲劳设计,有效提升了操作人员的舒适度与数据采集效率。

据悉,Dexmal 原力灵机也将与各产业伙伴一起,持续丰富 Dexbotic Open Source 系列,以开源硬件助力具身智能前沿研究,加速机器人技术在真实物理世界的落地与应用。

未来展望

未来,Dexmal 原力灵机计划扩展更多的先进 VLM 基座模型和开源硬件,集成仿真到真实物理世界的迁移学习工具链,并建立社区驱动的模型贡献机制,不断持续投入 Dexbotic 生态建设,致力于成为具身智能领域的「基础运行层」,为通用机器人智能的到来奠定坚实基础。

Dexmal 原力灵机诚邀全球开发者共同参与 Dexbotic 社区建设,通过代码贡献、算法优化、开源硬件应用案例分享,携手推动具身智能迈向新高度。正如 Linux 之父林纳斯・托瓦兹所言:「软件进化需要群体的智慧」,Dexbotic 正是这一理念在 AI 时代的具体实践。

同时,Dexbotic 正与全球首个具身智能的大规模真机评测平台 RoboChallenge 形成深度协同。研究者基于 Dexbotic 开发的模型,可在 RoboChallenge 平台进行公开、公平、透明的性能验证,从基础设施层面构建 “开发 - 训练 - 推理 - 评测” 的完整技术闭环。

10 月 23 日晚 19:00,Dexmal 原力灵机创始团队成员汪天才将现身直播间,讲解开源一站式 VLA 工具箱 Dexbotic,欢迎大家预约观看、线上交流。



直播间链接:https://www.yunxianchang.com/h5/info/9474

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。