当前位置: 首页 » 资讯 » 科技头条 » 正文

智源研究院开源单图高精度6D位姿估计方法

IP属地 中国·北京 北京商报 时间:2025-10-27 22:14:19

北京商报讯(记者 魏蔚)10月27日,智源研究院宣布,单图高精度6D位姿估计方法开源,让机器人"一眼看懂"陌生物体。传统6D位姿估计方法大多依赖高质量CAD模型或多视角重建,难以满足动态、实时的实际需求。现有的单张图像推理方法则普遍受限于尺度、外观和姿态的模糊性。正因如此,尽管近年来视觉-语言-动作(VLA)模型在宽容度较高的任务中取得进展,但在毫米级精度的操作场景中,感知—控制链条仍难以闭合,制约了机器人通用操作能力的进一步提升。

针对这一挑战,北京智源人工智能研究院(BAAI)可控世界模型创新中心赵昊团队提出了OnePoseViaGen:该方法无需预设 3D 模型,仅依赖单张RGBD参考图像,即可在未知物体上实现高精度 6D 位姿估计。相关论文 "One View, Many Worlds: Single-Image to 3D Object Meets Generative Domain Randomization for One-Shot 6D Pose Estimation"入选 CoRL 2025 Oral。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。