小米发布并开源Xiaomi OneVL自动驾驶模型

IP属地中国·北京 IT之家 时间：2026-05-13 18:16:49

IT之家 5 月 13 日消息，小米技术今日正式发布并开源 Xiaomi OneVL 一步式潜空间语言视觉推理框架。
官方表示，该模型在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一，在具备 XLA 模型强悍推理能力的基础上，大幅提升了推理的速度和精度，是行业内具备开创性的方案，在精度上超越显式 CoT、在速度上对齐“仅答案”预测的潜空间 CoT 方案。

过去，VLA 和世界模型是自动驾驶领域两条相对独立的技术路线：VLA 专注于理解场景并输出驾驶动作，世界模型专注于预测未来场景的演变。Xiaomi OneVL 通过潜空间推理，首次将两者统一到同一套框架中。
在涵盖感知、推理与规划的多个主流基准上，Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。

▲ 在 ROADWork、Impromptu、Alpamayo-R1 三项基准上均达到 SOTA，在 NAVSIM 上取得优越性能
同时，Xiaomi OneVL 能为模型决策提供语言和视觉双维度的可解释性 —— 既能用文字说明“为什么这样开”，也能用预测画面展示“接下来会发生什么”。

▲ 为模型决策提供语言以及视觉的可解释性
小米已将 Xiaomi OneVL 的模型权重和训练、推理代码全面开源，IT之家汇总链接如下：
技术报告：https://arxiv.org/abs/2604.18486项目主页：https://Xiaomi-Embodied-Intelligence.github.io/OneVL开源代码：https://github.com/xiaomi-research/onevl

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2026年东莞抖音关键词：大连黑白字母网络科技的专业实践

企业微信Agent一手实测！3小时干了我一周的活

“超智融合”架构创新推动中国超算再“登顶”

高校禁入小米汽车引争议：规则透明性合理性受拷问，管理能否多点章法？

小米YU7年销24.4万辆月均2.03万，细分赛道称王，离全民神车还有多远？

同样谈AI，为何科技大佬被嘘哲学教授被赞

全站最新

2026年东莞抖音关键词：大连黑白字母网络科技的专业实践

企业微信Agent一手实测！3小时干了我一周的活

“超智融合”架构创新推动中国超算再“登顶”

高校禁入小米汽车引争议：规则透明性合理性受拷问，管理能否多点章法？

热门推荐

2026年东莞抖音关键词：大连黑白字母网络科技的专业实践

企业微信Agent一手实测！3小时干了我一周的活

“超智融合”架构创新推动中国超算再“登顶”

京东物流在深圳成立科技公司

高校禁入小米汽车引争议：规则透明性合理性受拷问，管理能否多点章法？

小米YU7年销24.4万辆月均2.03万，细分赛道称王，离全民神车还有多远？

同样谈AI，为何科技大佬被嘘哲学教授被赞

ICML 2026 Oral｜大模型的能力从哪些训练数据来？北大&智源提出「机理数据归因」

BOE（京东方）前沿电竞技术矩阵亮相“核聚变嘉年华” 携手合作伙伴共筑原生电竞生态新格局

宁德时代旗下宜昌邦普时代新材料公司增资至7亿增幅约330%

智元通用具身机器人精灵G2量产达15000台推动人形机器人大规模应用

优质内容成创作者黄金机遇：供需变革下视频创作开启“好内容时代”

微软终于放开限制：Windows 11更新可永久关闭！

BOE（京东方）前沿电竞技术矩阵亮相“核聚变嘉年华” 携手合作伙伴共筑原生电竞生态新格局

算力供不应求！谷歌限制Meta使用Gemini模型