当前位置: 首页 » 资讯 » 科技头条 » 正文

刚刚,智元拿下WorldArena世界模型总分冠军!

IP属地 中国·北京 机器之心Pro 时间:2026-05-29 22:18:47



机器之心发布

WorldArena 世界模型赛道从来都是竞争异常激烈,在经历了前几次比赛过程中的放榜之后,CVPR 2026 WorldArena 世界模型赛道锁定总成绩,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称 GE 2.0)拿下了最终的冠军,成为了 “强者中的强者”。



WorldArena 是目前世界模型赛道最权威的榜单,拥有最严苛的评测基准,构建了包含 16 项细分核心指标和 3 大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的考察。由于其极高的学术严谨性与行业公信力,WorldArena 吸引了全球几乎所有头部世界模型团队同台竞技。

在该赛道评测中,智元团队使用了原生的世界模型 GE 2.0,并未针对赛题进行特殊设计优化,仅基于榜单数据进行了基础微调(Finetune)。“轻装上阵” 依然拔得头筹,充分印证了 GE 2.0 强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮,智元始终保持自己的节奏,从长远第一性原理出发 ,专注于打磨具身世界模型的坚实技术底座。此次登顶,是智元坚持长期技术演进的实力见证。



项目链接:https://ge-sim-v2.github.io/Arxiv:https://arxiv.org/abs/2605.27491Github:https://github.com/AgibotTech/GE-Sim-V2

裸考封神

智元 GE 2.0 模型实力登顶

没有针对 WorldArena 进行特别调优,裸考出战依然断层领跑。在 GE 2.0 技术报告中,智元团队对模型进行了全面的能力剖析。相比上一代模型,GE 2.0 不仅在单点性能上实现了跃升,更真正演进为一个全功能、高可用的世界模拟器,构建可试错、可迭代、可进化的虚拟仿真环境,让机器人策略在虚拟场景中自主积累经验、完成动态试错,规避真实场景的试错成本,最终高效迁移至真实物理世界稳定落地,真正实现从 “感知预测” 到 “仿真进化、自主决策” 的闭环升级。

功能矩阵全面补齐:GE 2.0 在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节,构建了世界模拟器完整的技术能力闭环。



长时序推演能力突破: 在长时序推理任务中,GE 2.0 表现出极强的稳定性,画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演 40-50 秒的长视频片段时,其生成质量依然超越了基线模型前 10 秒内的表现。



高可靠的闭环评测:作为世界模拟器,核心在于能否真实反映物理世界。团队验证了大量闭环评测结果,证明 GE 2.0 在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的 “成功率一致”,团队还进行了逐案(Case-by-case)的 rollout 结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证,强有力地证明了 GE 2.0 作为策略评测器的可靠性。



打通数据回流反哺机制:在奖励模型(Reward Model)的加持下,GE 2.0 能够对闭环评测的 rollout 过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验证明,这一机制在多项任务上均助力策略模型实现了显著的性能涨点。



从技术沉淀来看,智元 GE 2.0 的登顶,是长期深耕底层算法、打磨物理 AI 核心能力的必然结果。相较于行业同类模型,该模型实现了全方位技术跃升,不仅补齐长时序稳定推演、多视角精准生成、实时物理还原、闭环奖励判别等全维度能力,更突破传统模型 “重视觉、轻物理、难落地” 的行业痛点。即便在 40-50 秒超长时序复杂场景推演中,依旧能保持画面稳定、物理逻辑精准、空间结构无偏差,生成数据可直接反哺机器人策略模型迭代,真正实现从 “视觉拟真” 到 “物理可信、可用、可落地” 的质变,算法通用性、稳定性、实用性全面领先行业水平。

ALL IN AI

智元定位 “具身智能的基础模型公司”

区别于行业多数聚焦机器人硬件整机、场景应用或单点技术优化的企业,智元坚定锚定具身智能基础模型公司核心定位,核心逻辑不在于制造机器人本体,而在于打造支撑整个物理 AI 行业发展的底层基础设施与通用基础能力。不同于单点应用技术的迭代,智元深耕通用具身基础模型,打造可适配全场景、可通用泛化、可自主进化的底层 AI 能力,为机器人的运动、感知、决策、作业提供核心大脑。

今年 4 月,智元连续一周进行了 “ALL IN AI” 智元 AI WEEK 成果发布,完成了开源数据集、开源仿真平台、基座大模型、世界仿真器、机器人部署应用平台五大核心维度的完整技术闭环搭建,构建了行业独一份的 “数据筑基 — 仿真赋能 — 模型进化 — 应用落地 — 生态开放” 全链路能力体系,彻底摆脱单点技术短板,成为具身智能领域全能型战士。

AGIBOT WORLD 2026:首个系统性覆盖具身智能全域研究的开源数据集Genie Sim 3.0:首个大语言模型驱动的仿真开发平台Genie Operator-2:通用具身基座大模型,定义 “知行合一” 新高度Genie Envisioner 2.0:世界模型驱动的环境模拟器Genie Studio Agent:面向具身作业场景的零代码 Agent 应用平台

当前行业普遍存在数据质量参差不齐、仿真成本高、模型落地难、部署门槛高的痛点,智元通过全栈基础技术布局,打通了完整价值闭环,解决了制约行业发展的共性底层难题。同时,智元坚持 ALL IN AI 的核心战略,所有技术迭代均围绕通用基础能力升级,而非单一场景定制优化,其技术成果可覆盖全品类机器人、全行业物理作业场景,具备极强的产业赋能属性,真正承担起具身智能领域基础底座搭建者、行业标准定义者的角色,也是智元能够拿下世界模型赛道全球总冠军、持续领跑物理 AI 的核心根源。

真正的通用机器人,离不开硬件本体与智能系统的深度协同,更需要全栈自研的 AI 能力体系作为坚实底座。具身智能的未来,不在于零散的单点创新,而在于可持续进化、可协同放大的系统性能力。从建成全球首个 3000 平方米机器人实景数据采集场地,到推出一站式仿真开发平台 Genie Sim;从通用具身基础模型 Genie Operator 1,到实现对物理世界深度理解的世界模型 Genie Envisioner;再到面向全量开发者的具身智能一站式开发平台 Genie Studio:智元持续构建面向物理 AI 的完整能力底座,打通技术价值闭环,让每一项 AI 能力都成为推动机器人迈向 “部署态” 的坚实支撑。

锚定 “部署态”

让具身智能从炫技走向商用闭环

部署态是今年智元在 2026APC 合作伙伴大会上提出来的概念,智元依托全栈技术闭环,实现机器人在真实复杂场景中大规模稳定作业、持续迭代,具备可落地、可复用特质,真正标志着具身智能从技术演示迈向规模化商用新阶段。

成功实施 “部署态” 的核心在于底层算法的演进,智元 ALL IN AI 的核心逻辑始终围绕真实物理世界、真实作业需求、真实商用落地,全部服务于机器人规模化部署:真实场景数据集保证模型适配复杂真实环境;生成式仿真大幅降低试错成本;基座模型保障作业精准稳定;世界模型提升复杂任务自主决策能力;零代码平台彻底解决落地难、复制难、迭代难的产业痛点,实现技术价值到产业价值的完整闭环。

一次裸考登顶,是实力的印证;持续全域领跑,是强者的常态。智元本次登顶 WorldArena 世界模型总分冠军,是智元长期坚持 All in AI 战略的成果。算法是未来具身智能产业的竞争核心,只有持续迭代世界模型、基座大模型等核心算法能力,深化虚实融合技术闭环,才能在具身智能这条长跑之路上,不断引领向前。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新