当前位置: 首页 » 资讯 » 科技头条 » 正文

继HappyHorse后,阿里又有一款模型登顶权威评测榜单

IP属地 中国·北京 编辑:李娜 量子位 时间:2026-04-18 01:51:26

阿里巴巴旗下一款名为ABot-PhysWorld的世界模型登顶世界模型领域的权威评测WorldArena。不到半个月内,阿里巴巴已先后有两个全新模型登顶世界级评测榜单。

4月初,来自阿里巴巴的HappyHorse横空出世,一举登顶权威AI模型测评榜单Artificial Analysis。而这次,ABot-PhysWorld也是力压GigaWorld、Google Veo等知名模型,登顶WorldArena。

WorldArena是世界模型领域公认的权威评测,由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学以及中国科学技术大学等8所顶尖高校共同打造。其构建了包含16项细分核心指标和3大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的压力测试。

从能力指标上来看,ABot-PhysWorld的领先性体现在其对物理规律的深度内化与长程动态预测能力上。不同于多数模型仅能生成短时、静态或装饰性的视频片段,ABot-PhysWorld够准确预见物体在复杂交互下的运动轨迹,如滑动、倾倒、堆叠、流体变化等,并保持多步因果逻辑的一致性。

这种“可推理”的生成能力使ABot-PhysWorld在任务规划、异常预判和自主决策中具备实际价值,而非停留在视觉演示层面。

标签: 模型 权威 登顶 能力 任务 上海交通大学 榜单 规律 大学 物理 世界 中国 深度 内化 指标 中国科学院 香港大学 北京大学 静态 实际 逻辑 视觉 视频 决策 一致性 层面 装饰性 价值 立体

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。