IT之家 2 月 9 日消息,Alphabet 旗下自动驾驶技术企业 Waymo 当地时间本月 6 日宣布推出其世界模型。这一模型基于其兄弟企业谷歌旗下 DeepMind 的通用世界模型 Genie 3 打造,可生成逼真且交互式的 3D 环境。
Waymo 表示,自动驾驶行业的大多数仿真模型都是基于收集到的道路数据从 0 开始训练的,这意味着上述模型缺乏对一些极其罕见的超常规事件的信息,难以应对龙卷风、大象、风滚草、恐龙头套 Cosplay 等异常罕见事件。
而谷歌 Genie 3 为 Waymo 的世界模型提供了广泛的知识基础,Waymo 又在此基础上通过后训练将海量 2D 视频信息转化为 Waymo 自动驾驶硬件支持的 LiDAR 激光雷达信号,让该模型几乎可以生成任何场景。
Waymo 世界模型通过三种主要机制实现了强大的模拟控制能力,即驾驶动作控制、场景布局控制、语言控制(IT之家注:这里指在基础生产内容上的各种环境背景变化调整)。在基础版本之外,Waymo 世界模型还有支持更长时间模拟的更高效变体。





京公网安备 11011402013531号