当前位置: 首页 » 资讯 » 科技头条 » 正文

美团发布并开源视频生成模型 将融入自动驾驶、具身智能等场景中

IP属地 中国·北京 贝壳财经 时间:2025-10-27 12:06:38

新京报贝壳财经讯(记者陈维城)10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平),并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。

LongCat-Video的模型评估围绕内部基准测试和公开基准测试展开,覆盖 Text-to-Video(文本生成视频)、Image-to-Video(图像生成视频)两大核心任务。依托视频续写任务预训练,新模型可稳定输出5分钟级别的长视频,视频推理速度提升至10.1倍。

美团LongCat团队认为,此次发布的视频生成模型,是为探索“世界模型”迈出的第一步。未来,凭借精准重构真实世界运行状态的能力,LongCat模型也会融入公司近年来持续投入的自动驾驶、具身智能等深度交互业务场景中。

编辑 杨娟娟

校对 陈荻雁

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。