美团发布LongCat-Video视频生成模型，支持5分钟级连贯输出

IP属地中国·北京 编辑：杨凌霄 TechWeb 时间：2025-10-27 12:05:11

10月27日消息，美团 LongCat 团队正式发布 LongCat-Video 视频生成模型，该模型支持文生视频、图生视频及视频续写。美团强调，LongCat-Video 可稳定输出5分钟级别的长视频，且无质量损失。
据介绍，在文生视频方面， LongCat-Video可生成 720p、30fps 高清视频，能精准解析文本中物体、人物、场景、风格等细节指令，语义理解与视觉呈现能力达开源 SOTA 级别。
图生视频， LongCat-Video严格保留参考图像的主体属性、背景关系与整体风格，动态过程符合物理规律，支持详细指令、简洁描述、空指令等多类型输入，内容一致性与动态自然度表现优异。
视频续写是LongCat Video的核心差异化能力，可基于多帧条件帧续接视频内容，为长视频生成提供原生技术支撑。
另外，依托视频续写任务预训练、Block-Causual Attention 机制和 GRPO 后训练，LongCat-Video 可稳定输出5分钟级别的长视频。
模型结合块稀疏注意力（BSA）与条件 token 缓存机制，大幅降低长视频推理冗余 —— 即便处理 93 帧及以上长序列，仍能兼顾效率与生成质量稳定，打破长视频生成 “时长与质量不可兼得” 的瓶颈。
美团发布的数据显示，通过全面的评估显示，LongCat-Video 通用性能优秀，综合能力跻身开源 SOTA：
136 亿参数的视频生成基座模型，在文生视频、图生视频两大核心任务中，综合性能均达到当前开源领域 SOTA 级别；
通过文本-视频对齐、视觉质量、运动质量、整体质量四大维度评估，其性能在文本对齐度、运动连贯性等关键指标上展现显著优势；
在 VBench 等公开基准测试中，LongCat-Video 在参评模型中整体表现优异。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

谷歌前CEO批评中国AI开源：“这样我们就失去了任何控制手段”

中国大模型跻身全球AI第一梯队，开源改写中西方竞争规则！

6G试验成果、量子科技、“息壤”平台……中国电信亮相上海世界移动通信大会

裁员风波背后，飞猪「失焦」的365天

彻底退出？三星电子官方公众号已正式注销

2026年财富中国科技50强出炉华为/字节跳动/联想入选

全站最新

谷歌前CEO批评中国AI开源：“这样我们就失去了任何控制手段”

中国大模型跻身全球AI第一梯队，开源改写中西方竞争规则！

6G试验成果、量子科技、“息壤”平台……中国电信亮相上海世界移动通信大会

裁员风波背后，飞猪「失焦」的365天

热门推荐

苹果大幅涨价！涉iPad、Mac多款产品

谷歌前CEO批评中国AI开源：“这样我们就失去了任何控制手段”

中国大模型跻身全球AI第一梯队，开源改写中西方竞争规则！

阿里Meoo CLI上线QoderWork，助力本地项目一键变线上应用降门槛

REDMI K100系列8月登场，顶配9000mAh大电池，性能屏幕音频全升级

冷链物流市场规模将破5850亿，现存冷链运输相关企业超3.2万家

斥资7.3亿元控股晋商消金，盈利走弱下晋商银行能否撬动增长

6G试验成果、量子科技、“息壤”平台……中国电信亮相上海世界移动通信大会

裁员风波背后，飞猪「失焦」的365天

彻底退出？三星电子官方公众号已正式注销

2026年财富中国科技50强出炉华为/字节跳动/联想入选

开放麦 | 启明创投胡奇：从AI算法工程师到投资人，与AI一起走过的十年

华为亮相2026MWC上海，业网算协同创新，迈向Token经营新征程

扫地机器人被蟑螂钻入后损坏，云鲸回应

2030年中国全域电动化全产业链规模有望超8万亿元