超长视频生成的新突破！LongVie 框架让创作无界限

IP属地中国·北京 编辑：钟景轩 Chinaz 时间：2025-08-20 18:40:25

在过去的两年中，视频生成技术经历了惊人的进步，尤其是短视频的创作。然而，制作超过一分钟的高质量、风格统一的超长视频仍然是一项巨大的挑战。对此，上海人工智能实验室联合南京大学、复旦大学、南洋理工大学 S-Lab 以及英伟达等机构，共同推出了 LongVie 框架，系统性解决了这一领域中的核心问题。
LongVie 的目标是让超长视频的生成变得更加可控和一致。团队发现，传统的视频生成模型在处理长视频时，常常面临时序不一致和视觉退化等难题。前者主要表现为画面细节与内容不连贯，后者则指随着视频时长的增加，画面颜色和清晰度的下降。
为了解决这些问题，LongVie 从 “控制信号” 和 “初始噪声” 两个方面入手。首先，团队提出了 “控制信号全局归一化” 策略，这意味着在生成视频时，不再只在单一片段内进行归一化，而是统一整个视频段的控制信号，从而提升跨片段的连贯性。其次，他们引入了 “统一噪声初始化” 策略，确保各个片段共享同一初始噪声，这样可以从源头上减少不同片段之间的视觉漂移。
在解决视觉退化问题上，LongVie 采用了多模态精细控制方法。单一模态的控制常常无法提供稳定的约束，而 LongVie 结合了密集控制信号（如深度图）和稀疏控制信号(如关键点)，并引入退化感知训练策略，使得模型在处理长视频时，能够保持更高的画质和细节。
此外，LongVie 还推出了 LongVGenBench，这是首个专为可控超长视频生成设计的基准数据集，包含100个超过1分钟的高分辨率视频，旨在推动该领域的研究与评测。根据定量指标和用户评测结果，LongVie 在多个评估上超越了现有技术，赢得了用户的高度偏好，达到了 SOTA（最先进技术）水平。
随着 LongVie 框架的问世，超长视频生成将迎来新的时代，创作者们将能够在更大的自由度下实现自己的创意。
项目地址：https://vchitect.github.io/LongVie-project/

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

华为首次系统拆解途灵平台：汽车底盘竞争，为何开始拼算力和通信架构？

新机涨价官翻补位！MacBook Neo官翻版上架：679美元苹果最便宜笔记本

京东创始人：机器人将取代70万快递员，公司已启动再培训计划

谷歌前CEO感叹中国人聪明：不如美国硬件做出媲美AI模型但不受美国控制我憎恨

产教融合创新发展论坛暨华为院校人才培养论坛在吉林建科举办

B站举办17周年庆，5分钟以上视频观看时长占比达65%

全站最新

华为首次系统拆解途灵平台：汽车底盘竞争，为何开始拼算力和通信架构？

新机涨价官翻补位！MacBook Neo官翻版上架：679美元苹果最便宜笔记本

京东创始人：机器人将取代70万快递员，公司已启动再培训计划

谷歌前CEO感叹中国人聪明：不如美国硬件做出媲美AI模型但不受美国控制我憎恨

热门推荐

华为首次系统拆解途灵平台：汽车底盘竞争，为何开始拼算力和通信架构？

岚图追光S首秀：四激光雷达+475kW双电机，零百加速进3秒级

新机涨价官翻补位！MacBook Neo官翻版上架：679美元苹果最便宜笔记本

京东创始人：机器人将取代70万快递员，公司已启动再培训计划

谷歌前CEO感叹中国人聪明：不如美国硬件做出媲美AI模型但不受美国控制我憎恨

OpenAI推出GPT-5.6系列：天体命名新体系，Sol登顶编程测试榜首

中国为何坚定奔月？资源、战略、技术、合作四大驱动力引领未来

小牛自动化拥有超400项专利

阿里推出CosyVoice输入法：支持全场景口述！一键成稿

1999元！vivo Y6a悄悄上市：LCD真护眼屏+7200mAh长寿大电池

2026链博会 | 通用技术健康管理院院长闫焱：数字化技术大幅提升服务效率与管理精度

产教融合创新发展论坛暨华为院校人才培养论坛在吉林建科举办

B站举办17周年庆，5分钟以上视频观看时长占比达65%

超盒算NB加速全国布局：首进华北北京连开6店，自有品牌占比近60%

优派TD2465-CN触控显示器开售，23.8英寸VA屏配10点触控，售价2699元