快手可灵3.0系列AI模型发布并内测，视频生成能力升级

IP属地中国·北京 IT之家 时间：2026-01-31 14:14:24

IT之家 1 月 31 日消息，快手今日宣布推出新一代视频生成模型可灵 3.0 系列，目前处于超前内测阶段。该系列包含图片 3.0、视频 3.0 和视频 3.0 Omni，在原有模型基础上进行了技术升级。
其中，图片 3.0 模型主要升级包括四项功能：
新增组图生成能力，支持通过单张或多张输入图像批量生成逻辑连贯的系列画面；输出分辨率提升至 2K 与 4K 级别，适配影视预演图、场景设定等专业需求；增强画面细节一致性，优化纹理、光影的呈现效果以降低“AI 感”；强化对构图、视角等元素的控制精度，提升影视类创作场景的适用性。
据介绍，此次升级采用视觉思维链（vCoT）技术辅助生成前的场景解构推理，并通过 Deep-Stack 视觉信息流机制增强细粒度感知能力。模型训练过程中引入强化学习框架，结合真实感与电影质感双重评估标准优化输出效果。

另外，新的视频模型采用统一的多模态训练框架，支持文本、图像、视频片段等多种输入形式，单次视频生成时长最高可达 15 秒，并支持 3-15 秒灵活时长设置。功能改进主要包括：
新增智能分镜系统，可根据文本指令自动调度景别与机位；增强主体一致性控制，允许通过多图或视频锚定特定视觉元素；升级音画同步能力，支持中、英、日、韩、西五种语言及方言的精准口型匹配，并实现多人场景下的角色定向发声；提升文字生成清晰度，确保招牌、字幕等文字信息可辨识。
视频 3.0 Omni 版本额外支持创建视频主体特征库，可提取 3-8 秒视频中的角色形象与音色进行还原应用。技术文档显示，此次升级涉及多模态指令解析架构优化、音频采样区间调整及特征解耦重组方案。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

硬刚马斯克，软银称已开始量产机器人，将成为“压倒性的世界第一”

iPad/Mac等涨价只是开始？苹果声明暗示后续还有新一轮调价

徕卡发布SL3-P全画幅相机：4400万像素、无可乐标，4.5 万元

大型零售商警告：《GTA 6》或带动今年圣诞节期间主机供不应求

2025年中国具身智能市场规模约9150亿元，预计今年将冲上万亿

全站最新

新能源汽车补能网络升级：私人桩崛起，行业迈向精细化运营新阶段

2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

硬刚马斯克，软银称已开始量产机器人，将成为“压倒性的世界第一”

iPad/Mac等涨价只是开始？苹果声明暗示后续还有新一轮调价

热门推荐

Meta加速AI布局：大语言模型接棒人工审核，年省数十亿美元成本

互联网大厂战略转向：阿里聚焦AI基建，灵犀互娱或成“弃子”待售？

北京银河华科股权投资基金登记成立出资额4.48亿

2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

硬刚马斯克，软银称已开始量产机器人，将成为“压倒性的世界第一”

iPad/Mac等涨价只是开始？苹果声明暗示后续还有新一轮调价

徕卡发布SL3-P全画幅相机：4400万像素、无可乐标，4.5 万元

大型零售商警告：《GTA 6》或带动今年圣诞节期间主机供不应求

2025年中国具身智能市场规模约9150亿元，预计今年将冲上万亿

紫光同芯联合中国联通首发eSIM智能受理方案

全世界最顶级的MPV爆单！尊界V680、V800双车开售1小时订单破3200台

折叠iPhone触屏Mac 新CEO动真格：苹果下一步棋怎么走

塔塔电子被黑，部分iPhone 18 Pro与苹果A20 Pro资料确认泄露

突发！苹果深夜大涨价，黄牛疯狂囤货，iPhone 18危险了

DeepSeek深夜发文：开启大规模“抢人”