新智元报道
编辑:犀牛 KingHZ
站在2026年春天回望,Sora浪潮之后,SkyReels V4用四位一体顶级能力(多模态参考+音视频联合+统一任务框架+全模态强化)登顶全球第一!AI视频创作的大一统时刻,真正属于中国的时代来了!
就在刚刚,第三方机构 Artificial Analysis 最新榜单里,SkyReels V4 拿下了「文本生成视频(含音频)」全球第一!
它压过了谷歌Veo 3.1,也超过了Kling 3.0。
更关键的是,这个榜单不是厂商自己跑分。看的是大量真实用户的盲评结果。
这标志着,在最难、也最具价值的「文生视频+音频」赛道里,国产模型已经冲到了最前面。
2月27日,SkyReels V4 Preview首次亮相时,已经拿到全球第二。
不到一个月,SkyReels V4又往前跨了一步,直接冲到第一。
SkyReels V4不只是更强了,它已经开始改写全球视频模型的排位。
它标志着中国AIGC视频技术正式引领世界。
在2026中关村论坛,SkyReels-V4即将正式重磅发布,API已经开放(skyreels.ai)。
链接:https://www.skyreels.ai/api-platform
在其他模态上,SkyReels V4也表现出色,在「文本到视频(无音频)」中排名第二。
空谈数据,不如直接看能力。接下来,好好看看全球第一的视频AI到底有多猛。
实测:AI短剧之王
对昆仑万维天工AI而言,SkyReels开始迈向完整的多模态视频生成系统转型,支持文本、图像、视频和音频输入。
它是全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务的视频基础模型。
下面六个方向的实测,每一个都能让你感受到这款模型的恐怖之处。
AI短剧生成:两张图+一段台词,直出影院级短剧。
你只要丢进两张角色图,再写一段台词。
SkyReels-V4就能直接吐出一段 1080p、32FPS、15 秒的视频。
画面质感、角色表情、嘴型同步,几乎没什么AI味儿。
不管是东方面孔还是西方面孔,效果都极其自然。
雷鸣交加,荒原上风沙漫卷,关公秦琼展开史诗对决——
从简单文字到完整视频+音频,零基础也能轻松创作电影级内容,真正做到「想拍什么,就拍什么」!
关键是AI味儿,几乎没了。
更关键的是,这次不是「先出画面,再硬贴声音」。
SkyReels-V4专门被设计为同时处理画面和声音。
多帧参考:九张图,终于把角色和剧情都钉住了。
此次SkyReels-V4最重磅的升级之一,是多帧参考。
你最多可以给它 9 张关键帧。
它会按这9张图,把中间的动作、镜头和过渡补出来。
这很重要,很实用。
以前做 AI 短剧,最容易翻车的就是两点:
前一秒还是这张脸,后一秒就「换脸」了;
刚刚还在这个场景,转头就跳到了另一个世界。
SkyReels-V4这次最实用的进步,就是把这两个坑压下去了,当之无愧的AI漫剧之王。
过去你需要在Premiere、AE、各种AI工具之间反复切换才能完成的工作,现在SkyReels-V4一个模型就全搞定。
换句话说,视频生成、元素植入、角色编辑与画面清理,正在被收敛到同一套通用编辑框架里。
这一次的一大突破,是把视频生成、补帧、延展、编辑统一进同一套接口,让文生视频、图生视频、视频延展、首尾帧插值,以及局部、全局编辑,都落在同一种处理框架下。
技术硬突破:凭什么硬刚Seedance 2.0?
看完效果,我们来看看SkyReels-V4背后的技术到底硬在哪里。
上个月,SkyReels V4 Preview登上全球现役模型排名第2时,我们就做过详细的分析报道。——AI味没了。
不到一个月,从Preview版全球第二到升级版登顶第一——这个速度,放在游戏里叫「开挂」,放在AI圈叫「SkyReels-V4」。
SkyReels-V4 这次往前冲,靠的不是小修小补。
它主要治好了两个视频AI老毛病。
第一个老毛病,是「画面好看,但逻辑不通」。
比如,水往天上流,杯子悬在空中,还不是动漫;人一转身,动作就穿帮。
为了解决这个问题,SkyReels-V4 在训练时,不再只盯着「像不像」,还要判断「对不对」。
说得直白一点,就是给模型加了一套更严格的评分系统:
画面要好看,动作要合理,声音还得对上嘴型和节奏。
哪里不对,就反复打回去重练。
这个过程,论文里叫全模态强化学习。
另一方面,团队引入了阶梯式课程强化学习机制,围绕分辨率与时长、任务复杂度、数据难度三个关键维度,推动模型从简单任务逐步进阶到复杂任务,持续提升对高难度生成场景的掌控能力。
你可以把它理解成: 以前老师只看卷面漂不漂亮;现在老师开始同时盯逻辑、动作和表达了。
以前老师只看考试成绩好不好;现在老师开始同时关注学生学习过程,改进授课方法了。
第二个老毛病,是「角色记不住」。
你给几张关键帧,SkyReels-V4就能把中间过程补出来。 你给它九张剧情图,SkyReels-V4就能尽量把角色脸、服装和场景风格一直锁住。
这对AI短剧太关键了。
以前最让人出戏的,就是角色一会儿一个样。
以前AI拍短剧,男主第一集是尖下巴,第二集变成了国字脸,观众直接出戏。
现在有了九宫格参考,角色全程一致,场景全程连贯,AI短剧终于从「看个热闹」升级到了「可以认真追」的水平。
这两项能力把视频生成的一致性和可控性拉到了行业天花板,也让SkyReels-V4从一个「视频生成工具」,正式进化为「短剧工业化生产引擎」。
SkyReels-V4技术报告也已公开。
技术报告:https://arxiv.org/pdf/2602.21818
直面实践的检验
国产AI版Netflix来了
真正值得注意的,不只是榜单,而是这套模型已经被放进业务里跑了。
DramaWave:昆仑万维的AI版Netflix。
SkyReels-V4的技术直接支撑了昆仑万维旗下的短剧平台DramaWave。
截至2026年1月,以DramaWave和FreeReels为核心的昆仑短剧平台,MAU已突破8000万大关,年化流水收入ARR破4.8亿美元,月流水高达4000万美元。
这不是PPT上的数字,而是真实的用户在真实地付费观看AI参与制作的内容。
近期,DramaWave 推出「百万美金・剧启 AI 」创作扶持计划,广纳全球优质创作者。昆仑万维全新自研的AI短剧Agent工具SkyAnime也同步上线,从工具端为创作者赋能,全方位提升创作效率。
DramaWave上的AI剧模块已上线近千部作品,AI自制剧月产能超30部。
以自制AI短剧《掠夺词条!我转职为亡灵天灾》为例,依托SkyAnime工具制作,成本不足2万美金,上线后单日投放超10万美金,累计播放量达数百万次。
这是一个完美的「技术→产品→商业化」闭环验证。
从「片段生成」升级为工业化全链路视频生产。
SkyReels-V4的意义远不止于「能生成一段好看的视频」。
对于AI短剧产业而言,SkyReels-V4解决的是最核心的痛点:角色一致性。
过去AI生成的短剧,角色换个镜头就「变脸」,观众根本无法入戏。
SkyReels-V4的九宫格参考能力,让角色在整部剧集中保持一致,让AI短剧的品质第一次达到了「可以认真看」的水平。
这对于整个AI影视产业来说,是质的飞跃。
为游戏、音乐、内容生态提供统一视频生成底座。
值得注意的是,SkyReels-V4不是一个孤立的产品。
昆仑万维旗下还有AI音乐创作平台Mureka——其O1模型是全球首个引入思维链(CoT)技术的音乐推理大模型,V8版本在音色、演奏技法、情感表达上持续突破,用户遍布全球100多个国家和地区。
SkyReels-V4的视频能力+Mureka的音乐能力,构成了从画面到声音、从配乐到人声的全链路创作闭环。
一家公司同时拥有全球顶尖的视频大模型和音乐大模型,这在全球范围内屈指可数。
一个品牌方可以用一句话生成完整的视频广告,一个独立音乐人可以把歌曲直接变成高质量MV,一个教育机构可以把课程自动转化为配有讲解、配乐和动态画面的教学视频——这些不是畅想,而是正在发生的事。
All in AGI
回顾昆仑天工在视频大模型领域的发展轨迹,你会发现SkyReels-V4的崛起绝非偶然,而是一场精心布局的战略级爆发。
2025年2月,开源SkyReels-V1——中国首个面向AI短剧创作的视频生成模型,基于千万级影视数据训练,支持33种微表情和400多种动作组合。
2025年4月,发布SkyReels-V2——全球首个使用扩散强迫(Diffusion Forcing)框架的无限时长电影生成模型。
2026年1月,开源SkyReels-V3——支持1-4张参考图像输入,实现多主体视频生成。
2026年2月,SkyReels-V4 Preview发布——Artificial Analysis全球榜第二。
2026年3月,SkyReels-V4正式登顶全球第一。
从V1到V4,它不是简单加参数。每一代都在补一个关键短板。
平均每3-4个月一次重大升级,这种迭代节奏在全球AI视频领域几乎无人能及。
这种持续创新的节奏,配合Mureka在AI音乐领域的领先地位、Skywork系列在大语言模型和多模态推理上的突破、以及DramaWave短剧平台的商业化落地,昆仑万维正在构建一个覆盖「算力—模型—应用」的完整AI生态闭环。
这正是昆仑万维自2023年初确立「All in AGI与AIGC」核心战略以来,最具说服力的成果展示。
AI视频创作的「大一统」时刻
站在2026年春天回望,AI视频生成领域在过去一年经历了翻天覆地的变化。
从Sora掀起的第一波浪潮,到Veo、Kling、Seedance等模型的百家争鸣,再到SkyReels-V4以「全模态参考+音视频联合生成+统一任务框架+全模态强化学习」的四位一体能力登顶全球——我们正在见证一个新时代的开启。
在这个时代里,视频创作不再是专业团队的专属特权,而是每一个有创意的人都能触及的表达方式。
而SkyReels-V4所代表的技术方向——用一个模型、一次操作,完成从文字构思到音视频成品的全流程创作——正是通往那个未来的最清晰路径。





京公网安备 11011402013531号