快科技8月26日消息,今晚,阿里云正式发布全新多模态视频生成模型通义万相Wan2.2-S2V,并宣布开源。
Wan2.2-S2V极大地简化了视频制作过程,仅需提供一张静态图片和一段音频,模型便能生成面部表情自然、口型与音频高度一致、肢体动作流畅丝滑的电影级数字人视频。
支持分钟级长视频稳定生成,不止嘴动,手势、表情、姿态都能动。
而且模型在训练中充分挖掘跨域泛化能力,可自然驱动卡通人物、动物形象、二次元角色、艺术风格化人像,不再局限于真人肖像。
无论是萌宠说话,还是动漫角色唱歌,Wan2.2-S2V都能精准还原音画同步效果。
其提供480P与720P两档分辨率,兼顾效率与画质,适用于短视频、数字人、轻量影视等场景。