8月21日消息,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。

即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
据介绍,百度蒸汽机是全球首个中文音视频一体化生成的I2V模型,不仅支持环境音效,更支持多角色语音的一体化生成。百度蒸汽机2.0有声版模型让AIGC视频创作彻底告别了配音,创作者对完美视听语言的一切想象,只需要一张图和提示词。

这背后依托于百度蒸汽机视频模型的五大核心技术突破:行业首次实现多人有声音视频一体化生成,语音与唇形、表情、动作的毫秒级精准对齐,复杂场景下依然稳定;首创多模态潜在空间规划技术(Latent Multi-Modal Planner),自主协调多角色身份、情感与互动逻辑,保障电影级叙事连贯性;中文场景深度适配,以超98%的还原度精准呈现中文语音细节与情感表达;端到端电影级画质生成,通过精准主体动态刻画,打造真实细腻的人物表现力;大师级运镜控制,内置数十种专业镜头语言,精准响应文本指令,实现视觉细节与创意意图的完美对齐。

价格方面,针对不同需求用户,百度蒸汽机平台提供了梯度会员服务,价格低至行业同类产品的70%,生成5s视频仅需1.4元。
除此之外,新用户注册即可免费获得部分想象力值,平台还将在每周四创新推出"狂欢星期四"抽奖活动,用户最高可获18888点想象力值,实现"视频生成自由"。同时,基于持续丰富的特效能力,平台月月有生动有趣的特效赛事发布,参加即有机会赢得数万元大奖。(果青)