人民财讯7月25日电,记者25日从阿里旗下夸克获悉,夸克技术团队和浙江大学最新联合开源了OmniAvatar,这是一个创新的音频驱动全身视频生成模型,只需要输入一张图片和一段音频,即可生成相应视频,且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外,还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。
音频驱动全身视频生成模型 夸克与浙江大学联合开源OmniAvatar
IP属地 中国·北京
编辑:苏婉清 证券时报 时间:2025-07-25 10:28:15
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 机构:前三季度电子纸平板出货量175.8万台,同比增长31.3%
- 【图片新闻】 天问三号载荷“激光外差光谱仪”研制启动
- 如何发挥新型举国体制优势(科技视点·大家谈)
- 潜心探索地球深部的奥秘(迈向“十五五”的创新图景)
- 获8000亿美元估值,或面临更多“拷问”,SpaceX筹划全球最大规模IPO
- 朱帅:华盛顿以国家力量重构AI体系
- NASA火星探测器“失联”,暴露超期服役隐患
- 美学者撰文:对中国电动汽车与其筑墙,不如学习
- 从“晒技能”到“赛技能”(经济聚焦)
- 中国四线小城工厂,押注跨境电商
- C909飞机安全载客超3000万人次,成为国产商用飞机健康稳步发展的里程碑
- 让众多科技成果从实验室走向市场,他说靠的是“坚持和死磕”
- OpenAI:人类打字速度将成通用人工智能发展瓶颈
- 马斯克的Grok AI聊天机器人再现严重故障:混淆邦迪海滩枪击事件
- 一块布也能听音乐,初创公司Sensia展示织物音箱





京公网安备 11011402013531号