腾讯混元开源AI模型Hunyuan-Foley：视频+文字=“电影级”音效

IP属地中国·北京 编辑：柳晴雪 IT之家 时间：2025-08-28 14:26:19

IT之家 8 月 28 日消息，腾讯混元今天午间宣布开源端到端视频音效生成模型 Hunyuan-Foley，用户只需输入视频和文字，就能为视频匹配电影级音效。
根据官方介绍，HunyuanVideo-Foley 不仅打破了 AI 生成的视频只能“看”不能“听” 的局限，让无声 AI 视频成为历史，更是真正做到了“看懂画面、读懂文字、配准声音”，带来沉浸式视听体验。这款音效生成工具可广泛应用于短视频创作、电影制作、广告创意和游戏开发等场景。
文字描述：Engine revving loudly and accelerating.
文本描述：Rustling and crunching of leaves and twigs under the fox kit's paws.
混元团队开发了一个全面的数据处理管道，能够自动化标注和过滤收集的音视频数据，构建了约 10 万小时级的高质量 TV2A 数据集，为模型训练提供了强大支撑，使得模型拥有强大的泛化能力，能够在各种复杂的视频条件下生成音画一致、语义对齐的高质量音频，包括音效与背景音乐。生成的音频能够与无声视频相结合，极大提升了视频的真实感和沉浸感。
IT之家附有关链接如下：
体验入口：https://hunyuan.tencent.com/video/zh?tabIndex=0项目官网：https://szczesnys.github.io/hunyuanvideo-foley/代码：https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley技术报告：https://arxiv.org/abs/2508.16930Hugging Face：https://huggingface.co/tencent/HunyuanVideo-Foley

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

iOS 27 Beta 2现百度视觉搜索组件，AI升级内存有要求，折叠屏相关功能引关注

佳和影城2026年6月多部佳片齐上映！四渡、玩具总动员等场次时间一览

金山办公高层提议回购股份！2.5亿至5亿资金用于员工激励助力公司长远发展

华为技术赋能启境GT7，猎装新秀登场，20.99万起能否赢得年轻用户青睐？

广州华立学院“禁入令”引热议：小米汽车缘何被单独“拒之门外”？

科大讯飞SR302星火版VS BKHE录音神器：谁才是数码录音领域的优选利器？

全站最新

iOS 27 Beta 2现百度视觉搜索组件，AI升级内存有要求，折叠屏相关功能引关注

佳和影城2026年6月多部佳片齐上映！四渡、玩具总动员等场次时间一览

金山办公高层提议回购股份！2.5亿至5亿资金用于员工激励助力公司长远发展

华为技术赋能启境GT7，猎装新秀登场，20.99万起能否赢得年轻用户青睐？

热门推荐

厦门国升产业链创新基金登记成立出资额10亿

小米REDMI 17C新机来袭：护眼大屏搭配超级岛，入门价位享旗舰美学体验

红米REDMI K90至尊版6月30日登场：165Hz高刷直屏，游戏体验全面升级

iOS 27 Beta 2现百度视觉搜索组件，AI升级与折叠屏布局成新亮点

红米Note17系列来袭，超大杯或配万级电池，千元机市场要变天？

VR跑步机Omni One牵手Meta Quest：原生支持开启沉浸运动新体验

360发布“图龙锋”“仪天阵” 助力政企单位掌握AI时代安全主动权

智元第15000台具身机器人下线具身智能产业开启规模化商业部署新篇

Meta开源Astryx：八年磨一剑，用JSON清单为AI前端开发立新规

捷迅AI+农业亮相链博会AI专区与英伟达等巨头同台共绘产业新篇

张毅：从硅谷到苏州，以AI算法赋能供应链，书写科技报国新篇章

周鸿祎谈AI落地困境：组织不革新、防御不升级，新技术难成生产力引擎

B站17周年陈睿演讲：优质内容成增长引擎，UP主充电收入大涨71.1%

DeepSeek融资后发力工程优化：DSpark框架让大模型推理提速最高达85%

OpenAI推迟IPO引思考：中国大模型公司如何应对二级市场考验？