官方介绍说,这是业界首个支持原生3D重建的超长漫游世界模型,能够生成长距离、世界一致的漫游场景,支持将视频直接导出为3D格式。 除此之外,混元Voyager3D输入-3D输出的特性,与此前已开源的混元世界模…
此外,Hunyuan-MT-7B模型也已在腾讯混元官网上线体验入口,并在Huggingface和Github等开源社区提供下载,对应的技术报告和论文也已经在开源社区公开。 从行业动态上看,今年3月,网易…
今日,腾讯混元官方宣布,HunyuanWorld-Voyager(简称混元Voyager)正式发布,这是业界首个支持原生3D重建的超长漫游世界模型。 该模型在斯坦福大学李飞飞团队发布的世界模型基准测试Worl…
同时开源的还有一个翻译集成模型 Hunyuan-MT-Chimera-7B (奇美拉),是业界首个翻译集成模型,它能够根据原文和多个翻译模型给出的不同内容,再生成一个更优的翻译结果,不仅原生支持Hunyua…
腾讯混元开源轻量级翻译模型:支持5种汉语言与方言互译
当输入一段包含海浪、沙滩人群及海鸥的视频,且文字描述仅为“海浪声”时,Hunyuan-Foley不仅能敏锐捕捉海浪画面,生成与之同步的波浪音效,精准响应文本需求,还能巧妙地捕捉视频中人群交谈的声音、海鸥盘旋的…
从效果上来看,千问、即梦、可灵和Gemini的文生图效果都是很不错的
腾讯混元开源端到端AI模型Hunyuan-Foley:视频+文字=“电影级”音效
07/09 12:20
07/09 12:19
07/09 12:18