京东开源JoyAI-Echo长音视频生成框架，宣称“进入全球第一梯队”

IP属地中国·北京 IT之家 时间：2026-06-04 00:20:58

IT之家 6 月 3 日消息，京东今日宣布推出 JoyAI-Echo 长音视频生成框架，号称直接解决行业头疼已久的三大难题 —— 角色易崩、声音乱变、生成缓慢。同时还实现了“对话式编辑”功能，不用再为改一个镜头重跑整条视频。

京东官方表示，JoyAI-Echo 的发布，标志着京东在长视频生成领域进入全球第一梯队。
据介绍，JoyAI-Echo 框架内置了一个专门的记忆库，能在多镜头生成过程中，持续保存并调用角色的外观特征和说话人音色信息。实测结果显示，长达 5 分钟的视频里，角色身份、视觉形象和声音音色都能保持高度一致，再也不会出现“同一个人演着演着变成另一个人”的尴尬情况。
团队提出了记忆驱动后训练流程，结合 SFT、跨模态 RLHF 和 Distribution Matching Distillation（DMD）技术，不仅提升了生成质量，还实现了推理加速，DMD 一项技术就带来约 7.5 倍的速度提升。JoyAI-Echo 还加入了智能“导演助理”——Director Agent，支持自然语言说需求，自动拆分成剧本、角色、场景和镜头。
另外，JoyAI-Echo 还配套了专门的实时超分模块，通过单步超分就能生成高分辨率视频和精细化音频，并支持两档分辨率提升：736×1280 → 1152×1920 和 736×1280 → 1472×2560。
IT之家附项目页和 GitHub 代码仓库如下：
GitHub：https://github.com/jd-opensource/JoyAI-Echo 项目主页：https://echo-team-joy-future-academy-jd.github.io/Echo-LongVideo-Page/

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

连续领跑行业，百度智能云凭什么又拿第一？

阿里云百炼灰测开放式世界模型HappyOyster 1.0

盖茨发文称，终于相信艾滋病能被终结了

百度秒哒发布3.5版本：支持iOS App一键打包、多应用共享后端等功能

空头狂赚！短短一个月，SpaceX市值已较峰值蒸发1万亿美元

蚂蚁集团副总裁陈亮：智能体越强，信任风险越不容忽视

全站最新

连续领跑行业，百度智能云凭什么又拿第一？

阿里云百炼灰测开放式世界模型HappyOyster 1.0

盖茨发文称，终于相信艾滋病能被终结了

百度秒哒发布3.5版本：支持iOS App一键打包、多应用共享后端等功能

热门推荐

连续领跑行业，百度智能云凭什么又拿第一？

阿里云百炼灰测开放式世界模型HappyOyster 1.0

比亚迪腾势Z9S路试实车曝光轴距超3米

盖茨发文称，终于相信艾滋病能被终结了

百度秒哒发布3.5版本：支持iOS App一键打包、多应用共享后端等功能

空头狂赚！短短一个月，SpaceX市值已较峰值蒸发1万亿美元

蚂蚁集团副总裁陈亮：智能体越强，信任风险越不容忽视

乐道全系完成智能软硬件大升级，神玑NX9031X芯片出货超30万

头掉了还能打！马斯克“围观”中国机器人格斗比赛：看笑了

上海重磅发布“星枢计划”：打造分布式太空算力实现按需即问即算

手机不会“消亡”，但它正在变成另一个物种

脑机接口热得发烫创始人：投资人见我5000元/小时

吊打传统车机！吉利超级EVA亮相WAIC：物理AI时代来了

影石首款M43微单完整信息曝光！专为视频博主打造的入门新机

燧原科技联合中兴通讯发布云燧ESL64-O超节点