该功能适用于视频播放场景,可以将音频即时翻译成目标语言。
该模型创新性地提出了一种通用于AR系统的“时间编码”机制
目前相应功能已向海外用户开放,暂仅支持英语
该模型采用了一种创新且通用的方法,能够兼容自回归架构,实现对语音时长及情感的精准控制。他们独创性地结合了语音时长匹配、原声翻译标准与UP主独特风格,构建了多目标奖励模型,并采用对抗式强化学习训练,推动模型不断…
为攻克「AI原声翻译功能」中的核心挑战——尤其在游戏、二次元等专名梗点密集领域——实现原风格精准保留与语音时长完美对应,B站技术团队基于大语言模型(LLM)构建翻译引擎,独创性基于语音时长匹配、原声翻译标准…
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20