FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。 有监督预训练则在编码器-解码器架构(AED)下进行,使编码器能够从大规模…
FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。智东西在实测中体验了FunAudio-ASR在嘈杂场景的识别能力。 有监…
10/31 16:58
10/31 16:56
10/31 16:55