据报道,在全球权威AI评测平台Artificial Analysis的Speech Arena语音榜单中,阿里巴巴语音大模型Fun-Realtime-TTS-Preview以1190分Elo评分,位列全球第五、国内第一。
该模型在ASR(将语音转为文字)、Chat(端到端的语音理解与对话)以及TTS(将文字转为语音)三大核心赛道均拿下全国第一,实现语音交互全维度领先。此前,阿里语音大模型家族另外两款产品Fun-Realtime-ASR和Fun-RealtimeAudioChat已在同一平台登顶,在听准、听懂、会聊关键指标上超越GPT-Realtime-2等国际模型。
目前,阿里语音大模型已落地千问、高德、钉钉等国民应用,提供实时转写、导航交互、会议纪要等服务,并开放企业级接口,适配金融、医疗等行业场景。团队开源的FunASR、CosyVoice等多款模型在GitHub获得广泛关注。


京公网安备 11011402013531号