小米开源OmniVoice多语言语音克隆TTS模型,号称搞定600余种语言
豆包发布语音识别模型2.0,支持多模态视觉识别和13种海外语种识别
目前相应功能已向海外用户开放,暂仅支持英语
04/01 16:41
10/31 16:58
10/31 16:56