微软自测数据显示,该模型在全部25种语言中均优于OpenAI的大型语音模型Whisper第三代;在22种语言中超越谷歌Gemini3.1极速版;对比Eleven Labs的文本转写二代模型与OpenAI智能…
A:微软发布了三款AI模型:MAI-Transcribe-1是语音识别模型,支持25种语言,GPU成本比竞争对手低50%;MAI-Voice-1是语音生成模型,能在单个GPU上不到一秒生成60秒音频;MAI…
面对的会是一套格外挑剔的定价标准。
04/01 16:41
10/31 16:58
10/31 16:56