AI应用风向标
小米开源OmniVoice多语言语音克隆TTS模型,号称搞定600余种语言
小米发布MiMo-V2.5-TTS/ASR语音大模型:通过自然语言指令调度声音表现
小米自研MiMo-V2-TTS语言合成大模型发布:能说会唱 河南话、粤语等样样精通
该功能不仅限于微信聊天框,而是系统级全局可用
DeepSeek-OCR 2发布:让AI像人一样“读懂”复杂文档
阿里健康推出AI产品氢离子:定位医生版GPT
豆包输入法iOS版迎来首次更新!优化耗电、语音输入更方便了
通义千问Qwen Code v0.3.0发布:内置中英文,国际化能力提升
千问App上线Wan 2.5和Qwen-Image:支持对口型、对话修图
它提供了一种高效、准确且轻量级的解决方案。
腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”
在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强。
目前,该模型已在魔搭社区与Hugging Face开源。
06/25 00:17
06/25 00:16
06/25 00:15