当前位置: 首页 » 资讯 » 科技头条 » 正文

​谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

IP属地 中国·北京 编辑:赵云飞 Chinaz 时间:2025-12-17 10:24:14

谷歌最近发布了 Gemini2.5Flash Native Audio 的更新,显著增强了其语音助手的功能。这一版本旨在更好地处理复杂的工作流程,提高执行用户指令的准确性,同时使对话更加自然流畅。根据谷歌的反馈,新版本在开发者指令的遵循率上从84% 提升至90%,这表明语音助手在理解和执行用户请求方面有了显著进步。

在多步骤对话的质量上,更新也带来了明显改善。用户在与语音助手互动时,将体验到更流畅的沟通。这种提升使得助手能够更好地适应复杂的询问和任务,使用户感受到更高效的服务。

谷歌还透露,更新后的音频模型在 ComplexFuncBench 基准测试中,函数调用的准确率达到了71.5%,相比之下,OpenAI 的 gpt-realtime 则为66.5%。不过需要指出的是,谷歌在测试中可能并未使用 OpenAI 最近发布的最新版本。

此次更新已经在 Google AI Studio、Vertex AI、Gemini Live 和 Search Live 中上线,Google Cloud 的客户也开始使用这项新技术。开发者们可以通过 Gemini API 对模型进行测试,进一步探索其潜力。

这次的更新不仅仅是功能的提升,也反映出谷歌在人工智能领域不断进步的决心和努力,为用户提供更好的体验。

划重点:

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。