当前位置: 首页 » 资讯 » 科技头条 » 正文

Reverie 推出印度专用语音识别模型,性能超越 Deepgram

IP属地 中国·北京 编辑:顾青青 Chinaz 时间:2025-11-13 16:17:01

在庆祝公司成立16周年之际,Reverie Language Technologies 发布了一款全新的语音转文本(STT)模型,旨在应对印度多元化的语言环境。这款模型不仅能够识别印地语、英语,还可以处理 Hinglish 等混合语言,极大地满足了银行和呼叫中心等行业的需求。

图源备注:图片由AI生成,图片授权服务商Midjourney

据 Reverie 介绍,该模型在过去一年内处理了300万次 API 调用,其精确度和速度都表现出色。在与 Deepgram 的独立测试中,Reverie 的模型在准确率上高出约4.2%,响应速度提升了1.5倍。这使其成为针对印度用户的强大语音识别系统。

这款模型的优势在于其对多语言和文化背景的理解能力。无论是用英语说的数字 “twenty-three”,还是用印地语说的 “तेईस”,该模型都能够准确识别。此外,它还能识别来自印度各地的名字,考虑到拼写和发音的差异,这些特性往往是全球模型难以处理的。

除了 Hinglish,Reverie 还推出了一系列针对其他印度语言的 STT 模型,包括泰米尔语、泰卢固语、孟加拉语、马拉地语、古吉拉特语、卡纳达语、马拉雅拉姆语、阿萨姆语、奥里亚语和旁遮普语。每个模型都针对特定语言的方言和口音进行了独立训练,旨在更真实地反映当地人的语言使用习惯。

Reverie 的 R&D 负责人 Pranjal Nayak 表示:“我们的研发一直专注于印度特有的语言挑战,这款 Hinglish 模型正是其中的成果。它能够理解印度人在使用数字时的习惯,以及在同一句话中如何混合使用英语和印地语。” 这使得 AI 代理的表现更加自然和人性化。

该模型已经在多个行业中得到应用,例如某大型金融服务公司采用 Reverie 的 STT 引擎处理超过15,000个多语种的债务催收电话,成功实现了高准确度的数字和付款识别。

目前,这款模型已在 Reverie 的 API 平台上上线,企业可通过云端或本地部署来使用。其支持特定领域的语言包、数字和名称的歧义消解以及热词增强等功能,所有配置均可通过同一个 API 完成。

划重点:

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。