封面新闻记者 蔡世奇
10月14日,科大讯飞在上海公布了其AI同传技术的第三次重大升级,并同时发布AI翻译耳机,公布了双屏翻译机2.0的功能及应用场景升级。
端到端语音同传效果再次升级
端到端技术持续升级 首字母响应时间缩短专业词库扩容
咨询机构 IDC今年10月发布的《中国 AI 翻译技术评估2025》报告指出,目前科大讯飞和字节跳动是当下AI翻译最值得关注的企业。
报告显示,科大讯飞在AI翻译速度、效果、专业度、拟人度、产品应用成熟度、商业化规模、研发投入及用户推荐度8大核心维度中排名第一,其中6项满分,字节跳动、腾讯、网易的相关产品同样名列前茅。
此次科大讯飞技术升级的亮点集中在中英同传效果的提升。新一代技术将翻译的主观体验提升至4.6分(满分5分),有效消除了传统机器翻译的“碎片化”和“机械感”,其首字响应时间低至2秒,并且专业词库扩充至10万+,新模型成功攻克了医疗、金融、法律等高壁垒行业的翻译难题。此外,语音播报的自然度与拟人度也实现大幅提升。在战略布局上,科大讯飞宣布新增中英到阿拉伯语、西班牙语的同传互译功能。
骨传导翻译耳机与苹果AirPods形成差异化竞争
2025年苹果秋季新品发布会上,全新的AirPods Pro 3降噪耳机除了在音质、降噪以及心率传感器等方面的升级外,最吸引人的新特性便是依托于Apple Intelligence的实时翻译功能,然而由于“苹果AI”在国内并未上线,传闻中苹果与阿里巴巴以及百度在大模型上的合作尚未落地,这也导致了AirPods Pro 3以及同样使用H2芯片的其他几款耳机暂时都无法开启中文实时翻译功能。
科大讯飞的翻译耳机在产品形态上就与苹果的AirPods系列有着明显区别:苹果几款耳机均为半入耳、入耳式耳机,而讯飞AI翻译耳机采用了开放式设计,骨传导与气传导结合的模式。讯飞AI翻译耳机多麦克风组合与 30 度拾音角度设计,辅以ENC 降噪算法,嘈杂场景也能精准拾音;同时通过定向出音与反相声波抵消技术守护沟通隐私。据了解,该产品覆盖四大核心场景:通话实时翻译支持跨洲际对话与多任务并行,面对面翻译可双人无按键互译且支持 18 组语种对离线使用,线上同传兼具双语转译与录音复盘功能,旁听同传凭借 5-8 米定向拾音适配会场需求。
开放式翻译耳机与AirPods系列形成了差异化竞争
端到端语音同传大模型的持续优化,讯飞AI翻译耳机在准确度、响应速度和播报自然度上实现全面升级,让跨语言交流更自然、更贴近真人体验。支持60种语言同传互译,内置10万+专业词库,覆盖医疗、制造、金融、法律等高壁垒行业场景。部署专属同传服务集群,中英同传首响播报延迟低至2秒,蓝牙6.0连接技术保障低延迟,带来“实时同步”的体验。
IDC中国研究总监卢言霞表示:“大模型的不断成熟正在加速变革AI翻译行业,未来大模型的演化将替代部分硬件以及软件的能力。大模型的投入与发展将引领新的AI翻译市场格局的形成。”