当前位置: 首页 » 资讯 » 科技头条 » 正文

腾讯混元开源翻译模型1.5支持端侧部署 性能超商用API

IP属地 中国·北京 编辑:周琳 CNMO科技 时间:2025-12-30 16:09:11

12月30日,腾讯官方宣布开源其混元翻译模型1.5版本,包含Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B两款模型,支持33种国际语言互译及5种民汉/方言翻译,覆盖捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。两个模型已在腾讯混元官网、GitHub及HuggingFace平台上线,供开发者免费下载使用。

其中,HY-MT1.5-1.8B专为手机等消费级设备优化,经量化后仅需1GB内存即可实现端侧离线实时翻译,在参数量极小的情况下,翻译效果已超过多数主流商用翻译API。实测显示,该模型处理50个tokens平均耗时仅0.18秒,显著快于其他商用模型约0.4秒的响应时间。在FLORES-200、WMT25及民汉翻译测试集中,其表现达到Gemini-3.0-Pro闭源模型90%的水平,部分场景下差距微小,远超同类开源与商用方案。

HY-MT1.5-7B则为此前WMT25比赛30项冠军模型的升级版,重点提升翻译准确率,有效减少译文夹带注释或语种混杂问题。两款模型可协同部署,实现端云结合,提升整体翻译一致性与稳定性。

实用性方面,新模型支持术语库自定义、上下文长文本理解及带格式文本翻译。用户可导入医学、法律、金融等行业术语表,确保专业词汇准确;模型还能基于前文语境优化后续翻译,适用于会议记录、小说章节等长内容;同时保留原始排版格式,提升网页、文档等结构化内容的翻译可用性。

技术上,1.8B模型通过On-Policy Distillation策略,由7B大模型作为教师实时引导训练,避免死记硬背,显著提升小模型泛化能力。目前,该系列模型已在腾讯会议、企业微信、QQ浏览器等内部产品中落地,并兼容Arm、高通、Intel、沐曦等主流硬件平台。

标签: 模型 翻译 腾讯 格式 文本 github intel 内存 可用性 民汉

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。