当前位置: 首页 » 资讯 » 科技头条 » 正文

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

IP属地 中国·北京 编辑:赵云飞 Chinaz 时间:2025-07-30 10:19:19

7月29日,Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升,标志着该模型在非思考模式(non-thinking mode)下仅激活3B参数,就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。

新版本的Qwen3-30B-A3B-Instruct-2507在通用能力上取得了巨大进步,涵盖了指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多个方面。这一改进不仅提升了模型的多功能性,还使其在处理复杂任务时表现得更加智能和高效。此外,该模型在多语言的长尾知识覆盖方面也取得了显著进步,能够更好地理解和生成多种语言的文本,这对于全球化的应用场景来说是一个巨大的优势。

在主观和开放性任务中,新模型与用户偏好的对齐更加紧密,能够生成更高质量的文本,为用户提供更有帮助的回答。这一改进使得模型在与用户的交互中更加自然和人性化,能够更好地满足用户的需求。同时,长文本理解能力也得到了显著提升,达到了256K,这进一步增强了模型的上下文理解能力,使其能够处理更长的文本输入,从而更好地理解和生成复杂的文本内容。

为了方便开发者和研究人员使用和测试这一新模型,开发团队已经在魔搭社区和HuggingFace等平台开源了Qwen3-30B-A3B-Instruct-2507。此外,开发团队还邀请用户前往QwenChat(chat.qwen.ai)直接体验这一新版本的强大功能。这一举措不仅展示了开发团队对模型性能的信心,也为用户提供了直接体验和反馈的机会,有助于进一步优化和改进模型。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。