当前位置: 首页 » 资讯 » 科技头条 » 正文

消费级显卡可跑!刚刚,阿里Qwen3.5又开源3款新模型

IP属地 中国·北京 机器之心Pro 时间:2026-02-25 18:28:12

机器之心编辑部


刚过完年,阿里又卷起来了。

2 月 25 日,继除夕开源 Qwen3.5-397B-A17B 之后,阿里继续开源千问 3.5 系列模型,而且是一口气开源三款中等规模的新模型,分别是Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B。



此次开源的三款千问 3.5 模型,凭借架构创新和训练突破,均创下中等尺寸模型的性能新高,不仅超越了更大尺寸的上代旗舰模型 Qwen3-235B-A22B 和 Qwen3-VL,更在多榜单表现上均明显优于 GPT-5 mini。

千问 3.5 新模型甚至可直接部署于消费级显卡,对开发者极为友好。目前,基于 Qwen3.5-35B-A3B 的托管模型 Qwen3.5-Flash 已上线阿里云百炼,每百万 Token 输入低至 0.2 元。

更小的参数,更强的性能

千问 3.5 模型采用混合注意力机制,结合高稀疏的 MoE 架构创新,并基于更大规模的文本和视觉混合 Token 上训练,新模型以更小的总参数和激活参数量,实现了更大的性能提升。

Qwen3.5-122B-A10B 与 Qwen3.5-35B-A3B,就是这一新范式在中等规模下的最新模型成果,在指令遵循(IFBench)、博士级别推理(GPQA)、数学推理(HMMT 25)、多语言知识(MMMLU)、Agent 工具调用(BFCL v4)、Agentic Coding(SWE-bench Verified)等多个权威榜单上,新模型均超越了远大于其规模的 Qwen3-235B-A22B 模型及 Qwen3-VL,以及 GPT-5 mini、gpt-oss-120b 等模型。



更紧凑的模型,更好的性能,千问 3.5 家族中的首个密集(Dense)模型 Qwen3.5-27B此次惊艳亮相。

Qwen3.5-27B 同时拥有更强的 Agent 能力和原生多模态能力,在工具调用、搜索、编程等多个 Agent 评测中均超过了 GPT-5 mini,在视觉推理、文本识别和理解、视频推理等多项视觉理解能力榜单中超过了 Qwen3-VL 旗舰模型和 Claude Sonnet 4.5。

Qwen3.5-27B可运行于单个 GPU,对于本地部署极为友好。


阿里开源再次引爆AI社区

此前,基于 Qwen3.5-397B-A17B 的 Qwen3.5-Plus 模型已上线阿里云百炼,性能媲美 Gemini 3 但 API 价格仅为其 5%,适用于高性能的 AI 编程、Agent 等场景。

此次,百炼上线基于 Qwen3.5-35B-A3B 的 Qwen3.5-Flash,支持 1M 的上下文长度,提供官方的内置工具调用,企业和开发者每百万 Token 输入成本低至 0.2 元。Qwen3.5-Flash 响应速度快、性价比高、门槛低,适合处理工作、生产、生活的日常 AI 任务。

此外,Qwen3.5-35B-A3B 的基座(Base)模型也一并开源。

千问 3.5 的系列开源引发全球 AI 开源社区热议,有开发者指出,这将加速机器人产业的 VLA 模型发展,或将衍生出一批基于 Qwen3.5 的多模态模型。

据了解,除夕开源的 Qwen3.5-397B-A17B 模型已登顶 Hugging Face 全球榜首,截至目前,阿里已开源千问模型超 400 个,全球下载量突破 10 亿次,衍生模型数超 20 万,千问稳居全球第一开源模型。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新