今天,阿里正式发布 Qwen3-Coder,这是阿里迄今为止最具代理能力的代码模型。
Qwen3-Coder 拥有多个尺寸,其中当前最强大的版本为Qwen3-Coder-480B-A35B-Instruct。这是一个 480B 参数激活 35B 参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。
Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美
据阿里官方介绍,借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。
与此同时,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。
Qwen Code 基于 Gemini Code 进行二次开发,但阿里进行了 prompt 和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。
另外,Qwen3-Coder 可以和社区优秀的编程工具结合,如 Claude Code、Cline 等。这一模型已在阿里云旗下大模型服务平台百炼上线,其API采用了阶梯计费的方式,根据输入token量调整价格。
在256K~1M一档,其输入价格为6美元/百万token,输出价格为60美元/百万token。相比之下,Claude Sonnet 4的输入输出价格分别为3美元/百万token、15美元/百万token,与Qwen3-Coder 128k~256k一档的价格持平。
Qwen3-Code的大规模强化学习
这次阿里从不同角度对Qwen3-Coder进行Scaling,以提升模型的代码能力:
数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;
上下文扩展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request)优化,助力 Agentic Coding;
合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,显著提升整体数据质量。
此外,与当前社区普遍聚焦于竞赛类代码生成不同,阿里认为所有的代码任务天然适合执行驱动的大规模强化学习。因此阿里选择在更丰富的真实代码任务上扩展 Code RL 训练。
通过自动扩展测试样例,阿里构造了大量高质量的训练实例,成功释放了强化学习的潜力:不仅显著提升了代码执行成功率,还对其他任务带来增益。
在Long-Horizon RL阶段,模型学会了在真实软件工程环境中进行多轮交互——规划、执行、接受反馈、再决策。阿里在 Qwen3-Coder 的后训练阶段执行了 Agent RL,鼓励模型通过多轮交互的方式利用工具解决问题。
而Agent RL 的主要挑战在于 Environment Scaling,阿里实现了可验证环境的扩展系统,借助阿里云的基础设施,实现同时运行 20k 独立环境。这一套基础设施可以提供大规模的强化学习反馈和评测,最终阿里在 SWE-bench Verified 上实现了开源模型 SOTA 的效果。
Qwen3-Coder的生态集成
Qwen3-Coder推出多元化的使用方案,降低开发者接入门槛。自研的Qwen Code工具基于Gemini Code进行优化,通过prompt和工具调用协议适配,最大化激发模型在代理式编程任务上的表现。
该模型同时支持与Claude Code的集成使用,开发者可通过阿里云百炼平台申请API密钥,采用两种接入方案实现无缝对接。此外,Qwen3-Coder还兼容Cline等主流编程工具。
通过百炼API平台,开发者可直接调用该模型服务,阿里云提供了完整的示例代码和配置指南,支持快速部署和测试:
Qwen Code 是一个 CLI工具,修改自Gemini CLI,针对 Qwen3‑Coder系列的模型增强了解析器和工具支持。
step1:安装Qwen Code
确保已安装 Node.js 20 及以上版本,可以通过以下命令安装:
step2:通过 npm 管理器安装 Qwen Code
从 npm 包安装:
从源码安装:
step3:配置环境变量(使用 OpenAI SDK 调用 LLM)
Qwen Code 支持 OpenAI SDK 调用 LLM,你可以导出以下环境变量,或者简单地将其放在 .envfile 中。
除了 Qwen Code 之外,现在还可以将 Qwen3‑Coder 与 Claude Code 搭配使用。只需在阿里云百炼平台申请 API Key,并安装 Claude Code,即可开始畅享编码体验。阿里提供了两种接入方式,帮助无缝地用 Qwen3‑Coder 进行编码:
方案 1:使用dashscope提供的代理 API
只需要将Anthropic的base url替换成dashscope上提供的endpoint即可。
至此就可以直接输入claude 开始使用 Qwen3-Coder & Claude Code
方案 2:使用 claude-code-config 自定义路由
claude-code-router是一个第三方的路由工具,用于为 Claude Code 灵活地切换不同的后端 API。dashscope平台提供了一个简单的扩展包 claude-code-config,可为 claude-code-router 生成包含 dashscope 支持的默认配置。
生成配置文件和插件目录:
该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/中的配置。
最后,通过 ccr 开始使用 Claude Code:
至此即可通过 ccr 使用 Claude Code 畅享 Qwen3‑Coder 的强大编码能力。而如果开发者想通过百炼API平台,可接调用该模型服务,阿里云也提供了完整的示例代码和配置指南,支持快速部署和测试:
Demo示例
正式发布时,Qwen官方也提供了Qwen3-Coder的部分用例。
例如,可以让其打造一个基于物理的烟囱拆除模拟,按照实际需求受控爆炸。
还有网友让Qwen3-Coder出了一道3D HTML开发题,内容是创建一个3D旋转的立方体展示台,六个面显示不同颜色,自动旋转,添加光照效果和阴影等。
Qwen3-Coder交付的结果完成度不错,基本实现了主要功能,旋转动效、阴影等处理到位。
市场前景:瞄准编程AI助手增长空间
阿里云表示将继续提升Coding Agent效果,希望承担更多复杂软件工程任务,释放开发者生产力。公司计划推出更多模型尺寸版本,在保证效果的同时降低部署成本。
该公司正积极探索Coding Agent的自我改进能力,这一技术方向被视为编程AI发展的关键突破点。随着企业对自动化编程需求的增长,代码生成模型市场预期将迎来快速扩张。
Qwen3-Coder的发布时机正值全球科技公司加速布局AI编程助手,该产品的开源策略和多工具兼容性有望在激烈的市场竞争中获得差异化优势。