7月23日,今日,通义Qwen系列大模型迎来了其在代码能力上的重要更新,专为Agent能力打造的全新代码模型Qwen3-Coder正式发布。此次率先亮相的是该系列中最强大的版本——Qwen3-Coder-480B-A35B-Instruct,这是一款采用混合专家(MoE)架构的大模型,旨在重塑AI在真实软件工程环境中的应用范式。
据介绍,Qwen3-Coder在核心能力上实现了多项突破。该模型原生便支持256K token的超长上下文窗口,并通过YaRN技术可扩展至1M token,使其能够轻松处理仓库级的代码库或复杂的动态数据(如Pull Request),这为其强大的代理能力奠定了基础。在性能方面,官方信息显示,Qwen3-Coder在多个关键的代理式任务评测中,包括代理式编码(Agentic Coding)、浏览器使用(Agentic Browser-Use)和工具调用(Agentic Tool-Use),均取得了当前开源模型的SOTA(业界最佳)效果,其综合表现甚至可以与业界顶尖的闭源模型Claude Sonnet 4相媲美。
为了充分发挥新模型的潜力,团队还同步推出了一款配套的命令行工具Qwen Code。该工具在Gemini Code的基础上进行了二次开发,通过深度的prompt和工具调用协议适配,能够最大化激发Qwen3-Coder在执行复杂编程任务时的代理表现。同时,模型本身保持了开放性,可以与社区中流行的编程工具(如Claude Code、Cline等)结合使用。
此次Qwen3-Coder在能力上的跃升,得益于其在训练方法上的深度创新。在预训练阶段,团队使用了总计高达7.5T token的海量数据,其中代码数据占比达到70%。更值得关注的是,团队并未沿用社区普遍聚焦于编程竞赛题的训练路径,而是选择了在更广泛、更真实的软件工程任务上,大规模应用强化学习(RL)。通过构建一个可同时运行两万个独立环境的庞大验证系统,模型得以在多轮交互中自主规划、调用工具并从反馈中学习,最终在衡量真实世界软件问题解决能力的SWE-bench Verified榜单上,实现了开源模型的最佳成绩。这一系列技术突破,标志着AI代码模型正从单纯的代码生成器,向能够自主解决复杂工程问题的“AI软件工程师”加速演进。