当前位置: 首页 » 资讯 » 科技头条 » 正文

通义最强代码AI模型Qwen3-Coder发布 性能直追Claude Sonnet 4

IP属地 中国·北京 编辑:陈丽 凤凰网科技 时间:2025-07-23 08:04:34

7月23日,今日,通义Qwen系列大模型迎来了其在代码能力上的重要更新,专为Agent能力打造的全新代码模型Qwen3-Coder正式发布。此次率先亮相的是该系列中最强大的版本——Qwen3-Coder-480B-A35B-Instruct,这是一款采用混合专家(MoE)架构的大模型,旨在重塑AI在真实软件工程环境中的应用范式。

据介绍,Qwen3-Coder在核心能力上实现了多项突破。该模型原生便支持256K token的超长上下文窗口,并通过YaRN技术可扩展至1M token,使其能够轻松处理仓库级的代码库或复杂的动态数据(如Pull Request),这为其强大的代理能力奠定了基础。在性能方面,官方信息显示,Qwen3-Coder在多个关键的代理式任务评测中,包括代理式编码(Agentic Coding)、浏览器使用(Agentic Browser-Use)和工具调用(Agentic Tool-Use),均取得了当前开源模型的SOTA(业界最佳)效果,其综合表现甚至可以与业界顶尖的闭源模型Claude Sonnet 4相媲美。

为了充分发挥新模型的潜力,团队还同步推出了一款配套的命令行工具Qwen Code。该工具在Gemini Code的基础上进行了二次开发,通过深度的prompt和工具调用协议适配,能够最大化激发Qwen3-Coder在执行复杂编程任务时的代理表现。同时,模型本身保持了开放性,可以与社区中流行的编程工具(如Claude Code、Cline等)结合使用。

此次Qwen3-Coder在能力上的跃升,得益于其在训练方法上的深度创新。在预训练阶段,团队使用了总计高达7.5T token的海量数据,其中代码数据占比达到70%。更值得关注的是,团队并未沿用社区普遍聚焦于编程竞赛题的训练路径,而是选择了在更广泛、更真实的软件工程任务上,大规模应用强化学习(RL)。通过构建一个可同时运行两万个独立环境的庞大验证系统,模型得以在多轮交互中自主规划、调用工具并从反馈中学习,最终在衡量真实世界软件问题解决能力的SWE-bench Verified榜单上,实现了开源模型的最佳成绩。这一系列技术突破,标志着AI代码模型正从单纯的代码生成器,向能够自主解决复杂工程问题的“AI软件工程师”加速演进。

标签: 模型 代码 编程 能力 工具 代理 团队 通义 问题 软件 基础 业界 深度 社区 任务 方面 性能 数据 范式 科技 凤凰网 协议 环境 官方 信息 潜力 真实世界 成绩 顶尖 闭源 标志 开源

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。