通义千问深夜“王炸”更新！Qwen3升级版全面超越Kimi-K2，Agent能力亮眼

IP属地中国·北京 编辑：杨凌霄华尔街见闻官方 时间：2025-07-22 10:24:24

国内的AI大模型竞赛，再次被按下了加速键！
AI圈的小伙伴们可能还记得，几天前Kimi-K2的开源还在被津津乐道。然而，开源的王座，热度还没持续几天，就迎来了新的挑战者。
7月22日凌晨，阿里巴巴通义千问团队突然发布了旗舰模型Qwen3的重磅更新，推出 Qwen3-235B-A22B-FP8 非思考模式（Non-thinking）的更新版本，命名为Qwen3-235B-A22B-Instruct-2507-FP8。
新版本模型在多项核心能力上实现了惊人飞跃，不仅全面超越了Kimi-K2等顶级开源模型，甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。
性能“爆表”，这次升级有多猛？
根据官方发布的数据，新模型的通用能力获得了全方位强化，在多个权威测评中表现极其亮眼：
包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面，在GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent能力）等众多测评中表现出色，超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

值得一提的是，本次更新的Qwen3模型在Agent能力尤其亮眼：在BFCL（Agent能力）测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上，达到了一个新的高度。“主打Agent”，将是未来AI应用的核心竞争力。

除了硬核的跑分，这次更新还带来了三大“体感”升级：
-在多语言的长尾知识覆盖方面，模型取得显著进步。
-在主观及开放性任务中，模型显著增强了对用户偏好的契合能力，能够提供更有用的回复，生成更高质量的文本。
-长文本提升到256K，上下文理解能力进一步增强。
告别“混合思维”，分离训练有多强？
这次最核心的变化，是技术路线的革新。
通义千问团队宣布，正式告别此前的“混合思维模式”，迈向全新的“分离训练”时代。他们将用于直接回答的Instruct模型和用于复杂思考的Thinking模型进行独立训练。

简单来说，就是让“快思考”和“慢思考”各司其职，从而在各自的领域都做到极致。
本次发布的 Qwen3-235B-A22B-Instruct-2507-FP8 ，就是“快思考”路线下的最新成果。它主打非思考模式（Non-thinking），追求的是在指令遵循、文本理解和知识问答等任务上，做到更快、更准、更强~
开源圈“卷”出新高度，大招还在后头！
从Kimi-K2到DeepSeek-V3，再到今天的Qwen3新版，国内的开源AI竞赛已经进入白热化阶段。每一次更新都伴随着性能的飞跃和王座的更迭。
更让人激动的是，通义千问团队在发布更新的同时，还留下了一个悬念：
“还有大招，马上就要来了！”
这不禁让人猜想，分离训练的另一端——专注于复杂推理的“Thinking”模型是否也已在路上？
目前，最新的Qwen3模型已在魔搭社区（ModelScope）和HuggingFace全面开源更新。如果你是AI开发者或爱好者，现在就可以去亲身体验这个“开源新王”的威力了

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

特朗普T1手机开放销售，结算页需额外支付41.75美元的“设备税”

消息称三星集团29日将公布1000万亿韩元巨额投资计划

小米YU7获CNCAP安全性测试五星认证：雷军称安全高于一切

全站最新

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

特朗普T1手机开放销售，结算页需额外支付41.75美元的“设备税”

热门推荐

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

新加的同事为啥能看到你以前的“同事不可见”朋友圈？微信官方给出答案

Notion宣布将于9月22日关闭AI邮箱服务Notion Mail

亚马逊加码印度：拟投 130 亿美元布局AI与云基础设施

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

特朗普T1手机开放销售，结算页需额外支付41.75美元的“设备税”

消息称三星集团29日将公布1000万亿韩元巨额投资计划

小米YU7获CNCAP安全性测试五星认证：雷军称安全高于一切

DeepSeek成立以来规模最大扩招，意味着什么？

头部新势力车企回应：暂不涨价

TD Cowen称马斯克SpaceX可能斥3200亿美元收购美国第三大运营商T-Mobile

近400家美国报纸联合起诉OpenAI和微软白嫖内容，AI热潮恐成地方新闻“丧钟”

国产大模型Kimi表态：最高优先是研发要跟美国御三家AI掰掰手腕

消息称小鹏机器人大调整：新设九部门，何小鹏兼任产品部负责人