当前位置: 首页 » 资讯 » 科技头条 » 正文

中文大模型测评出炉:豆包跻身全球第一梯队 小米MiMo上榜

IP属地 中国·北京 编辑:吴俊 驱动之家 时间:2026-03-30 17:21:23

快科技3月30日消息,中文大模型基准测评SuperCLUE发布2026年3月最新结果,22款国内外主流模型参与角逐。

字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下国内第一,成功跻身全球第一梯队;小米集团的MiMo-V2系列两款模型均顺利上榜。

本次测评覆盖数学推理、科学推理、代码生成等六大核心任务,全面检验模型综合能力。海外闭源模型依旧占据总分前列,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。

豆包则紧随其后,总分仅与GPT-5.4相差0.95分,实现全方位追赶,在智能体任务规划维度更是反超部分海外模型,跻身全球前五。

小米此次有两款模型入选测评榜单,其中MiMo-V2-Pro以60.67分位列闭源模型前列,在数学推理任务中取得84.03分的亮眼成绩;开源版本MiMo-V2-Flash虽以49.97分排名靠后,但在代码生成等细分场景中表现出一定潜力。

测评还显示,国产模型整体表现亮眼,开源赛道尤为突出,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜前三,大幅领先海外同类模型。

标签: 模型 小米 豆包 开源 全球 任务 梯队 亮眼 代码生成 中文 国产 规划 维度 全面 能力 总分 闭源 核心 智能 数学 整体 部分 细分 场景 版本 字节 成绩 科学 领先 同类 旗下 紧随其后

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。