多模态视觉大模型12月战报:Gemini 霸榜，豆包、商汤领跑国产阵营

IP属地中国·北京 编辑：杨凌霄 Chinaz 时间：2025-12-31 10:27:58

在刚刚公布的 SuperCLUE-VLM12月多模态视觉语言基准测评中，全球 AI 大模型展现出了极强的竞争态势。本次测评从基础认知、视觉推理以及视觉应用三个核心维度展开，全方位考察了各大模型的“眼力”与“脑力”。
在此次角逐中，谷歌推出的Gemini-3-pro以83.64分的绝对优势摘得桂冠。详细数据显示，其在三项细分指标上均实现了全面领先，展现了国际顶尖模型的深厚底蕴。而在国产模型方面，整体表现同样亮眼。商汤科技的 SenseNova V6.5Pro 以75.35分紧随其后位居次席，字节跳动旗下的豆包视觉版则以73.15分成功闯入前三。值得一提的是，豆包在基础认知方面的表现甚至超越了部分国际强敌。
此外，百度 ERNIE-5.0-Preview 与阿里巴巴的 Qwen3-vl 也成功进入榜单前五。其中，Qwen3-vl 更是成为榜单中首个总分突破70分大关的开源模型，为开源社区贡献了极强的视觉解析能力。
相比之下，部分国际老牌劲旅的表现略显乏力。Anthropic 的 Claude-opus-4-5获得71.44分，而 OpenAI 的 GPT-5.2（high）则意外跌出第一梯队，仅以69.16分排名靠后。这一排名的变动，也标志着多模态 AI 领域的竞争正进入白热化的阶段。
划重点:

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

古尔曼：苹果M7 Ultra芯片最高支持1.5TB内存

易淘直播助手：淘宝直播场控实操指南，人气激活+互动维护+高效运营，新手也能稳控直播间

B站内测网页内容发布平台“Toy”

用户结构向家庭延伸，OpenAI招募专职产品经理深耕家庭场景

曾西平：以AICT构建智能体互联网可信数字底座

广州海珠区副区长陈宇：以人工智能引领全域发展的城市核心

全站最新

仰望汽车再赴古德伍德速度节中国新能源以技术实力闪耀世界舞台

方程豹鲨鱼申报图曝光双排五座插混皮卡能否撼动长城炮地位？

古尔曼：苹果M7 Ultra芯片最高支持1.5TB内存

易淘直播助手：淘宝直播场控实操指南，人气激活+互动维护+高效运营，新手也能稳控直播间

热门推荐

红米Note17系列发布在即：配置亮点全解析，中端市场再掀波澜！

小米路由器：从跨界新秀到中国第一全球第二，凭啥逆袭老牌巨头？

古尔曼：苹果M7 Ultra芯片最高支持1.5TB内存

华硕主板点燃BW2026 ROG玩创宇宙引玩家狂欢

易淘直播助手：淘宝直播场控实操指南，人气激活+互动维护+高效运营，新手也能稳控直播间

B站内测网页内容发布平台“Toy”

用户结构向家庭延伸，OpenAI招募专职产品经理深耕家庭场景

曾西平：以AICT构建智能体互联网可信数字底座

广州海珠区副区长陈宇：以人工智能引领全域发展的城市核心

不止处理外卖业务，网友实测美团AI客服还能写代码

红果继续抢救真人短剧！出台千部计划激励撮合

小米汽车：小米澎程计划发布五座、七座两版本SUV

京东物流调集多架应急无人机前往广西灾区

马斯克星际路线图更新，先让特斯拉机器人上月球

OpenAI奥尔特曼：至少到目前为止，确定AI创造了新的就业机会