Artificial Analysis发布全新基准：GLM-5.1取得全球开源SOTA

IP属地中国·北京 澎湃新闻 时间：2026-05-12 22:29:43

5月12日，澎湃新闻记者获悉，全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index，用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Benchv2和SWE-Atlas-QnA主流基准上的表现。其中，闭源模型Opus4.7（在CursorCLI中运行）全球第一，GLM-5.1（在ClaudeCode运行）取得开源第一。从评测结果上来看，GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。（澎湃新闻记者范佳来）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

氢能核聚变、脑机接口、智能采矿……这场科技盛会7月来袭！

AI有“专长” 百业添“智囊”——石家庄垂直大模型打开“人工智能+”应用新场景

周鸿祎一小时密集输出：AI落地最大的误区，是把先进发动机装在马车上

烧毁史上最惨RTX 5090！16针接口炸无踪影 GPU和显存全毁

专家解读拼多多入驻雄安，以数字能力助推新区及河北传统产业新质转型

OpenAI发布新模型，价格很“美丽”！但目前仅向美国本土少数可信合作伙伴开放

全站最新

氢能核聚变、脑机接口、智能采矿……这场科技盛会7月来袭！

AI有“专长” 百业添“智囊”——石家庄垂直大模型打开“人工智能+”应用新场景

周鸿祎一小时密集输出：AI落地最大的误区，是把先进发动机装在马车上

长途驾驶选国道？先掌握这4个技巧，否则高速更稳妥安全！

热门推荐

海伦司小酒馆痛失中文名，市值跌超9成，遍地bistro生意不好做

氢能核聚变、脑机接口、智能采矿……这场科技盛会7月来袭！

AI有“专长” 百业添“智囊”——石家庄垂直大模型打开“人工智能+”应用新场景

周鸿祎一小时密集输出：AI落地最大的误区，是把先进发动机装在马车上

宗馥莉任职上海焱橙贸易公司

从第一性原理拆解：机器人AI如何突破数据、延迟与泛化难题？

B站17周年庆：优质内容成核心，超六成观看时长聚焦5分钟以上视频

烧毁史上最惨RTX 5090！16针接口炸无踪影 GPU和显存全毁

专家解读拼多多入驻雄安，以数字能力助推新区及河北传统产业新质转型

OpenAI发布新模型，价格很“美丽”！但目前仅向美国本土少数可信合作伙伴开放

死灰复燃？消失四天后，高德、百度地图们再现「开屏」争议，网友直呼「夺命营销」

顺丰同城在海南成立供应链公司

B站举办17周年庆，5分钟以上视频观看时长占比达65%

B站迎17周年庆，陈睿称社区是优质内容最好的土壤

微博部分用户出现功能异常，官方致歉称已经逐步修复