5月12日,澎湃新闻记者获悉,全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Benchv2和SWE-Atlas-QnA主流基准上的表现。其中,闭源模型Opus4.7(在CursorCLI中运行)全球第一,GLM-5.1(在ClaudeCode运行)取得开源第一。从评测结果上来看,GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。(澎湃新闻记者 范佳来)
Artificial Analysis发布全新基准:GLM-5.1取得全球开源SOTA
IP属地 中国·北京
澎湃新闻 时间:2026-05-12 22:29:43
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 海伦司小酒馆痛失中文名,市值跌超9成,遍地bistro生意不好做
- 氢能核聚变、脑机接口、智能采矿……这场科技盛会7月来袭!
- AI有“专长” 百业添“智囊”——石家庄垂直大模型打开“人工智能+”应用新场景
- 周鸿祎一小时密集输出:AI落地最大的误区,是把先进发动机装在马车上
- 宗馥莉任职上海焱橙贸易公司
- 从第一性原理拆解:机器人AI如何突破数据、延迟与泛化难题?
- B站17周年庆:优质内容成核心,超六成观看时长聚焦5分钟以上视频
- 烧毁史上最惨RTX 5090!16针接口炸无踪影 GPU和显存全毁
- 专家解读拼多多入驻雄安,以数字能力助推新区及河北传统产业新质转型
- OpenAI发布新模型,价格很“美丽”!但目前仅向美国本土少数可信合作伙伴开放
- 死灰复燃?消失四天后,高德、百度地图们再现「开屏」争议,网友直呼「夺命营销」
- 顺丰同城在海南成立供应链公司
- B站举办17周年庆,5分钟以上视频观看时长占比达65%
- B站迎17周年庆,陈睿称社区是优质内容最好的土壤
- 微博部分用户出现功能异常,官方致歉称已经逐步修复





京公网安备 11011402013531号