5月12日,澎湃新闻记者获悉,全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Benchv2和SWE-Atlas-QnA主流基准上的表现。其中,闭源模型Opus4.7(在CursorCLI中运行)全球第一,GLM-5.1(在ClaudeCode运行)取得开源第一。从评测结果上来看,GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。(澎湃新闻记者 范佳来)
Artificial Analysis发布全新基准:GLM-5.1取得全球开源SOTA
IP属地 中国·北京
澎湃新闻 时间:2026-05-12 22:29:43
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- xAI惨遭淘汰!马斯克的人工智能梦,碎了吗?
- 7999元起!坚果新激光投影值不值?
- “兼职”也给期权?看齐海外,MiniMax抢聘经济学、金融等顶尖专家
- 从579亿到1亿:车企研发账,两种活法
- “人工智能教育杭州倡议”发布:呼吁研制人工智能教育应用规范和标准
- 重庆启动科研人员顶岗培养计划 212名骨干将前往国内外知名高校
- 澳洲汽车媒体测试跑了2年的比亚迪海豹:电池健康度仍超95%
- 京东集团2026年一季度收入达3157亿元
- 宝付、通联“断供”!“7+4”机构代扣全停,高息助贷迎生死大考
- 新政落地四十天:AI漫剧迎来第一次泡沫破裂
- 股价去年来最高涨超10倍,9000亿美元存储巨头或将诞生
- 乐橙×火山引擎:给安防注入AI能力,让监控从“被动记录”进化为“主动思考”
- 京东集团一季度营收3157亿元 日百和服务业务成新增长极
- 京东集团一季度营收3157亿元 日百和服务业务成新增长极
- 10万人次的大会、Token飞轮和移动云的新色调





京公网安备 11011402013531号