财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 财经头条
  • 科技头条
  • 财经人物
  • 金融市场
  • 财经数据
  • 股市速递
  • AI 大模型
  • 智能汽车
  • 打破SWE-bench唯分数论,首个独立测量harness的基准开源了

    06/15
  • SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    04/20
  • SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    04/19
  • SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    04/19
  • SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    04/19
  • SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    04/19
  • SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

    04/19
  • 智谱发布GLM-5.1:SWE-bench评分全球领跑,模型单价上调10%

    04/08
  • 拜拜了SWE-Bench!Cursor刚发了个AI Coding评测基准,难哭Claude

    03/14
  • Mistral重磅开源Devstral 2:123B编码神器+SWE-bench 72.2分,免费API+本地CLI炸裂来袭!

    12/12
  • 慕尼黑工大GUIRepair登上SWE-bench Multimodal榜单第一

    09/16
  • 马斯克xAI推出Grok编码模型,编程实力冲进SWE-bench前五

    为了打造这款模型,xAI公司设计了一款全新的模型架构,并在训练阶段精心构建了一个高度聚焦于编程领域的语料库。xAI在推理和训练流程中做出了一系列创新,极大提升了运行速度,为用户带来了前所未有的体验。有开发者…

    08/30
  • GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

    GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

    08/12
  • Claude Opus 4.1深夜狙击OpenAI,SWE-bench编程卷到74.5%,预告更强大模型

    08/06
  • Claude 4.1 发布:更强的Agent、代码和推理

    Claude 4.1 发布:更强的Agent、代码和推理

    08/06
    全部热门
  • 中国支付的全球水路,谁来打通?

    06/25 00:17

  • 华峰化学关联并购迷雾:“高盈利+高负债”模式

    06/25 00:17

  • 京东与魔法原子达成战略合作 目标销售额10亿元

    06/25 00:17

  • 意法半导体推出全球首款后量子密码移动安全芯

    06/25 00:17

  • ChatGPT语音模式被曝本周大升级!被打断也能自

    06/25 00:17

  • 三星Galaxy Z Flip8国行版回归高通平台:自研

    06/25 00:16

  • ISC2026发布IO500最新榜单 中科曙光存储系统登

    06/25 00:16

  • 周鸿祎不再做“安全龙虾”了,要做中国版Mytho

    06/25 00:16

  • 五部门联合启动工业5G独立专网试点

    06/25 00:15

  • 商汤科技贾安亚:AI行业正从“能用”走向“好

    06/25 00:15

关于我们| 联系方式| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 头部财经
©2008-2026 DESTOON All Rights Reserved 京公网安备 11011402013531号