财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

  • 全部
  • 财经头条
  • 科技头条
  • 财经人物
  • 金融市场
  • 财经数据
  • 股市速递
  • AI 大模型
  • 智能汽车
  • 大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

    【新智元导读】首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。 DrafterBench以图纸修改为核心任务,在20个真实项目中收集并设计了1920个…

    07/18
  • OpenAI史上最强ChatGPT智能体发布:逛网站、做PPT样样精通

    ChatGPT智能体模型在Humanity's Last Exam(pass@1)中得分率为41.6%

    07/18
  • 刚刚,OpenAI发布ChatGPT版Manus!奥特曼:感受AGI时刻

    OpenAI交出了Agent的答案。

    07/18
  • OpenAI的“Manus时刻”来了:ChatGPT Agent正式发布

    OpenAI的“Manus时刻”来了:ChatGPT Agent正式发布

    07/18
  • 大模型转行土木工程!首个“打灰人”评估基准:检验读、改工程图纸能力

    你有模型,DrafterBench有任务。

    07/18
  • 2024投中私募股权基金业绩基准(Benchmark)

    07/17
  • 1万tokens是检验长文本的新基准,超过后18款大模型集体失智

    07/17
  • 1万tokens是检验长文本的新基准,超过后18款大模型集体失智

    此外,模型对干扰项的响应存在差异:Claude系列倾向于在不确定时弃权(明确表示无法回答),幻觉率较低;GPT系列则更可能生成自信但错误的答案,受干扰影响更明显;Gemini和Qwen模型的表现波动较大,易…

    07/17
  • 港中文&华为联合提出首个大模型推理可靠性评估基准

    图(b)分别展示了不同难度的无解问题的可靠性,发现难度为 1 的不可解问题可靠性偏低,即这些问题需要模型经过推理才能发现问题无解,这种情况更难也符合预期,说明大模型与人类在识别问题无解难度的相关性是一致的,尽…

    07/17
  • 港中文&华为联合提出首个大模型推理可靠性评估基准

    07/16
  • 智源RoboBrain 2.0+RoboOS 2.0双发:问鼎评测基准最强具身大脑

    07/14
  • 马斯克20亿送Grok 4上火星!20万GPU造宇宙大脑,一句话生成3D黑洞

    马斯克20亿送Grok 4上火星!20万GPU造宇宙大脑,一句话生成3D黑洞

    07/14
  • Perplexity CEO称赞月之暗面,希望基于Kimi K2进行后训练

    Kimi K2是月之暗面Kimi昨日刚发布的旗下首个万亿参数开源模型。

    07/13
  • 英特尔前 CEO 推出新基准 测试人工智能与人类价值观的契合度

    07/11
  • 真实科研水平集体不及格!全新基准SFE给主流多模态LLM来了波暴击

    07/09
  • ICCV 2025|UniOcc: 自动驾驶占用预测与推理统一数据集及基准平台

    07/09
  • 顶尖AI如何发挥最大战力?UIUC用一个新多智能体协作基准寻找答案

    07/09
  • 理财业良性信号凸显!产品到期收益率和业绩比较基准的偏离度正持续缩窄

    07/09
  • AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

    AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

    07/08
  •  «上一页   1   2   …   3   4   5   6   7   8   …   9   10   下一页»   共199条/10页 
    全部热门
  • 农发行湖北省分行被罚150万,涉违反金融统计管

    10/31 16:58

  • 浙江平湖农商行被罚450万,涉关联交易管理不审

    10/31 16:58

  • 老铺黄金距离奢侈品牌有多远?

    10/31 16:56

  • 文华东方300亿元赎身,“老钱”找新路子了

    10/31 16:56

  • 思妍丽入局,美丽田园能否完成“二次蜕变”

    10/31 16:56

  • 预售比现货贵背刺“所有女生”,李佳琦们黄金

    10/31 16:56

  • 张一鸣死磕游戏,字节海外再出平台

    10/31 16:56

  • 鸣鸣很忙冲刺港股:半年营收281亿,门店16783

    10/31 16:55

  • 苹果季绩沸腾,港股“果链”表现分化

    10/31 16:55

  • AI重构之下的双11

    10/31 16:55

关于我们| 联系方式| 用户协议| 隐私政策| 版权声明| 网站地图| 友情链接| 财经头条| 酒业之家
©2008-2025 DESTOON All Rights Reserved 京公网安备 11011402013531号