道题_资讯搜索_财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

GPT-5.6来了，Fable 5慌了？

GPT-5.6来了，Fable 5慌了？

07/13

OpenAI炮轰AI评测"标杆"： 731 道题近三成有缺陷， 8 个月通过率从23%飙到80%已失灵

07/09

Fable平替登顶真相：它没打败Opus，它雇了Opus

Fable平替登顶真相：它没打败Opus，它雇了Opus

06/27

对话正大食品中国区副董事长扬纲：标准、利润与C端，行业仍需回答三道题

06/21

对话正大食品中国区副董事长扬纲：标准、利润与C端，行业仍需回答三道题

06/19

只需10分钟，AI就能“养废”你的大脑

关掉AI之后，他们连题都不想做了

05/01

所有AI全军覆没！学者出2500道题，GPT-5得分25.3%，GPT-4o 2.7%

03/01

比IMO还难的数学挑战赛，谷歌赢了OpenAI

下一轮问题集3月中旬就要来了，难度只会更高

02/26

羽绒服只卖499，中产这道题，山姆做累了

01/28

具身智能测评“上海卷”宣布开源，100道题补齐国内行业短板

01/27

文汇海报 | 做全球开源之城，上海先解这道题

01/14

2025：科技投资正酣，如何答好这道题？

12/17

谷歌Gemini 3杀疯了！陶哲轩亲测：10分钟干翻百年数学难题

谷歌Gemini 3杀疯了！陶哲轩亲测：10分钟干翻百年数学难题

11/24

大模型在具身推理上「翻车」了？4496 道题全面揭示短板

10/28

深度揭秘OpenAI如何让GPT-5“技术性”超越Claude：悄悄跳过最难的23道题

GPT-5代码排名涉作弊？被曝跳过23道难题，真实得分输给Claude！

08/20

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

08/20

「0污染」LLM理解基准来了！20000道题14个学科全覆盖，来自微软

07/18

「0污染」LLM理解基准来了！20000道题14个学科全覆盖，来自微软

为了提供更为准确、公平的评估，微软亚洲研究院推出了MMLU-CF，它是基于公开数据源，经过去污染设计的大语言模型理解基准，并已在Huggingface上开放。对于MMLU-CF，研究人员在数据收集时应用了…

07/18

全部热门

中国支付的全球水路，谁来打通？
06/25 00:17
华峰化学关联并购迷雾：“高盈利+高负债”模式
06/25 00:17
京东与魔法原子达成战略合作目标销售额10亿元
06/25 00:17
意法半导体推出全球首款后量子密码移动安全芯
06/25 00:17
ChatGPT语音模式被曝本周大升级！被打断也能自
06/25 00:17
三星Galaxy Z Flip8国行版回归高通平台：自研
06/25 00:16
ISC2026发布IO500最新榜单中科曙光存储系统登
06/25 00:16
周鸿祎不再做“安全龙虾”了，要做中国版Mytho
06/25 00:16
五部门联合启动工业5G独立专网试点
06/25 00:15
商汤科技贾安亚：AI行业正从“能用”走向“好
06/25 00:15