正确率_资讯搜索_财经中国

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

清华发现：让AI自己出"模拟题"，数学竞赛题的正确率飙升了4分

05/28

美国AI机器人挑战分拣包裹：直播10小时最终输给人类

美国AI机器人挑战分拣包裹：直播10小时最终输给人类

05/18

不拼热闹入口，科大讯飞要拼大模型最稳定的正确率

从 X1.5 到 X2，讯飞把升级重点放在两件事上：一是整体能力上台阶，尤其在数学、答题、语言理解与智能体能力上，追求对标全球最高水平；二是把推理能力进一步压进行业场景，让行业大模型继续领先，并在产品与方案层…

02/13

不拼热闹入口，科大讯飞要拼大模型最稳定的正确率

从 X1.5 到 X2，讯飞把升级重点放在两件事上：一是整体能力上台阶，尤其在数学、答题、语言理解与智能体能力上，追求对标全球最高水平；二是把推理能力进一步压进行业场景，让行业大模型继续领先，并在产品与方案层…

02/11

不拼热闹入口，科大讯飞要拼大模型最稳定的正确率

02/11

CUDA护城河破了？AI暴力直出82%算子，开发彻底告别手搓时代

CUDA护城河破了？AI暴力直出82%算子，开发彻底告别手搓时代

02/06

揪出“AI人脸”更简单，新研究称只需约5分钟针对训练即可

揪出“AI人脸”更简单，新研究称只需约5分钟针对训练即可

12/26

首个虚拟数字人中国标准发布！需精准判断用户喜悦、悲伤情绪

首个虚拟数字人中国标准发布！需精准判断用户喜悦、悲伤情绪

12/18

DeepSeek推出DeepSeekMath-V2模型，主打自验证数学推理能力

DeepSeek推出DeepSeekMath-V2模型，主打自验证数学推理能力

11/28

不用跟AI客气了！新研究：语气越粗鲁回答正确率越高

10/15

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

在Video-TT出现之前，视频理解领域已有相应的评测标准，但这些标准普遍存在一定局限性，导致AI的真实能力无法被准确衡量。在这种情况下，一些顶尖模型的表现接近甚至达到了人类水平（上图左侧），这容易给人一种…

08/01

Mistral 推出 Voxtral 语音理解模型：以开源提供出色正确率表现

07/16

全部热门

中国支付的全球水路，谁来打通？
06/25 00:17
华峰化学关联并购迷雾：“高盈利+高负债”模式
06/25 00:17
京东与魔法原子达成战略合作目标销售额10亿元
06/25 00:17
意法半导体推出全球首款后量子密码移动安全芯
06/25 00:17
ChatGPT语音模式被曝本周大升级！被打断也能自
06/25 00:17
三星Galaxy Z Flip8国行版回归高通平台：自研
06/25 00:16
ISC2026发布IO500最新榜单中科曙光存储系统登
06/25 00:16
周鸿祎不再做“安全龙虾”了，要做中国版Mytho
06/25 00:16
五部门联合启动工业5G独立专网试点
06/25 00:15
商汤科技贾安亚：AI行业正从“能用”走向“好
06/25 00:15