快科技2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。 也就是说即使是如今最强的语言模型,在上下…
论文特别提到,在不提供任何上下文的情况下,GPT-5.1(High)仅能解决不到1%的任务,有力证明了模型若不从上下文中学习几乎完全无法解决这些任务。 团队在CL-bench上评估了十个最先进的语言模型,…
再顶级的AI也只会背字典,不会写文章
英伟达新论文让AI学会先盖房、再装修。
这揭示了当前模型的训练范式和在真实场景中应用之间是不匹配的:我们优化出的模型擅长对自己「已知」的事物进行推理,但用户需要的,却是让模型解决那些依赖于杂乱、动态变化的上下文的任务。在许多情况下,模型只会利用预…
华为新一代鸿蒙电脑发布:70Wh电池,21小时续航
捅破Moltbook泡沫:150万个复读机,做一场“硅基文明”的幻梦
“太空挖矿”过于科幻?中国动真格了
商汤开源多模态自主推理模型SenseNova-MARS,支持调用多种工具
DeepSeek正招兵买马,布局AI搜索与智能体领域
这场竞赛的结果,也将在很大程度上决定AI行业未来的格局
05/29 10:26
04/01 16:41
10/31 16:58