近期在财报媒体交流会上,腾讯总裁刘炽平提到,在大模型方面,过去几个月腾讯密集进行了整个团队的升级和工作流程的重构,重构目的主要是让团队更健壮、组织方式更合理,同时还重新建立了整个预训练和强化学习的基础设施,…
腾讯混元HY 3.0大模型内部测试中 预计四月发布
两家公司,两种路径,一个时间点。
下一个阶段的大模型,究竟该怎样真正走进生产环境
一个关于“实验室理想”与“AI帝国”的故事。
林俊旸卸任阿里千问核心负责人职务 AI顶尖人才争夺战已白热化
腾讯打响AI入口保卫战。
让听得见炮火的人决策
论文通过消融实验验证了这一设计的有效性:在不提供上下文的情况下,即使是最强的 GPT-5.1 模型也只能解决不到 1% 的任务,充分证明了任务对上下文的依赖性。AI说这个虚构国家的宪法第3条规定了什么,得和…
这个基准的核心设计理念,是挑选那些在模型的预训练数据中不存在的难题,让每个任务都必须要求模型从提供的上下文中学习全新的知识才能解决。 论文通过消融实验验证了这一设计的有效性:在不提供上下文的情况下,即使是最…
在这篇论文里,腾讯混元和复旦大学联合研究团队提到,要让大模型学会“从上下文中学习”,远比我们想象的要难。官方技术博客还提到,如果模型的上下文学习能力能像之前其他能力那样被提升上去,人类在AI 系统中的角色将…
这揭示了当前模型的训练范式和在真实场景中应用之间是不匹配的:我们优化出的模型擅长对自己「已知」的事物进行推理,但用户需要的,却是让模型解决那些依赖于杂乱、动态变化的上下文的任务。在许多情况下,模型只会利用预…
05/29 10:26
04/01 16:41
10/31 16:58