此外,专门做大模型基准测试与对比分析的第三方评测机构也发布了相关测试结果,大赞Gemini 3.1 Pro在构成ArtificialAnalysis Intelligence Index的10项评测中领先…
上周,谷歌发布了 Gemini 3 Deep Think 的一次重大更新,以应对当今科学、研究和工程领域的复杂挑战。 谷歌表示,今天推出的Gemini 3.1 Pro 是一个预览版,之后将在自主工作流等领…
擅长处理“超级复杂的任务”
Gemini 3 DeepThink的实力不止于此,它还直接把ARC-AGI-2——这个公认测试AI推理能力的前沿基准,给刷到了史无前例的84.6% 不使用任何工具,在HLE中取得新SOTA——48.4%…
但你没有看错,姚顺宇的确没有任何计算机背景,他本身是一位理论物理学家,他的博士研究方向是量子引力和量子信息扰乱。 我个人认为,姚顺宇在Anthropic积累的强化学习经验,以及他作为物理学家对复杂系统的理解…
清华物理天才,在AI全开挂了。
从数据来看,这一模型在多项基准测试中创下新纪录,超越了头部独角兽旗下的ClaudeOpus4.6和GPT-5.2,也超越了自家的Gemini3ProPreview。谷歌提到,在2025年国际物理和化学奥林匹…
04/01 16:41
10/31 16:58
10/31 16:56