![]()
2026 年 5 月,在一年一度的 Google I/O 开发者大会接近尾声时,Google DeepMind CEO 德米斯·哈萨比斯(Demis Hassabis)登台发言。
在演讲的后半段,他将话题从 Gemini、Agent 等消费级 AI 产品转向 AI 科学研究:他展示了 WeatherNext 天气预测模型,并用一段视频说明了该模型在去年飓风梅利莎(Hurricane Melissa)灾难性登陆牙买加之前如何发出预警,表明 AI 在气象预报中的潜力;随后他又回顾了 Google 近年来在生命科学、地球科学等领域的进展。
接着,他说出这样一句话:“当未来回望这个时代,我们会意识到,自己正站在奇点的山脚下(the foothills of the singularity)。”
这句话很快成了 I/O 之后被科技圈传播最广的引言。在随后与 Axios 创始人迈克·艾伦(Mike Allen)的对话中,哈萨比斯进一步阐述了自己的观点。他说所谓奇点,是 AGI(通用人工智能)到来之后所开启的那个时代。“它将是有史以来最重要的发明,以至于很难对那个临界点之后做出任何预测,因为一切都会改变太多”。他给出的时间表是 2030 年前后,上下浮动一年。
![]()
图 | 迈克·艾伦(左)与德米斯·哈萨比斯(右)对谈(Yout)
类似关于“技术奇点”的预测和讨论,在科技圈早已不算新鲜事。从最早雷·库兹韦尔(Ray Kurzweil)对 2045 年奇点的预言,到近几年 AI 公司创始人频繁谈论 AGI,人们早已习惯了这种带有未来主义色彩的宏大宣言。因此,真正值得关注的,不是哈萨比斯再次提到了“奇点”,而是他说话时的语境。
当时他不是在介绍 Gemini 模型的新版本,不是在讨论搜索或广告业务的 AI 化,而是在科学 AI 的板块里。也就是说,Google 眼中的奇点,从来就不是更好的聊天机器人,而是 AI 最终能像科学家一样思考和发现。
一条走了十年的路
2010 年,当哈萨比斯联合创立 DeepMind 时,他写下的使命宣言只有两步:第一步,造出通用人工智能;第二步,用它解决其他一切。“那时候我想的主要就是科学和医学,”他在 I/O 的对话中回忆道,“增进我们对周围世界运转方式的理解,这一直是我的热情所在。”
早期的实践是 AlphaGo。2016 年 3 月,这套围棋 AI 系统在首尔击败了李世石,那场比赛的十周年刚刚过去不久。围棋其实不是科学问题,但 AlphaGo 验证了一条技术路径:深度强化学习可以在极其复杂的搜索空间中发现人类专家未曾想到的策略。它是一个概念验证(proof of concept),证明 AI 不只是模式识别的工具,而可能具备某种接近“洞察”的能力。
然后是更令人惊艳的 AlphaFold。2018 年 DeepMind 首次参加 CASP(Critical Assessment of protein Structure Prediction,蛋白质结构预测关键评估)竞赛就拿了第一,2020 年 AlphaFold 2 基本宣告攻克了蛋白质折叠这个困扰结构生物学界 50 年的难题。2022 年,团队一口气预测了地球上几乎所有已知蛋白质的结构——超过 2 亿个,并将数据库免费向全球研究者开放。
哈萨比斯在 I/O 对话中回忆了那个时期:他意识到 AlphaFold 既准确又快速,几秒钟就能折叠一个蛋白质,而已知蛋白质总共只有两亿多个,算一算投入足够算力一年之内就能全部完成。“没有必要搞一个服务器让人排队提交序列,”他说,“我们还是想直接把所有结果开放出来,让全世界的研究者像使用搜索引擎一样使用它。”
2024 年 10 月,哈萨比斯和同事约翰·杰柏(John Jumper)因 AlphaFold 获得了诺贝尔化学奖。这是 AI 研究者第一次获得科学类诺贝尔化学奖,某种意义上也是“AI for Science”这条路线的巅峰时刻。Google 似乎证明了:造一个足够强大的专用 AI 工具,对准一个足够重要的科学问题,就能产生诺奖级的突破。
![]()
图 | 哈萨比斯和约翰·杰柏(Google DeepMind)
从“工具”到科学“合作者”
但拿奖之后,故事开始有了一些转折。
如果说过去十年 Google 做的是“AI for Science”,为具体科学问题打造专用 AI 工具。那么现在,它开始把野心推向一个不同的方向:“AI Scientist”(AI 科学家),甚至“AI Co-Scientist”(AI 协研者)。区别在哪里?前者是锤子,你可以拿它去敲不同的钉子;后者则更像一个研究伙伴,它会主动寻找钉子,判断该使用什么工具,设计实验验证自己的想法,甚至与人类研究者协作推进整个项目。
这就不得不提到今年 I/O 上发布的一个整合性品牌:Gemini for Science。它把 Google 此前开发的几个基于 LLM 的科学智能体系统归拢到一起,包括能自主生成和评估科学假说的 AI Co-Scientist,以及用于算法优化的 AlphaEvolve。Google Cloud 首席科学家普什米特·科利(Pushmeet Kohli)在学术期刊《Daedalus》的 AI 与科学专刊上写道:“我们正在走向一种 AI,它不只是辅助科学,而是开始做科学。”
![]()
(Google Blog)
这个表述与哈萨比斯自己的说法形成了有趣的呼应。他在同一期刊的访谈中说:“在未来十年左右,我们应该把 AI 当作一种帮助科学家的强大工具;再往后就很难说了,也许这些系统会变得更像合作者。”从“工具”到“合作者”,这中间的距离可不是渐进式升级,而是一种跳跃。
如何跨越鸿沟?
那么,从“工具”到“合作者”,中间到底靠什么跨过去?
哈萨比斯在 I/O 后的对话里给出了答案。首先他提到,接下来所有前沿实验室都在盯着一件事:self-improvement,自我改进,即在可验证环境中的递归式学习。
哈萨比斯指出,在 Google 的语境里,自我改进有着清晰的落脚点:代码与数学。这两个领域之所以特殊,是因为它们的输出结果具有客观的可验证性。一段代码能不能跑通,一个数学推导是否成立,都有着清晰的标准。更重要的是,系统可以在这两个领域内生成海量的合成数据,通过验证反馈来提升模型自身的逻辑能力。哈萨比斯将这种机制称为“复利式飞轮”(compounding flywheel)。
这也就解释了,为什么 AI 的编程能力在 Google 内部被提到了前所未有的高度。在消费级软件市场,写代码的 AI 只是程序员的提效工具;但在科学 AI 的叙事中,编程能力是智能体真正介入科学研究流程的“手”。如果一个科学智能体不会写代码,它就无法自己搭建模拟环境,无法处理庞杂的实验数据,更无法复现长链条的实验流程。
哈萨比斯在采访中举了一个日常的例子:他现在经常利用深夜的一两个小时,用 Google 内部的 AI 编码系统快速做出一些小游戏原型,而这种工作量在过去可能需要耗费一个工程师半年的时间。
这个例子看似平常,但它说明了一个关乎科学验证周期的重要变化:当 AI 能够将想法快速转译成可运行的程序时,很多原本停留在理论阶段的科学假说,就能更快地进入验证阶段。
而且根据近期的公开报道,因 AlphaFold 斩获诺奖的研究员约翰·杰柏,目前已在 Google 内部调转方向,开始重点攻坚 AI 编程相关的工作,而非继续开发下一个垂直生命科学工具。将顶尖的科学 AI 领军人物调去解决代码大模型的问题,这一人事动向已经能够说明一些问题。
此外,科学研究从来不是在数据库里寻找答案,而是不断将未知问题转化为实验设计,再将实验结果转化为数据,并据此修正理论的过程。因此,Google 押注 AI 科学家,本质上是在打造一个能够完成“提出假说—设计验证—分析结果—修正假说”完整科研闭环的系统。
这也引出了哈萨比斯反复强调的关键能力:可靠性(reliability)与消除“锯齿状智能”(jagged intelligence)。
哈萨比斯认为,越接近 AGI,系统越不应在能力上出现明显断层。例如能够完成复杂推理,却会在稍微变化表述的简单问题上出错。一个真正的科学助手,不仅要在演示案例中表现出色,更要能在跨学科问题、复杂边界条件和长期任务中保持稳定。对于科研 AI 而言,工具调用、指令跟随和安全监控等基础能力,决定了它究竟是实验室里的展示品,还是现实科研中的生产力工具。
除了可靠性,哈萨比斯还强调了持续学习(continual learning)。
目前的大语言模型在训练完成后,其核心参数基本固定。它们可以检索外部信息,也能在上下文中临时吸收知识,但不会像人类一样在长期实践中持续更新认知。哈萨比斯认为,真正强大的系统必须具备部署后继续学习的能力。
这对科学探索尤为重要。科学家的价值不仅在于掌握知识,更在于能够被新证据改变。实验失败意味着推翻旧假说,异常数据可能促使理论修正。一个不会持续进化的 AI,本质上仍是高效检索工具;只有能够吸收新实验结果、消化负面反馈并调整研究策略的系统,才更接近真正的科研合作者。
为了给 AI 提供更大的试错空间,Google 也在持续投入仿真与世界模型(simulation and world models)。
哈萨比斯提到,AI 与仿真天然互补。一方面,AI 可以通过数据学习复杂系统的运行规律,例如 WeatherNext 利用海量数据预测天气变化;另一方面,逼真的仿真环境又能为 AI 提供安全、低成本的测试场。Google 已经利用 Genie 等交互式世界模型,模拟自动驾驶在极端场景下的表现。
![]()
图 | Genie 生成画面(Google DeepMind)
这一思路同样适用于科学研究。许多实验成本高昂、周期漫长。如果 AI 能够先在接近真实物理规律的仿真环境中筛选大量低价值假说,再将少数有潜力的方向交给真实实验验证,科学发现的效率将大幅提升。
当我们将这些技术线索拼凑在一起时,就能理解 Google CEO 桑达尔·皮查伊(Sundar Pichai)在近期接受 The Verge 专访时所传达的信息。
皮查伊坦言,近年来他意识到 Google 必须调整组织阵型以应对技术演进。他主导了 Google Brain 与 DeepMind 的合并,设立了集中的 AI 基础设施团队。更关键的是,皮查伊明确表示,Google 正在经历一场从“AI 优先”(AI-first)到“智能体优先”(Agent-first)的转变。
在这个大背景下,Gemini for Science 的发布就不仅仅是一款新产品上线那么简单。它更像是 Google 试图将固有的科学研究流程重新拆解,逐步移交给智能体系统:先从可验证性高的代码和算法优化切入;随后深入到假说生成和实验路径设计;最后,再去挑战现实世界中更复杂的未知科学难题。
就在今年 I/O 大会同期,同行业的竞争对手 OpenAI 也对外透露,其通用推理模型在未经过特定数学训练的情况下,推翻了由保罗·埃尔德什(Paul Erdős)于 1946 年提出的单位距离猜想。这也向整个科技界印证了一个趋势:通用模型在基础科学发现中正展现出越来越大的潜力。传统的、为每个单一学科定制独立 AI 工具的路径,正在受到具备通用推理能力的智能体路线的冲击。
理解了这些后,再回看哈萨比斯那句“我们正站在奇点的山脚下”,听起来反倒务实了一些。它指向的是一种可能性:如果 AI 能够深度参与科学发现,那么科技进步的方式将发生根本变化。科学探索不再完全依赖一代代人类研究者的接力,人类可以和 AI 同行,AI 也可能成为独立推动知识增长的新引擎。
1.https://www.youtube.com/watch?v=dgBLVm2L1P4&t=165s
2.https://www.theverge.com/podcast/936445/sundar-pichai-ai-search-google-zero-youtube-
3.https://www.theverge.com/tech/934260/google-io-ai-singularity-demis-hassabis
4.https://www.technologyreview.com/2026/05/22/1137813/google-i-o-showed-how-the-path-for-ai-science-is-shifting/
运营/排版:何晨龙
注:封面/首图由 AI 辅助生成





京公网安备 11011402013531号