谷歌DeepMind团队近日正式推出了全新的AI框架“AlphaProof Nexus”。该系统凭借强大的人工智能推理与形式化验证能力,在数学研究领域取得了里程碑式的突破,成功解开了两道已悬而未决长达 56 年的Erdős(埃尔德什)数学难题。
独创四级智能体架构协同破局AlphaProof Nexus在架构设计上极具创新,由 4 个复杂度递增的AI智能体组合而成。系统从最基础的Gemini模型与Lean编译器循环交互开始,逐步引入代码补全片段机制和类似AlphaEvolve的进化机制,最终通过功能最完整的智能体实现多个证明草稿的共享、评分与排序。
在针对 353 个开放的Erdős问题进行的自主测试中,该系统不仅成功解决了 9 个问题,还顺带证明了整数序列在线百科全书中的 44 个开放猜想。令人惊叹的是,AlphaProof Nexus完成单个复杂问题的推理成本仅仅需要数百美元。
编译器反馈锚定推动AI进化除了在组合数学、数论等领域斩获颇丰,该系统还成功解决了一个存在 15 年的Hilbert函数问题,并显著改进了凸优化中的已知界限。研究团队在分析实验数据时发现,即使是最简单的基础智能体,在强大的Lean编译器反馈“锚定”作用下,也能成功攻克部分难题。
这一发现表明,底层模型能力的持续提升与严格的代码形式化验证相结合,正在为AI注入逻辑严密的数学直觉。谷歌此次的技术飞跃,不仅标志着AI驱动的科学发现迈向新高度,也预示着人类正迎来与AI深度协作攻克科学禁区的新时代。





京公网安备 11011402013531号