留给人类数学家的悬赏不多了!谷歌DeepMind一口气解决9道埃尔德什问题

数百美元成本攻克56年未解悬案

谷歌DeepMind最新发布的数学智能体AlphaProof Nexus,一口气拿下了9道埃尔德什(Erdős)开放问题。这些难题中,最古老的已悬赏超过56年无人能解。系统挑战了353道开放问题,成功解开9道,成功率恰好契合了此前陶哲轩预言的1-2%。更令人惊叹的是,每道题的解题成本只有几百美元,完全由AI自主完成,无人为干预。

谷歌DeepMind的AlphaProof Nexus:一个复杂的解题框架

这套系统的核心架构十分巧妙:Gemini 3.1 Pro负责生成Lean语言证明步骤,随后交由Lean编译器逐行检查,一旦发现报错,立即反馈给模型进行修改,如此循环直至通过。开发者设计了从简单到复杂的多个代理(Agent)模式:

  • Agent A:最简单的模式,同时启动多个独立子Agent,依靠大模型梳理解题思路,编写代码并接受编译器检验。
  • Agent B:当Agent A在某个小步骤上反复卡住时,Agent B能调用AlphaProof进行强化学习驱动的树搜索,专门攻克局部难点。
  • Agent D:全功能完全体,集成了进化筛选思路、专项工具攻克难点和大模型逻辑推理,是此次批量破解难题的主力。

留给人类数学家的悬赏不多了!谷歌DeepMind一口气解决9道埃尔德什问题

“埃尔德什宇宙攻击”与惊人的AI发现

AI解决的这9道问题涵盖多个领域,其中包括一道关于“埃尔德什宇宙攻击”的难题。题目设定了一个无限集合,它不像无限点阵那样整齐排列,但在任何有限区域内都找不到三个点构成的漂亮直线。当试图把这个无限集合拆分成有限个“绝对没有任何三点共线”的子集时,过去认为几乎是不可能的。AI利用构造归纳性稀疏化论证,通过不断找到两个几乎对齐的尺度,让密度以0.99的比率一步步衰减直到归零,成功破解了这一难题。

更多领域突破:从OEIS到代数几何

除了上述三道难题,AlphaProof Nexus在其他领域也取得了显著突破:

  • 整除集构造、范德瓦尔登数间隙、西顿集孤立点、集合拆分密度等领域,解决了另外六道埃尔德什问题。
  • 在OEIS整数序列百科中,证明了44个开放猜想。
  • 在代数几何领域,解决了一道关于希尔伯特函数对数凹性的15年悬案。
  • 在凸优化方面,改进了锚定梯度下降法的理论边界。

未来方向:简单循环或成为主流?

这次的实验结果揭示了令人意外的趋势:在没有进化算法、没有AlphaProof的情况下,仅靠大语言模型循环加编译器反馈的Agent A模式,尽管在复杂问题上成本更高,但其表现并未被完全碾压。这或许预示着,未来随着大模型能力持续升级,复杂的多工具组合系统可能不再是刚需。仅用“大模型+专业校验工具”这套简单循环,就能搞定大多数数学难题。