人类56年解不出,谷歌AI一夜连破9道世纪难题

55 分钟前
1 阅读

56年无人能解的Erdős难题被AI一夜攻破

数学界长期悬而未决的9道Erdős开放难题,在谷歌DeepMind的最新AI面前彻底崩塌。这些难题由20世纪传奇数学家Paul Erdős提出,其中一道最老的已悬空56年,从1968年至今无人能解。然而,AlphaProof Nexus仅用一夜时间便完成了全部证明,每一条推理链条都得到了严格验证。这一突破不仅刷新了AI在高等数学领域的实力天花板,更让人类数学家惊呼“智力竞赛的规则已被改写”。

人类56年解不出,谷歌AI一夜连破9道世纪难题

AlphaProof Nexus:数学推理的AlphaGo时刻

这套名为AlphaProof Nexus的数学智能体,采用了深度强化学习与符号推理相结合的架构。与之前只会生成“看似合理”答案的大语言模型不同,它能自主构建证明树,并在每一步都进行逻辑回溯。其核心创新在于将数学问题转化为可被Lean编译器检查的代码,确保结论绝对可靠。这正如当年AlphaGo在围棋领域颠覆人类认知一样,AlphaProof Nexus在数学证明上创造了属于自己的“AlphaGo时刻”。

形式化验证消除幻觉,证明绝对可靠

传统AI数学工具的最大痛点在于“幻觉”——模型可能编造出看似严谨但实际错误的推理。谷歌团队这次彻底扫清了这一障碍:所有生成的证明都直接输送至Lean形式化验证工具,一旦出现逻辑漏洞或错误的定义调用,系统会立即拒绝并重新搜索路径。最终输出的9个证明,每一个都通过了Lean的严格检查,相当于给每道难题盖上了“永久有效”的印章。这意味着AI不再是“摸索”答案,而是真正“证明”了答案。

数学界震动:人机协作的新协作时代

消息传出后,全球数学论坛和社交媒体瞬间炸锅。有数学家感慨:“过去56年我们连第一步都找不到,AI却在一夜间走完了全程。”更深远的影响在于,AlphaProof Nexus不仅展示了AI解决极难问题的能力,还开创了“人类构思+AI验证”的全新工作流。未来数学家只需提出猜想,AI即可负责完成庞杂的证明——这种协作有望将数学发现的速度推向不可思议的高度。谷歌CEO皮查伊在回应争议时表示:“这并非替代人类,而是赋予人类一双看不见的数学之眼。”