菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题
背景:埃尔德什问题与AI的尴尬开局
2025年10月,OpenAI研究员Mark Sellke高调宣称GPT-5破解了10个埃尔德什开放问题,引发轰动。但谷歌DeepMind CEO Demis Hassabis简短评论“太尴尬了”,揭穿真相:GPT-5仅通过网络搜索找到了早已存在的论文,并非独立求解。这次乌龙事件让数学界对AI能力产生质疑,甚至有教授断言“现阶段AI无法独立攻克有真实学术背景的数学难题”。然而,短短几个月后,多个团队便用行动推翻了这一论断。
埃尔德什问题是传奇数学家保罗·埃尔德什以独特魅力和悬赏机制建立的开放性数学难题宝库,涵盖加性组合、解析数论、极值图论等领域。截至2026年,官方网站已收录超1200个问题,约44%被解决,但仍有大量难题等待突破。
详情:内部模型“摸着新路”震惊高尔斯
真正的转折来自OpenAI的非数学模型——一个未公开命名的内部系统。该模型在处理埃尔德什经典问题时,完全脱离搜索依赖,自主推导出全新解题思路。菲尔兹奖得主蒂莫西·高尔斯(Timothy Gowers)对此评价道:“这算是实打实头一回,AI自主啃下这种未解数学难题。”他亲自将几道加法数论公开难题抛给AI,不到两小时,小GPT(内部模型)便独立完成了解答。
具体突破包括:
- #1196问题:被多位数学家称为“AI第一个非平凡的数学成果”。该模型为埃尔德什悬赏1000美元的难题给出了独创性证明,方法可推广至其他问题,相关论文已提交arXiv。
- 批量解决:Boris Alexeev、Mehtaab Sawhney等人使用同一内部模型一次性解决5个埃尔德什问题,包括#1091(图论反例)、#728(加性组合)等,部分证明经Lean语言验证。
- 技能传承:21岁的剑桥本科生Kevin Barreto与伙伴Liam Price借助GPT-5.2 Pro解决#728,其AI生成的证明方法与2014年数学家Carl Pomerance的论文思路高度吻合,但确是首次将技术应用于该问题。
影响:普通人用AI攻克数学猜想的时代来了
这次突破的深远影响远超单一问题解决。其方法论公开后,门槛骤降:
- 操作流程:选用最前沿AI(如月费200美元的GPT系列),强制禁止搜索模式,引导模型“思考而非检索”;通过多实例分工进行头脑风暴、交叉审查证明;鼓励模型诚实承认“未能证明引理”以防幻觉。
- 平民化成果:17岁美国高中生Enrique Barschkis将开放问题丢给GPT-5.5,外出散步80分钟后归来,AI已给出完整LaTeX证明,经Lean校验通过。从5月1日到2日,24小时内5个埃尔德什问题的状态从“开放”转为“已解决”。
- 学术生态剧变:网站管理员Thomas Bloom抱怨AI提交的答案(包括大量无意义内容)已让网站濒临瘫痪,同时呼吁“AI头条是次要的,背后优美的数学才是主角”。菲尔兹奖得主杰曼诺夫等学者开始关注如何利用AI辅助代数学研究。
OpenAI高管Kevin Weil称:“由AI驱动的科学加速时代正式开启了。”虽然仍有人质疑AI的“独创性”与“理解能力”,但正如数学家们所见——当AI能独立完成80年未解难题,并让高中生在没有专业训练的情况下做出数学贡献,这场变革已不可逆转。