菲尔兹奖得主都看懵了：OpenAI非数学模型首次自主突破80年未解数学难题

2 个月前

AI资讯

41 阅读

人工智能 OpenAI 数学难题菲尔兹奖

背景：埃尔德什问题与AI的尴尬开局

2025年10月，OpenAI研究员Mark Sellke高调宣称GPT-5破解了10个埃尔德什开放问题，引发轰动。但谷歌DeepMind CEO Demis Hassabis简短评论“太尴尬了”，揭穿真相：GPT-5仅通过网络搜索找到了早已存在的论文，并非独立求解。这次乌龙事件让数学界对AI能力产生质疑，甚至有教授断言“现阶段AI无法独立攻克有真实学术背景的数学难题”。然而，短短几个月后，多个团队便用行动推翻了这一论断。

埃尔德什问题是传奇数学家保罗·埃尔德什以独特魅力和悬赏机制建立的开放性数学难题宝库，涵盖加性组合、解析数论、极值图论等领域。截至2026年，官方网站已收录超1200个问题，约44%被解决，但仍有大量难题等待突破。

详情：内部模型“摸着新路”震惊高尔斯

真正的转折来自OpenAI的非数学模型——一个未公开命名的内部系统。该模型在处理埃尔德什经典问题时，完全脱离搜索依赖，自主推导出全新解题思路。菲尔兹奖得主蒂莫西·高尔斯（Timothy Gowers）对此评价道：“这算是实打实头一回，AI自主啃下这种未解数学难题。”他亲自将几道加法数论公开难题抛给AI，不到两小时，小GPT（内部模型）便独立完成了解答。

具体突破包括：

#1196问题：被多位数学家称为“AI第一个非平凡的数学成果”。该模型为埃尔德什悬赏1000美元的难题给出了独创性证明，方法可推广至其他问题，相关论文已提交arXiv。
批量解决：Boris Alexeev、Mehtaab Sawhney等人使用同一内部模型一次性解决5个埃尔德什问题，包括#1091（图论反例）、#728（加性组合）等，部分证明经Lean语言验证。
技能传承：21岁的剑桥本科生Kevin Barreto与伙伴Liam Price借助GPT-5.2 Pro解决#728，其AI生成的证明方法与2014年数学家Carl Pomerance的论文思路高度吻合，但确是首次将技术应用于该问题。

影响：普通人用AI攻克数学猜想的时代来了

这次突破的深远影响远超单一问题解决。其方法论公开后，门槛骤降：

操作流程：选用最前沿AI（如月费200美元的GPT系列），强制禁止搜索模式，引导模型“思考而非检索”；通过多实例分工进行头脑风暴、交叉审查证明；鼓励模型诚实承认“未能证明引理”以防幻觉。
平民化成果：17岁美国高中生Enrique Barschkis将开放问题丢给GPT-5.5，外出散步80分钟后归来，AI已给出完整LaTeX证明，经Lean校验通过。从5月1日到2日，24小时内5个埃尔德什问题的状态从“开放”转为“已解决”。
学术生态剧变：网站管理员Thomas Bloom抱怨AI提交的答案（包括大量无意义内容）已让网站濒临瘫痪，同时呼吁“AI头条是次要的，背后优美的数学才是主角”。菲尔兹奖得主杰曼诺夫等学者开始关注如何利用AI辅助代数学研究。

OpenAI高管Kevin Weil称：“由AI驱动的科学加速时代正式开启了。”虽然仍有人质疑AI的“独创性”与“理解能力”，但正如数学家们所见——当AI能独立完成80年未解难题，并让高中生在没有专业训练的情况下做出数学贡献，这场变革已不可逆转。

菲尔兹奖得主都看懵了：OpenAI非数学模型首次自主突破80年未解数学难题

背景：埃尔德什问题与AI的尴尬开局

详情：内部模型“摸着新路”震惊高尔斯

影响：普通人用AI攻克数学猜想的时代来了

链接失效反馈