
图/OpenAI
编者按:如果这篇论文是由人类撰写并提交给《数学年刊》,来向我征求意见,我会毫不犹豫地推荐接收。”菲尔兹奖得主蒂莫西·高尔斯(Timothy Gowers)评价一篇刚刚出现在预印本平台 arXiv 上的数学论文。
论文讨论的,是匈牙利数学家保罗·埃尔德什1946年提出的Erdős 平面单位距离猜想。几十年来,尽管始终无人能够给出完整证明,但大多数研究者都倾向于相信猜想成立。
然而,上述论文通过构造反例推翻了这个猜想。更关键的是,论文的核心思路并非来自人类,而是OpenAI未公开的一个模型。
这并不是AI第一次闯入数学前沿。过去一年间,AI 频繁出现在数学研究的新闻之中。就在2025年底,OpenAI还因夸大AI在数学上的进展而陷入争议,当时OpenAI宣称GPT-5已经解决多个“埃尔德什问题”。随后事实证明,那些所谓成果大多只是发现了已存在于文献中的解答。
进入2026年,多个埃尔德什问题陆续在AI帮助下获得解决,其中一些成果甚至得到了包括菲尔兹奖得主陶哲轩等多位顶尖数学家的确认与扩展。特别是四月底23岁的利亚姆·普赖斯(Liam Price)在没有任何正式数学训练的情况下,通过向AI提问获得了埃尔德什问题 #1196 的解答。
陶哲轩承认AI给出解答的独创性,他表示“关注过它的人类数学家,集体在第一步就走错了方向”。很快,他将GPT提出的证明精炼拓展,发布了一篇论文。
5月20日,OpenAI又宣称解决了平面单位距离猜想。这次他们请到了9位数学家来审核,这些数学家在随后撰写的文章中,对AI提出的解法给出了高度赞誉。
沃尔夫奖得主诺加·阿隆(Noga Alon)评价“这是一项杰出成就”。蒂莫西·高尔斯还不无忧虑地表示“我们或许已经进入一个人类在解决数学问题方面很难与AI竞争的时代”。
在单位距离猜想相关结果公布后,数学研究者马骁利用 GPT-5.5 Pro 成功复现了 OpenAI 构造的反例。
马骁现任密歇根大学数学系 Donald J. Lewis Research Assistant Professor,并将于今年入职中国科学技术大学任教授职位。他2018年中国科学技术大学本科毕业,2023年普林斯顿大学博士毕业,之后到密歇根大学从事博士后研究。其与邓煜、Zaher Hani 关于希尔伯特第六问题的合作研究,严格建立了从微观粒子运动到宏观流体方程的数学联系,被认为是希尔伯特第六问题狭义版本上的重要突破。
单位距离猜想的推翻结果意味着什么?AI会给数学研究带来什么?数学家们的护城河还能存在多久?围绕这些问题,《知识分子》专访了马骁。
编辑|张天祁
● ● ●
最近,OpenAI 的内部模型通过构造反例,解决了 Erdős 平面单位距离猜想。密歇根大学博士后、即将入职中国科学技术大学的数学研究者马骁,随后借助 GPT-5.5 Pro 成功复现了这一构造。这说明,类似能力已经不只存在于内部研究模型中,普通用户能够使用的模型也开始接近这一水平。
在外界看来,这似乎是 AI 在数学研究中的一次标志性突破。但马骁并不感到特别惊讶。几个月前,包括他在内的不少人就曾利用更早版本的 GPT 解决过若干公开问题。在他看来,那些工作中 AI 展现出的创造力并不比这次低,只是因为没有 Erdős 单位距离猜想这么有名,所以没有引起同样规模的关注。
“我很早就认为,它早晚有一天会出来这样一个新的成果。”
不过,马骁也认为,这次进展的新闻效应可能大于其实际数学尺度。它当然是一个漂亮而重要的成果,但从证明结构来看,它还不是那种需要几十页、上百页连续推进的现代数学大定理。更准确地说,它展示的是 AI 在“少跳、跨学科、高模式匹配”问题上的强大能力。
01
数学是多跳思考
马骁认为,数学研究本质上是一种多跳思考。
什么是“一跳”呢?研究者面对一个目标时,往往需要不断拆解出子目标,并一步步解决它们。每解决一个小目标,就相当于完成了一跳。一个证明可能只有几跳,也可能需要几十跳、上百跳。
完成每一跳,依赖的不只是逻辑推理,也依赖知识积累、对理论的熟悉程度,以及模式识别能力。很多时候,数学家之所以能想到某个方向,是因为他见过足够多相似结构,知道某个工具在这里可能有用。
从这个角度看,AI 在少跳问题上已经表现出很强能力。它接触过大量数学内容,熟悉许多不同领域的工具,因此在快速调用知识、识别结构、完成跨领域联想的问题上,有时会展现出惊人的表现。
02
这次为什么仍然是“少跳问题”
Erdős 单位距离问题问的是:平面上给定 (n) 个点,最多能出现多少对距离为 1 的点?
这个问题看起来属于离散几何或组合数学,但这次 AI 给出的反例构造,用到了很深的代数数论工具。
证明中确实有跨领域跳跃。粗略拆开,大约有六七跳:从“证明上界”转向“寻找反例”,再回到 Erdős 的格点构造;从平方格点联想到高斯整数;再从高斯整数推广到更一般的数域整数环;随后引入高维格点与平面投影,把数论构造转化为平面单位距离构造;最后再用分裂素数、类群和类域塔等工具控制参数。
这些转换对大多数研究者而言并不自然,因此长期没有被充分探索。
但如果把证明链条展开,会发现核心逻辑其实只有有限几跳,证明篇幅也只有几页。它的难点更多在于找到正确的跨学科连接,而不是完成一个上百页级别的长链条证明。
因此,在马骁看来,这次进展更接近顶级 IMO(国际数学奥赛)题目的跳跃方式与跳跃次数。这里的“IMO 级别”并不是说数学工具简单。恰恰相反,证明中用到了 CM 域、数域整数环、类群、分裂素数、类域塔等专业数论工具,远超高中竞赛范围。
但如果忽略知识门槛,只看思维结构,它像一道非常难的竞赛题:真正关键的是少数几个不容易想到的转化。一旦找到了正确视角,证明本身并不需要特别漫长的连续执行。很多人喜欢低估 IMO 题目的难度,其实顶级 IMO 题目在思维跳跃上已经不输于很多科研问题,只是问题本身的重要性不同。
这说明 AI 已经能在少跳问题上完成很强的跨学科创造,但还不能说明 AI 已经能够稳定完成长篇幅、强执行、强验证的数学研究。
03
人类数学家为什么没做出来?
马骁认为,人类数学家长期没有破解这个猜想,并不只是因为问题本身困难,也和数学家的工作方式有关。
组合数学家往往不会长期死磕某一个著名猜想。他们更常见的方式,是先发展自己的理论体系,等理论成熟之后,再去看哪些问题可以用这些理论解决。
因此,许多著名猜想对他们来说,更像是一种 benchmark:它们可以用来测试理论是否有力量,但未必是研究者一开始就全力攻克的目标。
另一个原因是,这次 AI 的解法用到了较深的代数数论知识。这个领域学习门槛很高,很少有组合数学家会专门投入大量时间学习这些方法,只为了尝试解决一个特定的组合问题。反过来,代数数论专家虽然也有人考虑过这个问题,但他们对组合数学和离散几何的了解又未必足够深入。
于是,这个问题长期处在两个领域之间的缝隙里。
而跨领域知识的调用与重组,恰恰是 AI 的长处。

此前已知的一种构造,由缩放后的正方形网格产生大量单位距离点对。图/OpenAI
04
AI 的优势是跨度,短板是执行
马骁过去也曾尝试用 AI 证明一些数学问题。
他举例说,在一个极小曲面中的微分几何问题上,AI 想到的是代数几何的解法;而在一些统计学问题上,AI 会从多复变的角度切入。
“它的思路跨度确实是非常大的,懂得特别多。”
但这不意味着 AI 已经能够超过数学家。
马骁认为:
“在目前这个阶段,如果是在数学家自己最擅长的方向上,AI 通常还很难真正超过他本人。”
原因在于,在数学家最熟悉的方向上,他往往已经知道应该怎么做。真正困难的不是想出一个方向,而是沿着这个方向正确执行大量步骤,把所有细节严谨地补完。
这正是当前 AI 的短板。
如果一个问题已经有相对明确的思路,只是需要在大量细节上不断尝试和推进,AI 的表现还不够稳定。尤其是在需要长时间规划、持续探索、反复验证的任务上,AI 目前仍然有限。
因此,在现阶段,AI 更像是一个能提出方案、提供灵感、帮助验证局部细节的工具,而不是能够独立完成完整研究计划的数学家。

图/OpenAI
05
复现不是自动完成的
从马骁复现这次成果的过程,也能看出让 AI 产出数学发现并不是一件轻松的事。
他发现,如果直接把问题交给模型,通常很难得到有效答案。因此,他采用了一种“计划与执行”(Plan and Execute)的模式。
具体来说,他先让 AI 列出几种可能的解决思路,再由自己进行筛选。由于每一步的分支数量有限,再加上他一开始就明确告诉 AI“这个命题是错的”,AI 给出的候选方向并不算太多。通过这种“人做决策,AI 提供方案”的方式,最终成功复现了破解猜想的方案。
但即使找到正确方向,AI 输出的内容也不能直接作为论文证明。
马骁表示,GPT 生成的证明经常会跳过关键细节,有时还会出现小错误,不符合论文标准。整理、补全和重写这些证明,本身就需要大量工作。AI 也经常生成错误结果,因此验证同样耗时。
他的办法是把验证工作放到全新的对话框里单独进行。
“新的对话框或者在已有对话框里专门要求验证的,一般都是对的,验证能力也很强,但是 AI 还不能完全自主地同时做到证明强和验证强。”
06
数学家还能安心多久
虽然马骁认为这次进展没有外界想象中那么大,但他也认为,不应该低估 AI 对数学未来的影响。
如果 AI 只能完成几页证明,那么它的能力仍然主要局限在少跳问题上。它可以提出跨学科想法,也可以解决一些短而巧的问题,但还无法替代数学家完成复杂的长链条研究。
但是,随着智能体领域的快速发展,情况一定会发生变化。
未来的 AI 会越来越像一个完整的研究系统:它能够规划目标,展开搜索,验证中间结论,发现错误后自我修正,并不断提高连续正确执行的次数。换句话说,AI 能稳定完成的数学证明长度,几乎必然会逐步提升。
如果 AI 能够稳定完成的长度从 10 页增长到 30 页,再从 30 页增长到 100 页,那么数学研究的格局将不只是发生局部变化,而是可能被彻底重塑。
一旦 AI 能够处理百页级别的证明,它的数学能力将远远超过任何单个数学家,甚至可能超过全体数学家能够同时覆盖的范围。那时,围棋的故事有可能复现——AI 像上帝一样,人类数学家和 AI 合作可能不如 AI 自己。
而这一天,按照目前智能体的发展速度来看,不一定会太久,最早可能是今年年底,也可能是明年。
马骁说,是时候来思考未来我们应该做什么了。
0
推荐


京公网安备 11010502034662号 