菲尔兹奖得主0贡献躺赢:GPT-5.5 Pro两小时搞定博士级数学,我直接一个焦虑的大动作

温故智新AIGC实验室

TL;DR:

菲尔兹奖得主亲测GPT-5.5 Pro,17分钟破解博士级数学难题,全程贡献为零。这位剑桥教授直接破防,给数学系拉响了红色警报:AI这波迭代,是冲着年轻人的饭碗来的。数学家陶哲轩则淡定得多,表示“真正的人类价值在于消化证明,而不是卷证明数量”。

事情是这样的

数学界最近炸了锅。

原因不是哪位大神证明了世纪难题,而是一个人们熟悉的“常客”——ChatGPT,带着它的5.5 Pro版本,把一位菲尔兹奖得主给整“瘫软”了。

这位数学家就是剑桥大学的 Timothy Gowers,加法组合论的顶级大佬。他搞到了ChatGPT 5.5 Pro的“尊贵内测”权限,像拿到新玩具一样,随手就把几个加法数论的公开丢给了AI。

他想看看这个“新玩具”到底什么水平。结局,完全超出了他的认知边界。1

17分钟,人类三周的活

Gowers丢给AI的问题,来自数学家Mel Nathanson的一篇论文。核心是:给定一个整数集合,已知元素数量和它们两两相加的和集大小,求这个集合的最小直径能是多少?

Nathanson自己只证出了一个指数级上界(2^k),并且猜测还能优化。这属于典型的“方向明确、难度适中”的博士生练手题。

然后,高能预警:

ChatGPT 5.5 Pro思考了17分钟零5秒。

它不仅给出了一个理论上最优的二次上界,还用了 Sidon集(一种让求和集最大化的特殊集合)和等差数列进行组合构造,思路比原作者更巧妙。

你可以理解为——大家都在用大块乐高搭房子,难免浪费空间(导致直径巨大)。而GPT直接掏出了一套精密的小颗粒积木(更高效的Sidon集),空间利用率直接拉满,把房子造得更紧凑了。

Gowers自己都承认:“Nathanson本人没想到这一步,ChatGPT想到了。”1

然后,整活开始了

Gowers看它挺能整,又追问了一个更难的升级版问题。AI再次搞定,随后用了47分钟,把两个结果写成了一篇格式标准的LaTeX预印本。

事情到这里已经有点离谱了,但Gowers决定再上难度。他问了更一般化的k重求和集问题,这属于连基本构造框架都不清楚的领域。

结果呢?

  • 第一轮:GPT思考16分41秒,把一个指数级上界改进到了亚指数级。
  • 第二轮:Gowers让他写成论文,花了47分39秒。
  • 第三轮:MIT学生Isaac Rajagopal(该问题的先驱研究者)审阅,认为论证严谨,思路巧妙,结论基本成立。
  • 随后几轮:GPT甚至自我迭代,提出了原创的“k-解离集合构造”,最终把上界从指数级直接干到了多项式级(N(h,k) ≤ O(k^{10h³}))。2

整个过程,Gowers的数学输入:

他做的唯一工作就是当“项目经理”:提出需求,确认方向,要求交付。数学本身,全是ChatGPT在做。

数学博士生,危?

这件事如果只是一个酷炫的Demo,那还好。但Gowers看到的,是逼近的危机。

最现实的问题是:AI搞出来的成果,论文算谁的?

  • arXiv已经明确拒绝AI生成内容。
  • 传统期刊也不会接受。
  • 这个成果目前只能挂在Gowers的博客上,靠一个链接存在着。

但比这更焦虑的,是数学培养体系的被动摇

过去,博士生练手的经典路径是:导师给一个难度适中的公开问题,你花几个月甚至几年去啃下来。这本身就是训练。但现在,ChatGPT 5.5 Pro两小时就解决了。

Gowers说:“如果AI的数学水平继续按目前速度发展,我们(数学研究者)很快会面临一场危机。1

入门门槛被瞬间抬高:以前你需要证明一个没人证过的东西,现在你需要证明一个AI也证不了的东西。

陶哲轩的“证明消化不良”

这时候,另一位菲尔兹奖得主 陶哲轩 站了出来,给出了不同角度的思考。

作为AI和数学交界线的“老玩家”,陶哲轩比较淡定。他提出了一个 “金字塔”模型

  • 证明生成:构造出一个完整证明(AI正在自动化)
  • 证明验证:确认证明正确(AI正在自动化)
  • 证明消化:真正理解和解释证明的意义(人类独有

前两个AI干得越来越溜,但第三个——消化——远远没有被解决。

陶哲轩称其为 “证明消化不良”(proof indigestion)。意思是,证明像不要钱一样被生成,但没人能真正消化它们。他打了个很绝的比方:

如果为了提高消化效率,把所有食物丢进搅拌机打成糊,用管子灌进胃里。技术上确实解决了问题,但没人想这么吃饭3

这就像数学学习中那些 “自然难度”——你必须自己咀嚼、摸索,才能真正理解并迸发灵感。如果AI把所有“嚼头”都优化掉了,你也就失去了学习的意义。

人类的“烟火气”

两位菲尔兹奖得主,给了我们两套方案:

Gowers 看到了危机和路径——数学研究者需要从追求“个人冠名定理”转向“与AI协作”,沉淀可迁移的底层思维能力。

陶哲轩 则划出了边界——AI能生成和验证,但“消化”这件事,触及智能本身,我们必须守住。

AI正在把我们逼到墙角,反复追问:到底什么才是独属于人类的、最珍贵的东西?

在数学领域,可能是那些必须自己“嚼”才能理解的艰难证明。在其他领域,可能是那些无法被流程化和量化的“烟火气”。

不要沦为黑客帝国里,被插着管子的生物电池。

这或许,是AI时代给我们每个人留下的,最诚实的作业。

引用


  1. 菲尔兹奖得主亲测:ChatGPT 17分钟解决了博士级数学难题,我们该怎么办?·Timothy Gowers博客(2026/5/11)·检索日期2026/5/11 ↩︎ ↩︎ ↩︎

  2. 菲尔兹奖得主0贡献!GPT-5.5 Pro两小时跑出博士级证明)·新浪财经(2026/5/11)·检索日期2026/5/11 ↩︎

  3. 陶哲轩关于证明消化问题的讨论(2026/5/11)·检索日期2026/5/11 ↩︎