GPT-5「解决」数学难题？OpenAI这次是“检索的王”，还是“凡尔赛”翻车？

TL;DR：

OpenAI 研究员喜滋滋宣布 GPT-5 解决了 10 个数学悬赏难题，结果被数学家和谷歌大佬Demis Hassabis 当场「揭穿」，原来 GPT-5 只是个「超级文献检索员」！Meta大佬LeCun更是直接上嘴炮，这场 AI 圈的「凡尔赛文学」翻车现场，简直是大型连续剧！

周末的AI圈，那叫一个热闹！原本以为是GPT-5横空出世，直接把数学界的「悬案」给破了，结果，剧情来了个360度大反转，一众AI界顶流大佬在线“吃瓜”，甚至亲自下场“点评”，好好的科技新闻瞬间变成了年度大戏。究竟是AI太神还是“人设”崩塌？咱们今天就来深度扒一扒。

突发！GPT-5“怒刷”10道数学难题，AI届沸腾了？

故事得从几条火爆X（前Twitter）的推文说起。

10月12日，OpenAI的Sebastien Bubeck先是预告了一下，说GPT-5在文献搜索方面简直是**“超凡脱俗”，连Erdős问题339这种深藏不露的答案都能“挖”出来，而且官方数据库都没来得及更新状态。嗯，这操作听起来就有点“降维打击”**的意思。

几天后，更劲爆的来了！OpenAI研究员Mark Sellke和他的搭档，晒出了一张成绩单：他们用GPT-5模型**“地毯式搜索”了erdosproblems.com网站上的“未解决”问题，通过数千次查询，声称“发现了”10个问题的解决方案！甚至在另外11个问题上也有了“部分进展”。OpenAI首席产品官Kevin Weil立马转发，副总裁Sebastien Bubeck更是“盖章认证”：“AI加速科学已正式开始！” 甚至还顺手官宣Mark Sellke加入OpenAI，这波操作，简直是“名利双收”**的节奏啊！

一时间，媒体和吃瓜群众都沸腾了：哇塞，GPT-5这么牛，直接把困扰人类数学家几十年的难题给秒了？这是要直奔AGI（通用人工智能）的节奏吗？！

“这很尴尬”！谷歌大佬Demis Hassabis在线“打脸”

然而，AI圈的瓜，总是反转来得比剧本还快。

就在OpenAI的“凡尔赛”达到顶峰时，谷歌DeepMind的CEO，也是图灵奖得主Demis Hassabis，突然在Sebastien Bubeck那条“AI加速科学”的推文下，轻描淡写地留下了四个字：“这很尴尬。” ¹

划重点： 谷歌CEO亲自下场，还用了“尴尬”这种词，这事儿不简单！

Hassabis随后引导大家去看看这个数学难题网站的维护者——数学家Thomas Bloom的澄清。Bloom教授表示，OpenAI的表述简直是**“戏剧性的误解”。他把这些问题标记为“未解决”，仅仅是因为他个人不知道**相关解答已经发表，不代表数学界没人解决！

这就好比你家冰箱里的可乐被你爸喝了，你不知道，结果你告诉全世界你发明了“喝可乐的新方法”一样……不对，是冰箱里明明有可乐，你以为没有，结果AI帮你**“找到了”**可乐的存在！

真相大白： GPT-5不是数学家，它只是一个效率奇高、堪称“文献搜索界卷王”的学术搜索引擎。它并没有独立思考、推理出新的数学解法，只是像个“图书馆管理员”一样，帮你从浩如烟海的文献中，捞出了那些人类早已解决但信息还没同步的问题。

眼看“人设”要崩，OpenAI的几位当事人赶紧出来“擦屁股”。Sebastien Bubeck删帖道歉，说“我无意误导任何人，认为表述很清楚，对不起”。 Kevin Weil也承认“我实际上误解了我们的结果（尴尬）”。Mark Sellke的更新也跟着被删。这波操作，简直是**“互联网记忆清零大法”**，但可惜，互联网是有记忆的！

Meta“嘴炮王”LeCun辛辣点评：“被自己的GPTards给坑了”

这场闹剧，自然也少不了Meta首席AI科学家、另一位图灵奖得主Yann LeCun的“辣评”。他直接引用莎士比亚的《哈姆雷特》名句“Hoist with his own petard”（被自己的炸药包炸飞了），但把“petard”改成了**“GPTards”**。²

小课堂： “-tards”源自英文单词“retard”（笨蛋），所以LeCun这是在嘲讽OpenAI**“被那些盲目吹捧GPT的笨蛋们给坑了”，讽刺OpenAI这是“作茧自缚”**啊！这“嘴炮”段位，不服不行！

搞笑的是，就在同一天，LeCun还在另一个指出某热门论文存在虚假引用的帖子下面，回复了一模一样的话。看来，LeCun对这种“AI夸大宣传”的现象，是真的有点忍无可忍了。

AI批评家Gary Marcus也补了一刀：“任何期望当前范式接近AGI的人都是在痴心妄想。” 网友们更是议论纷纷，有人觉得OpenAI这次是**“炒作失败，妥妥的翻车现场”**，也有人觉得，能有效检索文献，其实也挺有价值的。

数学天才陶哲轩：AI是“文献加速器”，不是“数学大神”

在这场“瓜田李下”的混战中，菲尔兹奖得主、被称为“数学界莫扎特”的陶哲轩教授，也给出了他专业且清醒的看法。

他在社交媒体Mastodon上表示，AI在数学领域的即时潜力，在于加速文献搜索这类“琐碎”任务，而不是直接解决最难的开放问题。³ 他承认AI确实可能**“工业化”数学研究**，加速整体进展，但同时强调，人类专家依然是不可或缺的，他们需要审查、分类和整合AI给出的结果。

陶神点拨： AI是个好工具，能帮你“查字典”查得飞快，但让你“写作文”还得是你自己。它能帮你高效地找到散落在世界各地的“答案碎片”，但把这些碎片拼成一幅完整的“理论拼图”，甚至创造全新的“拼图”，那还是人类的活儿。

这场“罗生门”背后：AI宣传的边界在哪里？

OpenAI这次的“乌龙事件”，像是一面镜子，映照出当前AI领域在技术突破、公众期待和商业宣传之间的复杂关系。

一方面，我们能看到AI模型在信息检索和处理上的惊人效率。GPT-5能够通过海量数据，快速发现被遗漏或未更新的知识点，这对于科研人员来说，无疑是一个**“生产力工具”的福音**。就像陶哲轩所说，它能**“加速科学”**，让学者们从繁琐的文献堆里解放出来。

但另一方面，这次事件也再次敲响了警钟：AI的宣传到底该多“负责任”？ 仅仅是“检索到”已知答案，却被包装成“解决了”难题，这种**“包装过度”的行为，很容易误导公众，甚至让人们对AI产生不切实际的幻想**。当幻想破灭，随之而来的就是信任危机，甚至是对整个AI领域的质疑。

所以，在这波AI浪潮中，我们需要的不仅仅是技术的**“突飞猛进”，更需要的是“实事求是”的科学精神和“克制严谨”的传播态度。毕竟，AI的未来，需要的是坚实的技术基石，而不是昙花一现的“海市蜃楼”**。

AI的发展之路还很长，与其急着“造神”，不如踏踏实实地“炼金”。

引用

OpenAI 研究人员夸大GPT-5 数学能力后删帖，遭杨立昆等业界人士批评·IT之家·（2025/10/19）·检索日期2025/10/19 ↩︎
OpenAI 研究人员夸大GPT-5 数学能力后删帖，遭杨立昆等业界人士批评·新浪科技·（2025/10/19）·检索日期2025/10/19 ↩︎
mathstodon.xyz/@tao/115385022005130505·Mastodon·Terrence Tao（2025/10/19）·检索日期2025/10/19 ↩︎