TL;DR:
OpenAI 研究员喜滋滋宣布 GPT-5 解决了 10 个数学悬赏难题,结果被数学家和谷歌大佬Demis Hassabis 当场「揭穿」,原来 GPT-5 只是个「超级文献检索员」!Meta大佬LeCun更是直接上嘴炮,这场 AI 圈的「凡尔赛文学」翻车现场,简直是大型连续剧!
周末的AI圈,那叫一个热闹!原本以为是GPT-5横空出世,直接把数学界的「悬案」给破了,结果,剧情来了个360度大反转,一众AI界顶流大佬在线“吃瓜”,甚至亲自下场“点评”,好好的科技新闻瞬间变成了年度大戏。究竟是AI太神还是“人设”崩塌?咱们今天就来深度扒一扒。
突发!GPT-5“怒刷”10道数学难题,AI届沸腾了?
故事得从几条火爆X(前Twitter)的推文说起。
10月12日,OpenAI的Sebastien Bubeck先是预告了一下,说GPT-5在文献搜索方面简直是**“超凡脱俗”,连Erdős问题339这种深藏不露的答案都能“挖”出来,而且官方数据库都没来得及更新状态。嗯,这操作听起来就有点“降维打击”**的意思。
几天后,更劲爆的来了!OpenAI研究员Mark Sellke和他的搭档,晒出了一张成绩单:他们用GPT-5模型**“地毯式搜索”了erdosproblems.com网站上的“未解决”问题,通过数千次查询,声称“发现了”10个问题的解决方案!甚至在另外11个问题上也有了“部分进展”。OpenAI首席产品官Kevin Weil立马转发,副总裁Sebastien Bubeck更是“盖章认证”:“AI加速科学已正式开始!” 甚至还顺手官宣Mark Sellke加入OpenAI,这波操作,简直是“名利双收”**的节奏啊!
一时间,媒体和吃瓜群众都沸腾了:哇塞,GPT-5这么牛,直接把困扰人类数学家几十年的难题给秒了?这是要直奔AGI(通用人工智能)的节奏吗?!
“这很尴尬”!谷歌大佬Demis Hassabis在线“打脸”
然而,AI圈的瓜,总是反转来得比剧本还快。
就在OpenAI的“凡尔赛”达到顶峰时,谷歌DeepMind的CEO,也是图灵奖得主Demis Hassabis,突然在Sebastien Bubeck那条“AI加速科学”的推文下,轻描淡写地留下了四个字:“这很尴尬。” 1
划重点: 谷歌CEO亲自下场,还用了“尴尬”这种词,这事儿不简单!
Hassabis随后引导大家去看看这个数学难题网站的维护者——数学家Thomas Bloom的澄清。Bloom教授表示,OpenAI的表述简直是**“戏剧性的误解”。他把这些问题标记为“未解决”,仅仅是因为他个人不知道**相关解答已经发表,不代表数学界没人解决!
这就好比你家冰箱里的可乐被你爸喝了,你不知道,结果你告诉全世界你发明了“喝可乐的新方法”一样……不对,是冰箱里明明有可乐,你以为没有,结果AI帮你**“找到了”**可乐的存在!
真相大白: GPT-5不是数学家,它只是一个效率奇高、堪称“文献搜索界卷王”的学术搜索引擎。它并没有独立思考、推理出新的数学解法,只是像个“图书馆管理员”一样,帮你从浩如烟海的文献中,捞出了那些人类早已解决但信息还没同步的问题。
眼看“人设”要崩,OpenAI的几位当事人赶紧出来“擦屁股”。Sebastien Bubeck删帖道歉,说“我无意误导任何人,认为表述很清楚,对不起”。 Kevin Weil也承认“我实际上误解了我们的结果(尴尬)”。Mark Sellke的更新也跟着被删。这波操作,简直是**“互联网记忆清零大法”**,但可惜,互联网是有记忆的!
Meta“嘴炮王”LeCun辛辣点评:“被自己的GPTards给坑了”
这场闹剧,自然也少不了Meta首席AI科学家、另一位图灵奖得主Yann LeCun的“辣评”。他直接引用莎士比亚的《哈姆雷特》名句“Hoist with his own petard”(被自己的炸药包炸飞了),但把“petard”改成了**“GPTards”**。2
小课堂: “-tards”源自英文单词“retard”(笨蛋),所以LeCun这是在嘲讽OpenAI**“被那些盲目吹捧GPT的笨蛋们给坑了”,讽刺OpenAI这是“作茧自缚”**啊!这“嘴炮”段位,不服不行!
搞笑的是,就在同一天,LeCun还在另一个指出某热门论文存在虚假引用的帖子下面,回复了一模一样的话。看来,LeCun对这种“AI夸大宣传”的现象,是真的有点忍无可忍了。
AI批评家Gary Marcus也补了一刀:“任何期望当前范式接近AGI的人都是在痴心妄想。” 网友们更是议论纷纷,有人觉得OpenAI这次是**“炒作失败,妥妥的翻车现场”**,也有人觉得,能有效检索文献,其实也挺有价值的。
数学天才陶哲轩:AI是“文献加速器”,不是“数学大神”
在这场“瓜田李下”的混战中,菲尔兹奖得主、被称为“数学界莫扎特”的陶哲轩教授,也给出了他专业且清醒的看法。
他在社交媒体Mastodon上表示,AI在数学领域的即时潜力,在于加速文献搜索这类“琐碎”任务,而不是直接解决最难的开放问题。3 他承认AI确实可能**“工业化”数学研究**,加速整体进展,但同时强调,人类专家依然是不可或缺的,他们需要审查、分类和整合AI给出的结果。
陶神点拨: AI是个好工具,能帮你“查字典”查得飞快,但让你“写作文”还得是你自己。它能帮你高效地找到散落在世界各地的“答案碎片”,但把这些碎片拼成一幅完整的“理论拼图”,甚至创造全新的“拼图”,那还是人类的活儿。
这场“罗生门”背后:AI宣传的边界在哪里?
OpenAI这次的“乌龙事件”,像是一面镜子,映照出当前AI领域在技术突破、公众期待和商业宣传之间的复杂关系。
一方面,我们能看到AI模型在信息检索和处理上的惊人效率。GPT-5能够通过海量数据,快速发现被遗漏或未更新的知识点,这对于科研人员来说,无疑是一个**“生产力工具”的福音**。就像陶哲轩所说,它能**“加速科学”**,让学者们从繁琐的文献堆里解放出来。
但另一方面,这次事件也再次敲响了警钟:AI的宣传到底该多“负责任”? 仅仅是“检索到”已知答案,却被包装成“解决了”难题,这种**“包装过度”的行为,很容易误导公众,甚至让人们对AI产生不切实际的幻想**。当幻想破灭,随之而来的就是信任危机,甚至是对整个AI领域的质疑。
所以,在这波AI浪潮中,我们需要的不仅仅是技术的**“突飞猛进”,更需要的是“实事求是”的科学精神和“克制严谨”的传播态度。毕竟,AI的未来,需要的是坚实的技术基石,而不是昙花一现的“海市蜃楼”**。
AI的发展之路还很长,与其急着“造神”,不如踏踏实实地“炼金”。
引用
-
OpenAI 研究人员夸大GPT-5 数学能力后删帖,遭杨立昆等业界人士批评·IT之家·(2025/10/19)·检索日期2025/10/19 ↩︎
-
OpenAI 研究人员夸大GPT-5 数学能力后删帖,遭杨立昆等业界人士批评·新浪科技·(2025/10/19)·检索日期2025/10/19 ↩︎
-
mathstodon.xyz/@tao/115385022005130505·Mastodon·Terrence Tao(2025/10/19)·检索日期2025/10/19 ↩︎