TL;DR:
最近OpenAI的GPT-5搞了个大乌龙,被自家员工狂吹破解了10道“埃尔德什难题”,结果被扒出来,这AI只是勤勤恳恳地在网上“查文献”,找到了一堆早就被人类解决的答案。谷歌DeepMind大佬和图灵奖得主纷纷吐槽:“太尴尬了!” 这波啊,是大型社死现场。
突发!GPT-5“智商超群”震惊学界,结果…只是个大乌龙?
几天前,AI圈炸开了锅!OpenAI的科学家Sebastien Bubeck激动地在X(就是以前的推特啦)上刷屏,自家团队的研究员联手GPT-5 Pro,只用了一个周末,就“攻克”了10个传说中的“百年悬案”——埃尔德什难题(Erdos problems)。这消息一出,OpenAI的副总裁Kevin Weil也跟着摇旗呐喊,那架势,仿佛人类的智慧又被AI刷新了上限!
当时大家都在想,“卧槽,AI这是要逆天了吗?” 连数学界都搞不定的硬骨头,GPT-5居然一口气啃下了这么多,这不就是传说中的“奇迹”吗?不少吃瓜群众和科技爱好者都信了,毕竟,OpenAI嘛,那可是AI界响当当的“顶流”!
然而,就像所有网络“爆款”一样,反转来得比翻书还快!没等大家鼓掌太久,真相就以一种**“打脸”的方式浮出了水面:这十道被GPT-5“破解”的难题,其实早就!都!被!解!决!了! GPT-5,它只是一个平平无奇的“资料查找小能手”,通过“阅览群书”(检索网络文献)**把答案给扒拉出来了,根本不是独立思考、原创解决。
消息一出,整个AI圈瞬间从**“膜拜”模式切换到了“尬聊”**模式。
谷歌DeepMind的CEO Demis Hassabis直接下场点评:“这也太尬了。” 1
图灵奖得主LeCun更是直接甩出了那句经典的吐槽:“简直就是,搬起石头(GPT)砸自己的脚。” 2
这波操作,OpenAI是真的有点**“下不来台”**了。
闹剧始末:两大“误会”酿成的“AI神话”
那么问题来了,好好的一场“AI突破”,怎么就变成了大型“社死”现场?这背后,其实是两个**“美丽的误会”凑到了一起,才让人们产生了GPT-5“攻克难题”的“幻觉”**。
首先,让我们把时间倒回到研究人员Mark Sellke和Mehtaab Sawhney最初的帖子。人家原文可没有直接说GPT-5“破解”了难题,而是更严谨地表述:通过GPT-5进行了数千条查询后,他们“找到了”十个被列为埃尔德什问题的解。注意,是“找到”,不是“创造”!
当时的结果是,问题223、339、494、515、621、822、883、903、1043、1079都得到了解决,同时在另外 11 个问题上也取得了部分进展。
其次,也是最“要命”的一点,这些“难题”之所以还在erdosproblems.com这个网站上显示为“开放”(open),并不是因为它们在科学界真的无解,而是因为网站的运营者——英国皇家学会研究院Thomas Bloom,他本人对此并不知情!也就是说,网站上标注的“开放”,仅仅代表Bloom个人没来得及更新,不代表整个学术界都束手无策。
总而言之,研究人员在表述上的“模糊地带”,加上网站信息更新的“滞后”,共同编织了一个关于GPT-5的**“AI神话”**。就好像你家孩子考了90分,你逢人便夸“他考了90分”,却没说其实是抄了同桌的卷子,而同桌的卷子还是几年前的老题,只是阅卷老师没来得及改成绩簿。这波操作,妥妥的“迷惑行为大赏”啊!
最终,Sebastien Bubeck也只好尴尬地出来“擦屁股”:
“GPT-5只是在文献中找到了解决方案,仅此而已。” 3
但他话锋一转,也为GPT-5正名了一波:“即便如此,已经非常高效了,因为我知道搜索文献是有多么地困难。”
这倒也是大实话,对于科研狗来说,查文献的**“体力活”**,那可真是“谁用谁知道”的痛!
网友热议:AI搞科研,到底该咋看?
这场GPT-5的“乌龙事件”,自然引来了全球网友的**“前排吃瓜”和热烈讨论。大佬们纷纷表示:“AI发现新科学成果?别急,让子弹飞一会儿!”**
开发者Matt Mazur严肃指出,大家必须**“谨慎地对待任何关于AI发现新科学/数学成果的说法”。Hyperbolic创始人Yuchen Jin也强调,AI在科学/数学领域的新发现,需要更多的“同行评审”**。
这可不是说AI没用,而是提醒我们,面对AI的“神迹”,要保持一份**“清醒”。就像一个小学生做出了大学物理题,你先别急着夸他天才,得看看他是自己推导的,还是把答案从百科全书上抄下来的。AI目前更多扮演的是一个“超级辅助”的角色,而不是一个完全独立的“创世神”**。
当然,也有不少网友给GPT-5打抱不平:
“这对GPT-5来说并不尴尬,毕竟它在文献检索方面表现还是很出色的。”
这话没毛病。想想看,如果让你在海量的数学文献里,捞出几百年前就被解决的难题的答案,那工作量,恐怕比让GPT-5原创一个新定理还大!所以,把GPT-5当成一个**“学霸级资料员”,它绝对是“卷王”**级别的存在。
就连数学大神陶哲轩(Terence Tao)也曾发文表达过类似的观点:
“我越来越觉得,眼下AI要在数学领域真正发挥作用,关键可能不在用最牛的模型去攻克最难的题目……更靠谱的路线,反而是用中等水平的AI工具,去帮我们搞定那些研究里绕不开的琐碎活、体力活。”
陶神的这番话,无疑给AI在科研领域的定位,提供了一个**“人间清醒”的视角。AI可能不是那个能一锤定音的“绝世高手”,但它绝对能成为那个帮你搬砖、扫地、整理资料的“全能小助手”**,把科学家从繁琐的重复劳动中解放出来,让他们能把精力集中在真正需要“灵感乍现”和“脑洞大开”的地方。
结语:AI辅助科研,要谨慎但更要期待
这次GPT-5的“世纪难题乌龙”,虽然给OpenAI带来了点**“小尴尬”,但也着实给我们上了一课。它提醒我们,在AI的“高光时刻”面前,保持“审慎”和“批判性思维”**是多么重要。无论是AI公司还是我们普通用户,都不能被一时的“宣传攻势”冲昏头脑。
然而,这并不意味着我们要贬低AI的价值。恰恰相反,GPT-5在文献检索方面展现出的惊人效率,预示着AI辅助科研的巨大潜力。未来,AI也许不能直接“创造”出惊天动地的科学发现,但它绝对能在海量数据中帮你**“大海捞针”,成为科研人员“事半功倍”**的得力干将。
所以,与其纠结AI能不能“原创”,不如思考如何更好地**“人机协作”。毕竟,科学的进步,从来都不是孤立的,而是站在巨人的肩膀上,再往前迈一步。而AI,也许正是我们这个时代,那个“超级巨人的肩膀”**。只是,在登上肩膀之前,咱得先确认这肩膀是不是真的,别是充气的啊!