GPT-5“突破”风波:AI的虚妄与真实,一场关于信任与协作的深度反思

温故智新AIGC实验室

TL;DR:

OpenAI宣称GPT-5解决了数学难题的“突破”最终被证伪,引发了对AI行业过度炒作、商业伦理和透明度的信任危机。然而,这场风波也凸显了AI在加速文献检索等常规科学研究任务上的巨大潜力,预示着人机深度协作将是未来科学发现的真正范式。

OpenAI 研究员高调宣称 GPT-5 在解决埃尔德什数学难题上取得了“突破”,却在短短数日内因事实与宣传不符而迅速撤回,引发了 AI 社区的广泛质疑和万条推文的“怒轰”,甚至导致 OpenAI 估值下跌并引来监管机构调查。Meta 首席 AI 科学家 Yann LeCun 尖锐评论其为“搬起自己的 GPT 石头砸了自己的脚”1,谷歌 DeepMind 首席执行官 Demis Hassabis 也批评其沟通疏漏。这起事件不仅仅是一次公关失误,更是对当前 AI 商业化狂潮下,技术宣传伦理、行业信任以及 AI 在科学研究中真正角色的一次深刻拷问。

“突破”的表象与技术核心的辨析

最初的声明由 OpenAI 研究科学家 Sebastien Bubeck 率先放出,声称 GPT-5 解决了埃尔德什问题中的 10 个未解难题。Mark Sellke 随后证实,GPT-5 通过数千次查询找到了答案,甚至发现埃尔德什本人原始论文中的一个错误。这些表述暗示 GPT-5 独立生成了复杂的数学证明,具备了自主发现未知解决方案的能力,这无疑将是一项颠覆性的科学成就。然而,真相很快浮出水面。负责维护埃尔德什问题网站的数学家 Thomas Bloom 澄清,GPT-5 只是“找到了一些能解决这些问题的参考文献,而这些文献是我个人之前未曾知晓的”1。这意味着 GPT-5 的“突破”并非创造性地生成了新的数学证明,而是高效地检索并识别了现有文献中已被解决但未被广泛认知的问题答案。

从技术原理层面看,这揭示了当前大语言模型在“理解”和“创造”之间的边界。GPT-5 展现的是其强大的信息检索、关联与合成能力,能够穿透复杂的学术文献网络,定位并关联散落在各处的知识点。这种能力对于处理文献分布零散、术语表述不统一的领域至关重要。但它并非真正意义上的数学推理和证明生成,至少在这次事件中,其角色更像是极度高效且“博闻强识”的图书馆管理员或研究助理,而非独立思考的数学家。这种误导性的宣传模糊了 AI 的真实能力边界,是对公众认知的一次严重透支。

信任危机:AI 商业化狂潮下的伦理拷问

这起事件对 OpenAI 乃至整个 AI 行业都带来了巨大的“反噬”。除了社交媒体上“OpenAIFail”话题的热度飙升,OpenAI 的估值指标在盘前交易中大幅下跌,这直接反映了市场对技术炒作的反感。更深层次的危机在于对 AI 行业伦理和透明度的拷问。在 AI 领域充斥着数十亿美元的投资和巨大期望的背景下,为何顶尖研究员会在未充分核实的情况下发布如此耸动的言论?这种行为不仅损害了 OpenAI 的声誉,也可能动摇公众对 AI 技术及其应用前景的信任。

美国联邦贸易委员会(FTC)已开始调查 OpenAI 的行为是否构成虚假广告,并可能面临罚款。同时,监管机构还加强了对 OpenAI 未公开与 Epoch AI 资金关系获取 FrontierMath 基准测试优先访问权的审查,这引发了关于 公平竞争和基准测试透明度的严重担忧1。著名通用人工智能(AGI)怀疑论者 Gary Marcus 此前曾指出 OpenAI 的公开演示“具有操纵性”,此次事件无疑为他的观点提供了新的佐证。在一个快速发展且高度资本化的行业中,客观性、严谨性和责任感的重要性被再次凸显。缺乏这些,技术创新再快,也难以赢得长期的社会认可和信任。

重塑研究范式:陶哲轩眼中AI的真实力量

尽管虚假突破带来了负面影响,但事件背后真正有价值的信息,即 AI 在追踪相关学术论文方面的实用价值,不应被掩盖。著名数学家陶哲轩(Terence Tao),这位菲尔兹奖得主,长期以来一直是 AI 辅助数学研究的积极倡导者和实践者。他多次强调,AI 在数学领域最富有成效的应用,并非直接攻克最挑战性的难题,而是作为**“中等算力工具”来加速和规模化处理那些更普通、更耗时但依然关键的研究任务**2

陶哲轩指出,AI 在文献综述方面具有独特优势。对于那些文献分散、术语不统一的问题,AI 能够高效检索并整合信息。他强调,AI 检索的输出结果可由人类独立验证,这使得文献检索成为 AI 的理想应用场景。他甚至认为,系统性地利用 AI 报告“阳性结果”(找到相关文献)和“阴性结果”(未找到相关文献),能够更准确地呈现某一问题的现有文献实际情况,避免重复劳动或错误判断某个问题仍未解决1。陶哲轩本人也曾多次借助 GPT-4 和 GPT-5 等 AI 工具解决数学难题,优化工作流程,将数小时的编码工作缩短为短时间的多轮互动345。他将 AI 视为一种强大的研究助手,能够加速数学研究“工业化”,但前提是人类的专业判断始终是审查、分类和整合 AI 生成结果的关键。这正是 AI 赋能科学发现的务实路径:增能(Augmentation),而非替代(Replacement)

未来展望:人机协作的新科学范式

OpenAI 的“数学乌龙”事件,无疑是 AI 发展史上的一个警示。它促使我们重新审视 AI 在科学发现中的真实角色和伦理边界。未来,AI 将不再仅仅是工具,而是深度参与科学研究全流程的智慧协作伙伴

  1. 科学范式重构: AI 不会取代科学家的核心创造力,但将极大地提升研究效率。从文献检索、数据分析、假设生成到实验设计和结果验证,AI 将作为智能助理,帮助科学家扩展认知边界,加速从想法到成果的转化。这种人机智能协同的新范式,有望推动科学发现进入一个前所未有的加速期。
  2. 专业化AI工具的兴起: 此次事件也为垂直领域 AI 工具的商业化提供了明确方向。针对特定学科(如数学、物理、生物医药)定制化训练的 AI 模型,其在专业文献理解、模式识别和知识图谱构建方面的能力将是巨大的商业蓝海。开发者需要专注于提供可靠、可验证、透明的 AI 辅助解决方案,而非追求“独立突破”的噱头。
  3. 重塑学术出版与知识管理: AI 辅助的文献综述能力将改变学术出版和知识管理的方式。未来可能会出现 AI 驱动的“知识库助手”,能够实时追踪研究进展,识别知识空白,甚至辅助论文评审。这要求学术界建立更完善的AI辅助发表规范和数据溯源机制。
  4. 伦理与治理的常态化: 随着 AI 深入科学研究,对其透明度、可解释性、潜在偏见及责任归属的伦理与治理将成为常态。研究机构、科技公司和监管部门需要共同制定并遵循严格的行为准则,确保 AI 成为人类进步的可靠力量,而非滋生虚假信息和信任危机的源头。

此次风波是 AI 行业在高速发展中不可避免的“成长的烦恼”。真正的突破不在于 AI 能否独立解决“百年悬案”,而在于我们如何以负责任、务实且富有远见的方式,将 AI 整合进人类的知识探索之旅,共同开创一个人机共生、加速发现的新时代。

引用


  1. 万条推文“怒轰”、估值下跌, OpenAI被误导性“突破”反噬,陶哲轩:有实力,但方向错了?·AI前线·华卫(2025/10/20)·检索日期2025/10/20 ↩︎ ↩︎ ↩︎ ↩︎

  2. 陶哲轩联手GPT-5,1小时攻克数学难题!全程无编码,OpenAI副总惊呼·好财网·(2025/10/20)·检索日期2025/10/20 ↩︎

  3. GPT-5又帮陶哲轩解决了一个难题| 量子位·量子位·一水(2025/09/03)·检索日期2025/10/20 ↩︎

  4. 陶哲轩用GPT-5解决数学难题:仅29行Python代码| 量子位·量子位·(2025/10/20)·检索日期2025/10/20 ↩︎

  5. GPT-4野生代言人陶哲轩:搞论文学新工具没它得崩溃!11页“超简短”新作已上线·量子位·丰色(2023/10/11)·检索日期2025/10/20 ↩︎