AI顶流又“开撕”！奥数金牌罗生门，编程赛爆肝险胜，OpenAI这波操作你看懂了吗？

TL;DR：

最近AI圈的“瓜”有点多！OpenAI先是“嘴硬”说自家模型IMO奥数夺金，结果被谷歌DeepMind官方认证的“真金”狠狠补了一刀。那边厢，神秘新模型“o3 Alpha”刚露面就神隐，引爆“GPT-5”猜想。更劲爆的是，OpenAI前员工爆肝三天，竟然在编程赛上亲手“吊打”老东家模型，捍卫了人类尊严！

最近这AI圈，可谓是“神仙打架，凡人吃瓜”。特别是两大巨头OpenAI和谷歌DeepMind，那真是你方唱罢我登场，轮番秀肌肉，看得我们这些吃瓜群众是眼花缭乱。不过，这波“秀”操作，有的赢得漂亮，有的嘛，就有点**“翻车现场”**的味道了。

奥数金牌“罗生门”：OpenAI vs. 谷歌，谁才是真“卷王”？

话说这国际数学奥林匹克竞赛（IMO），那可是全球数学天才的**“华山论剑”。往年是学霸们的专属舞台，今年嘛，AI模型也来凑热闹了。先是OpenAI的研究员Alexander Wei急不可耐**地宣布，他们家的新模型拿到了IMO金牌级别的成绩，达到了每年不到9%人类参赛者能企及的高度¹。听起来是不是特振奋人心？

然而，还没等大家欢呼雀跃，剧情就来了个神反转。谷歌DeepMind的CEO Demis Hassabis紧接着也宣布，他家的Gemini Deep Think在IMO中同样达到了金牌水平²。这不就是**“同款金牌，不同版本”**吗？

蹊跷的地方来了：OpenAI这个“金牌”，是自己组织的评审团**“盲审”出来的，而且，还被爆料提前撕毁保密协议**，在IMO主办方要求7月28日之后公布结果时，OpenAI却**“抢跑”了³。这操作，直接惹恼了IMO社区，连谷歌都忍不住侧面“阴阳怪气”**了几句：“我们尊重IMO委员会的请求，等人家的独立专家验证！”⁴

相比之下，谷歌这边的“金牌”，不仅有官方认证的意味（虽然具体细节待定，但其声明和行动更显稳重），而且人家还在技术上**“内卷”：之前的AlphaProof和AlphaGeometry 2需要三天时间，还要人类协助，而现在Gemini Deep Think在人类同等限制**（4.5小时，纯文本，不联网）下解决问题。所以，有网友犀利点评：“OpenAI为了博眼球啥都干得出来，没官方分数，没点耐心，更没底线。”而谷歌DeepMind则被赞**“堪称典范”。这波“躺赢”**，谷歌拿捏得死死的。

神秘“o3 Alpha”驾到？GPT-5在暗示你什么！

这边IMO战火未平，OpenAI那边又悄悄**“搞事情”了。上周，有眼尖的网友在WebArena测试平台，“惊鸿一瞥”地捕捉到一个名为“o3-alpha-responses-2025-07-17”的神秘新模型⁵。这玩意儿，名字看着就透着一股“高端大气上档次”的神秘感，而且它还以“Anonymous-Chatbot”的马甲出现，妥妥的“马甲党”**！

有大佬体验后直呼：“这东西很强大，太让人惊艳了！”特别是在网页开发这种需要**“脑洞大开”和“逻辑严谨”兼顾的任务上，它表现得那叫一个“丝滑”。关键是，这“o3 Alpha”只上线了短短五六个小时就被“下架”了，这种“昙花一现”**的操作，很难不让人联想到OpenAI之前测试Quazar Alpha后不久就正式发布的情形。

于是，科技圈又开始各种**“福尔摩斯”附体，有人大胆猜测：“这不会是伪装成o3 alpha的GPT-5吧？” 毕竟，OpenAI的CEO Sam Altman早在今年2月就“凡尔赛”地透露过，公司内部有个模型能排进全球编程高手前50名，还剑指2025年底推出“超人类级”编程模型。这“o3 Alpha”，简直是“对号入座”**！

不过，OpenAI官方对此还是保持了**“克制”，表示GPT-5“即将推出”，但具备这种水平的模型短期内还不会面向消费者。这也很正常，毕竟，这种级别的模型，每次“跑起来”，那都是“烧钱”的节奏，计算资源“哗哗地流”，成本高得吓人，短期内想让大家“免费白嫖”或“低价享用”**，怕是有点难。

人类程序员“极限爆肝”：AI，你丫还差点火候！

在奥数和新模型的“瓜”之外，还有一场更**“燃”的对决——那就是在东京举行的2025年AtCoder世界巡回赛总决赛启发式竞赛上，AI模型第一次和人类程序员“真刀真枪”**地干了一仗！

OpenAI派出了一个代号为“OpenAIAHC”的**“神秘推理模型”，据说也跟“o3”系列沾亲带故⁶。而人类这边的“守门员”**，则是OpenAI的前员工Przemysław Dębiak，他的ID是“Psyho”。

这场比赛，那真是**“神仙打架，谁弱谁尴尬”。参赛者要在10小时内解决一个复杂的优化问题，比拼的是“硬核实力”和“临场应变”。结果呢？爆肝3天，只睡了10个小时的Psyho，最终以1,812,272,588,909的超高分，力压AI模型的1,654,675,725,406分，C位出道，拿下了冠军！而AI，则“屈居”**亚军。

Dębiak在X上**“凡尔赛式”地庆祝：“人类已经获胜（暂时！）”⁷。这句“暂时”，道尽了人类程序员的“危机感”和“自嘲”。毕竟，AI的进步速度那可是“肉眼可见”。OpenAI虽然自家模型输了，但心态倒是挺“凡尔赛”**的：“能排进前100名，这次能进前三，不错了！这证明我们模型会战略推理、长期规划，还能反复试错！”⁸

这场比赛无疑给程序员们敲响了警钟：AI的**“降维打击”可能迟到，但绝不会缺席。今天AI只是亚军，明天呢？后天呢？用不了多久，“AI模型在类似赛事中占据榜首”的未来，可能就不是“危言耸听”了。所以，人类程序员们，“卷起来”吧，不然“饭碗不保”**可不是开玩笑！

总的来说，OpenAI这波操作，有**“自砸招牌”的奥数风波，有“犹抱琵琶半遮面”的神秘新模，也有“虽败犹荣”的编程竞赛。AI的军备竞赛正如火如荼，我们既要为人类的“暂时领先”而欢呼，也要为AI的“一日千里”而警醒。这场“人机大战”和“巨头之争”**，只会越来越精彩！

引用

OpenAI jumps gun on international math olympiad gold medal announcement · Ars Technica · Benj Edwards（2025/7/22）·检索日期2025/7/22 ↩︎
谷歌宣布其Gemini AI 在国际数学奥林匹克竞赛测试中获金牌水平成绩 · IT之家 · IT之家（2025/7/22）·检索日期2025/7/22 ↩︎
Altman 秀新模型“翻车”，谷歌补刀躺赢！OpenAI 前员工爆肝3天 · 网易 · 华卫（2025/7/22）·检索日期2025/7/22 ↩︎
打脸OpenAI！谷歌Gemini高级版获IMO 2025官方认证金牌 · 华尔街见闻 · 华尔街见闻（2025/7/22）·检索日期2025/7/22 ↩︎
Altman 秀新模型“翻车”，谷歌补刀躺赢！OpenAI 前员工爆肝3天 · 网易 · 华卫（2025/7/22）·检索日期2025/7/22 ↩︎
Humanity has prevailed (for now!) says former OpenAI employee admitting he's barely alive after beating one of its AI models in a coding world championship fight · PC Gamer · Wes Fenlon（2025/7/22）·检索日期2025/7/22 ↩︎
Humanity has prevailed (for now!) says former OpenAI employee admitting he's barely alive after beating one of its AI models in a coding world championship fight · PC Gamer · Wes Fenlon（2025/7/22）·检索日期2025/7/22 ↩︎
Altman 秀新模型“翻车”，谷歌补刀躺赢！OpenAI 前员工爆肝3天 · 网易 · 华卫（2025/7/22）·检索日期2025/7/22 ↩︎