TL;DR:
最近AI圈的“瓜”有点多!OpenAI先是“嘴硬”说自家模型IMO奥数夺金,结果被谷歌DeepMind官方认证的“真金”狠狠补了一刀。那边厢,神秘新模型“o3 Alpha”刚露面就神隐,引爆“GPT-5”猜想。更劲爆的是,OpenAI前员工爆肝三天,竟然在编程赛上亲手“吊打”老东家模型,捍卫了人类尊严!
最近这AI圈,可谓是“神仙打架,凡人吃瓜”。特别是两大巨头OpenAI和谷歌DeepMind,那真是你方唱罢我登场,轮番秀肌肉,看得我们这些吃瓜群众是眼花缭乱。不过,这波“秀”操作,有的赢得漂亮,有的嘛,就有点**“翻车现场”**的味道了。
奥数金牌“罗生门”:OpenAI vs. 谷歌,谁才是真“卷王”?
话说这国际数学奥林匹克竞赛(IMO),那可是全球数学天才的**“华山论剑”。往年是学霸们的专属舞台,今年嘛,AI模型也来凑热闹了。先是OpenAI的研究员Alexander Wei急不可耐**地宣布,他们家的新模型拿到了IMO金牌级别的成绩,达到了每年不到9%人类参赛者能企及的高度1。听起来是不是特振奋人心?
然而,还没等大家欢呼雀跃,剧情就来了个神反转。谷歌DeepMind的CEO Demis Hassabis紧接着也宣布,他家的Gemini Deep Think在IMO中同样达到了金牌水平2。这不就是**“同款金牌,不同版本”**吗?
蹊跷的地方来了:OpenAI这个“金牌”,是自己组织的评审团**“盲审”出来的,而且,还被爆料提前撕毁保密协议**,在IMO主办方要求7月28日之后公布结果时,OpenAI却**“抢跑”了3。这操作,直接惹恼了IMO社区,连谷歌都忍不住侧面“阴阳怪气”**了几句:“我们尊重IMO委员会的请求,等人家的独立专家验证!”4
相比之下,谷歌这边的“金牌”,不仅有官方认证的意味(虽然具体细节待定,但其声明和行动更显稳重),而且人家还在技术上**“内卷”:之前的AlphaProof和AlphaGeometry 2需要三天时间,还要人类协助,而现在Gemini Deep Think在人类同等限制**(4.5小时,纯文本,不联网)下解决问题。所以,有网友犀利点评:“OpenAI为了博眼球啥都干得出来,没官方分数,没点耐心,更没底线。”而谷歌DeepMind则被赞**“堪称典范”。这波“躺赢”**,谷歌拿捏得死死的。
神秘“o3 Alpha”驾到?GPT-5在暗示你什么!
这边IMO战火未平,OpenAI那边又悄悄**“搞事情”了。上周,有眼尖的网友在WebArena测试平台,“惊鸿一瞥”地捕捉到一个名为“o3-alpha-responses-2025-07-17”的神秘新模型5。这玩意儿,名字看着就透着一股“高端大气上档次”的神秘感,而且它还以“Anonymous-Chatbot”的马甲出现,妥妥的“马甲党”**!
有大佬体验后直呼:“这东西很强大,太让人惊艳了!”特别是在网页开发这种需要**“脑洞大开”和“逻辑严谨”兼顾的任务上,它表现得那叫一个“丝滑”。关键是,这“o3 Alpha”只上线了短短五六个小时就被“下架”了,这种“昙花一现”**的操作,很难不让人联想到OpenAI之前测试Quazar Alpha后不久就正式发布的情形。
于是,科技圈又开始各种**“福尔摩斯”附体,有人大胆猜测:“这不会是伪装成o3 alpha的GPT-5吧?” 毕竟,OpenAI的CEO Sam Altman早在今年2月就“凡尔赛”地透露过,公司内部有个模型能排进全球编程高手前50名,还剑指2025年底推出“超人类级”编程模型。这“o3 Alpha”,简直是“对号入座”**!
不过,OpenAI官方对此还是保持了**“克制”,表示GPT-5“即将推出”,但具备这种水平的模型短期内还不会面向消费者。这也很正常,毕竟,这种级别的模型,每次“跑起来”,那都是“烧钱”的节奏,计算资源“哗哗地流”,成本高得吓人,短期内想让大家“免费白嫖”或“低价享用”**,怕是有点难。
人类程序员“极限爆肝”:AI,你丫还差点火候!
在奥数和新模型的“瓜”之外,还有一场更**“燃”的对决——那就是在东京举行的2025年AtCoder世界巡回赛总决赛启发式竞赛上,AI模型第一次和人类程序员“真刀真枪”**地干了一仗!
OpenAI派出了一个代号为“OpenAIAHC”的**“神秘推理模型”,据说也跟“o3”系列沾亲带故6。而人类这边的“守门员”**,则是OpenAI的前员工Przemysław Dębiak,他的ID是“Psyho”。
这场比赛,那真是**“神仙打架,谁弱谁尴尬”。参赛者要在10小时内解决一个复杂的优化问题,比拼的是“硬核实力”和“临场应变”。结果呢?爆肝3天,只睡了10个小时的Psyho,最终以1,812,272,588,909的超高分,力压AI模型的1,654,675,725,406分,C位出道,拿下了冠军!而AI,则“屈居”**亚军。
Dębiak在X上**“凡尔赛式”地庆祝:“人类已经获胜(暂时!)”7。这句“暂时”,道尽了人类程序员的“危机感”和“自嘲”。毕竟,AI的进步速度那可是“肉眼可见”。OpenAI虽然自家模型输了,但心态倒是挺“凡尔赛”**的:“能排进前100名,这次能进前三,不错了!这证明我们模型会战略推理、长期规划,还能反复试错!”8
这场比赛无疑给程序员们敲响了警钟:AI的**“降维打击”可能迟到,但绝不会缺席。今天AI只是亚军,明天呢?后天呢?用不了多久,“AI模型在类似赛事中占据榜首”的未来,可能就不是“危言耸听”了。所以,人类程序员们,“卷起来”吧,不然“饭碗不保”**可不是开玩笑!
总的来说,OpenAI这波操作,有**“自砸招牌”的奥数风波,有“犹抱琵琶半遮面”的神秘新模,也有“虽败犹荣”的编程竞赛。AI的军备竞赛正如火如荼,我们既要为人类的“暂时领先”而欢呼,也要为AI的“一日千里”而警醒。这场“人机大战”和“巨头之争”**,只会越来越精彩!
引用
-
OpenAI jumps gun on international math olympiad gold medal announcement · Ars Technica · Benj Edwards(2025/7/22)·检索日期2025/7/22 ↩︎
-
谷歌宣布其Gemini AI 在国际数学奥林匹克竞赛测试中获金牌水平成绩 · IT之家 · IT之家(2025/7/22)·检索日期2025/7/22 ↩︎
-
Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天 · 网易 · 华卫(2025/7/22)·检索日期2025/7/22 ↩︎
-
打脸OpenAI!谷歌Gemini高级版获IMO 2025官方认证金牌 · 华尔街见闻 · 华尔街见闻(2025/7/22)·检索日期2025/7/22 ↩︎
-
Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天 · 网易 · 华卫(2025/7/22)·检索日期2025/7/22 ↩︎
-
Humanity has prevailed (for now!) says former OpenAI employee admitting he's barely alive after beating one of its AI models in a coding world championship fight · PC Gamer · Wes Fenlon(2025/7/22)·检索日期2025/7/22 ↩︎
-
Humanity has prevailed (for now!) says former OpenAI employee admitting he's barely alive after beating one of its AI models in a coding world championship fight · PC Gamer · Wes Fenlon(2025/7/22)·检索日期2025/7/22 ↩︎
-
Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天 · 网易 · 华卫(2025/7/22)·检索日期2025/7/22 ↩︎