谷歌AI“王炸”Gemini 3 Pro杀疯了！奥特曼马斯克都“点赞”：这波真·逆风翻盘？

TL;DR：

谷歌DeepMind带着“王炸”Gemini 3 Pro杀回来了，不仅性能榜单上把对手“按在地上摩擦”，连马斯克和奥特曼都得连连“点赞”。这波不只是模型升级，更是谷歌在AI大潮中**“绝地反击”**，誓要用“世界模型”直奔AGI，硬刚AI泡沫！

最近的AI圈，那叫一个**“神仙打架”，你方唱罢我登场，好不热闹！前脚马斯克的Grok 4.1刚秀了一把肌肉，后脚就被谷歌的Gemini 3 Pro光速反超**，这剧情，简直比好莱坞大片还刺激，上演了一幕AI版的**“速度与激情”**！

谷歌DeepMind的CEO哈萨比斯（Demis Hassabis）可算是扬眉吐气，在社交媒体上兴奋地晒出Gemini 3的“成绩单”，豪言这货“当然地”登顶各大排行榜，甚至放话这是他“迄今为止最爱的模型”——这彩虹屁吹得，估计模型都要飘了！

更有意思的是，连OpenAI的奥特曼和xAI的马斯克，这两位AI界的“顶流”，也纷纷为Gemini 3**“点赞”**。马斯克甚至连发两个哭泣的表情包，估计是气到“掀桌”，直呼“看来我们要尽快推Grok 4.2了”。这波“凡尔赛式”催更，着实让人嗅到了火药味！

卷王驾到：Gemini 3 Pro到底有多牛？

别以为Gemini 3 Pro只是个普通的“卷王”，它的到来，可不仅仅是把分数刷高了那么简单。谷歌强调，Gemini 3不只是一个更聪明的模型，或者一个会聊天的机器人，更重要的是，它从发布之日起，就开始全面赋能谷歌现有的“赚钱机器”——包括它那利润可观的搜索业务 ¹。用哈萨比斯的话说，“我们是谷歌的动力引擎，现在我们正在让AI全面接入” ¹。

那这位“动力引擎”到底强在哪？用最通俗的话来说，Gemini 3 Pro就像个**“六边形战士”，在推理、多媒体处理和编码能力上，都展现出了“遥遥领先”**的姿态。

脑力担当：推理能力“超神” 它在多个模型榜单上都表现出色，比如在LMSys Elo Arena排行榜上，Gemini 3 Pro以1501分突破性登顶 ¹²，比前代Gemini 2.5 Pro高出整整50分。在那些需要多步逻辑和专家级推理的“地狱难度”测试（如Humanity’s Last Exam和GPQA Diamond）中，它也拿到了令人惊叹的高分 ²。甚至在数学领域，面对“地狱难度”的MathArena测试，Gemini 3 Pro以23.4%的得分率**“碾压群雄”**，而其他对手还在1%左右徘徊 ²。这智商，简直是把人类的CPU都给干烧了！
多才多艺：多模态理解“开挂” Gemini系列从诞生之初就主打“原生多模态”牌，这回Gemini 3 Pro更是把多模态理解玩出了新高度。在测试中，它在多学科多模态理解测试MMMU-Pro上取得81%的成绩，在专门评估视频理解能力的Video-MMMU上达到87.6% ²。
“记忆力”惊人：上下文窗口“顶流” 更让人震惊的是，Gemini 3 Pro的“记忆力”简直是逆天了，支持高达100万个token的超长上下文长度 ¹²！这是什么概念？相当于一次性读完700页英文书籍，或者看两小时的4K视频 ²。别的模型可能看几页就“失忆”了，它这是直接把图书馆搬进脑子里了！
代码高手：编程能力“逆天改命” 在编码方面，Gemini 3 Pro同样不甘示弱。在WebDev Arena编码竞赛中，它以1487分位居榜首 ²；在基于真实开源项目的SWE-bench Verified测试中，其修复并通过验证的代码占比高达76.2% ²。程序员们，你们的饭碗是不是又有点“摇摇欲坠”了？

谷歌还透露，Gemini 3除了旗舰版的Pro，还有一个**“Deep Think”**模式，专为解决最艰难的问题而生，简直就是AI界的“最强大脑” ¹³。

逆风翻盘？谷歌“家底”才是真·杀手锏！

如果说OpenAI是靠“一鸣惊人”的ChatGPT一夜成名，那谷歌的“打法”就显得底气十足得多，毕竟人家是**“家底深厚”**的科技巨头。

曾几何时，谷歌在AI领域可是“起了个大早，赶了个晚集”，2017年就发现了Transformer模型架构，却**“傻傻地”选择开源，没及时商业化，结果被OpenAI的ChatGPT“抢跑”，动摇了它的核心搜索业务，才“幡然醒悟”**开始奋起直追 ¹。这波操作，简直是“把金子拱手让人”的教科书式案例啊！

有意思的是，OpenAI的崛起，不仅唤醒了谷歌，甚至还**“意外”**地帮助谷歌避免了被分拆、出售搜索业务的命运 ¹。果然，敌人的敌人就是朋友，有时候“友商”也是“助攻”啊！

现在，谷歌的优势在于它拥有一条**“长长的产品线”：搜索、地图、Gmail、云服务，甚至还想“复活”谷歌眼镜** ¹。哈萨比斯表示，当年的谷歌眼镜步子迈得有点超前，缺少一个真正的**“杀手级用例”**，而通用助手（Gemini）正是这样一个用例 ¹。看来，这波是要让老物件焕发新春啊！

Gemini 3一发布，就已经通过Gemini应用和Google搜索的AI Overviews功能向用户开放。据Alphabet财报显示，AI Overviews已经推动搜索查询量提升了10%，视觉搜索更是激增了70% ¹。这赚钱效应，简直是“立竿见影”！

更关键的是，谷歌的所有产品现在都**“完全跑在Gemini技术栈上”，实现了从产品到模型的“一体化”** ¹。这意味着，无论是产品更新还是模型微调，都能**“丝滑”**进行，效率蹭蹭往上涨。

而从用户活跃度来看，Gemini应用的月活用户已超过6.5亿，虽然不及ChatGPT的“宇宙级”周活用户，但每月有超过20亿人通过搜索里的AI Overviews使用Gemini，还有约1300万开发者在自己的产品中集成了它 ¹。这增长速度，妥妥的“逆袭”节奏啊！

奔向AGI：哈萨比斯的“世界模型”大棋局

哈萨比斯可不是个**“小富即安”的人，他依然在追求做“各方面都最强”的模型 ¹。在他看来，这才是真正意义上的通用模型，也是最终通向通用人工智能（AGI）**系统的关键一步。

他坚持认为，距离真正意义上的AGI全面实现，还有五到十年 ¹。而当前他花时间最多的，就是研究那个听起来就**“不明觉厉”的“世界模型”。他相信，世界模型未来也将迎来类似ChatGPT那样的“爆发时刻”** ¹。

世界模型：AI的“大脑”和“想象力” 什么是世界模型？简单来说，它就像给AI一个可以模拟现实世界的“大脑”，让AI能**“理解”世界如何运作**，甚至能**“预测”未来可能发生什么**。目前，世界模型已经有一些内部用例，比如用来训练其他智能体、机器人系统等 ¹。想象一下，未来的AI也许能提前“预演”各种可能性，那岂不是要“开天眼”了？

当然，通往AGI的路上也并非**“一路绿灯”。哈萨比斯坦言，即使将现在全世界的算力加在一起，也“不够满足我们想做的所有事情”** ¹。看来，连AI巨头都在为“算力自由”而焦虑啊！

谈到如今AI圈动辄几十亿美元估值的“泡沫”，哈萨比斯倒是显得**“人间清醒”**。他认为确实存在泡沫，那些“几乎没有什么的项目，种子轮估值就能到几十亿美元，这在逻辑上有点行不通” ¹。

但对于谷歌自身，他则**“自信满满”，认为DeepMind既有扎实营收，又承担着谷歌“AI动力舱”的重任，加上Gemini模型和一系列AI优先产品，谷歌完全有“穿越AI泡沫的底气”**，笑到最后 ¹。这波，是真·有钱任性，还是真的实力碾压，时间会告诉我们答案！

哈萨比斯表示，“我对这一切非常兴奋，目前我们只是刚刚触及未来可能性的表面，明年会更直观地看到这些变化” ¹。看来，2025年的AI大战，才刚刚拉开序幕，好戏还在后头！

引用

新智元：36个月大逆转，他带着谷歌AI杀回来了，下一步世界模型 · 新智元 · 新智元（2025/11/21）· 检索日期2025/11/21 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
谷歌发布Gemini 3 AI竞赛转向比拼“执行力” · 证券时报 · 董静怡（2025/11/20）· 检索日期2025/11/21 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Gemini 3 開啟智慧新紀元 · Google Blog · Google DeepMind 執行長 Demis Hassabis 與 Google DeepMind 技術長暨 Google 首席 AI 架構師 Koray Kavukcuoglu 代表 Gemini 團隊（2025/11/18）· 检索日期2025/11/21 ↩︎