谷歌AI“王炸”Gemini 3 Pro杀疯了!奥特曼马斯克都“点赞”:这波真·逆风翻盘?

温故智新AIGC实验室

TL;DR:

谷歌DeepMind带着“王炸”Gemini 3 Pro杀回来了,不仅性能榜单上把对手“按在地上摩擦”,连马斯克和奥特曼都得连连“点赞”。这波不只是模型升级,更是谷歌在AI大潮中**“绝地反击”**,誓要用“世界模型”直奔AGI,硬刚AI泡沫!

最近的AI圈,那叫一个**“神仙打架”,你方唱罢我登场,好不热闹!前脚马斯克的Grok 4.1刚秀了一把肌肉,后脚就被谷歌的Gemini 3 Pro光速反超**,这剧情,简直比好莱坞大片还刺激,上演了一幕AI版的**“速度与激情”**!

谷歌DeepMind的CEO哈萨比斯(Demis Hassabis)可算是扬眉吐气,在社交媒体上兴奋地晒出Gemini 3的“成绩单”,豪言这货“当然地”登顶各大排行榜,甚至放话这是他“迄今为止最爱的模型”——这彩虹屁吹得,估计模型都要飘了!

更有意思的是,连OpenAI的奥特曼和xAI的马斯克,这两位AI界的“顶流”,也纷纷为Gemini 3**“点赞”**。马斯克甚至连发两个哭泣的表情包,估计是气到“掀桌”,直呼“看来我们要尽快推Grok 4.2了”。这波“凡尔赛式”催更,着实让人嗅到了火药味!

卷王驾到:Gemini 3 Pro到底有多牛?

别以为Gemini 3 Pro只是个普通的“卷王”,它的到来,可不仅仅是把分数刷高了那么简单。谷歌强调,Gemini 3不只是一个更聪明的模型,或者一个会聊天的机器人,更重要的是,它从发布之日起,就开始全面赋能谷歌现有的“赚钱机器”——包括它那利润可观的搜索业务 1。用哈萨比斯的话说,“我们是谷歌的动力引擎,现在我们正在让AI全面接入” 1

那这位“动力引擎”到底强在哪?用最通俗的话来说,Gemini 3 Pro就像个**“六边形战士”,在推理、多媒体处理和编码能力上,都展现出了“遥遥领先”**的姿态。

  • 脑力担当:推理能力“超神” 它在多个模型榜单上都表现出色,比如在LMSys Elo Arena排行榜上,Gemini 3 Pro以1501分突破性登顶 12,比前代Gemini 2.5 Pro高出整整50分。在那些需要多步逻辑和专家级推理的“地狱难度”测试(如Humanity’s Last Exam和GPQA Diamond)中,它也拿到了令人惊叹的高分 2。甚至在数学领域,面对“地狱难度”的MathArena测试,Gemini 3 Pro以23.4%的得分率**“碾压群雄”**,而其他对手还在1%左右徘徊 2这智商,简直是把人类的CPU都给干烧了!
  • 多才多艺:多模态理解“开挂” Gemini系列从诞生之初就主打“原生多模态”牌,这回Gemini 3 Pro更是把多模态理解玩出了新高度。在测试中,它在多学科多模态理解测试MMMU-Pro上取得81%的成绩,在专门评估视频理解能力的Video-MMMU上达到87.6% 2
  • “记忆力”惊人:上下文窗口“顶流” 更让人震惊的是,Gemini 3 Pro的“记忆力”简直是逆天了,支持高达100万个token的超长上下文长度 12!这是什么概念?相当于一次性读完700页英文书籍,或者看两小时的4K视频 2别的模型可能看几页就“失忆”了,它这是直接把图书馆搬进脑子里了!
  • 代码高手:编程能力“逆天改命” 在编码方面,Gemini 3 Pro同样不甘示弱。在WebDev Arena编码竞赛中,它以1487分位居榜首 2;在基于真实开源项目的SWE-bench Verified测试中,其修复并通过验证的代码占比高达76.2% 2程序员们,你们的饭碗是不是又有点“摇摇欲坠”了?

谷歌还透露,Gemini 3除了旗舰版的Pro,还有一个**“Deep Think”**模式,专为解决最艰难的问题而生,简直就是AI界的“最强大脑” 13

逆风翻盘?谷歌“家底”才是真·杀手锏!

如果说OpenAI是靠“一鸣惊人”的ChatGPT一夜成名,那谷歌的“打法”就显得底气十足得多,毕竟人家是**“家底深厚”**的科技巨头。

曾几何时,谷歌在AI领域可是“起了个大早,赶了个晚集”,2017年就发现了Transformer模型架构,却**“傻傻地”选择开源,没及时商业化,结果被OpenAI的ChatGPT“抢跑”,动摇了它的核心搜索业务,才“幡然醒悟”**开始奋起直追 1这波操作,简直是“把金子拱手让人”的教科书式案例啊!

有意思的是,OpenAI的崛起,不仅唤醒了谷歌,甚至还**“意外”**地帮助谷歌避免了被分拆、出售搜索业务的命运 1果然,敌人的敌人就是朋友,有时候“友商”也是“助攻”啊!

现在,谷歌的优势在于它拥有一条**“长长的产品线”:搜索、地图、Gmail、云服务,甚至还想“复活”谷歌眼镜** 1。哈萨比斯表示,当年的谷歌眼镜步子迈得有点超前,缺少一个真正的**“杀手级用例”**,而通用助手(Gemini)正是这样一个用例 1看来,这波是要让老物件焕发新春啊!

Gemini 3一发布,就已经通过Gemini应用和Google搜索的AI Overviews功能向用户开放。据Alphabet财报显示,AI Overviews已经推动搜索查询量提升了10%,视觉搜索更是激增了70% 1这赚钱效应,简直是“立竿见影”!

更关键的是,谷歌的所有产品现在都**“完全跑在Gemini技术栈上”,实现了从产品到模型的“一体化”** 1。这意味着,无论是产品更新还是模型微调,都能**“丝滑”**进行,效率蹭蹭往上涨。

而从用户活跃度来看,Gemini应用的月活用户已超过6.5亿,虽然不及ChatGPT的“宇宙级”周活用户,但每月有超过20亿人通过搜索里的AI Overviews使用Gemini,还有约1300万开发者在自己的产品中集成了它 1这增长速度,妥妥的“逆袭”节奏啊!

奔向AGI:哈萨比斯的“世界模型”大棋局

哈萨比斯可不是个**“小富即安”的人,他依然在追求做“各方面都最强”的模型 1。在他看来,这才是真正意义上的通用模型,也是最终通向通用人工智能(AGI)**系统的关键一步。

他坚持认为,距离真正意义上的AGI全面实现,还有五到十年 1。而当前他花时间最多的,就是研究那个听起来就**“不明觉厉”“世界模型”。他相信,世界模型未来也将迎来类似ChatGPT那样的“爆发时刻”** 1

  • 世界模型:AI的“大脑”和“想象力” 什么是世界模型?简单来说,它就像给AI一个可以模拟现实世界的“大脑”,让AI能**“理解”世界如何运作**,甚至能**“预测”未来可能发生什么**。目前,世界模型已经有一些内部用例,比如用来训练其他智能体、机器人系统等 1想象一下,未来的AI也许能提前“预演”各种可能性,那岂不是要“开天眼”了?

当然,通往AGI的路上也并非**“一路绿灯”。哈萨比斯坦言,即使将现在全世界的算力加在一起,也“不够满足我们想做的所有事情”** 1看来,连AI巨头都在为“算力自由”而焦虑啊!

谈到如今AI圈动辄几十亿美元估值的“泡沫”,哈萨比斯倒是显得**“人间清醒”**。他认为确实存在泡沫,那些“几乎没有什么的项目,种子轮估值就能到几十亿美元,这在逻辑上有点行不通” 1

但对于谷歌自身,他则**“自信满满”,认为DeepMind既有扎实营收,又承担着谷歌“AI动力舱”的重任,加上Gemini模型和一系列AI优先产品,谷歌完全有“穿越AI泡沫的底气”**,笑到最后 1这波,是真·有钱任性,还是真的实力碾压,时间会告诉我们答案!

哈萨比斯表示,“我对这一切非常兴奋,目前我们只是刚刚触及未来可能性的表面,明年会更直观地看到这些变化” 1看来,2025年的AI大战,才刚刚拉开序幕,好戏还在后头!

引用


  1. 新智元:36个月大逆转,他带着谷歌AI杀回来了,下一步世界模型 · 新智元 · 新智元(2025/11/21)· 检索日期2025/11/21 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 谷歌发布Gemini 3 AI竞赛转向比拼“执行力” · 证券时报 · 董静怡(2025/11/20)· 检索日期2025/11/21 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  3. Gemini 3 開啟智慧新紀元 · Google Blog · Google DeepMind 執行長 Demis Hassabis 與 Google DeepMind 技術長暨 Google 首席 AI 架構師 Koray Kavukcuoglu 代表 Gemini 團隊(2025/11/18)· 检索日期2025/11/21 ↩︎