TL;DR:
谷歌掏出了 Gemini 3.1 Pro,推理性能直接翻倍,价格却纹丝不动。这波“降维打击”不仅让开发者直呼真香,也标志着 AI 竞赛正式从“看谁话多”转向“看谁脑子转得快”的推理纪元。
马年“AI 春运”的赛程刚过半,OpenAI、Anthropic、阿里这些大户人家刚秀完肌肉,谷歌就坐不住了。当地时间 2 月 19 日,谷歌祭出了 Gemini 3.1 Pro 这一记重锤。1
这次谷歌没整那些虚头巴脑的概念,直接表演了一场“暴力美学”:性能翻倍,价格不变。这种“加量不加价”的策略,简直是 AI 界的良心批发商。
技术大揭秘:这脑子是“二次发育”了吗?
在 AI 界,ARC-AGI-2 是公认的“智商收割机”,专门用来测试模型的逻辑推理极限。结果呢?Gemini 3.1 Pro 拿下了 77.1% 的高分。1
这个数字可能不够直观,我们来做个对比:它的前辈 Gemini 3 Pro 只有 31.1%,而那个专门负责“深度思考”的 Gemini 3 Deep Think 也才 45.1%。2 这一跃升,不是什么挤牙膏式的微调,而是妥妥的“二次发育”。
用通俗的话说,以前的 AI 像是背诵全文的学霸,遇到新题型容易抓瞎;而 3.1 Pro 像是突然开了窍,不仅能解题,还能举一反三。
这种“高级推理”在实战中非常强悍。一位开发者分享,他只用了一个提示词(Prompt),Gemini 3.1 Pro 就帮他写出了一个完整的 Windows 11 风格网络操作系统,连文件管理器和 Python 终端都配齐了。1 这种“一站式”解决复杂问题的能力,正是目前各家大厂争夺的制高点。
行业“地震”:谁笑了谁哭了?
在商言商,谷歌这次的杀招在于“反商业”的定价策略。在大多数测试中,Gemini 3.1 Pro 已经能把 Anthropic 的 Opus 4.6 和 OpenAI 的 GPT-5.2 斩于马下,但它的价格却只有 Opus 4.6 的一半。12
调侃点评:谷歌这是要把“性价比”这个词刻进 AI 的 DNA 里,不仅要卷技术,还要断了竞品的财路。
从反馈来看,企业客户已经开始狂欢了:
- 医疗与生命科学:Box AI 的评估显示,准确性从 47% 猛增到 67%。1
- 法律任务:准确率从 57% 提到了 74%。1
- 3D 动画:Cartwheel 发现它解决了长期困扰 3D 转换的旋转顺序死结。1
更有趣的是这个“.1”的版本号。在软件圈,“.1”意味着重要更新而非架构重构。谷歌选这个数字,似乎在傲娇地暗示:“我们的大招还在后头,这只是个开胃菜。”3
未来预测:下一个“风口”在哪里?
随着 Gemini 3.1 Pro 的发布,AI 竞赛的叙事已经发生了 180 度大转弯。去年大家还在担心谷歌是不是掉队了,现在的市场风向变成了“谷歌真香”,甚至直接拉动了母公司 Alphabet 的估值上修。4
当然,Gemini 3.1 Pro 并非全能。在衡量真实世界经济任务的 GDPval-AA 测试中,它距离 Anthropic 的 Sonnet 4.6 还有一截差距。1 这说明 AI 在处理复杂的现实“搞钱”问题时,还是需要继续修炼。
接下来的主战场将是代理式工作流(Agentic Workflows)。谷歌这次同步推出的 Antigravity 开发平台,允许开发者在速度和推理准确性之间“反复横跳”,灵活配置推理预算。23
简单来说,未来的 AI 不再只是个聊天机器人,而是一个能自主操作、会思考方案、且性价比极高的“虚拟员工”。谷歌已经把“推理能力”这一核心护城河挖深了三尺,剩下的就看 OpenAI 和 Anthropic 如何接招了。
这场推理军备竞赛,才刚刚进入最精彩的下半场。
引用
-
Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则 · 极客公园 · 桦林舞王 (2026/2/20) · 检索日期 2026/2/20 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Gemini 3.1 Pro 登場 大幅提升 AI 邏輯推理能力 · Yahoo新聞 · (2026/2/20) · 检索日期 2026/2/20 ↩︎ ↩︎ ↩︎
-
Google发布 Gemini 3.1 Pro:主打“复杂问题求解”的推理升级 · cnBeta · (2026/2/20) · 检索日期 2026/2/20 ↩︎ ↩︎
-
【美股動態】谷歌AI敘事反轉,估值上修仍未封頂 · CMoney · (2026/2/20) · 检索日期 2026/2/20 ↩︎