谷歌新“卷王”驾到：Gemini 3 Flash，代码能力逆天还“白菜价”，OpenAI“红色警报”拉响了？

TL;DR：

谷歌甩出王炸Gemini 3 Flash，不仅速度快、价格亲民，代码能力还逆天，连亲哥Pro版都被它碾压了！AI圈这波内卷简直是“神仙打架”，连OpenAI都坐不住了，吃瓜群众表示：手里的瓜又甜了！

AI圈最近是真“热闹”，前脚OpenAI刚被爆出GPT-5.2“大蒜模型”的各种小道消息¹，后脚谷歌就光速甩出了自己的“王炸”——Gemini 3 Flash！这名字一听就主打一个“快”字，果然，它不仅速度拉满，价格还亲民到哭，更让人拍案叫绝的是，这货的编程能力居然吊打了自家大哥Gemini 3 Pro！这波操作，直接把AI大模型的“内卷”程度又拉高了一个level，搞得整个行业都集体“震动”。

AI界“闪电侠”：跑得快，还特能“码”？

还记得之前Google AI Studio产品负责人 Logan Kilpatrick 在X上发了三个闪电符号的推文吗？当时网友们就嗅到了不对劲，纷纷猜测谷歌是不是要搞个“速度至上”的Flash版本模型。果然，这回预言成真，Gemini 3 Flash带着风火轮来了！

谷歌这次是把“快、狠、准”刻在了Flash的基因里。官方介绍说，这模型拥有“前沿智能，专为速度而生”，能帮大家更快地学习、构建和规划任何事物。听起来是不是有点像AI界的“闪电侠”？但光快可不行，Flash这小家伙的智商也没掉线，在博士级别的推理和知识基准测试，比如GPQA Diamond（90.4%）和Humanity's Last Exam（33.7%），它都表现出足以媲美更大型前沿模型的性能。甚至在多项基准测试中，它还显著超越了之前的**“优等生”**Gemini 2.5 Pro。

不过，最让开发者们**“OMG”的，是它那逆天的编程能力**。在衡量编码代理能力的基准测试SWE-bench Verified中，Gemini 3 Flash的得分高达78%，这可不是闹着玩的！这意味着它不仅超越了2.5系列，甚至连自家更“重”的Gemini 3 Pro都被它甩在了后面。这活脱脱就是个编程界的“天降紫微星”啊，能够在高频工作流中快速推理和解决任务，简直是程序员们的**“梦中情模”**。

“在编程性能上，Gemini 3 Flash 拥有 Gemini 3 专业级的编码性能，同时延迟极低——能够在高频工作流程中快速推理和解决任务。”²

（潜台词：各位程序员，你们的头发可能保住了，也可能秃得更快了，毕竟有了它，活儿可能更多了！）

“白菜价”的性能怪兽：谷歌的“走量”策略？

光有性能还不够，价格更是杀手锏！谷歌这波操作，直接把Gemini 3 Flash的定价定在了每百万输入token 0.50美元，每百万输出token 3美元。虽然比Gemini 2.5 Flash略贵一丢丢，但你得看它带来的性价比爆炸：性能优于Gemini 2.5 Pro，速度更是快了三倍！而且，在处理思维任务时，它平均比2.5 Pro少用30%的token。算下来，这简直就是**“买到就是赚到”**的节奏啊！

“Gemini 3 Flash 的优势在于其极快的速度，它基于 Flash 系列产品打造而成。其性能超越 2.5 Pro，速度提升 3 倍（基于Artificial Analysis基准测试），而价格却低得多。”²

（翻译一下：老板们，省钱又高效的“打工人”来了，不考虑来一打吗？）

这不禁让人思考，谷歌这是要**“走量”了吗？Gemini Models高级总监兼产品负责人 Tulsee Doshi 明确表示，谷歌将Gemini Flash的定位更偏向于“主力机型”，而非高端展示型模型。通过极具竞争力的价格，谷歌试图在企业级应用和开发者生态中建立更具性价比的护城河**。毕竟，现在整个行业对“更快、更便宜、更易部署”的模型呼声是越来越高。

同时，Gemini 3 Flash也已经开始作为搜索中AI模式的默认模型推出，全球用户都将能尝鲜。想象一下，未来的谷歌搜索将由这个**“闪电侠”驱动，解析你的问题更细微，提供周全且易懂的答案，还能结合实时信息和实用链接，效率高到“飞起”**！

OpenAI“红色警报”拉响？AI大厂的“神仙打架”！

谷歌这波**“王炸”，无疑给AI圈的“流量王者”OpenAI带来了不小的压力。有报道称，本月初ChatGPT的整体访问量出现下滑后，OpenAI CEO Sam Altman 甚至向内部团队发出了“红色警报”备忘录¹。随后，OpenAI也“不甘示弱”，接连发布了GPT-5.2以及新的图像生成模型。这厢刚“官宣”完Gemini 3 Flash，那厢就传出GPT-5.2将“专狙Gemini 3”的消息，甚至其首战场还选在了开发者IDECursor，而非ChatGPT网页端。这简直是“神仙打架，凡人吃瓜”**啊！

根据泄露的“大蒜模型”（Project Garlic）文件及Cursor社区的反馈，GPT-5.2是一款经过彻底重构的专用模型，OpenAI首席研究官Mark Chen更是放出豪言，称其在编程和逻辑推理任务上的表现，已经超越了Gemini 3和Anthropic的Opus 4.5。这紧张刺激的节奏，简直比看**“权力的游戏”**还带劲儿！

更有意思的是，此前谷歌AI Studio免费额度的取消，被指与谷歌旗舰图像生成模型Nano Banana Pro（即Gemini 3 Pro Image）的规模化部署存在直接且必然的因果关系。Logan Kilpatrick 也证实了算力资源向新模型倾斜的事实，为了释放算力，以应对3.0 Pro和Nano Banana Pro的巨大增长需求。这背后的潜台词，是不是说：“不好意思，算力不够用了，得把资源给更有潜力的‘亲儿子’们了。”¹

网友：这波操作“真疯狂”，但跑分真的靠谱吗？

谷歌新模型发布后，全球网友都**“炸开了锅”。在X、Hacker News和Reddit等平台上，大家对Gemini系列，尤其是Flash版本，表达了多元观点**：

“太疯狂了！” 有Reddit用户直呼。
“从没见过能力这么强的轻量级模型。” 更多人对Flash的小身板、大能量感到震惊。

然而，也有**“人间清醒”**的网友指出，基准测试的成绩，并不能完全代表真实场景中的表现：

“因为基准测试的成绩，并不能很好地对应真实使用场景。尤其是在实际应用中，使用场景往往非常多样，也远比那些单轮对话的基准测试样本复杂得多。坦率地说，看到 Flash 这种定位更轻量的模型在评分上‘击败’ Pro 版本，反而让我对这种为了刷基准分数的做法产生了怀疑。尤其是最近几周，我一直在同时使用 Gemini 3 Pro 和 Opus 4.5，这两款模型本身都非常出色。但如果只看基准测试，Gemini 理应整体表现更强，可在实际使用中它却一次次让我失望；相反，Opus 4.5 却不断带来惊喜。”²

（这位朋友的吐槽，简直就是把**“跑分玄学”**的痛点说到了心坎里！）

还有用户认为，谷歌最近几次发布已经充分彰显了行业领头羊地位，OpenAI似乎已经被**“拍在沙滩上”**了。

不管怎样，谷歌和OpenAI这种**“你方唱罢我登场”的竞赛，无疑正在推动整个AI行业加速前进**。正如谷歌的Tulsee Doshi所说：“目前整个行业的状态是，各类模型都在快速演进，相互竞争、不断突破性能边界。”这对于开发者和用户来说，无疑是个**“躺赢”的时代，因为我们能见证，甚至亲手体验到AI技术是如何一天一个样，变得越来越“逆天”！**

引用

GPT-5.2提前泄露？今夜，OpenAI要拿Gemini 3祭天！ - 智源社区 · 新智元 · （2025/12/12）· 检索日期2025/12/18 ↩︎ ↩︎ ↩︎
Cursor 又要被秒了？谷歌祭出迄今编程能力最强模型 Gemini 3 Flash！白菜价、但代码能力超过 Gemini 3 Pro · infoQ · （2025/12/18）· 检索日期2025/12/18 ↩︎ ↩︎ ↩︎