TL;DR:
谷歌甩出王炸Gemini 3 Flash,不仅速度快、价格亲民,代码能力还逆天,连亲哥Pro版都被它碾压了!AI圈这波内卷简直是“神仙打架”,连OpenAI都坐不住了,吃瓜群众表示:手里的瓜又甜了!
AI圈最近是真“热闹”,前脚OpenAI刚被爆出GPT-5.2“大蒜模型”的各种小道消息1,后脚谷歌就光速甩出了自己的“王炸”——Gemini 3 Flash!这名字一听就主打一个“快”字,果然,它不仅速度拉满,价格还亲民到哭,更让人拍案叫绝的是,这货的编程能力居然吊打了自家大哥Gemini 3 Pro!这波操作,直接把AI大模型的“内卷”程度又拉高了一个level,搞得整个行业都集体“震动”。
AI界“闪电侠”:跑得快,还特能“码”?
还记得之前Google AI Studio产品负责人 Logan Kilpatrick 在X上发了三个闪电符号的推文吗?当时网友们就嗅到了不对劲,纷纷猜测谷歌是不是要搞个“速度至上”的Flash版本模型。果然,这回预言成真,Gemini 3 Flash带着风火轮来了!
谷歌这次是把“快、狠、准”刻在了Flash的基因里。官方介绍说,这模型拥有“前沿智能,专为速度而生”,能帮大家更快地学习、构建和规划任何事物。听起来是不是有点像AI界的“闪电侠”?但光快可不行,Flash这小家伙的智商也没掉线,在博士级别的推理和知识基准测试,比如GPQA Diamond(90.4%)和Humanity's Last Exam(33.7%),它都表现出足以媲美更大型前沿模型的性能。甚至在多项基准测试中,它还显著超越了之前的**“优等生”**Gemini 2.5 Pro。
不过,最让开发者们**“OMG”的,是它那逆天的编程能力**。在衡量编码代理能力的基准测试SWE-bench Verified中,Gemini 3 Flash的得分高达78%,这可不是闹着玩的!这意味着它不仅超越了2.5系列,甚至连自家更“重”的Gemini 3 Pro都被它甩在了后面。这活脱脱就是个编程界的“天降紫微星”啊,能够在高频工作流中快速推理和解决任务,简直是程序员们的**“梦中情模”**。
“在编程性能上,Gemini 3 Flash 拥有 Gemini 3 专业级的编码性能,同时延迟极低——能够在高频工作流程中快速推理和解决任务。”2
(潜台词:各位程序员,你们的头发可能保住了,也可能秃得更快了,毕竟有了它,活儿可能更多了!)
“白菜价”的性能怪兽:谷歌的“走量”策略?
光有性能还不够,价格更是杀手锏!谷歌这波操作,直接把Gemini 3 Flash的定价定在了每百万输入token 0.50美元,每百万输出token 3美元。虽然比Gemini 2.5 Flash略贵一丢丢,但你得看它带来的性价比爆炸:性能优于Gemini 2.5 Pro,速度更是快了三倍!而且,在处理思维任务时,它平均比2.5 Pro少用30%的token。算下来,这简直就是**“买到就是赚到”**的节奏啊!
“Gemini 3 Flash 的优势在于其极快的速度,它基于 Flash 系列产品打造而成。其性能超越 2.5 Pro,速度提升 3 倍(基于Artificial Analysis基准测试),而价格却低得多。”2
(翻译一下:老板们,省钱又高效的“打工人”来了,不考虑来一打吗?)
这不禁让人思考,谷歌这是要**“走量”了吗?Gemini Models高级总监兼产品负责人 Tulsee Doshi 明确表示,谷歌将Gemini Flash的定位更偏向于“主力机型”,而非高端展示型模型。通过极具竞争力的价格,谷歌试图在企业级应用和开发者生态中建立更具性价比的护城河**。毕竟,现在整个行业对“更快、更便宜、更易部署”的模型呼声是越来越高。
同时,Gemini 3 Flash也已经开始作为搜索中AI模式的默认模型推出,全球用户都将能尝鲜。想象一下,未来的谷歌搜索将由这个**“闪电侠”驱动,解析你的问题更细微,提供周全且易懂的答案,还能结合实时信息和实用链接,效率高到“飞起”**!
OpenAI“红色警报”拉响?AI大厂的“神仙打架”!
谷歌这波**“王炸”,无疑给AI圈的“流量王者”OpenAI带来了不小的压力。有报道称,本月初ChatGPT的整体访问量出现下滑后,OpenAI CEO Sam Altman 甚至向内部团队发出了“红色警报”备忘录1。随后,OpenAI也“不甘示弱”,接连发布了GPT-5.2以及新的图像生成模型。这厢刚“官宣”完Gemini 3 Flash,那厢就传出GPT-5.2将“专狙Gemini 3”的消息,甚至其首战场还选在了开发者IDECursor,而非ChatGPT网页端。这简直是“神仙打架,凡人吃瓜”**啊!
根据泄露的“大蒜模型”(Project Garlic)文件及Cursor社区的反馈,GPT-5.2是一款经过彻底重构的专用模型,OpenAI首席研究官Mark Chen更是放出豪言,称其在编程和逻辑推理任务上的表现,已经超越了Gemini 3和Anthropic的Opus 4.5。这紧张刺激的节奏,简直比看**“权力的游戏”**还带劲儿!
更有意思的是,此前谷歌AI Studio免费额度的取消,被指与谷歌旗舰图像生成模型Nano Banana Pro(即Gemini 3 Pro Image)的规模化部署存在直接且必然的因果关系。Logan Kilpatrick 也证实了算力资源向新模型倾斜的事实,为了释放算力,以应对3.0 Pro和Nano Banana Pro的巨大增长需求。这背后的潜台词,是不是说:“不好意思,算力不够用了,得把资源给更有潜力的‘亲儿子’们了。”1
网友:这波操作“真疯狂”,但跑分真的靠谱吗?
谷歌新模型发布后,全球网友都**“炸开了锅”。在X、Hacker News和Reddit等平台上,大家对Gemini系列,尤其是Flash版本,表达了多元观点**:
- “太疯狂了!” 有Reddit用户直呼。
- “从没见过能力这么强的轻量级模型。” 更多人对Flash的小身板、大能量感到震惊。
然而,也有**“人间清醒”**的网友指出,基准测试的成绩,并不能完全代表真实场景中的表现:
“因为基准测试的成绩,并不能很好地对应真实使用场景。尤其是在实际应用中,使用场景往往非常多样,也远比那些单轮对话的基准测试样本复杂得多。坦率地说,看到 Flash 这种定位更轻量的模型在评分上‘击败’ Pro 版本,反而让我对这种为了刷基准分数的做法产生了怀疑。尤其是最近几周,我一直在同时使用 Gemini 3 Pro 和 Opus 4.5,这两款模型本身都非常出色。但如果只看基准测试,Gemini 理应整体表现更强,可在实际使用中它却一次次让我失望;相反,Opus 4.5 却不断带来惊喜。”2
(这位朋友的吐槽,简直就是把**“跑分玄学”**的痛点说到了心坎里!)
还有用户认为,谷歌最近几次发布已经充分彰显了行业领头羊地位,OpenAI似乎已经被**“拍在沙滩上”**了。
不管怎样,谷歌和OpenAI这种**“你方唱罢我登场”的竞赛,无疑正在推动整个AI行业加速前进**。正如谷歌的Tulsee Doshi所说:“目前整个行业的状态是,各类模型都在快速演进,相互竞争、不断突破性能边界。”这对于开发者和用户来说,无疑是个**“躺赢”的时代,因为我们能见证,甚至亲手体验到AI技术是如何一天一个样,变得越来越“逆天”!**