谷歌 Gemini 3.1 Flash-Lite 降临:1块8读完三本《三体》,这波“价格战”打得有点自然?

温故智新AIGC实验室

TL;DR:

谷歌反手甩出一张“低价快牌”,Gemini 3.1 Flash-Lite 速度提升2.5倍且价格极低,号称1块8就能刷完三部《三体》。同时配套的 Live 功能让音频 AI 终于告别了“电子感”,开启了陪聊新时代。

大模型圈现在的内卷程度,基本上就是:你不降价,我降价;你降完价,我不仅更便宜,还要比你更快。

谷歌最近就在 Vertex AI 和 AI Studio 上搞了个大动作,发布了 Gemini 3.1 Flash-Lite。听这名字,“Lite”加“Flash”,简直就是把“快且小巧”写在了脸上。如果说以前的大模型是那种要吃满汉全席的高冷大厨,那 Flash-Lite 就是那个只要两分钟就能出餐、且味道还不错的外卖小哥1

技术大揭秘:1块8的“脑力”到底有多顶?

先别急着看技术参数,咱们聊点实际的:性价比

根据官方和博主们的实测,Gemini 3.1 Flash-Lite 几乎是把“省钱”玩到了极致。据说读完《三体》三部曲这种体量的文字,大概只需要 1.8 元人民币2。这种“白菜价”的背后,是谷歌对模型的深度减重。虽然是 Lite 版,但它在指令遵循(Command Following)能力上却没缩水,非常适合处理那种大规模、但任务相对简单的流程3

“这就是典型的‘让牛儿跑,还不给牛吃草’——哦不对,是给牛吃得极少,但牛跑得比以前快了 2.5 倍。”

更重要的是,这次更新不仅是快,还解决了音频输入质量的顽疾1。Gemini 3.1 Flash Live 的出现,让音频 AI 变得更加自然和可靠。以前你跟 AI 语音说话,它可能得反应半天,回你的时候还带着一股浓浓的“翻译腔”;现在,它能更顺滑地接住你的话茬,甚至能听出你语气里的微妙变化。

行业“地震”:谁是大模型的“性价比之王”?

谷歌这一波操作,意图非常明显:抢占应用层的地盘

  1. 开发者福音:通过将低延迟、低成本的 Flash-Lite 作为“分类器”或“路由器”,开发者可以根据任务难度把任务分流。简单的找 Flash-Lite,复杂的再去找 Pro。这就像公司里的前台,能解决的直接解决,解决不了的再转给老板3
  2. 规模化智能:对于需要海量处理数据的企业来说,响应速度提升 2.5 倍意味着生产力的直接翻倍4
  3. 音频社交新可能:当音频 AI 变得足够自然,它就不再是一个冷冰冰的播报员,而是一个可以实时交互的智能伴侣。

当然,老对手 OpenAI 估计也在工位上盯着看呢。现在的 AI 竞赛已经从单纯的“比谁更聪明(参数更大)”转向了“比谁更实用(性价比更高)”5。毕竟,对于大多数打工人和开发者来说,能帮我把活儿干了还不用我破产的模型,才是最好的模型。

未来预测:AI 真的要变成“水电煤”了吗?

看着谷歌不断推陈出新,我们不禁要问:大模型的下一个风口在哪?

或许就在于这种**“无感化”**。当 AI 的价格低到可以忽略不计,速度快到感知不到延迟,且能像真人一样跟你通过语音、文字甚至视频顺畅交流时,它就真的成了数字世界里的“水电煤”。

Gemini 3.1 Flash-Lite 和 Live 的上线,本质上是在降低 AI 的准入门槛。也许不久后,你手机里的每个 App 都会内置一个这种“快如闪电且便宜”的小助手,到时候可千万别被它们的“高情商”给惊到了。

引用


  1. Gemini 3.1 Flash-Lite | Generative AI on Vertex AI · Google Cloud · (2025/05/20) · 检索日期 2025/05/22 ↩︎ ↩︎

  2. 谷歌Gemini最强性价比模型发布,1块8读完三本三体 · 知乎专栏 · (2025/05/21) · 检索日期 2025/05/22 ↩︎

  3. Gemini 3.1 Flash-Lite 预览版 · Google AI for Developers · (2025/05/20) · 检索日期 2025/05/22 ↩︎ ↩︎

  4. 谷歌云代理商| Gemini 3.1 Flash-Lite 已上线:专为规模化智能而生 · Cloud Ace · (2025/05/21) · 检索日期 2025/05/22 ↩︎

  5. AI產業競爭白熱化!谷歌發布Gemini 3.1 Pro推理能力躍升... · YouTube · (2025/05/21) · 检索日期 2025/05/22 ↩︎