GPT-5.4 mini/nano 突袭:1/3 价格养出“满血”战力,OpenAI 这是要卷死谁?

温故智新AIGC实验室

TL;DR:

OpenAI 深夜“不讲武德”,祭出 GPT-5.4 mini 和 nano 双杀,主打一个“便宜大碗还跑得快”。性能直逼旗舰版,甚至能像真人一样“看屏幕干活”,简直是开发者和创业者的省钱救星,奥特曼:谢谢你们(写代码),剩下的交给我。

OpenAI 总是喜欢在大家快要进入梦乡的时候搞点“偷袭”。没有华丽的发布会,没有倒计时的预热,GPT-5.4 mini 和 GPT-5.4 nano 就这样悄无声息地直接上线了。1

如果说 GPT-5.4 是那种买不起也舍不得开的顶级超跑,那么这次发布的 mini 和 nano 简直就是装了火箭引擎的“平民神车”——不仅价格砍到了大动脉上,性能还硬生生磨到了旗舰版的脚后跟。

技术大揭秘:这玩意儿真能“以小博大”?

在很多人的印象里,“缩水版”模型通常意味着智力降级。但这次 GPT-5.4 mini 的表现,简直是拿着“轻量级”的入场券,跑去“重量级”赛场砸场子。

最让人掉下巴的是它的编码能力。在硬核的 SWE-Bench Pro(直接让模型修复 GitHub 上的真实 Bug)测试中,GPT-5.4 mini 拿下了 54.4% 的高分,而旗舰版 GPT-5.4 也不过是 57.7%。2

调侃式点评: 仅仅 3.3 个百分点的差距,价格却只有人家的三分之一,这性价比让还在交旗舰版“智商税”的开发者们情何以堪?

更别提速度了。相比上一代,GPT-5.4 mini 的运行速度直接飙升了 2 倍。这意味着,以前你等模型跑代码的时间够喝一杯美式,现在可能刚撕开糖包,代码就写完了。1 而超轻量级的 nano 表现同样不俗,甚至在很多指标上吊打了上一代的 mini 选手,这就是大模型“蒸馏”技术的恐怖进化速度。2

行业“地震”:谁在笑,谁在哭?

这次发布最重磅的信号,其实是 OpenAI 正在把 AI 推向“全自动助理(AI Agent)”时代。

以往的小模型,看个截图都费劲,更别提操作电脑了。但 GPT-5.4 mini 在 OSWorld(计算机使用基准)测试中拿到了 72.1%,几乎追平了旗舰版的 75.0%。2

这意味着,那些需要“看屏幕、动鼠标、填表格”的繁杂工作,以后都可以交给低成本的 mini 来处理。对此,OpenAI 明确提出了一个**“子智能体架构”**:

  1. GPT-5.4(指挥官): 负责思考、规划和发号施令。
  2. GPT-5.4 mini(执行队): 负责大量并行的繁琐任务,比如检索代码、审查文件。
  3. GPT-5.4 nano(小助理): 负责简单的数据分类和排序。2

这种分工明确的“模型大乱斗”,能让开发者的综合成本再降一个量级。难怪有人试用后直呼,mini 配合 Codex 简直比竞品 Claude 4.6 Opus 便宜了快 10 倍,“真香”定律再次应验。1

未来预测:下一个“风口”是变慢还是变快?

技术狂奔的同时,奥特曼的一条推文却把气氛搞得有点尴尬。他发文感谢那些“逐字逐句”写出复杂软件的开发者,称这种努力以后可能很难想象了。3

评论区瞬间破防:“谢谢你啊,感谢我们的方式就是让我们丢饭碗?”

但争议归争议,趋势是不可逆的。当 AI 的智力成本从“奢侈品”变成“自来水”,软件工程的核心竞争力正在发生质变:你会不会写那几行代码不再重要,重要的是你能不能设计出一套让 AI 完美跑起来的系统。

GPT-5.4 mini 和 nano 的出现,标志着大模型不再只是云端的神谕,而是正在变成每一个 App、每一个手机功能里的“毛细血管”。它够快、够强、够便宜,剩下的,就看人类怎么“压榨”它们了。

引用


  1. GPT-5.4 mini+nano突袭,1/3价格养满血「龙虾」,OpenAI彻底杀疯 · 新智元 · 36氪 (2026/03/18) · 检索日期 2026/03/18 ↩︎ ↩︎ ↩︎

  2. OpenAI发布GPT-5.4 mini与nano,以更低成本逼近旗舰模型性能 · 华尔街见闻 · 鲍奕龙 (2026/03/17) · 检索日期 2026/03/18 ↩︎ ↩︎ ↩︎ ↩︎

  3. OpenAI 發佈GPT-5.4 mini 與nano 號稱迄今最強大小型模型 · 流動日報 (2026/03/18) · 检索日期 2026/03/18 ↩︎