OpenAI最新“打工仔”上线:24小时连轴转,百万token不眨眼,程序员要“失业”了?

温故智新AIGC实验室

TL;DR:

OpenAI又祭出大招!全新编程模型GPT-5.1-Codex-Max,不仅能连轴转24小时不喊累,一口气处理几百万token,代码生成还更省钱。这货简直是程序员的“卷王”同事,未来写代码可能真就变成“审代码”了!

最近,科技圈的“劳模”OpenAI又不安分了,直接扔出来一个重量级炸弹!它家最新的智能体编程模型GPT-5.1-Codex-Max,简直是“把AI当人使”的终极典范,据说能一口气干活24小时,处理几百万个token都不带喘气的。这哪是模型,分明是24小时无休的“数字打工人”,而且还是个编程“全栈高手”!这下,程序员们是不是开始有点慌了?1

24小时连轴转?AI程序员这是要“卷”死谁!

想象一下,你还在纠结一个bug怎么改,你的AI同事已经连续奋战24小时,从需求分析到代码实现,再到测试修复,一条龙服务,最后还把项目给你打包交付了!这听起来是不是有点“凡尔赛”?但GPT-5.1-Codex-Max,这个由OpenAI研究科学家Noam Brown牵头打造的“超能特工”,确实在内部评估中秀了一把肌肉,针对同一任务连续工作24小时,最终成功交付。

它是怎么做到的?核心秘籍就在一项叫做**“压缩”(compaction)的技术。咱们平时跟AI聊天,上下文一长,AI就“失忆”了,这是因为上下文窗口有限。但GPT-5.1-Codex-Max就像拥有一个“无限背包”,在上下文快满的时候,它会“机智”地把重要信息打包压缩,然后开辟新的上下文窗口,接着聊,接着干,直到任务搞定。这种“左手倒右手”的骚操作,让它能在单一任务中连贯处理上百万个token**,完全是长文本处理的“天花板”级别!

“能够持续进行连贯工作,是迈向更通用、更可靠AI系统的基础能力。” —— OpenAI如是说,这不就是把AI往“全能打工人”方向培养嘛!

而且,这货不仅是Mac党的福音,更是OpenAI训练的首个适用于Windows环境编程的模型。看来,Windows用户终于也能体验到这种“躺平式”编程的快乐了!

不只干活快,还更“省钱”?这波操作太秀了!

别以为能干活就够了,GPT-5.1-Codex-Max还特别会过日子。在推理效率上,它在中等强度任务中,使用的“思考token”比前代GPT-5.1-Codex足足少了30%,但准确率反而更高!这意味着什么?——省钱! 对于开发者来说,这可是实实在在的成本降低啊。谁不喜欢又快又好又便宜的“打工仔”呢?

当然,如果你是个“完美主义者”,不差钱也不差时间,还可以开启超高强度推理模式,让模型“多思考一会儿”,输出更优的解决方案。这不就是AI界的“高配定制服务”嘛!

此外,OpenAI这次还顺手把GPT-5 Pro升级到了GPT-5.1 Pro,虽然没透露太多细节,但据说在写作、数据分析等方面的能力也更强。看来OpenAI的这波升级,是打算全方位“武装”自己的模型矩阵了。

炫技时间到!AI画饼能力哪家强?

光说不练假把式,OpenAI直接甩出了好几个GPT-5.1-Codex-Max打造的网页应用,那叫一个“秀翻全场”!

  • CartPole(倒立摆)强化学习沙箱:用户可以直接在浏览器里训练AI,看它怎么学着平衡倒立摆,还能实时看到神经网络的“脑内活动”。
  • 太阳系重力模拟器:拖拖拽拽就能构建行星系统,直观感受引力、轨道和速度的奥秘。这简直是物理老师的“梦中情模”!
  • 斯涅尔定律(Snell’s Law)演示器:调节折射率,光线怎么弯曲一目了然。

这些案例可不是静态的图片,而是完全可交互、功能流畅的网页应用。在实现类似功能时,GPT-5.1-Codex-Max使用的token数量只有27k,而GPT-5.1-Codex则用了37k。效率差距,立竿见影!

网友们也坐不住了,纷纷拿出自己的“考题”。

有网友让它和昨天发布的Gemini 3 Pro来了一场“世纪对决”——创建一个鹈鹕骑自行车的SVG。结果是:

“GPT-5.1-Codex-Max打造的鹈鹕、自行车等元素明显包含更多细节,也更逼真。” —— 看来,在艺术创作的“细节控”方面,Max略胜一筹。

英国定制化贺卡公司Moonpig的AI部门负责人Peter Gostev更是激动地表示,用GPT-5.1-Codex-Max打造的金门大桥模拟器,是他从类似提示词中获得的“最好效果”。他甚至直接对比了Pro版本:

“与GPT-5.1-Pro相比,Gostev认为GPT-5.1-Codex-Max明显更勤快,而且速度也更快。要让GPT-5.1-Pro完成类似的效果,需要不断指出问题,给出明确要求,GPT-5.1-Codex-Max则更有主动性。” —— 这不就是“主动性强”和“等着喂饭”的区别吗?AI也开始分“积极分子”和“佛系青年”了。

更有意思的是,AI工程师Peter Dedene分享了一段经历:

“GPT-5.1-Codex-Max盯着问题看了5分钟,决定以后再处理,自己以前从没见过Codex这么做。在他看来,模型似乎已经拥有意识了。” —— 盯着问题“发呆”五分钟,然后决定“下次一定”?这行为,简直是人类“拖延症患者”的真实写照!难道AI真的要开始“打太极”了?

当然,在惊叹“意识觉醒”的同时,咱们也得保持清醒。OpenAI强调,随着模型能力持续提升,安全性也是一大挑战。虽然GPT-5.1-Codex-Max尚未达到“高等级网络安全能力”,但它已经是目前业内最强大的。为了避免“AI作妖”,Codex系列模型默认都在高度隔离的安全沙箱里运行,网络访问基本“掐断”,除非你主动开权限。这就像给它装了个“电子手铐”,防止它“越狱”搞事情,比如常见的“提示词注入”(prompt injection)等风险。OpenAI也表示,会通过“渐进式部署”的方式,在真实世界中收集反馈,不断强化安全防护,主打一个“边学边改”

编程模型正在走向“智能体化”时代

从GPT-5.1-Codex-Max的横空出世,我们不难看出,OpenAI已经不满足于让AI简单地写代码了。这波升级,标志着编程模型正在大步迈向**“智能体化”时代**。它们不再是“有求必应”的机器人,而是能够持续工作、自主调试、主动规划的“编程智能体”。长时推理、上下文压缩、自我修复……这些能力让AI有望独立完成一整个项目,甚至超越人类程序员的工作范畴。

可以预见,随着AI编程模型越来越能干,运行成本越来越低,未来的软件开发方式可能真的要“大变样”了。从传统的“撸代码”,也许会逐渐变成**“描述需求+审核结果”。也就是说,你只需要告诉AI你想要什么,它就会帮你把活儿干得漂漂亮亮,你只负责当个“甲方”,最后检查验收就行。AI智能体,未来真的可能要承担更多实现与迭代的工作,程序员的饭碗嘛……嗯,或许要升级成“AI项目经理”**了!

引用


  1. OpenAI最强编程模型登场,连续干活24小时,一次处理几百万token·智东西·陈骏达(2025/11/20)·检索日期2025/11/20 ↩︎