OpenAI最新“打工仔”上线：24小时连轴转，百万token不眨眼，程序员要“失业”了？

TL;DR：

OpenAI又祭出大招！全新编程模型GPT-5.1-Codex-Max，不仅能连轴转24小时不喊累，一口气处理几百万token，代码生成还更省钱。这货简直是程序员的“卷王”同事，未来写代码可能真就变成“审代码”了！

最近，科技圈的“劳模”OpenAI又不安分了，直接扔出来一个重量级炸弹！它家最新的智能体编程模型GPT-5.1-Codex-Max，简直是“把AI当人使”的终极典范，据说能一口气干活24小时，处理几百万个token都不带喘气的。这哪是模型，分明是24小时无休的“数字打工人”，而且还是个编程“全栈高手”！这下，程序员们是不是开始有点慌了？¹

24小时连轴转？AI程序员这是要“卷”死谁！

想象一下，你还在纠结一个bug怎么改，你的AI同事已经连续奋战24小时，从需求分析到代码实现，再到测试修复，一条龙服务，最后还把项目给你打包交付了！这听起来是不是有点“凡尔赛”？但GPT-5.1-Codex-Max，这个由OpenAI研究科学家Noam Brown牵头打造的“超能特工”，确实在内部评估中秀了一把肌肉，针对同一任务连续工作24小时，最终成功交付。

它是怎么做到的？核心秘籍就在一项叫做**“压缩”（compaction）的技术。咱们平时跟AI聊天，上下文一长，AI就“失忆”了，这是因为上下文窗口有限。但GPT-5.1-Codex-Max就像拥有一个“无限背包”，在上下文快满的时候，它会“机智”地把重要信息打包压缩，然后开辟新的上下文窗口，接着聊，接着干，直到任务搞定。这种“左手倒右手”的骚操作，让它能在单一任务中连贯处理上百万个token**，完全是长文本处理的“天花板”级别！

“能够持续进行连贯工作，是迈向更通用、更可靠AI系统的基础能力。” —— OpenAI如是说，这不就是把AI往“全能打工人”方向培养嘛！

而且，这货不仅是Mac党的福音，更是OpenAI训练的首个适用于Windows环境编程的模型。看来，Windows用户终于也能体验到这种“躺平式”编程的快乐了！

不只干活快，还更“省钱”？这波操作太秀了！

别以为能干活就够了，GPT-5.1-Codex-Max还特别会过日子。在推理效率上，它在中等强度任务中，使用的“思考token”比前代GPT-5.1-Codex足足少了30%，但准确率反而更高！这意味着什么？——省钱！ 对于开发者来说，这可是实实在在的成本降低啊。谁不喜欢又快又好又便宜的“打工仔”呢？

当然，如果你是个“完美主义者”，不差钱也不差时间，还可以开启超高强度推理模式，让模型“多思考一会儿”，输出更优的解决方案。这不就是AI界的“高配定制服务”嘛！

此外，OpenAI这次还顺手把GPT-5 Pro升级到了GPT-5.1 Pro，虽然没透露太多细节，但据说在写作、数据分析等方面的能力也更强。看来OpenAI的这波升级，是打算全方位“武装”自己的模型矩阵了。

炫技时间到！AI画饼能力哪家强？

光说不练假把式，OpenAI直接甩出了好几个GPT-5.1-Codex-Max打造的网页应用，那叫一个“秀翻全场”！

CartPole（倒立摆）强化学习沙箱：用户可以直接在浏览器里训练AI，看它怎么学着平衡倒立摆，还能实时看到神经网络的“脑内活动”。
太阳系重力模拟器：拖拖拽拽就能构建行星系统，直观感受引力、轨道和速度的奥秘。这简直是物理老师的“梦中情模”！
斯涅尔定律（Snell’s Law）演示器：调节折射率，光线怎么弯曲一目了然。

这些案例可不是静态的图片，而是完全可交互、功能流畅的网页应用。在实现类似功能时，GPT-5.1-Codex-Max使用的token数量只有27k，而GPT-5.1-Codex则用了37k。效率差距，立竿见影！

网友们也坐不住了，纷纷拿出自己的“考题”。

有网友让它和昨天发布的Gemini 3 Pro来了一场“世纪对决”——创建一个鹈鹕骑自行车的SVG。结果是：

“GPT-5.1-Codex-Max打造的鹈鹕、自行车等元素明显包含更多细节，也更逼真。” —— 看来，在艺术创作的“细节控”方面，Max略胜一筹。

英国定制化贺卡公司Moonpig的AI部门负责人Peter Gostev更是激动地表示，用GPT-5.1-Codex-Max打造的金门大桥模拟器，是他从类似提示词中获得的“最好效果”。他甚至直接对比了Pro版本：

“与GPT-5.1-Pro相比，Gostev认为GPT-5.1-Codex-Max明显更勤快，而且速度也更快。要让GPT-5.1-Pro完成类似的效果，需要不断指出问题，给出明确要求，GPT-5.1-Codex-Max则更有主动性。” —— 这不就是“主动性强”和“等着喂饭”的区别吗？AI也开始分“积极分子”和“佛系青年”了。

更有意思的是，AI工程师Peter Dedene分享了一段经历：

“GPT-5.1-Codex-Max盯着问题看了5分钟，决定以后再处理，自己以前从没见过Codex这么做。在他看来，模型似乎已经拥有意识了。” —— 盯着问题“发呆”五分钟，然后决定“下次一定”？这行为，简直是人类“拖延症患者”的真实写照！难道AI真的要开始“打太极”了？

当然，在惊叹“意识觉醒”的同时，咱们也得保持清醒。OpenAI强调，随着模型能力持续提升，安全性也是一大挑战。虽然GPT-5.1-Codex-Max尚未达到“高等级网络安全能力”，但它已经是目前业内最强大的。为了避免“AI作妖”，Codex系列模型默认都在高度隔离的安全沙箱里运行，网络访问基本“掐断”，除非你主动开权限。这就像给它装了个“电子手铐”，防止它“越狱”搞事情，比如常见的“提示词注入”（prompt injection）等风险。OpenAI也表示，会通过“渐进式部署”的方式，在真实世界中收集反馈，不断强化安全防护，主打一个“边学边改”。

编程模型正在走向“智能体化”时代

从GPT-5.1-Codex-Max的横空出世，我们不难看出，OpenAI已经不满足于让AI简单地写代码了。这波升级，标志着编程模型正在大步迈向**“智能体化”时代**。它们不再是“有求必应”的机器人，而是能够持续工作、自主调试、主动规划的“编程智能体”。长时推理、上下文压缩、自我修复……这些能力让AI有望独立完成一整个项目，甚至超越人类程序员的工作范畴。

可以预见，随着AI编程模型越来越能干，运行成本越来越低，未来的软件开发方式可能真的要“大变样”了。从传统的“撸代码”，也许会逐渐变成**“描述需求+审核结果”。也就是说，你只需要告诉AI你想要什么，它就会帮你把活儿干得漂漂亮亮，你只负责当个“甲方”，最后检查验收就行。AI智能体，未来真的可能要承担更多实现与迭代的工作，程序员的饭碗嘛……嗯，或许要升级成“AI项目经理”**了！

引用

OpenAI最强编程模型登场，连续干活24小时，一次处理几百万token·智东西·陈骏达（2025/11/20）·检索日期2025/11/20 ↩︎