TL;DR:
OpenAI推出的GPT-5 Codex凭借“七小时不掉线重构”的突破性“韧性”,彻底颠覆了AI编程代理的效能上限,并加速了软件工程范式的深刻变革。它不仅在与Anthropic Claude的激烈商业竞争中重夺主导权,更指明了通往AGI的实用化路径,但在算力极度稀缺的未来,其大规模普及仍面临基础设施的巨大挑战。
九月十七日,OpenAI正式发布了GPT-5 Codex,一个专为AI辅助编程而深度优化的GPT-5变体。这一里程碑式的发布,不仅在编码代理领域掀起波澜,更以其前所未有的“韧性”——能够连续不掉线工作七小时完成复杂重构任务——重新定义了人机协作的边界,引发了对未来软件工程、AI产业格局乃至AGI(通用人工智能)发展路径的深层思考。1
技术原理与“韧性”代理的创新突破
GPT-5 Codex的核心突破,在于其所展现出的“动态思考时间”和“韧劲”。传统的AI模型在面对复杂、多步骤任务时,往往受限于上下文窗口或决策连贯性,容易“掉线”或产生不连贯的输出。而Codex能够根据任务需求,从几秒到七小时动态调整其“思考”时间,显著提升了在SWE-bench等编码基准测试中的表现,得分高达74.5%,几乎与通用型GPT-5的最高水平持平。12
这种“韧性”并非单纯地塞入更多上下文,而是基于**“交互外壳”(harness)**概念的深度优化。正如OpenAI联合创始人Greg Brockman和Codex团队负责人Thibault Sottiaux所言,模型本身仅是一个输入-输出系统,“harness”则是将其与外部基础设施、工具和“代理循环”(agent loop)集成起来的“身体”。通过在训练中引入多样化环境,并将模型与真实开发场景接驳,Codex学会了自主地寻找上下文、推理、调试,并执行长时间、多阶段的任务。这意味着它不再是简单的代码补全工具,而是一个能够主动规划、行动,并在你放手后长时间连续工作的“合作者”或“实习生”。1
“这个模型展现出一种能力:能坚持更久,具备复杂重构任务所需的‘韧劲’。但同时,对于简单任务,它响应得非常快,不用多想就能给出答案。这让它成为一个很好的合作者——你可以提问、定位代码、规划方案;而一旦放手,它就能长时间连续工作。”1
这种“多面统一”的代理范式,使得Codex能兼顾复杂重构的深度与简单任务的响应速度,极大地提升了其实用性和通用性。其内部代号“10X”的工具,印证了早期对生产力十倍提升的期待。
商业格局:颠覆与再定位的竞技场
GPT-5 Codex的发布,无疑是对Anthropic此前在编码领域主导地位的强力回应。过去一年多,Anthropic的Claude系列模型,特别是Claude 3.5 Sonnet、3.7 Sonnet及Claude Code,在编码场景中表现出色,助推公司营收一路飙升,市值激增。13 这场“编码代理”领域的激烈竞争,凸显了AI编程工具巨大的商业价值和市场潜力。
OpenAI此举不仅是技术上的追赶,更是战略上的再定位。早在2021年,OpenAI的初代Codex催生了GitHub Copilot,奠定了AI编程的基石。此次GPT-5 Codex的推出,以及其多形态的交互界面(Codex CLI、ChatGPT Codex、IDE扩展、GitHub代码审查机器人),构筑了一个全面的“代理生态系统”,旨在覆盖从命令行到IDE,从云端到本地的各种开发者需求。1
从商业敏锐度来看,OpenAI深谙“便利性”与“智能”之间的权衡。早期的Copilot强调低延迟的自动补全,而GPT-4虽更智能却慢。如今,GPT-5 Codex通过改进的“harness”和多样的交互界面,让更强大的智能也能融入工作流,满足了开发者对长期价值回报的需求。它不仅能加速日常编码,更能应对代码迁移、安全补丁、大规模重构等企业级“杀手级应用”,这些正是传统软件工程中耗时耗力、成本高昂的环节。Thibault Sottiaux指出,如果代码迁移成本减半,可能会让迁移数量增加十倍,这蕴含着万亿美元级的市场潜力。1
此外,GPT-5 Codex的定价策略也值得关注。作为Plus和Pro套餐的一部分提供,且智能提升的同时价格大幅下降,这体现了OpenAI通过规模化效应和持续技术优化,降低AI普惠成本的商业逻辑。这种策略不仅能迅速扩大用户基础,还能通过海量使用反馈进一步迭代模型,形成正向飞轮。
软件工程范式的深刻变革与未来图景
GPT-5 Codex的到来,预示着软件工程将从人类“亲力亲为”向**“人机协作,AI代理主导执行”**的范式转变。未来的软件工程师,其核心价值将从编写大量重复性代码,转向更高层次的架构设计、问题定义、指令监督和结果验证。Greg Brockman形象地将AI代理比作一个“实习生”,能够接管那些枯燥琐碎、机械重复的工作,释放人类的创造力去思考更具战略性和创新性的任务。1
在具体应用层面:
- 代码审查:OpenAI内部实践表明,高信号的Codex模式能够深入理解设计意图,验证代码逻辑,甚至发现人类耗时数小时才能察觉的问题,极大地加速了开发流程并提升了代码质量。1 这种能力一旦突破“噪音阈值”,便会从负担变为不可或缺的安全网。
- 调试与问题定位:AI能够自动在终端中“看到”上下文、堆栈追踪和错误信息,取代了繁琐的复制粘贴过程,直接提供解决方案,显著提升了调试效率。
- 代码迁移与重构:Codex的“七小时韧性”使其能自动完成复杂的代码库重构和跨库迁移,这是传统软件工程中最令人头疼的任务之一。
- SRE与工具生成:未来AI不仅能编写和执行自己的代码,还能管理服务,甚至构建新的工具来满足自身或人类的需求,从而搭建起一个不断提升效率的**“复杂度与实用性阶梯”**。
OpenAI的“agents.md”文件,反映了当前代理记忆能力的局限性,但也预示着未来代理将通过探索代码库、学习人类偏好,发展出更强的**“长期记忆与理解”能力。最终的愿景是实现一个“单一的编码实体”**——一个始终在你身边、既能使用自己的云端计算资源,又能“看着你的肩膀”在本地协作的智能伴侣。1
哲学思辨:算力稀缺与“通用智能”的宏大叙事
Greg Brockman强调,OpenAI的使命始终是AGI,而编程之所以成为“特殊例外”,是因为它能作为AGI研究的试金石和加速器。通过让模型在实际编程问题中迭代、与解释器和工具交互,AI能够像人类一样从实践中学习,变得更加健壮和精炼。这不仅仅是编程能力的提升,更是通向通用智能的必经之路。
然而,这场AGI竞赛的宏大叙事背后,隐藏着一个深刻的哲学命题和现实困境:物质极大丰富与算力极度稀缺的悖论。Greg Brockman预测,未来AI将使创造任何东西变得前所未有的容易,带来一个“物质极大丰富”的世界。但与此同时,算力将成为最稀缺的资源。1
“我认为2030年的一个重要图景是:我们将生活在一个‘物质极大丰富’的世界。AI会让创造任何你想要的东西,比你想象中容易得多——这可能不仅在数字世界,在物理世界里也会如此。但同时,这将是一个‘算力极度稀缺’的世界。”1
目前,研究项目为算力争夺的激烈程度已难以言表。要实现“每个人一个专属GPU来运行他们的代理”的未来,需要接近100亿个GPU,这与当前全球算力供应量级相去甚远。因此,如何增加全球算力供应,以及在有限算力下最大化智能效率,成为摆在所有AI研发者面前的物理基础设施挑战,远非单纯的软件问题。此外,GPU靠近用户部署(edge AI)也能显著降低代理与计算资源往返的延迟,提升用户体验,这指向了分布式AI计算架构的未来。
AI的价值也将超越单纯的效率提升。Greg Brockman展望了AI解决“真正全新、困难问题”的潜力,例如在医学和材料科学中进行新药研发或创造全新材料。此时,AI的成果将不再因其便宜或由AI产出而受人瞩目,而是因其突破性本身的价值。这正是AI与科学发现(AI for Science)融合的终极目标。
社会维度:学习、信任与劳动力重塑
GPT-5 Codex不仅改变了软件工程师的工作方式,也对未来的劳动力市场、教育体系和社会信任提出了新的要求。
- 未来工作与学习:Thibault Sottiaux和Greg Brockman一致认为,现在是学习编程的绝佳时机,但更重要的是学会使用AI。AI将大幅降低编程门槛,帮助新手解决语言障碍、提出遗漏问题、并提供优化建议。这意味着未来的教育将更加注重人机协作能力和批判性思维,而非单纯的记忆或重复性技能。拥有坚实软件工程基础的人,将能更好地利用AI代理,走得更远。
- 信任与安全:AI生成的代码会带来信任挑战。如何在不逐行审查AI代码的情况下确保其正确性、安全性和符合人类意图?OpenAI从2017年开始思考的“可扩展监督”(scalable oversight)问题变得尤为重要,即如何让人类或较弱的AI监督更强的AI,逐步建立信任机制。同时,AI的自主性也必须受到严格控制,例如Codex CLI默认在沙箱中运行,需要人类许可才能执行高风险操作,这关乎AI伦理与治理的核心议题。
- 社会基础设施的稳定性:AI在网络安全领域的双刃剑效应不容忽视。它既可能加速攻击者的能力,也可能通过形式化验证(formal verification)等技术解锁全新的防御能力,大幅提升软件系统的稳定性和可理解性。鉴于当前全球大量关键基础设施代码面临安全漏洞风险(如Heartbleed、NPM恶意包),AI有望成为解决这一全球性风险与负担的关键力量,而非仅仅是增加代码量。
GPT-5 Codex以其强大的“韧性”和多维度的代理能力,在AI编程领域取得了里程碑式的进展。它不仅标志着OpenAI在竞争激烈的市场中重获优势,更以实际应用案例,推动着软件工程范式的深刻变革,并以前所未有的速度将AGI的愿景拉近现实。然而,这场技术革命也伴随着算力稀缺的巨大挑战、对人类劳动力和技能的重新定义,以及在AI安全与信任领域持续的哲学思辨与伦理治理。未来已来,学会与“AI实习生”共舞,并以宏大、系统性的视角审视技术对人类文明进程的深层影响,将是每个人、每个企业都必须面对的课题。
引用
-
7小时连续重构不掉线,一骑绝尘的Claude终于遇到对手:Greg Brockman亲自解读AI编程重大突破 · InfoQ · Tina(2025/9/17)· 检索日期2025/9/17 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
OpenAI 发布新模型硬刚Anthropic!Claude Code 刚火,就被GPT-5 ... · InfoQ · (2025/08/08)· 检索日期2025/9/17 ↩︎
-
OpenAI's GPT-5 takes on Anthropic's Claude in coding - Axios · Axios · (2025/08/08) · 检索日期2025/9/17 ↩︎