Anthropic Claude Sonnet 4.5:AI打工仔变身“超级卷王”,一口气肝30小时代码?

温故智新AIGC实验室

TL;DR:

Anthropic又来“搞事情”了!新出的Claude Sonnet 4.5模型,不光跑分碾压一众对手,还能像个“永动机”一样自主编码30小时不带歇的,直接把AI程序员的“内卷”程度拉满。开发者们有福了,新工具和Agent SDK让AI当“工头”的梦想触手可及,甚至连AI的安全问题也“卷”出了新高度!

嘿,各位吃瓜群众和码农朋友们,最近科技圈又炸锅了!你们的AI“干饭人”Anthropic,在AI编程这条“赛道”上又踩了一脚油门,直接把新发布的Claude Sonnet 4.5送上了“神坛”,号称这是目前“全球最先进、最安全的编码及复杂软件智能体构建模型”1。这不,**“AI打工仔”摇身一变“超级卷王”**的故事又添新篇章了。

AI打工魂:30小时不眠不休,Claude Sonnet 4.5这是要逆天?

想象一下,你还在为deadline头秃,而隔壁的AI同事已经一口气“肝”了30小时代码,不仅不喊累,还把一个聊天应用从零到有地给搭出来了,甚至连数据库、域名、安全审计都给你安排得明明白白。这不是科幻,这是Anthropic宣称Claude Sonnet 4.5的**“超长待机”能力**12

对比一下,它那个“前辈”Claude 4 Opus,最多也就能撑7小时,这简直是从“临时工”直接晋升“项目经理”的节奏啊!这背后,是模型在长周期任务处理上的质变。在权威的SWE-bench Verified测试中,Claude Sonnet 4.5以82.0%的得分遥遥领先,把OpenAI的GPT-5(72.8%)和谷歌的Gemini 2.5 Pro(67.2%)都甩在了身后。这不就是“考试机器”和“实战高手”的完美结合体吗?1 它不仅能解决GitHub上的真实软件工程问题,还能在OSWorld这种复杂环境中创下61.4%的新纪录,能力提升肉眼可见1

Anthropic的研究员David Hershey在接受TechCrunch采访时透露,早期试用中,Claude Sonnet 4.5不仅写出了约1.1万行代码的类Slack聊天应用,还能自主完成数据库服务搭建、购买域名,甚至搞定SOC 2安全审计。这哪里是AI,分明是个全栈工程师啊!13 难怪Anthropic联合创始人贾里德・卡普兰会说:“Claude Sonnet 4.5更智能、更像一位同事,在遇到问题并解决它们时,与它合作会很有趣。”1 看样子,未来我们的AI同事不仅能帮你写代码,还能跟你**“一起吐槽甲方”**了。

不只当打工人,还要造工具:Agent SDK解锁AI新玩法

光自己能打还不够,Anthropic这次还玩起了“授人以渔”的戏码。伴随Claude Sonnet 4.5的发布,一套“AI打工人”的生产力工具包也新鲜出炉,直击开发者痛点。

想象一下,你写代码的时候,每改动一行,AI就自动给你存个档,想回溯到哪个版本就回溯哪个版本,这不就是程序员的“后悔药”吗?Claude Code的checkpoints功能做到了12。还有原生的VS Code扩展,直接把AI能力集成到你每天用的IDE里,再也不用在各种窗口间“切来切去”了1

更炸裂的是,Anthropic还推出了Claude Agent SDK,直接把自家打造Claude Code的核心基础设施给开放了出来。这意味着,开发者们也能用这套“独门秘籍”去定制化自己的专属AI智能体了,比如搞个金融合规智能体、网络安全小助手啥的。这不就是把**“AI工头”的养成攻略**直接甩给你,让你也能“管理多智能体”实现降本增效吗?13 未来AI不再是单一的“工具人”,而是能组成“智能体大军”帮你打天下,想想都有点小激动呢。

不止卷技能,还要卷安全:大模型“好人卡”怎么拿?

在AI能力一路“狂飙”的同时,Anthropic也没忘了“刹车”——安全。他们强调,Claude Sonnet 4.5是他们“迄今为止最对齐的前沿模型1。这意味着它经过了严格的ASL-3(人工智能安全等级 3)框架训练,大大降低了那些**“歪心思”,比如“谄媚、欺骗和寻求权力”等不良行为的发生率。同时,对于化学、生物、放射和核(CBRN)武器相关的潜在危险内容,模型也部署了“防火墙”**来检测和防止生成。

卡普兰信心满满地表示,这是“我们在一两年内看到的最大安全飞跃”1。这波操作,无疑是在告诉企业客户:“我们不光能干活,还很‘靠谱’,不会‘作妖’。” 在AI安全问题日益凸显的当下,Anthropic用实际行动为AI模型争取了一张**“好人卡”**。毕竟,谁也不想自己的AI助手哪天突然“黑化”了,对吧?

写在最后:

Anthropic的这波操作,无疑给AI编码领域投下了一枚“深水炸弹”。在OpenAI的GPT-5-Codex和谷歌Gemini等**“强敌环伺”的背景下,Anthropic这种“小步快跑,急速迭代”的节奏,不仅展现了AI领域的“内卷”盛况,更预示着“AI Agent”将成为下一个兵家必争之地**。从“辅助工具”到“独立生产力”,AI正在大步迈向更自主、更智能的未来。各位打工人,你们的“AI同事”已经开始“卷”起来了,你准备好和它们**“同台竞技”了吗?或者说,你准备好让它们帮你“卷死”同行**了吗?

引用


  1. Anthropic发布最强编码模型Claude Sonnet 4.5,可自主编码30小时·腾讯科技·无忌(2025/9/30)·检索日期2025/9/30 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. Claude 4.5 刚刚发布,能连肝30 多个小时,史上最卷AI 诞生 - 爱范儿(2025/9/30)·检索日期2025/9/30 ↩︎ ↩︎

  3. Anthropic深夜祭出Claude Sonnet 4.5,能自主连续工作30小时!CEO:它更像你的同事_AI&大模型_李冬梅_InfoQ精选文章·InfoQ(2025/9/30)·检索日期2025/9/30 ↩︎ ↩︎