TL;DR:
Anthropic深夜放大招,推出Claude Sonnet 4.5,这AI简直是“卷王”附体,不仅代码能力封神,还能连轴转30小时帮你“搬砖”!更绝的是,它还自带“安全锁”,价格也YYDS,这波操作直接让AI从“工具人”进化成你的“真同事”了!
昨夜,当无数打工人还在梦乡中,或者正挣扎着完成“KPI”时,人工智能领域的“搞事儿王”Anthropic却悄咪咪地放了个大招——全新模型Claude Sonnet 4.5闪亮登场!这可不是一般的更新,它直接号称是“世界上最好的编码模型”,而且,它还能连轴转30小时不带喘气,帮你把活儿干得漂漂亮亮。Anthropic的联合创始人兼首席科学官贾里德·卡普兰更是直接喊话:“它更像你的同事。”emmm,一个不需要咖啡、不会摸鱼、还能连续工作30小时的同事?这简直是“职场卷王”本人啊!
卷王驾到:AI“码农”不仅会写代码,还能独立“交付产品”?!
以往我们提到AI写代码,总觉得它像个勤奋的“实习生”,能帮你敲敲基础代码,改改小bug。但Sonnet 4.5一上来,就直接告诉你:“我不是实习生,我是项目经理!” 它的核心卖点,就是那“生产级开发任务”的能力。在衡量真实软件编码能力的SWE-bench Verified基准测试中,Sonnet 4.5以77.2%的准确率直接登顶,比前代足足提升了近20个百分点1。这是什么概念?相当于你的“AI码农”一下子从“合格”直接跳到了“优秀”,甚至“卓越”!
更让人大跌眼镜的是它的“续航”能力。据Anthropic介绍,这货在实测中能自主连续运行30小时,一口气生成1.1万行代码,完整开发出一款类似钉钉的企业聊天应用!从数据库配置到域名注册,再到合规审计,全流程搞定,简直是全栈开发者的终极梦想!2 喂,旁边那位程序员小哥,你的饭碗还好吗?
不光是代码,Sonnet 4.5在计算机操作(OSWorld基准测试得分从四个月前的42.2%跃升至61.4%)、金融、法律、医学和STEM等专业领域的推理能力也都突飞猛进,比上一代Opus 4.1提升了30%以上。Anthropic的研究员贾里德·卡普兰就表示:
“用户会发现它更像同事,合作解决问题时非常高效。”2
(内心OS:所以,以后同事吵架,是不是找AI更省心?)
不只模型牛,还送“秘籍”:Agent SDK帮你打造专属“AI分身”
光模型厉害还不够,Anthropic这次还很大方地把自家的“独门秘籍”——Claude Agent SDK(开发工具包)给开源了。3 这可不是闹着玩的,它把Anthropic内部开发Claude Code的核心基础设施直接打包送你! 解决了AI代理开发中那些让人头疼的问题:长期任务记忆管理、自主性与用户控制的平衡、以及多个AI代理之间的**“群聊”调度**。
想象一下,你不再需要从零开始搭积木,Anthropic已经把基础框架给你搭好了。开发者们现在可以基于这个SDK,快速构建自己的定制化AI助手,无论是项目管理、数据处理还是客户服务,都能让AI给你当个得力助手。Anthropic首席产品官迈克·克里格(Mike Krieger)自信满满地表示,这个SDK已经在Canva等大厂验证过,效率蹭蹭往上涨。
此外,Anthropic还顺手升级了产品生态:
- Claude Code 2.0:新增呼声极高的“检查点”功能,支持代码进度保存与即时回滚,配合刷新的终端界面与原生VS Code扩展,大幅提升开发效率。
- API能力强化:新增上下文编辑与记忆工具,使AI代理的持续运行时间从7小时延长至30小时,可处理更复杂的多步骤任务。
- 交互体验革新:Claude应用内直接集成代码执行与文件创建功能,支持在对话中生成电子表格、幻灯片等文档。
- 浏览器拓展落地:面向上月加入候补名单的Max订阅用户,开放Claude for Chrome扩展程序下载使用。
这波操作,简直是给开发者们发了个“神级外挂”!2
不止“能打”,还“听话”:安全感MAX,价格更是“香”到爆!
你可能要问了:AI这么强,会不会“反噬”人类啊?Anthropic表示,请放心! Claude Sonnet 4.5不光能力强,安全性能也是杠杠的。它通过了AI安全等级3(ASL-3)认证,配备了各种危险内容分类检测器,误报率比初代模型降低了90%2。而且,那些让人头疼的“谄媚、欺骗、权力追求”等风险行为,也都大幅减少。
Anthropic联合创始人兼首席科学官贾里德·卡普兰更是直接盖章:
“我认为这是我们在过去一年或一年半中看到的最大安全飞跃。”2
(看来这AI不光是个学霸,还是个“德智体美劳”全面发展的“好孩子”啊!)
更让人惊喜的是它的价格策略。Anthropic非但没涨价,API调用费用还和之前的Claude Sonnet 4完全一致,每百万代币输入3美元、输出15美元。2 这简直是“加量不加价”的业界良心啊!Anthropic首席产品官迈克·克里格都力荐,让Sonnet 4.5成为用户的默认选择,适用于“基本上所有用例”。
这不就是妥妥的“性价比之王”吗?即便如此,Anthropic也留了个“活口”:如果你是Opus的忠实用户,或者暂时不想切换,老款依然欢迎使用。但克里格也偷偷透露,Sonnet 4.5虽然“小一号”,但“几乎在各个方面”都比Opus 4.1更智能。2 这潜台词,不就是“新欢虽小,却更得宠”嘛!
行业分析师们已经看得很清楚了,Claude Sonnet 4.5的发布,标志着AI从“辅助工具”到“独立生产力”的历史性跨越。而那个开放的Agent SDK,就像一个“催化剂”,势必会加速AI代理技术在各行各业的落地生根。贾里德·卡普兰也预告,年底前可能还会有“一两部”更好的作品,包括Opus的升级版。4 看来,AI世界的“内卷”大戏,才刚刚拉开序幕!
引用
-
Anthropic推出Claude Sonnet 4.5,号称“全球最佳编码模型”·华尔街见闻·(2025/09/29)·检索日期2025/09/30 ↩︎
-
Anthropic深夜祭出Claude Sonnet 4.5,能自主连续工作30小时!CEO:它更像你的同事·InfoQ·(2025/09/29)·检索日期2025/09/30 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
30小时,1.1万行代码,Claude Sonnet 4.5 做了什么?·网易·(2025/09/29)·检索日期2025/09/30 ↩︎
-
Anthropic's Claude AI Sonnet 4.5 can continuously work for 30 hours, CEO says it's more like a colleague·CNBC·(2025/09/29)·检索日期2025/09/30 ↩︎