TL;DR:
Anthropic家新晋“卷王”Claude Sonnet 4.5横空出世,不仅能一口气连肝30多小时写代码,还直接登顶编程榜首,大有“降智风波”后绝地反击,把对手卷到“内伤”的架势!
嘿,各位“打工人”注意了,你们的“卷王”AI又升级了!当你们还在为“996”焦虑时,AI界的“肝帝”已经悄悄进化到了一个新高度。Anthropic在没有任何预告的情况下,直接甩出了王炸——Claude Sonnet 4.5,这款新模型一上线就放出豪言:它是全球最强编程模型,还能连续专注干活超过30小时!1 是的,你没看错,是30!小!时! 人类程序员直呼:“放过我们吧!”
AI“肝帝”的硬核实力:不是在写代码,就是在“肝”代码!
这波操作,简直是AI界的“史诗级加强”。Anthropic这次拿出的成绩单,亮眼得让人怀疑人生。在考察真实编程水平的SWE-bench Verified测试里,Claude Sonnet 4.5直接登顶业界第一,把各路编程高手都甩在了身后。这不就是传说中的“别人家的孩子”吗?
更令人惊掉下巴的是,它的“续航”能力堪比永动机。想象一下,让它写个类似Slack或Teams的聊天应用,它能一口气敲出大约1.1万行代码。要知道,之前的Claude Opus 4 和 OpenAI 的Codex,最多也就只能独立工作七小时。这差距,简直是从“普通员工”到“超级赛亚人”的飞跃。用Anthropic的话来说,Claude Sonnet 4.5 现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学,各项能力都狠狠提升了一波。2
不光是编程,在OSWorld这种专门测试真实计算机任务的基准测试里,它也以61.4%的成绩直接问鼎。四个月前,Sonnet 4 以42.2%的成绩遥遥领先,这才多久,性能又被“抬”了一大截。而且,Anthropic的Claude Chrome插件甚至能直接在浏览器里“自我导航”、填表格、处理任务,像个真人老司机在操作似的。
技术堆料:AI Agent的“养成攻略”已上线
光是模型强还不够,Anthropic 这次还把“工具箱”都给你备齐了,简直是把“宠粉”两个字刻在了脑门上:
- Claude Code 新增“检查点”功能:写代码不再怕翻车,随时保存,想回退到之前的“完美状态”一键搞定。这不就是游戏里的“存档点”吗?
- 终端界面翻新+原生VS Code插件:让程序员小哥哥小姐姐们用起来更顺手,沉浸式开发体验,一整个爱住!
- Claude API 升级:增加了上下文编辑功能和记忆工具,代码执行和文件创建直接整合到对话里。这效率,简直了!
- 重磅推出 Claude Agent SDK:这是个啥?Anthropic直接把自己内部用来搭建Claude Code 的底层基础设施给开放出来了。这意味着,构建智能体那些头疼的问题,比如记忆管理、自主性与用户控制的平衡、多子智能体协作,现在你也能“抄作业”了。这下,人人都能成为AI“驯兽师”了,想想都觉得刺激!
有网友@vasumanmoza 体验完直接发帖:“Claude 4.5 Sonnet 刚在一次调用里重构了我整个代码库,25 次工具调用,新增 3000 多行代码,生成了 12 个全新文件。它把所有东西都模块化了,拆掉了巨石式结构,清理了意大利面条式代码。结果完全跑不通,但天啊真的很优雅。”这评价,属于又爱又恨那种,像极了被AI“整活儿”的我们。
值得一提的是,Anthropic还在Claude Sonnet 4.5 发布的同时,推出了一个临时研究预览功能——“Imagine with Claude”。在这个功能里,Claude会实时生成软件,所有功能、所有代码都不是预设、提前写好的,而是Claude在跟你互动时当场创造和调整出来的。这种“活久见”的体验,估计会让不少极客直呼YYDS。
“降智风波”后,Claude 4.5能否打个“翻身仗”?
等等,是不是觉得这个故事有点熟悉?是的,就在几个月前,Claude系列模型刚经历了一场**“降智”风波**,用户普遍反映模型推理、代码、格式和工具调用质量“断崖式下滑”,连付费用户都抱怨连连。Anthropic后来虽然紧急回滚了更新,承认了Bug,还声明“绝非为省成本故意降智”,但用户流失已成事实。GitHub和X等平台上甚至出现了“退订潮”,不少人直接转投了OpenAI的Codex。
所以,这次Claude Sonnet 4.5的发布,显然就是Anthropic为挽回用户口碑打出的一张“诚意牌”和“性能牌”。它不仅在性能上做到了极致对齐,减少了“阿谀奉承、欺骗”等AI行为,还在防御提示注入攻击和减少内容误判上取得了重大突破。这波操作,简直是AI界的“洗白”和“回炉重造”,至于能不能成功上演“真香定律”,就看市场接下来几周的实际表现了。
行业“卷王”的修罗场:正面“硬刚”OpenAI?
Anthropic 这次发布的时间点,卡得也颇为“心机”。就在OpenAI年度开发者大会前一周,突然发布了自家“史上最卷AI”,这明摆着就是要给竞争对手上一波压力,上演一出“踢馆”大戏。
毕竟,今年的AI赛道依旧是“卷编程”的一年。Anthropic虽然估值已经到了1830亿美元,年化营收也达到了50亿美元,但其中相当一部分增长是靠着编程软件的普及。老对手OpenAI和Google Gemini也都在疯狂推类似工具抢程序员用户,这场AI编程界的“华山论剑”,才刚刚拉开序幕。
Anthropic联合创始人兼首席科学官Jared Kaplan更是自信满满地表示,更先进的Opus模型预计今年晚些时候推出:“Anthropic在大小模型的使用上都能占优势。”看来,AI巨头们的“内卷”大戏,才刚刚开始。