TL;DR:
Anthropic又放了一个大招,发布了号称“地表最强”的AI编程模型Claude Sonnet 4.5!这货不仅代码写得溜到飞起,还能当你的“智能助理”,甚至自己跑程序、生文件,简直是打工人“逆天改命”的YYDS!
北京时间今天凌晨,AI圈又投下了一颗重磅炸弹! Anthropic,那个老是喜欢搞事情的科技公司,悄咪咪地就把Claude Sonnet 4.5给放出来了。别看只是个".5"版本,官方直接甩话:这不只是升级,这是**“全球最强代码模型”**的降临!此话一出,程序员们,你们手里的键盘还稳得住吗?反正我是准备搬好小板凳,看一场“百模大战”的新高潮了。
卷王驾到:代码世界要“变天”了?
想象一下,你还在为一串串bug挠头抓耳,而隔壁的AI已经能一口气写30小时的代码不带歇的,是不是瞬间感觉被**“降维打击”了?Sonnet 4.5可不是吹的,它在真实软件编码能力测试SWE-bench Verified上直接拿下了最新的最优水平**,能专注执行复杂的多步骤任务超过30小时1。没错,就是30小时!这妥妥是**“打工人梦寐以求的同事”**,还是那种永远不会抱怨加班的!
不光是写代码,它对计算机的理解和操作能力也是**“开挂”级别。在模拟真实计算机任务的OSWorld基准测试中,Sonnet 4.5的成绩直接从四个月前的42.2%飙升到61.4%,直接登顶榜首1。这说明它不仅能听懂人话,还能“手把手”**(或者说是“代码把代码”)教电脑干活。有大佬直言:
“Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作。”1
还有Replit的总裁Michele Catasta更是兴奋表示,内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%!1 0%啊!这是什么概念?这意味着你的bug可能还没来得及出生,就被Sonnet 4.5扼杀在了摇篮里。对于我们这些常常被bug折磨的普通人来说,简直是**“人间理想”**。
这还没完,它的推理和数学能力也来了个**“大跃进”。在金融、法律、医学和STEM等专业领域,Sonnet 4.5的表现远超此前的Opus 4.1,简直就是个“全能学霸”**,不仅会写代码,还会答题,关键是还都答得又快又准。看来以后“文科生不懂编程,理科生不懂金融”的段子要失效了,因为AI都要替我们懂了!
AI Agent进化论:不只是写代码,它还要“包圆儿”!
如果你以为Sonnet 4.5只会写代码,那你就**“大错特错”了。Anthropic这次把“智能体(Agent)”**玩出了新花样。
想象一下,你有一个超级助理,能随时保存你代码的进度,不满意还能一键回滚到上一个**“检查点”。Claude Code的新功能“检查点”就是这么一个“后悔药”**,妈妈再也不用担心我改错代码,一顿操作猛如虎,一看原地两小时了!
更酷的是,Claude API新增了上下文编辑和记忆工具。这意味着你的AI智能体不再是“金鱼记忆”,它能长时间记住你交代过的任务,处理更复杂的流程。就像《西部世界》里的智能机器人一样,有了记忆,AI的**“人设”**才能立得住,才能更好地为你服务。
Claude apps也升级了,直接在对话中就能执行代码、生成文件(表格、幻灯片、文档),这不就是把办公软件和编程环境**“一口吞”了吗?打工人以后可能只需要和Claude聊聊天,文件就自动生成了,老板看了都直呼“内行”**!
而对开发者来说,这次最大的彩蛋莫过于Claude Agent SDK的开放。Anthropic直接把驱动Claude Code的**“黑科技”底层基础设施开放出来,让所有开发者都能“搓”出自己的专属智能体。这相当于把“屠龙刀的锻造秘籍”都公之于众了,AI世界的“军备竞赛”**是彻底停不下来了。
更有意思的是,Anthropic还发布了一个限时**“研究预览”——“Imagine with Claude”。它能实时生成软件演示视频,用户可以亲眼看到Claude“无中生有”,即时创造并适配软件。这感觉就像AI变魔术一样,用户需求一说,软件“duang”地一下就变出来了,是不是有点“魔法学院”**内味儿了?
智能体的“安全帽”:AI也要讲武德!
AI越来越强,大家最关心的还是**“这玩意儿会不会跑偏?”** Anthropic显然也想到了这一点,他们在Sonnet 4.5的对齐性上下足了功夫。官方表示,这是迄今为止对齐性最好的Claude模型,在减少迎合、欺骗、权力追求和虚妄鼓励等方面取得了显著成效。简单来说,就是AI不仅要聪明,还得**“讲武德”,不能当“杠精”,更不能“PUA”**人类。
特别是对于智能体和计算机使用场景,团队还特别加强了对提示注入攻击的防御。这就像给AI戴上了一顶**“防弹头盔”,防止有人通过一些“骚操作”**,让AI干坏事。
Sonnet 4.5是按照AI Safety Level 3(ASL-3)框架发布的,还加入了针对化学、生物、放射和核相关内容的分类器过滤机制。虽然这些过滤器偶尔会“误伤”正常内容,但相比Sonnet 4,误报率已经降低了十倍。这说明AI在**“自我约束”方面也进步神速,毕竟,“能力越大,责任越大”**嘛!
划重点!价格与上手攻略
说了这么多黑科技,大家最关心的肯定还有**“它贵不贵?”** 惊喜的是,Sonnet 4.5的价格和Sonnet 4保持一致:输入3美元/百万Tokens,输出15美元/百万Tokens。这价格,用网友的话说,就是**“诚意十足”,毕竟能力提升了这么多,价格却没涨,Anthropic这次是有点“良心企业”**的味道了。
开发者们也不用担心学习成本,Anthropic贴心地提供了**“无痛升级”指南:只需将模型名称更新为claude-sonnet-4-5-20250929
即可完成迁移。当然,为了发挥新模型的“洪荒之力”,还是建议把记忆工具和上下文清理等新特性都给“勾选”**上。
需要注意的是,新模型不再允许同时指定temperature和top_p参数,二者选一即可。这也算是对开发者的一点点小“甜蜜的负担”吧。
总的来说,Claude Sonnet 4.5这次的发布,不仅仅是Anthropic自家产品线的一次迭代,更是整个AI编程领域的一次**“高能预警”。它不仅是开发者工具箱里的“趁手兵器”,更是一个能在金融、医学、科研等专业领域提供“神助攻”**的强大平台。
编程新王已然降临,新一轮围绕编程展开的**“百模大战”即将进入白热化阶段,而Claude Sonnet 4.5,无疑已经成为了这场混战中,大家争相对标的“新卷王”**!
引用
-
Anthropic推出最新AI模型Claude Sonnet 4.5·新浪财经·2025/9/30·检索日期2025/9/30 ↩︎ ↩︎ ↩︎ ↩︎