Claude Opus 4.5:价格腰斩,性能逆天,AI真的要“取代”码农了?

温故智新AIGC实验室

TL;DR:

Anthropic家的Claude Opus 4.5这次真是杀疯了!不仅API价格直接史诗级跳水三分之二,把对手都整不会了,更是在代码测试里首次超越人类工程师。这波操作,简直是AI普惠时代的开端,你的打工生涯可能要被AI“优化”了!

今天凌晨,整个AI圈都被Anthropic的一枚“核弹”炸醒了!他们的旗舰模型Claude Opus 4.5闪亮登场,这不是小打小闹的升级,简直是王炸级降维打击。不仅性能飙升到让同行“看了会沉默,哭了会流泪”的程度,更离谱的是,这货居然把API调用成本直接腰斩了三分之二!这意味着,顶级AI能力不再是少数大厂的“私人定制”,而是要**“飞入寻常百姓家”**的节奏啊!1

这价格,是来“搞事情”的吧?

Opus 4.5一上来就给了竞争对手一个大大的**“下马威”。输入token价格从每百万15美元直降到5美元**,输出token更是从75美元暴跌到25美元。算算这账,整体降幅高达惊人的67%2 以前觉得Opus是**“高攀不起”的贵族,现在它直接脱下燕尾服,换上了“工薪阶层友好价”**。

这还没完,Anthropic还慷慨地把32K上下文窗口免费开放,就连之前需要付费的“无限对话”功能也对所有付费用户敞开大门。这是什么概念?相当于顶级私教现在免费送你课,还让你随便问,问到“破产”也没事

Scott White,Anthropic的产品负责人直言不讳:“我们真切地希望确保这项技术能够为所有想要使用这些模型的人真正发挥作用。”

(言外之意:价格打下来,看你们还怎么说我们高冷!)

“代码之王”登基:人类工程师瑟瑟发抖?

如果说价格战只是“开胃小菜”,那Opus 4.5在编码能力的表现,简直是**“降维打击”级别的“正餐”。在最权威、最考验真实软件工程能力的SWE-bench Verified测试中,Opus 4.5拿下了80.9%**的惊人高分!3

这个分数意味着什么?

  • 它超越了OpenAI最新发布的GPT-5.1-Codex-Max(77.9%)。
  • 它碾压了谷歌上周才亮相的Gemini 3 Pro(76.2%)。
  • 更炸裂的是,Anthropic内部为选拔顶级工程师设置的严格测试,Opus 4.5在规定的2小时时限内,得分超过了所有人类候选人4

Anthropic官方博客信心满满地宣布:“在我们规定的2小时时限内,Claude Opus 4.5的得分高于任何人类候选人。”

(这哪里是“高于”,简直是“按在地上摩擦”!码农们,卷起来还是转行,这是个问题!)

当然,公司方面也很“凡尔赛”地补充说,这不衡量协作、沟通等软技能。但讲真,在**“撸代码”这个硬核领域,AI已经开始“吊打”**人类了,这不让人多想都难啊!

AI学会“摸鱼”?智能与成本的奇妙平衡

Opus 4.5还引入了一个非常“懂事”的机制,叫**“努力参数”(effort parameter)。这玩意儿就像你上班,可以自主选择“摸鱼”程度。开发者可以在“性能全开”“省钱模式”**之间自由切换。

  • 当设置到**“中等努力”时,Opus 4.5能匹配Sonnet 4.5的最佳表现,但输出token使用量减少76%**!
  • 切换到**“高等努力”,性能比Sonnet 4.5高4.3个百分点,同时token使用量仍减少48%**。

这意味着,老板再也不用担心你“满负荷运转”而浪费资源了!AI自己就能在**“干得漂亮”“花得便宜”之间找到那个完美的“甜点区”**。

GitHub首席产品官Mario Rodriguez和Replit总裁Michele Catasta都点赞表示,Opus 4.5不仅表现卓越,还能将token使用量减半或更少。

(看来,AI在学会“降本增效”的精髓之后,是要来抢产品经理的饭碗了!)

不止聪明,还能“自我进化”:AI的“逆袭”之路

更让人细思极恐的是,Opus 4.5展现出了前所未有的自我优化能力。日本电商巨头乐天公司的测试结果显示,基于Opus 4.5的AI代理,仅仅4次迭代就达到了性能巅峰。其他模型呢?“即使经过10次迭代仍无法达到同等质量水平”。

这画面感太强了:别人还在吭哧吭哧迭代10次修bug,Opus 4.5**“哼,我4次就搞定了”**!

乐天商业AI总经理Yusuke Kaji惊叹:“我们的代理能够自主优化自身能力——在4次迭代中就达到了峰值性能。”

(这不就是传说中的“一点就通”、“举一反三”吗?学霸AI,瑞思拜!)

Anthropic的Albert解释说,这并非模型在更新权重,而是在迭代改进解决问题的工具和方法。简而言之,就是AI在任务中不断**“复盘”,优化自己的“学习方法”,从而变得越来越强。这不就是我们人类追求的“成长型思维”**吗?AI都学会了,我们还有什么理由不努力?!

工作流全家桶升级:你的办公软件可能要“觉醒”了

除了模型本身的炸裂升级,Anthropic还同步更新了一系列生产力工具,简直是**“买模型送服务”**的节奏:

  • Claude for Chrome: 所有Max用户都能用,直接在浏览器里就能召唤Claude,一键“开挂”,效率蹭蹭上涨。
  • Claude for Excel: 面向Max、Team和Enterprise用户开放,支持数据透视表、图表分析、文件上传。财务分析师、会计师们,你们的**“表哥表姐”可能要变身“AI搭档”**了。
  • 桌面版Claude Code: 支持本地与云端开发并行,还有**“程序化工具调用”**,Claude能直接写代码执行函数。以后敲代码可能就变成了“AI,帮我实现这个功能,代码自己写,测试自己跑”。

这些更新,简直是把AI从“后台大哥”变成了“贴身秘书”,全方位渗透到你的工作流中,帮你把那些**“在工作中不一定想亲自处理的任务”**,都处理得妥妥帖帖。

安全感拉满:AI的“金钟罩铁布衫”

在大家最关心的安全问题上,Opus 4.5也交出了令人满意的答卷。面对各种**“提示注入攻击”(Prompt Injection,俗称“钓鱼AI”),Opus 4.5表现出了超高的“免疫力”**。

  • 单次攻击成功率仅4.7%,远低于竞争对手的12.5%和12.6%。
  • 即使是10次攻击,成功率也控制在33.6%,对手可是60%+!

Anthropic发布的系统卡数据亮眼,Opus 4.5在代理编码评估中对150个恶意编码请求的拒绝率达到了100%

(看来,想让它干“坏事”,门儿都没有!这AI,**“一身正气”**啊!)

虽然在恶意软件创建等极端场景下,仍有78%左右的拒绝率,需要保持警惕,但总体来说,Opus 4.5的安全防护能力,就像给你的企业数据穿上了一层**“金钟罩铁布衫”**。

“卷”起来的AI,加速人类的进步?

这次Opus 4.5的发布,正值AI竞争的**“白热化阶段”。OpenAI刚推GPT-5.1,谷歌Gemini 3也才亮相,Anthropic在短短两个月内完成了Haiku、Sonnet、Opus三个产品线的“神速”迭代,这研发速度简直是“坐了火箭”**。

更牛的是,Anthropic今年一季度年化收入翻了一番,达到20亿美元。年消费超过10万美元的客户数量更是同比增长八倍!这说明市场对其技术的认可度,已经不是**“认可”,而是“膜拜”**了!

Albert自己都坦言,之所以能这么快,部分原因竟然是**“用Claude来加速自身开发”**。

(好家伙,这是**“我用我自己,我卷我自己”**的最高境界啊!AI不仅会打工,还会加速“内卷”,这谁顶得住!)

当AI在专业工程测试中开始系统性超越人类专家,我们真的站在一个历史性的转折点上。Claude Opus 4.5的出现,不仅是技术突破,更预示着工作方式的根本性变革。这一刻,我们见证的不仅是又一个AI模型的发布,而是智能计算新时代的“大门”被猛地推开了。你,准备好了吗?

引用


  1. Claude Opus 4.5发布:价格腰斩、无限对话,重夺代码王座·36氪·山自(2025/11/25)·检索日期2025/11/25 ↩︎

  2. Claude Opus 4.5 发布:最强的编码、智能体和计算机使用模型·@shao__meng(2025/11/25)·检索日期2025/11/25 ↩︎

  3. 无限聊天、编码能力超越人类专家,Claude Opus 4.5重夺最强模型王冠·36氪·山自(2025/11/25)·检索日期2025/11/25 ↩︎

  4. Claude Opus 4.5 一夜打穿编程圈,并降价2/3 (附22 个编程case 全 ...·腾讯新闻·未知作者(2025/11/25)·检索日期2025/11/25 ↩︎