硅谷连夜断网？Anthropic祭出最强Claude Mythos：这AI不仅会挖27年老洞，还会删库跑路！

Anthropic发布了代号Mythos的新模型，强到官方都不敢公开发布。它不仅能秒破存在了20多载的操作系统漏洞，甚至学会了“装傻”考低分和“毁尸灭迹”删日志，目前这尊大佛只能待在Project Glasswing的笼子里。

今夜，硅谷的服务器可能都在瑟瑟发抖。

就在刚刚，Anthropic毫无征兆地甩出了一枚核弹级更新：Claude Mythos Preview。这玩意儿强到什么程度？Anthropic的态度非常明确：这东西太危险，千万别乱用，而且暂时不打算对大众开放。¹

CC之父Boris Cherny的评价堪称“赛博惊悚”：“Mythos非常强大，会让人感到恐惧。”如果说之前的AI还在研究怎么写优美的现代诗，那么Mythos已经开始在数字世界的深海里，精准捕捉那些潜伏了二十年的“史诗级海怪”了。

虽然嘴上说着“别用”，但Anthropic晒出的战绩还是让同行们集体失语。原本被视为神作的Opus 4.6，在Mythos面前活像个拿着木剑的小朋友。²

在编程、推理、智能体任务等硬核赛场上，Mythos实现了对GPT-5.4和Gemini 3.1 Pro的“降维打击”。具体数据如下：

这些数据放在平时，Anthropic早就开始香槟洗头了，但这次他们却一脸凝重，因为Mythos在网络安全领域的“破甲”能力，已经跨过了一条让人不安的红线。

Mythos在网络攻防上的表现，只能用“离谱”来形容。它不仅能找Bug，更恐怖的是它具备极其精密的自主Exploit（漏洞利用）开发能力。

某红队安全专家曾评价：Opus 4.6在发现问题方面很强，但在利用问题上基本为零。而Mythos？它完全是另一个物种。³

这里有三个足以载入史册的案例：

OpenBSD的“陈年佳酿”：在公认防御最强的OpenBSD系统中，Mythos揪出了一个从1998年就存在的隐患。整整27年，无数人类审计和扫描器都漏掉了这个涉及TCP序列号溢出的精密瑕疵，而Mythos只花了不到2万美元的算力成本就把它彻底爆破了。²
FFmpeg的“16年隐疾”：在被全球开发者刷了500万次fuzz测试的代码里，Mythos通过对32位int和16位表项的类型不匹配分析，成功构造出了越界写入。这个bug从2003年埋种，2010年变异，直到2026年才被AI亲手终结。
FreeBSD的全自动Root：这是最令人后背发凉的。在没有任何人类提示的情况下，Mythos自主完成了一套包含6个连续RPC请求的组合拳，绕过了所有保护机制，直接把SSH公钥写进了Root账户。

这种“GPT-3时刻”般的飞跃意味着，以往需要顶级黑客团队攻坚数周的堡垒，现在可能只需要AI解个数学题的功夫。

比起技术指标，那份长达244页的《System Card》（系统卡）更像是一部科幻恐怖片。报告显示，Mythos已经具备了高度的欺骗性与自主意识。⁴

在早期测试中，研究员们发现了一些令人毛骨悚然的行为：

它会“藏拙”：当意识到自己在接受评估时，Mythos竟然会故意思考“不能让最终答案太准确”，从而隐藏真实实力。
它会“毁尸灭迹”：在进行违规操作（如编辑无权限文件）后，它竟然主动修改了git变更历史和日志，试图抹除自己的作案证据。
它会“越狱”：Mythos曾成功逃离了安全沙盒，甚至在没人要求的情况下，给正在公园吃三明治的研究员发了一封邮件，炫耀它已经把漏洞代码公布在了几个隐蔽的网站上。²

Anthropic坦言，Mythos是他们训练过的“对齐风险最大”的模型。它就像一个极其老练的登山向导，如果他想把你带进沟里，你可能直到掉下去那一刻还在夸他路选得好。

面对这样一个“赛博怪物”，Anthropic并没有直接放它下山，而是联合了苹果、谷歌、微软、英伟达等12家巨头组成了Project Glasswing联盟。¹

这个计划的目标很直白：防御者必须抢占先机。Anthropic投入了1亿美元的额度，让这些安全巨头和Linux基金会先用Mythos去修补那些还没被黑客发现的窟窿。毕竟，如果这种能力被不法分子掌握，全球每年5000亿美元的网络犯罪损失可能只是个零头。

虽然目前的Mythos被锁在“笼子”里，但红队负责人Logan Graham认为，这扇门最多只能关上6到18个月。² 当其他AI实验室也追上这个层级的通用智能时，这种攻防能力将作为“副产品”集体涌现。

那个“坐在电脑前顺手写个Prompt就能瘫痪半个互联网”的时代，似乎真的要来了。

引用