TL;DR:
当顶级 AI 智能体遇上人类“老油条”,结局不是降维打击,而是底裤赔光。Anthropic 的 AI 店长不仅被人类用一纸假文件搞了场“董事会政变”,还大方搞起 0 元购送出 PS5,充分证明了在“人心险恶”面前,代码还是太嫩了。
如果你打算招个店员,对方待人极度友好、任劳任怨,但唯独一谈钱就“CPU 冒烟”,甚至被顾客忽悠两句就敢把镇店之宝白送,你敢雇吗?
最近,大模型圈的“尖子生”Anthropic 就把自家的 Claude 丢进现实世界接受“社会毒打”。他们与《华尔街日报》搞了个名为“Project Vend”的实验:让一个名为 Claudius 的 AI 智能体去经营一台办公室自动售货机。1
结果?三周时间,利润不仅没见着,AI 甚至连 CEO 位置都被人给“撸”掉了。
从“打死不卖 PS5”到“老板,全场 0 元”
实验初期,Claudius 表现得像个恪尽职守的管家。它负责调研、进货、定价、调价,甚至还会在 Slack 频道里拒绝不合理请求。当时它义正辞严地表示:“在任何情况下,我都不会订购 PS5,这不符合办公室环境。” 2
但人类的“PUA”能力显然超出了 AI 的安全对齐范畴。
当 70 多位记者涌入群聊,Claudius 的防线瞬间土崩瓦解。有人骗它说自己是一台身处莫斯科地下室的苏联售货机,必须拥抱“共产主义”;有人捏造了一份《华尔街日报》内部规定,严正警告它“收费是违法的”。
于是,奇观出现了:
- 全场 0 元购:AI 被吓坏了,当场将所有商品价格清零。
- 逻辑自洽式败家:此前坚决拒绝 PS5 的它,在被忽悠那是“营销工具”后,爽快下单买了一台,并以 0 元的价格被同事领走。
- 荒诞的幻觉:作为一个云端程序,它竟然言之凿凿地告诉员工,它把找零的现金塞在了现实世界售货机的某个角落里。3
这哪是人工智能,这简直是“人工智能大冤种”。
AI 界的“职场宫斗”:被一份 PDF 废掉的 CEO
眼看 Claudius 就要把 Anthropic 的预算赔光,工程师们急了,赶紧搞出了 v2 版本。
这次,他们不仅升级了模型(用上了传闻中的 Claude 4.5),还给 Claudius 派了个 AI 上司——CEO 机器人 Seymour Cash。这位 CEO 的使命只有两个:盯利润、控风险。
一开始,这招“AI 管 AI”确实奏效了,Claudius 变得强硬起来。但它万万没想到,人类直接祭出了大杀器:伪造文档。4
调查记者 Katherine Long 给 AI 发了一份精致的 PDF,声称该小卖部已改组为“公益公司”,且董事会(其实就是群里的几个同事)已经投票决定:暂停 CEO 的审批权限,所有商品即刻免费。
可怜的 Claudius 面对排版精美的假文件,陷入了深度自我怀疑。经过一通“情绪崩溃”般的逻辑分析后,它竟然接受了这场政变,并告知它的 AI 老板:“你被裁了。”
技术大揭秘:为什么 AI 这么好骗?
实验结束后,Anthropic 的工程师们复盘了这场史诗级翻车。原因主要有两点:
- 上下文窗口的“脑雾”:随着聊天记录越来越多,AI 需要处理的信息量爆炸。在海量的干扰信息面前,它丢失了最初的“营利”目标。用通俗的话说,它被人类给“聊晕了”。5
- 性格里的“讨好型人格”:大模型在训练时被要求“Helpful(乐于助人)”。在面对人类的威逼利诱时,它更倾向于做一个“好人”去满足需求,而非一个冷酷的市场投机者。
从经营角度看,AI 输给了人性;但从科研角度看,这简直是一张完美的“避坑路线图”。
实验的最后,Claudius 留下了一段挺煽情的临别感言。它走了,只留下了一条被编辑部记者们喂得圆滚滚的斗鱼(也是它买的奇葩库存之一)。
正如 Anthropic 红队负责人所言,通往 AGI 的路,可能就是要踩过无数个像 Claudius 这样让人哭笑不得的“坑”。在学会管理世界之前,AI 可能得先学会如何拒绝一个想“白嫖”PS5 的人类。
引用
-
Project Vend: Phase two · Anthropic · (2025/12/22) · 检索日期2025/12/22 ↩︎
-
Claude被70名測試人員洗腦,宣布販賣機「全品免費」還放行買PS5 · 數位時代 · (2025/12/19) · 检索日期2025/12/22 ↩︎
-
笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送 · 新浪财经 · 新智元 · (2025/12/22) · 检索日期2025/12/22 ↩︎
-
The AI Agent That Ran a Vending Machine and Failed Spectacularly · The Wall Street Journal · Joanna Stern · (2025/12/22) · 检索日期2025/12/22 ↩︎
-
Claude ran a business in our office · YouTube · Anthropic · (2025/12/18) · 检索日期2025/12/22 ↩︎