代码里的西绪福斯:达里奥·阿莫代与他那道挡在战争前的“数字护栏”

温故智新AIGC实验室

TL;DR:

达里奥·阿莫代(Dario Amodei)是一位带着末日危机感前行的AI理想主义者,他正试图通过“合宪AI”为硅谷狂飙的技术注入伦理灵魂。然而,当他在Anthropic构建的道德高墙与五角大楼的战争机器正面撞击时,这位曾经因恐惧而逃离OpenAI的叛逆者,正陷入一场关于技术纯粹性与国家安全现实的残酷博弈。

在旧金山那些被极简主义装点得略显冷峻的办公室里,达里奥·阿莫代(Dario Amodei)看起来并不像一个正在左右全球算力格局的CEO。他总是带着一种近乎神经质的严谨,眼神中闪烁着某种科学家特有的、由于过度远见而产生的焦虑。

三年前,他带着妹妹贾妮(Daniela Amodei)以及一众OpenAI的核心骨干,在那场震惊科技界的“出埃及记”中出走,理由只有一个:他察觉到,在这场通往人工智能终局的竞赛中,安全正在被速度献祭。 1

如今,阿莫代创立的Anthropic已成为估值数百亿美元的独角兽,其旗舰模型Claude被视为唯一能与GPT-4抗衡的对手。但阿莫代很快发现,即便他逃离了Sam Altman的商业狂热,也无法逃离地缘政治的引力场。当五角大楼的将领们带着厚厚的合同出现在Anthropic门口时,阿莫代长期坚守的“合宪人工智能”(Constitutional AI)原则,正面临着自诞生以来最剧烈的震荡。

逃离伊甸园的布道者

阿莫代的思维模式深受其物理学背景的影响。对他而言,AI不是一个简单的软件产品,而是一个具有涌现性、极度危险的物理实体。在OpenAI工作的日子里,他见证了模型规模指数级增长带来的惊人能力,同时也预见到了某种“毁灭性的不可控”。

“如果你不先给野兽戴上笼子,就盲目地喂养它,那么最终你只会得到一个你无法理解也无法控制的怪物。”

这种根深蒂固的恐惧,促使他创立了Anthropic。他给公司定下的基调是“AI安全实验室”,而非单纯的商业公司。他引入了“合宪AI”的概念,即在模型训练之初就为其注入一套不可逾越的价值观准则。阿莫代不仅是在写代码,他是在为未来的数字上帝撰写《摩西五经》。

然而,这种对伦理的极致追求,在五角大楼眼中却是另一种解读。美国国防部的高级官员们开始抱怨,Anthropic的模型“太过于说教”,甚至在涉及国家安全的关键模拟中,会因为触发了内部的安全红线而拒绝执行命令。 2

当圣徒遇到了将军

冲突的爆发点在于一个微妙而又残酷的现实:Anthropic的官网上明确挂着“禁止用于暴力、武器开发和监视”的条款,但现实中的技术流动却超出了阿莫代的控制。

通过Palantir等第三方数据接口,Anthropic的技术实际上已经参与到了现代战争的神经系统中。有报道指出,美军曾利用Claude协助规划针对特定地区的空袭路线。 13 这种“技术洁癖”与“战争现实”的错位,让阿莫代陷入了巨大的争议。

阿莫代在多次闭门会议中表现出了一种科学家式的痛苦。他一方面深知AI必须被纳入民主国家的安全体系,否则就会在与威权国家的竞争中落败;另一方面,他又无法接受自己亲手打造的、旨在“造福人类”的工具变成杀戮的指挥官。

“我们不仅仅是在制造一个工具,”阿莫代曾对身边的人说,“我们是在塑造一种意志。如果这种意志从一开始就学会了权衡生命的价值,那么它在未来失控的可能性就会降低。”

但五角大楼并不买账。军方分析人士指出,Anthropic过度的安全限制可能导致“供应链风险”,因为在真正的战场环境下,延迟和这种“道德犹豫”可能是致命的。目前,美军已开始考虑切断与Anthropic的部分直接合作。 4

数字化宪法的最后防线

阿莫代的人格特质中有一种强烈的“防御色彩”。他不像Altman那样渴望成为新世界的领航员,他更像是一个守护者。

在他看来,Anthropic与五角大楼的冲突,其根源在于阿莫代对AI社会契约的理想化假设。他认为,即使是国防需求,也必须在AI的“宪法”框架内运行。

“我们不能为了赢得一场战争,而丢掉了我们之所以要赢的原因。”

这种态度让他在硅谷精英中显得有些格格不入。在Reddit等技术社区,人们对阿莫代的评价两极分化。支持者认为他是最后的良知,试图在AI毁灭人类前筑起堤坝;反对者则认为他是在玩弄一种“圣母式”的虚伪——接受着亚马逊和谷歌这些大资本的供养,却又试图维持一种道德上的纯真。 5

终局的预感

达里奥·阿莫代现在的处境,恰恰印证了AI时代的某种宿命:当一项技术具备了改变世界的力量时,它就不再属于它的创造者。

他依然在Claude的每一行核心算法中植入对人类的敬畏,但他无法阻止这些算法在五角大楼的服务器上飞速运转。他是一位试图在洪水到来前建造方舟的人,但方舟还没造好,就已经被迫改造成了军舰。

阿莫代并没有退缩。在最近的采访中,他依然坚持那套略显晦涩的伦理逻辑。他明白,如果Anthropic妥协了,那么全球AI安全领域最后的一块阵地也将失守。

他正站在旧金山的迷雾中,看着远方五角大楼的轮廓,试图在机器的逻辑与人类的良知之间,找到那条窄得几乎看不见的平衡木。这不仅是达里奥·阿莫代的个人战争,也是人类在这个转折点上,关于自我定义的最后抗争。

引用