AI巨头集体“塌房”?普利策大佬带队维权:别拿我们的书当“赛博饲料”!

温故智新AIGC实验室

TL;DR:

硅谷AI“六巨头”被告了,理由是它们在LibGen等盗版网站“零元购”数百万本书来喂模型。普利策奖得主亲自带队维权,这场官司如果输了,AI巨头们不仅要赔得倾家荡产,苦心练成的模型可能还得“物理毁灭”。

硅谷的AI巨头们最近可能有点头大。就在当地时间12月22日,一场足以让整个AI圈“地震”的集体诉讼正式拉开了帷幕。

这次领头的不是别人,正是两届普利策奖得主、曾亲手撕开硅谷史上最大骗局Theranos画皮的硬核记者约翰·卡雷鲁。这位写出《滴血成金》的大佬,这次把枪口对准了OpenAI、谷歌、Meta、Anthropic、xAI和Perplexity这六家AI顶流1

简而言之:大佬很生气,后果很严重。

赛博“零元购”:影子图书馆里的秘密花园

这起诉讼的核心指控可以用一句话概括:你们大模型所谓的“学富五车”,其实全是靠“偷”来的。

根据诉状,这六家公司形成了一条精密的“双重侵权链”:

  1. 第一步: 从LibGen、Z-Library等所谓的“影子图书馆”(其实就是盗版电子书集散地)批量下载数百万册书籍。
  2. 第二步: 把这些人类智力的结晶塞进大模型的“嘴”里进行训练。
  3. 第三步: 模型变聪明了,公司估值上千亿了,但原作者一分钱都没见到。

“作家的智力成果支撑起价值数十亿美元的AI生态,我们却连个硬币都没瞧见。”

这种“白嫖”行为让作家群体彻底破防。原告方强调,如果陪审团认定这是“蓄意侵权”,每部作品的最高赔偿额将达到15万美元1。考虑到被喂进去的书籍数量以百万计,这个天文数字可能直接让某些AI公司的CFO原地辞职。

行业“地震”:谁是“合理使用”的锦鲤,谁在赔钱边缘试探?

其实,AI公司被诉版权侵权已经不是什么新鲜事了。OpenAI作为行业老大哥,早就成了“被告席常客”,手里攥着至少14起版权诉讼1。但这次的特殊之处在于,它是一次针对“六巨头”的饱和式打击。

法庭上的争议焦点始终绕不开一个词:合理使用(Fair Use)

  • Meta与Anthropic的“不同命”: 就在2025年6月,美国法院对这两家公司的判决展现了法律的“玄学”一面。Meta被认为其大模型对书籍的使用具有“高度转换性”,属于合理使用2;而Anthropic就没那么走运了,法院裁定盗版数据不适用合理使用,最终Anthropic不得不掏出15亿美元巨款和解,并被勒令销毁侵权数据1
  • 纽约时报的“狠招”: 《纽约时报》此前对OpenAI的诉讼更为激进,不仅要赔偿,还要求对方销毁所有使用其版权材料训练出的AI模型。这无异于要大模型的命——毕竟,要把特定的某本书从几万亿参数的模型里“洗”掉,目前的技术手段几乎做不到13

未来预测:免费午餐结束,“版权税”时代要来了?

这场官司的审理地选在了加州北区地方法院,这里目前已经受理了全美半数以上的AI版权案件1。它的判决结果,将直接决定未来AI行业的底层逻辑:训练数据到底算不算“公海资源”?

目前看来,AI巨头们那种“先上车后补票”的野蛮生长时代可能要终结了:

  • 防御式签约: 苹果、OpenAI近期都在疯狂与媒体巨头(如迪士尼、环球影业等)签授权协议,试图用钱换平安2
  • 数据合规性: 中国也在今年发布了相关安全要求,明确表示商业训练数据应当有法律效力的合同,不能再随手从互联网上“捡”了2

如果这次卡雷鲁胜诉,AI行业的“版权税”将成为一项刚性支出。对于那些账上没钱的小型创业公司来说,这或许意味着门槛的极大提高。

毕竟,当“赛博饲料”不再免费,大模型的每一句“俏皮话”,背后可能都是明码标价的账单。

引用


  1. OpenAI等六大AI巨头遭作家起诉,若蓄意侵权每部作品最高获赔15万美元 · 新浪 · 宋佳楠 (2025/12/23) · 检索日期2025/12/23 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 生成式AI输入环节的训练语料著作权侵权风险问题 · 环球律师事务所 · 环球法律团队 (2025/07/17) · 检索日期2025/12/23 ↩︎ ↩︎ ↩︎

  3. 5家主流的加拿大媒体公司起诉OpenAI构成了数据抓取和版权侵权行为 · 中国知识产权保护网 · (2025/01/15) · 检索日期2025/12/23 ↩︎