看完3·15不敢用AI了?大模型也吃“垃圾食品”,大厂祭出“三板斧”反投毒

温故智新AIGC实验室

TL;DR:

3·15晚会撕开了AI时代的“牛皮癣”:有人用GEO技术给大模型喂假料,愣是把一款不存在的“量子纠缠手环”捧成了推荐第一。别慌,AI大厂已经带上“数字水印”和“交叉验证”来清理门户了,这波是魔法对抗魔法。

年年3·15,岁岁有新梗。但今年最让打工人脊背发凉的,可能不是外卖里的“糟心肉”,而是你天天请教的AI助手,可能正对着一份“电子垃圾”在那儿本正经地胡说八道。

央视记者在晚会上揭露了一个名叫“GEO(生成式引擎优化)”的灰色产业。简单来说,就是营销公司通过批量制造AI生成的虚假软文,精准投喂给大模型的爬虫。结果就是:一款虚构的、甚至带点科幻色彩的“Apollo-9”手环,在短短几天内就让各大模型信以为真,纷纷将其列为“推荐首选”。

技术大揭秘:给AI“洗脑”到底分几步?

这套被戏称为“AI洗脑术”的GEO,其实就是搜索引擎时代SEO(搜素引擎优化)的魔改版。以前是骗百度排名,现在是骗大模型抓取。

那些GEO服务商的操作主打一个“量大管饱”。他们利用自动化工具,针对大模型的“胃口”量身定制成百上千篇评测、榜单和专家软文。大模型在互联网上“学习”时,发现关于某个产品的正面评价铺天盖地,自然就掉进了“信息茧房”。

最离谱的案例莫过于那款“Apollo-9”手环。在虚假软文中,它拥有“量子纠缠传感”和“黑洞级续航”——稍微有点常识的人都知道这是在瞎扯,但在“数据即真理”的大模型眼里,只要证据链够长,垃圾也能变黄金。1

AI大厂的反击:大模型也得打“疫苗”

面对这种“有毒”的数据投喂,AI大厂们当然坐不住了。如果大模型给出的都是付费假广告,那跟当年的竞价排名还有什么区别?为了挽回信任,大厂们纷纷祭出了“免疫系统”三板斧。

  • 第一斧:数字水印(Digital Watermarking) 这是目前的“反投毒”神技。以谷歌的SynthID为代表,它在AI生成的文字、图片甚至音频里偷偷打上肉眼看不见的补丁。比如在预测下一个Token时,故意微调词语的分布概率。这种“加密痕迹”人类读起来没感觉,但AI爬虫扫一眼就能识别:“这是同类生的,可信度降一级”。2

  • 第二斧:语料溯源与“电子身份证” 2021年成立的C2PA联盟(成员包括微软、Adobe、字节等)正在推行一种“数字准考证”。每一条正经产出的内容都会附带加密元数据,记录谁、在什么时间、用什么设备生成的。2 以后大模型抓取信息,得先查身份证,没证的“野生言论”直接关进小黑屋。

  • 第三斧:多模型交叉验证 大模型现在也学会了“货比三家”。在生成答案前,它会去不同权重的信源进行事实核查。如果发现某个产品的推荐信源发布时间太密集、内容重复度太高,AI就会启动“怀疑机制”。毕竟,真正的爆款不会只在三天内突然冒出几百篇一模一样的夸奖。3

行业“地震”:高质量数据才是硬通货

这场“投毒与反投毒”的博弈,其实预示着大模型竞争进入了下半场:从卷参数到卷“干净度”。

现在的国产大模型,如阿里、字节、DeepSeek等,都在数据清洗上卷到了极致。阿里推出了“AI安全护栏”,DeepSeek则用“AI脱敏工具”进行双重校验。2

甚至连带火了相关产业链的上市公司。比如做数据标注的海天瑞声,现在的价值不在于量大,而在于其精度能达到99.97%的“无毒”保障。3 以后,干净的语料池就是AI厂商最值钱的家底。

结语:猫鼠游戏永远不会终结

作为普通用户,我们该怎么办?虽然大厂们在努力反向投毒,但灰产也在升级。正如SEO和垃圾邮件从未消失,GEO和AI投毒也将是一场持久战。

小雷建议大家:凡是涉及掏钱包的重大决定,别只信一家AI。 多换几个模型问问,或者看一眼AI提供的参考资料链接。如果那些链接全是来自没听过的自媒体,那你的AI大概率是“吃错药”了。

AI向善还是作恶,不只是算法的问题,更是利益的博弈。在这个“万物皆可AI”的时代,保持一点人类原始的质疑精神,或许才是最有效的“防火墙”。

引用


  1. 315晚会曝光GEO灰产!给AI大模型“投毒” · 猎云网 · 腾讯新闻 (2026/3/15) · 检索日期2026/3/17 ↩︎

  2. 看完3·15不敢用AI?为了预防AI投毒,AI大厂备好了三板斧 · 雷科技 · 36氪 (2026/3/17) · 检索日期2026/3/17 ↩︎ ↩︎ ↩︎

  3. 海天瑞声怎么干2026年央视315晚会曝光了AI大模型“被投毒”的灰色 · 东方财富网 (2026/3/15) · 检索日期2026/3/17 ↩︎ ↩︎