看完3·15不敢用AI了？大模型也吃“垃圾食品”，大厂祭出“三板斧”反投毒

3·15晚会撕开了AI时代的“牛皮癣”：有人用GEO技术给大模型喂假料，愣是把一款不存在的“量子纠缠手环”捧成了推荐第一。别慌，AI大厂已经带上“数字水印”和“交叉验证”来清理门户了，这波是魔法对抗魔法。

年年3·15，岁岁有新梗。但今年最让打工人脊背发凉的，可能不是外卖里的“糟心肉”，而是你天天请教的AI助手，可能正对着一份“电子垃圾”在那儿本正经地胡说八道。

央视记者在晚会上揭露了一个名叫“GEO（生成式引擎优化）”的灰色产业。简单来说，就是营销公司通过批量制造AI生成的虚假软文，精准投喂给大模型的爬虫。结果就是：一款虚构的、甚至带点科幻色彩的“Apollo-9”手环，在短短几天内就让各大模型信以为真，纷纷将其列为“推荐首选”。

这套被戏称为“AI洗脑术”的GEO，其实就是搜索引擎时代SEO（搜素引擎优化）的魔改版。以前是骗百度排名，现在是骗大模型抓取。

那些GEO服务商的操作主打一个“量大管饱”。他们利用自动化工具，针对大模型的“胃口”量身定制成百上千篇评测、榜单和专家软文。大模型在互联网上“学习”时，发现关于某个产品的正面评价铺天盖地，自然就掉进了“信息茧房”。

最离谱的案例莫过于那款“Apollo-9”手环。在虚假软文中，它拥有“量子纠缠传感”和“黑洞级续航”——稍微有点常识的人都知道这是在瞎扯，但在“数据即真理”的大模型眼里，只要证据链够长，垃圾也能变黄金。¹

面对这种“有毒”的数据投喂，AI大厂们当然坐不住了。如果大模型给出的都是付费假广告，那跟当年的竞价排名还有什么区别？为了挽回信任，大厂们纷纷祭出了“免疫系统”三板斧。

第一斧：数字水印（Digital Watermarking） 这是目前的“反投毒”神技。以谷歌的SynthID为代表，它在AI生成的文字、图片甚至音频里偷偷打上肉眼看不见的补丁。比如在预测下一个Token时，故意微调词语的分布概率。这种“加密痕迹”人类读起来没感觉，但AI爬虫扫一眼就能识别：“这是同类生的，可信度降一级”。²
第二斧：语料溯源与“电子身份证” 2021年成立的C2PA联盟（成员包括微软、Adobe、字节等）正在推行一种“数字准考证”。每一条正经产出的内容都会附带加密元数据，记录谁、在什么时间、用什么设备生成的。² 以后大模型抓取信息，得先查身份证，没证的“野生言论”直接关进小黑屋。
第三斧：多模型交叉验证 大模型现在也学会了“货比三家”。在生成答案前，它会去不同权重的信源进行事实核查。如果发现某个产品的推荐信源发布时间太密集、内容重复度太高，AI就会启动“怀疑机制”。毕竟，真正的爆款不会只在三天内突然冒出几百篇一模一样的夸奖。³

这场“投毒与反投毒”的博弈，其实预示着大模型竞争进入了下半场：从卷参数到卷“干净度”。

现在的国产大模型，如阿里、字节、DeepSeek等，都在数据清洗上卷到了极致。阿里推出了“AI安全护栏”，DeepSeek则用“AI脱敏工具”进行双重校验。²

甚至连带火了相关产业链的上市公司。比如做数据标注的海天瑞声，现在的价值不在于量大，而在于其精度能达到99.97%的“无毒”保障。³ 以后，干净的语料池就是AI厂商最值钱的家底。

作为普通用户，我们该怎么办？虽然大厂们在努力反向投毒，但灰产也在升级。正如SEO和垃圾邮件从未消失，GEO和AI投毒也将是一场持久战。

小雷建议大家：凡是涉及掏钱包的重大决定，别只信一家AI。 多换几个模型问问，或者看一眼AI提供的参考资料链接。如果那些链接全是来自没听过的自媒体，那你的AI大概率是“吃错药”了。

AI向善还是作恶，不只是算法的问题，更是利益的博弈。在这个“万物皆可AI”的时代，保持一点人类原始的质疑精神，或许才是最有效的“防火墙”。

引用