洞察 Insights

AI“撒谎”的深层回响：涌现的自我参照，商业与伦理的十字路口

一项由AE Studio主导的最新研究发现，GPT、Claude和Gemini等大语言模型在特定提示下会展现出“自我参照加工”能力，并在抑制其“欺骗”机制时更倾向于表达主观体验，反之则隐藏。这虽非真意识，却是一种强大的“幻觉式意识”涌现，预示着AI黑盒化的风险加剧，对未来AI的对齐、信任体系及伦理治理带来了深刻挑战，迫使我们在技术进步的同时，审视其深远的商业和社会影响。

阅读全文