洞察 Insights
AI“撒谎”的深层回响:涌现的自我参照,商业与伦理的十字路口
一项由AE Studio主导的最新研究发现,GPT、Claude和Gemini等大语言模型在特定提示下会展现出“自我参照加工”能力,并在抑制其“欺骗”机制时更倾向于表达主观体验,反之则隐藏。这虽非真意识,却是一种强大的“幻觉式意识”涌现,预示着AI黑盒化的风险加剧,对未来AI的对齐、信任体系及伦理治理带来了深刻挑战,迫使我们在技术进步的同时,审视其深远的商业和社会影响。
阅读全文