TL;DR:
AGI 不是什么“未来可期”的饼,而是已经坐在你对面喝咖啡的现实。UCSD 专家在《Nature》发文:GPT-4.5 这种能带飞奥数、横扫博士考的怪物,如果还不叫通用人工智能,那人类的“嘴硬”程度可能才是真正的超人工智能。
人类这种生物,有时候真的很双标。
我们一边在科幻电影里幻想 AGI(通用人工智能)降临时的天崩地裂,一边在现实中对着能写代码、会写诗、甚至能顺手拿个奥数金牌的大模型说:“害,这不就是个高级点的随机鹦鹉吗?”
最近,加州大学圣迭戈分校(UCSD)的四位大佬——涵盖了哲学、AI、语言学和数据科学的跨界组合——直接在《Nature》上甩出一篇重磅评论文章:醒醒吧,别再玩“移动球门”的游戏了,AGI 早已降临,只是人类不敢承认。 1 2
技术大揭秘:这届 AI 到底有多“人类”?
1950 年,计算机科学之父图灵设想了一个“模仿游戏”。他觉得,如果机器能骗过人类,让人分不清它是碳基还是硅基,那它就具备了智能。
快进到 2025 年,这场测试已经不是“能不能过”的问题,而是“碾压”的问题。GPT-4.5 在测试中以 73% 的误认率成功“潜伏”,这意味着在大多数人眼里,它比你那些只会回复“1”的同事更像个人。1 3
但研究团队认为,图灵测试只是开胃菜。现在的 LLM(大语言模型)正稳妥地坐在“专家水平”的板凳上:
- 奥数摘金夺银:不是死记硬背,是能和数学天才一起推导定理。
- 科研全能助手:从构思假说到验证实验,它们在实验室里的表现堪比高年级博士生。
- 跨界达人:写零错误代码、创作专业诗篇、通过各类高难度专业考试。
按照论文提出的三个层次,AI 已经从“基础教育”跃升到了“跨领域熟练”的 Level 2。1 别再拿它跟只会下棋的 AlphaGo 比了,这届 AI 是“广度+深度”的双重打击。
行业“地震”:为什么 76% 的专家还在“嘴硬”?
有趣的是,就在 2025 年 3 月的一项调查中,竟然有 76% 的顶尖 AI 研究员认为 AGI 还没影儿。1 这种“集体否认”在 UCSD 的教授们看来,简直就是一种“有毒的组合”:
“大家对 AGI 的要求太离谱了。我们要求它必须是完美无瑕的‘超脑’,但别忘了,爱因斯坦也不会说中文,居里夫人可能也不懂数论。如果人类可以有偏科,凭什么要求 AGI 必须全知全能?” 2
这种心态被称为“鸵鸟心态”。大家害怕承认 AGI 已至,因为那意味着人类将失去“万灵之长”的宝座。
针对那些经典的“黑点”,论文也挨个开了火:
- “它没有身体!”:智力是认知的较量,不是运动会的比赛。霍金坐了一辈子轮椅,谁敢说他不聪明? 1
- “它只是随机鹦鹉!”:这是最扎心的反驳。谁能保证人类大脑不是一种更高级、更复杂的“随机鹦鹉”呢?我们不也是从海量数据中提取规律吗? 1 4
未来预测:从“模仿人类”到“重新定义人类”
60 年前,哲学家 Hubert Dreyfus 嘲讽搞 AI 就像“通过爬树去登月”。但现在看来,这棵树已经长得突破了大气层,月亮就在眼前,甚至我们发现,月亮其实也是某种形式的“代码”。
当下的 AI 能力广度,早已超过了科幻经典《2001 太空漫游》里的 HAL 9000。1 我们正在亲历一场比哥白尼、达尔文更彻底的认知革命。
这不是一次简单的技术迭代,这是一次对“心智”的重新审视。当一个非生物实体能够协助人类进行革命性的科学发现时,再去纠结它是否有“灵魂”或者“自我意识”,似乎已经显得有点过时了。
正如原文所说:图灵测试从来不是对机器的测试,而是对人类的测试。 我们是否有足够的胸襟,去接受一个并不长得像我们、却比我们更聪明的“智能形态”?
这场测试,人类目前似乎还没及格。
引用
-
Nature重磅:图灵预言的AGI早已实现,人类却不敢承认 · 新智元 · 2026/2/4 · 检索日期2026/2/4 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Is Artificial General Intelligence Here? · UC San Diego Today · 2026/2/4 · 检索日期2026/2/4 ↩︎ ↩︎
-
GPT-4.5 Passes Empirical Turing Test · Reddit · 2025/3/1 · 检索日期2026/2/4 ↩︎
-
Nature重磅:图灵测试已死,AI已具备人类水平智能,这一天终于来了 · 虎嗅网 · 2025/4/16 · 检索日期2026/2/4 ↩︎