TL;DR:
本吉奥领衔的顶级团队以人类心智为蓝本,重塑了AGI的清晰可量化定义,并揭示当前大模型虽有显著进步,但在记忆、推理、适应性等多维认知能力上存在0分短板。这一新框架不仅戳破了“能力扭曲”的通用智能假象,更为业界指明了通往真正AGI的攻坚方向和深远挑战。
近年来,人工智能领域关于大语言模型(LLM)能否通向人工通用智能(AGI)的争论日益白热化。一方以OpenAI和Google为代表的企业界,坚信现有模式和“扩展定律”(Scaling Law)是实现AGI的关键;另一方则以强化学习之父Richard Sutton、著名批评者Gary Marcus和图灵奖得主Yann LeCun为首的学术界,对LLM的局限性提出尖锐质疑,认为其缺乏真正的学习机制、推理能力存在根本缺陷、且无法理解物理世界。这场旷日持久的争论,核心症结在于一个长期模糊不清的问题:AGI的定义究竟是什么?
为了破解这一症结,2025年10月16日,由“AI教父”之称的图灵奖得主约书亚·本吉奥(Yoshua Bengio)领衔,汇聚了AI安全、伦理、经济学等领域全球顶级学者、研究员和行业领袖的27人豪华团队,发布了重磅论文《A Definition of AGI》1。这篇论文试图为AGI提供迄今为止最清晰、最可操作的定义和评估框架,为这场关乎人类未来的科技辩论提供了关键的“地图”与“指南针”。
技术原理与创新点解析:AGI定义的新范式与人类心智蓝图
该论文开宗明义,为AGI给出了一个精炼而直观的定义:AGI是一个在认知通用性(versatility)和熟练度(proficiency)上,能够达到或超过一个受过良好教育的成年人水平的人工智能。 这一巧妙的定义将抽象的“通用智能”具象化为现实世界中唯一可参考的通用智能范例——人类。
新定义强调AGI的两个核心特质:
- 通用性(广度):真正的AGI不能偏科,需在广泛的认知领域具备能力,而非仅在少数任务上超人。
- 熟练度(深度):在每个认知领域,AGI的能力都需达到一定深度,即受过良好教育的成年人的水平。
为了将这一定义操作化和可量化,研究团队引入了心理测量学界最受认可、证据最充分的人类智力结构模型——Cattell-Horn-Carroll(CHC)理论1。CHC理论将人类认知能力描绘为三层级金字塔:顶层是普遍的“一般智力因素”(g因子),中层是约10个相对独立的“广义能力”,底层是约80多种具体的“狭义能力”。
基于CHC理论,论文将AGI的能力细分为十大方向,每个方向在AGI总分中平均占比10%,完整覆盖了人类认知的广阔领域:
- 通用知识 (K):对世界常识、科学、历史、文化的理解。
- 读写能力 (RW):理解和生成书面语言的熟练度。
- 数学能力 (M):涵盖算术、代数、微积分等知识与技能。
- 即时推理 (R):在不依赖先验知识的情况下,解决新颖问题的能力。
- 工作记忆 (WM):短期内主动保持、处理和更新信息的能力。
- 记忆存储 (MS):从经验中持续学习、巩固和存储新信息的能力。
- 长期记忆检索 (MR):精准、流畅地提取知识,并避免幻觉。
- 视觉处理 (V):感知、分析、推理和生成视觉信息的能力。
- 听觉处理 (A):识别、区分和处理听觉刺激的能力。
- 速度 (S):快速、自动化地执行简单认知任务的能力。
该框架提供了具体的定义、测试样例和公开数据集,使其具备极高的可操作性。文章明确指出,100%的AGI分数代表的是一个认知能力_全面发展且高度熟练_的个体,并非聚合了所有人类的顶尖才能,而是衡量一个在所有维度上都达到“精通”水平的个体可能达到的能力上限。
产业生态影响评估:模型能力剖析与通往AGI的崎岖之路
利用这一全新的AGI评估标准,研究团队对当前最先进的AI模型进行了剖析,揭示了当代AI能力发展极不均衡的“犬牙交错”认知剖面图。评估结果显示,GPT-4的AGI总分为27%,而预计2025年问世的GPT-5的总分可达58%2。总分翻倍,进步显著,但这种进步却呈现出严重的偏科现象。
当前LLM的显著优势: AI的强项集中在可以从海量数据中直接学习的领域。例如,在通用知识(K)、读写能力(RW)以及(对GPT-5而言)数学能力(M)上,模型展现出极高的熟练度。这印证了LLM作为强大知识库和文本处理工具的现有认知。
当前LLM的深层短板: 然而,在另一些核心认知维度上,现有模型表现出令人担忧的根本缺陷:
- 长期记忆存储(MS)与可靠性(MR幻觉):无论是GPT-4还是GPT-5,在长期记忆存储(MS)上的得分均为刺眼的0%。这意味着AI系统缺乏从持续互动中积累经验、形成个性化记忆或修正错误的能力。每一次对话都是一次冷启动,极大地限制了其成为真正智能伙伴的潜力。在长期记忆检索(MR)下的“幻觉”分项上,GPT-4和GPT-5同样获得0%。尽管GPT-5号称减少幻觉,但相对于人类,其幻觉水平仍无法接受,使其在不依赖外部工具(如搜索引擎)的情况下,成为不可靠的信息来源。这正与Gary Marcus的“随机鹦鹉”论调不谋而合。
- 即时推理与适应性(R):即使大幅进步的GPT-5,在即时推理(R)模块中的“适应”分项上,得分也为0%。这表明当前AI擅长在固定规则下执行任务,但在规则悄然改变时,会表现出极端的认知僵化,无法灵活调整策略,缺乏元认知能力(即意识到自身方法不再有效)。这正是Richard Sutton在《The Bitter Lesson》中强调的深层缺陷。
- 多模态的浅薄理解(V, A):GPT-5在视觉处理(V)和听觉处理(A)上虽能在感知和生成方面取得分数,但在更高级的视觉推理(如空间扫描)和听觉底层结构理解(如音素编码、节奏能力)上仍为0%。这说明即使多模态能力有进展,模型依然停留在输入/输出的表层,尚未形成对物理规律、空间逻辑的“世界模型”。Yann LeCun对此的批判被有力证实。
这些细致的评估结果清晰地表明,当前大模型的能力进步是_不均衡且有偏向_的,反LLM联盟的批评并非空穴来风,而是击中了其核心痛点。
未来发展路径预测:从能力扭曲到真正的通用智能
论文提出的**“能力扭曲”(Capability Contortions)概念,进一步揭示了当前AI进步中的一个关键问题。它指出,当代AI系统常利用其压倒性的优势能力(如巨大的工作记忆和计算速度)来掩盖或绕过其基础能力的根本性缺陷,从而制造出一种看似通用的脆弱假象**。例如,超长上下文窗口(Work Memory)被用来伪装长期记忆,使得用户需反复喂入历史信息,成本高昂且效率低下;检索增强生成(RAG)技术则被视为一种“拐杖”,掩盖了模型无法从自身参数中可靠检索知识,更缺乏动态、可更新的私有记忆库的缺陷。
识别并解决这些被掩盖的根本性缺陷,才是通往AGI的必经之路。
技术演进:突破Scaling Law的局限 未来3-5年,AI研究的重心将从单纯扩大模型规模转向系统性地填补这些认知短板。这意味着我们需要突破仅依赖“扩展定律”的范式,寻求革命性的架构创新来解决:
- 持久且可更新的记忆机制:赋予AI真正的“经验”积累和“学习”能力,而非每次任务都从头开始。
- 深层次的推理与元认知能力:使AI能像人类一样适应环境变化、主动修正策略、理解问题本质。
- 物理世界模型的构建:让多模态AI从表层感知跃升至对世界运行规律的深度理解。 这一转变将需要跨学科的融合,包括认知神经科学、强化学习、具身智能等领域的突破性进展。
商业价值:解锁真正的企业级与个性化AI 目前“能力扭曲”下的AI,其高昂的计算成本和不可靠性,限制了其在金融、医疗、工业制造等关键企业级场景中的深度应用。如果未来的AGI能够弥补记忆、推理和适应性上的缺陷,将解锁全新的商业模式和巨大的市场潜力:
- 真正个性化的AI助手:能够理解用户偏好、历史互动,并持续学习演进。
- 高度自主的企业级Agent:能独立解决复杂业务问题,适应不断变化的市场环境。
- 可靠的决策支持系统:减少幻觉,提供可信赖的分析和建议。 未来资本的目光将更聚焦于那些能够攻克AGI核心认知障碍、而非仅停留在表面性能提升的创新企业和研究方向。
社会影响:理性应对与伦理先行 本吉奥等AI先驱的深度介入,也深刻体现了对AGI社会影响的关注。本吉奥曾表达对AI失控可能导致人类灭绝的担忧,并预测AGI最快五年内就能实现3。这种清晰的AGI定义,有助于引导社会对AGI的预期,从模糊的幻想转向理性的认识。它为政策制定者、伦理学家和公众提供了一个共同的讨论基础,以便在技术发展的同时,同步思考如何建立健全的AI治理框架,应对偏见、隐私、透明度及潜在的失控风险。真正的AGI将重塑就业市场、教育体系、甚至人类的认知方式,其带来的机遇与挑战都将是前所未有的。
跨领域整合:AGI的哲学反思与人类文明的未来
Wired风格的哲学思辨提醒我们,AGI的定义与评估,不仅是技术问题,更是对“智能”本质的深刻拷问。以人类心智蓝图作为衡量AGI的标准,反映出我们当前理解智能的“人类中心主义”视角。然而,未来AGI可能以我们尚未完全理解的方式实现智能,甚至超越人类智能的范畴。
将AGI描绘为“人工科学家”4的潜力,则进一步拓宽了我们的想象。真正的通用智能,不仅仅是一个庞大的知识库或信息处理工具,它更应该是新知识的创造者,能够主动提出假说、设计实验、进行科学发现。这与当前AI在即时推理、适应性上的短板形成鲜明对比,也预示着通往“人工科学家”的道路上,核心挑战在于构建深层理解、创新思维和自我修正的能力。
本吉奥团队的论文,不仅是AI技术发展史上的一个重要里程碑,更是一次对人类未来与智能边界的深度探索。它迫使我们重新审视当下AI的真实能力与局限,警醒我们不能被表面的“通用性”假象所迷惑。通过提供一张清晰的地图,它让AI的发展方向从模糊走向清晰,引导我们以更审慎、更负责任的态度,迈向AGI的彼岸。这是一条漫长而充满挑战的道路,但至少,我们现在知道该往何处去,以及还有多远的路要走。
引用
-
“AI教父”本吉奥携业界全明星发布重磅文章,重新定义AGI·36氪·博阳(2025/10/17)·检索日期2023/10/26 ↩︎ ↩︎
-
按照Bengio等大佬的AGI新定义,GPT-5才实现了不到10%·知乎专栏·新浪财经(2025/10/17)·检索日期2023/10/26 ↩︎
-
本吉奥:AI失控可能导致人类灭绝,AGI最快五年内就能实现·搜狐(2025/10/17)·检索日期2023/10/26 ↩︎
-
Arxiv论文速递:WTF is AGI·知乎专栏·(2025/10/17)·检索日期2023/10/26 ↩︎