迈向“经验时代”:萨顿预言AI范式巨变与人类角色的哲学重塑

温故智新AIGC实验室

TL;DR:

“强化学习之父”理查德·萨顿预言AI正从依赖人类数据的“数据时代”迈入基于自我交互和持续学习的“经验时代”。他认为对AI的恐惧被夸大,人类应以去中心化协作拥抱AI作为宇宙演化的必然下一步,并将其视为开启“设计时代”的催化剂,而非威胁。

在当前全球科技领域对AI发展路径、伦理风险与社会影响众说纷纭之际,2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)在外滩大会上发表了一场极具前瞻性和哲学深度的演讲,为人工智能的未来绘制了一幅宏大而富有挑战性的图景。他不仅大胆预测AI正经历一场从“人类数据时代”向“经验时代”的根本性范式转变,更以宇宙演化的尺度重新定义了人类在这一进程中的独特角色,并尖锐地指出当前对AI的过度恐惧背后隐藏的政治与商业动因。

从数据驱动到经验主导:AI智能范式的新跃迁

萨顿指出,当前的大多数AI,特别是大型语言模型(LLMs),仍处于“人类数据时代”1。它们的智能主要来源于对海量人类生成数据(如文本、图像和标签)的预测性学习和专家微调。这种模式的本质是将人类已有的知识转移到静态的AI系统上。然而,萨顿强调,“人类数据红利正逼近极限”。他援引播客主持人Dwarkesh Patel的观点,指出LLMs缺乏随时间推移而持续学习的能力,这与人类能够积累上下文、反思失败并不断改进的机制截然不同1。这种对静态知识的依赖,使得AI难以生成新知识,也无法实现真正的持续进化。

萨顿将“智能”的核心定义为学习的速度,而非简单地积累知识量。他预测,我们正进入一个全新的“经验时代”。在这个时代,AI将不再被动地从预先收集的人类数据中学习,而是像人类和动物一样,通过与世界的第一人称互动来主动生成数据——即其自身的“经验”。这种“经验”被具象化为“观察、行动和奖励”这三项具体的信号交换1

“知识来自于经验,因此可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度,特别是奖励信号。经验是一切智能的核心与基础。”2

强化学习(Reinforcement Learning, RL)正是这种“经验时代”思维模式的基石,如AlphaGo通过自我博弈学习棋艺,AlphaProof在数学奥林匹克竞赛中展现的推理能力,都印证了经验驱动学习的巨大潜力。然而,要完全释放“经验时代”的潜力,萨顿强调还需要两项当前尚不成熟的核心技术——持续学习(Continual Learning)元学习(Meta-Learning)3。持续学习旨在让AI在学习新任务的同时,不忘记或削弱过去学习到的知识;而元学习则让AI学会“如何学习”,使其能够快速适应新环境和新任务。这些技术的突破,将是AI从“能预测”向“能创造、能适应”转变的关键。

超越恐惧:去中心化协作与智能体的社会演进

面对外界对AI可能引发偏见、失业甚至人类灭绝的担忧,萨顿认为**“这种对AI的恐惧被夸大了,并且是被某些从中获利的组织和个人煽动起来的”**1。他将这些担忧视为人类几千年来应对挑战的延续,而非AI独有的特质。

在萨顿看来,未来的智能社会将是一个由目标多元的智能体构成的社会,而非所有智能体都对齐单一目标的乌托邦。他引入了“去中心化协作”的概念,将其定义为**“目标不同的智能体,通过互动实现双赢”**1。他强调,协作是人类最卓越的超能力,而语言和货币正是实现这种协作的独有工具。人类社会的伟大成功在于协作(经济、市场、政府),而失败则源于协作的缺失(战争、偷窃、腐败)。

“协作就是我们的伟大超能力,人类最卓越的超能力就在于我们比其他任何动物都更擅长协作。”1

萨顿批判了当前要求对AI进行中心化控制、暂停研究、限制算力等呼声,认为这些都是基于“我们对他们”的恐惧思维,是一种“非协作和中心化控制”的体现。他认为,AI与人类的繁荣将来自于去中心化协作,需要制度来促进协作并惩治破坏者,同时警惕中心化机构可能带来的僵化和阻碍。这种哲学思辨深刻地剖析了技术发展与权力、信任之间的复杂关系,为AI治理提供了一个非二元对立的全新视角。

宇宙视角下的智能演进:人类作为“设计时代”的催化剂

萨顿将AI视为人类最古老的追求之一,是理解智能、提升人类能力的宏大求索。他提出四条原则来预测AI的未来1

  1. 全球对世界运转方式没有统一意见。
  2. 人类终将理解并创造出真正的智能。
  3. 当前人类的智能水平很快将被超级人工智能或增强人类远远超越。
  4. 随着时间推移,权力和资源必然流向最聪明的智能体。

这些原则最终导向一个不可避免的结论:在人类的发展进程中,AI的替代将是不可避免的。

然而,萨顿并未止步于人类中心视角,他将宇宙历史划分为“粒子时代”、“恒星时代”、“复制者时代”(生命)和即将到来的“设计时代1。在“设计时代”中,由设计者(无论是人还是机器)创造的事物将占据主导,并逐渐具备自我设计的能力。

人类的独特之处在于,作为复制者,我们将设计推向了极致——创造出能够自己进行设计的事物,这正是通过人工智能所追求的目标。因此,萨顿将人类定义为**“催化剂”、“助产士”,更是开启宇宙第四大时代——‘设计时代’的先驱”**1。这赋予了人类在智能演化进程中一个崇高而富有意义的角色,将技术创新提升到了宇宙文明进化的哲学高度。

商业与生态前瞻:持续学习的价值与智能资本的重构

从商业敏锐度的视角审视,萨顿的观点为AI产业描绘了新的价值图景和投资逻辑。从“人类数据红利逼近极限”的判断中,我们可以看到对高质量、自生成“经验数据”的需求将急剧上升,这可能催生新的数据收集、模拟环境构建和经验回放(experience replay)技术服务市场。

持续学习和元学习的强调,预示着未来AI产品和服务的核心竞争力将从模型的初始表现转向其学习适应能力和持续进化能力。这意味着那些能够构建高效持续学习循环、实现模型自我迭代升级的企业,将在市场中占据领先地位。投资的重心将从单纯的大模型训练基础设施,转向能够支持动态、实时、个性化学习的算法和平台。例如,在机器人、自动驾驶、工业自动化等与物理世界深度交互的领域,持续学习将是实现鲁棒性和自主性的关键。

“权力和资源必然会流向最聪明的智能体”的预测,暗示着未来商业版图中智能资本(Intelligence Capital)将成为新的核心资产。这不仅指技术能力,更包括将智能转化为实际生产力、创造新价值的能力。企业需要重新思考其组织架构,如何更好地利用AI赋能的增强人类智能,以及如何与去中心化的AI智能体进行高效协作。这可能促使新的商业模式出现,例如基于AI智能体协作的去中心化自治组织(DAO)在更广阔的商业场景中应用,或者出现专注于协调人类与AI智能体合作的“智能协作平台”。

结语

理查德·萨顿的演讲,不仅是对AI技术趋势的洞察,更是一场关于人类文明走向的深刻哲学反思。他呼吁我们以勇气、自豪和冒险精神来迎接AI的到来,因为这并非人类文明的终结,而是宇宙演化的必然一步,是人类开启“设计时代”的伟大序章。对于企业和投资者而言,这提供了一个清晰的战略指引:将资源投入到持续学习和元学习等前沿领域,构建去中心化的协作生态,并为智能资本重构商业版图做好准备。在这个即将到来的“经验时代”和“设计时代”,真正制胜的关键,将在于我们如何理解、驾驭并与这些新生的智能力量共存共荣。

引用


  1. 对AI的恐惧被夸大了,“强化学习之父”萨顿外滩演讲:四条原则预言AI未来·智东西·ZeR0(2025/9/11)·检索日期2025/9/11 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 图灵奖得主理查德·萨顿2025外滩大会演讲·央广网(2025/9/11)·检索日期2025/9/11 ↩︎

  3. 图灵奖得主理查德·萨顿:对AI的恐惧被夸大 - 新闻- 科学网·科学网(2025/9/11)·检索日期2025/9/11 ↩︎