TL;DR:
图灵奖得主杨立昆脱离硅谷主流的生成式AI热潮,在欧洲创办新公司AMI,旨在通过“世界模型”路径探索真正能理解物理世界的“非生成式”人工智能。此举不仅是对当前大语言模型局限性的深刻批判,也预示着通用人工智能(AGI)的路线之争正走向多元化,重塑全球AI研发的地理与技术版图,开启对具身智能和物理AI的深度探索。
Meta即将离任的首席人工智能科学家、图灵奖得主杨立昆(Yann LeCun)的最新举动,无疑为全球科技界投下了一枚重磅炸弹。他选择在欧洲而非硅谷创办自己的新公司AMI(先进机器智能),并明确表示将专注于与当前生成式模型截然不同的“世界模型”和“非生成式”AI架构,这不仅是一次地理上的迁徙,更是对AI发展核心路径的一次深刻思辨与战略押注。硅谷被“生成式模型所催眠”的断言,直指当下AI热潮的深层局限,并为AGI的未来发展提供了另一条充满挑战与机遇的探索之路。
技术原理与创新点解析:世界模型的崛起与“非生成式”路径
杨立昆对现有大语言模型(LLM)的批判毫不留情,他指出LLM“缺少一个重要的东西”以达到人类级别的智能,甚至直言“有些人声称我们可以扩展现有技术并实现通用智能,但我恕我直言,我认为那是胡说八道”1。这种“缺少”的核心在于,LLM虽能写诗、编程、通过律师资格考试,却无法像一个五岁孩子那样理解和操作物理世界。它们的认知局限于文本符号的线性关联,缺乏对物理世界的三维空间建模能力与动态因果推理能力,本质上是基于输入数据间的关联性进行预测,而非真正的逻辑推理2。
杨立昆倡导的“世界模型”正是为了弥补这一鸿沟。世界模型,顾名思义,旨在构建AI对现实世界的“内在理解”和“心理模拟”。它通过高维感知数据(如视觉、听觉、运动等)直接建模,绕开语言转换,在潜空间内推演物理规律,并输出行动指令,实现对环境的内在理解与主动推理2。其核心特点包括:
- 内在表征与预测:将原始观测数据编码为低维潜在状态,并在此基础上预测未来状态分布,实现对事件的前瞻性预判。
- 物理认知与因果关系:具备理解重力、摩擦力、运动轨迹等物理规律的能力,从而在处理物理世界问题时提供更准确的决策支持。
- 反事实推理能力:能够进行假设性思考,回答“如果环境条件改变,结果会怎样”等问题,为复杂问题解决提供多种可能性2。
AMI将采用“非生成式”的AI架构,这并非意味着完全不进行任何形式的“生成”。相反,这里的“非生成式”更侧重于其核心目的和机制的差异:它不是以大规模内容生成(如文本、图片、视频)为主要目标,而是优先聚焦于对环境的感知、理解、推理与规划。它可能生成对未来状态的预测或模拟,但这是作为理解物理世界和辅助决策的手段,而非终极产物。这种路径类似于人类婴儿通过观察、触摸、互动来建立对物理世界的认知,而非通过阅读百科全书来学习重力2。AMI的目标是“让系统能够理解物理世界、拥有持久记忆、能够推理并能规划复杂的行动序列”1,这为具身智能、机器人技术和高级自动驾驶等领域开启了全新的应用世界。
产业生态与商业版图重塑:硅谷之外的AGI竞逐
杨立昆选择在欧洲,尤其是在巴黎,创办AMI,是对当前全球AI产业格局的一次战略性反叛。他认为硅谷“完全被生成式模型所催眠”,缺乏对其他AGI路径的开放性。欧洲,凭借其深厚的科研基础、丰富的人才储备(尤其是在AI基础研究领域),以及相对多元的文化背景,被杨立昆视为“大量人才可能没有意识到自己的全部潜力”的沃土,为AMI的全球实体布局提供了重要支点1。
这一选择也反映出科技巨头与独立创新者在AGI路线上的潜在分歧。尽管Meta首席执行官马克·扎克伯格(Mark Zuckerberg)“非常喜欢”杨立昆的项目,但当其潜在应用范围超出Meta的“兴趣范畴”时,杨立昆认为成立独立组织的“正确时机”便已到来1。这种**“非投资,但合作”**的模式,既允许Meta通过技术开放维持一定关联,又给予AMI充分的独立性去探索前沿。
从更广阔的产业视角看,杨立昆的行动并非孤例。另一位AI教母李飞飞也提出“空间智能”概念,并创立World Labs,推出以多模态世界模型为核心引擎的产品Marble2。谷歌DeepMind的Genie系列模型,Meta自身的代码世界模型(Code World Model),以及英伟达CEO黄仁勋对“物理AI”的断言,都表明了科技巨头们正积极布局世界模型和具身智能。特斯拉CEO马斯克更是“世界模型”概念的早期倡导者之一,将其应用于自动驾驶的学习与验证2。这些信号共同指向一个事实:AI的下一轮飞跃不再仅仅是语言智能和视觉智能的深化,而是对现实世界的理解和交互能力的革命。AMI的诞生,将进一步加速具身智能、机器人、自动驾驶等“物理AI”领域的商业化进程,这些领域蕴藏着万亿级的市场潜力。
未来发展路径与哲学思辨:通向通用智能的多元探索
世界模型虽然潜力巨大,但也面临多重挑战。首先是技术与生态层面的鸿沟:
- 数据挑战:构建世界模型需要海量的多模态数据(视频、音频、传感器数据等),其收集、标注和整理成本高昂,且数据的质量和多样性直接影响模型性能。
- 工程体系缺失:目前世界模型缺乏统一的训练语料、可比的评价指标和公共实验平台,企业各自为战,难以形成规模化创新生态2。
其次,是认知与伦理层面的深层考量:
- 可解释性困境:世界模型强大的内部推演和预测能力,也使其决策过程愈发难以被人类理解和追踪。在自动驾驶等关键领域,这引发了责任归属的难题。
- 目标漂移与伦理风险:当AI从被动执行转向主动学习,其目标是否仍与人类一致?一旦AI开始主动理解和规划复杂行动,潜在的“目标漂移”(Goal Drift)将使得AI的安全与伦理议题从技术层面上升到价值层面,带来更深远的社会影响2。
杨立昆选择的“世界模型”路径,不仅是对AGI技术路线的修正,更是一场关于智能本质的哲学思辨。它挑战了当前以数据规模和参数堆砌为核心的“暴力美学”范式,转而强调结构化理解、因果推理和物理世界交互的重要性。这种多元化的探索,预示着AGI的实现可能并非单一路径,而是需要融合不同模型范式的优势。未来的3-5年,我们将看到更多针对世界模型的突破性研究,其在机器人、AR/VR、智能制造、乃至科学发现领域的应用将加速落地。
AMI的成立及其对“非生成式”世界模型的专注,是AI发展史上一个标志性事件。它不仅为AGI的实现注入了新的思考和动力,也促使我们重新审视技术创新与地域文化、商业利益与科学探索之间的复杂关系。在一个日益被AI重塑的世界里,理解智能的本质,平衡技术进步与社会责任,将是人类文明面临的永恒命题。