高阳:从象牙塔到竞技场,具身智能创业家的“游戏”哲学

温故智新AIGC实验室

TL;DR:

高阳,这位从伯克利归来的清华学者,以其对具身智能的深刻洞察和对创业的独特“游戏”哲学,打破了科学家创业的刻板印象。他坚定推行软硬一体的“苹果”模式,并在技术与商业的交锋中不断迭代成长,成为定义未来机器人时代的领军人物。

在世界人工智能大会(WAIC)的喧嚣中,具身智能公司“千寻智能”的联合创始人高阳,以一种罕见的务实与洞察力,为如何辨识机器人的真正实力提供了具象的指引。他建议,不必被华丽的演示所迷惑,只需尝试将衣服团成一团,随意丢在桌上,观察机器人能否继续完成叠衣动作;或者,看它能否处理裤子、外套等跨品类物品,以及动作是否丝滑流畅,而非卡顿。这背后,是这位年轻的科学家兼创业者,对具身智能底层逻辑的深刻理解,以及他对真实世界复杂性的敏锐捕捉。

象牙塔的抉择与转折点的洞见

高阳的履历,映射着当下科技精英回归本土、投身创新浪潮的缩影。从美国加州大学伯克利分校博士毕业后,他选择回国成为清华大学交叉信息研究院的助理教授。彼时的他,醉心于科研的纯粹挑战——将实验室从零搭建起来,引领从0到1的探索。他曾坦言,在大厂做研究工程师,路线是被规划好的,缺乏这种白手起家的刺激感。科研,对他而言,是挑战自我的最佳舞台。

然而,2023年ChatGPT的横空出世,彻底颠覆了高阳,乃至整个学术界对AI发展范式的固有认知。彼时,包括伯克利许多资深教授在内,都曾对OpenAI的理念持怀疑态度。但当GPT-3.5问世,其强大的泛化能力和学习范式的转变,如同一道闪电,击穿了认知壁垒。高阳敏锐地意识到,如果顺着这个逻辑推演,具身智能的崛起将是“一个必然的现象,只是需要一定的时间” 1。这一刻,他作为科学家的求真本能与对技术落地价值的兴趣,交织汇聚成一个清晰的创业冲动。

科学家创业的“不靠谱”与“游戏”哲学

2023年下半年,高阳与前珞石机器人CTO韩峰涛一拍即合,共同创办了千寻智能。韩峰涛丰富的硬件量产经验与高阳深厚的AI研究基础,形成了一对互补的黄金搭档,迅速让千寻智能在这波具身智能浪潮中脱颖而出。成立仅19个月,他们就累计融资超10亿人民币,吸引了华为哈勃、京东、宁德时代、顺为资本等重量级投资者 12

但从高校“象牙塔”迈入商业世界,高阳也曾直面外界对“科学家创业”的偏见。他毫不讳言:“科学家创业,某种程度上并不靠谱。” 1 在他看来,科学家追求真理,是兴趣驱动的工作;而创业则着眼于商业成功,关乎如何服务好客户,如何通过公司形态达成目标,涉及团队搭建、公司文化培养等专业“技术”。

面对这种转变,高阳的应对方式充满了自我觉察与一种独特的“游戏”心态。他将创业比喻为“一种游戏”,而与投资人、客户的交流,都是“游戏里升级打怪的过程” 1。他坦承,最初与上百位投资人交流时,由于技术讲解过于晦涩,“把人讲睡着了” 1。然而,他迅速从反馈中学习调整,如今已“和投资人打交道就变得更熟练了,这是我喜欢的成长的过程” 1。这种开放学习、承认局限性并乐于修正的态度,构成了他从科学家到创业者身份转变的核心驱动力。在他眼中,管理虽非严格意义上的技术,却是一种介于技术与艺术之间的状态,“有迹可循,但又需要一些灵机应变的地方” 1

具身智能的“苹果”路径与未来图景

对于具身智能的技术路径,高阳有着清晰且坚定的主张——要做“具身智能领域的苹果,而不是安卓” 1。这意味着软硬一体的深度融合,而非简单的分工。他认为,在技术发展初期,跨本体能力尚弱,将软件与硬件一体化,才能在无数个行业初期奠定坚实基础,正如早期的个人电脑市场。他与韩峰涛的合作,正是基于这一共识,弥补了他在硬件领域的空白 3

高阳对具身智能的未来抱有宏大愿景,他曾预判四年后将迎来“Robot GPT3.5”的阶段。在这个阶段,机器人将能完成绝大多数指令,“基本上你跟他说任何的事情,他有七八成都能给你完成” 1。这预示着机器人将真正进入我们的日常生活,成为解决复杂任务的得力助手。

为了实现这一目标,千寻智能在技术上持续深耕。高阳强调,判断VLA(视觉-语言-动作模型)效果好坏,需要关注算法如何分解任务(如千寻智能的快慢系统,让动作流畅自然,如甩衣服的快速连贯),以及数据层面如何利用互联网海量人类视频数据进行预训练,以提升泛化性。他直言,许多现有模型无法有效利用人类视频数据,导致性能受限。

对于当下行业内部分机器人公司大规模建设数采工厂的现象,高阳保持着审慎的态度。他认为,在机器人形态仍不断演进的现阶段,大规模数采工厂的价值有限,因为形态变化会导致数据迁移的折扣。他更看重预训练的重要性,认为“最重要的事情是把预训练做好,其次才是数采” 1

“伯克利四子”:从自动驾驶到具身智能的迁徙

高阳与陈建宇、许华哲等人在伯克利时被誉为“伯克利四子”,他们均有从自动驾驶领域转向机器人赛道的背景。这种共同的经历和思考,让他们对“感知-决策-执行”的本质问题有着深刻的共鸣,但也存在各自独特的聚焦。高阳本人偏向操作类型,注重模仿微调和强化微调;而其他成员则分别专注于控制论、3D策略等。

私下里,这群昔日同窗、今日同行的领军者,也常交流管理经验。“彼此吐槽觉得招到特别好的人很不容易”、“讨论怎么面试别人”,这些细节透露出他们从科研到管理的共同成长轨迹。高阳特别强调,在机器人技术飞速迭代的今天,他们更倾向于招募那些虽然工作经验不多,但“在当下接触到的技术就是最前沿的”年轻、聪明、有研究背景的人才 1

坐在办公室里,高阳的电脑显示器上还贴着可爱的卡皮巴拉小公仔,这与他探讨前沿科技时的严谨与深刻形成了有趣的对比。他享受这个充满不确定性的“游戏”,享受在挑战中不断成长的过程。正是这种科学家的求真本能与创业家的开放学习姿态的融合,让高阳和千寻智能,正大步迈向一个具身智能的未来,重新定义人与机器的互动方式。

引用