TL;DR:
作为具身智能领域的先行者,王兴兴凭借其对“运动智能”近乎偏执的稳定性追求,正带领宇树科技试图跨越机器人行业的“ChatGPT时刻”。他不仅定义了机器人在陌生场景下完成任务的“80%准则”,更以一种“先塑肉身,再造灵魂”的哲学逻辑,预演了一场未来20年的工业与家庭革命。
2026年3月,GTC大会的聚光灯下,王兴兴身着标志性的深色外衣,神色中透着一种工程师特有的冷静与隐微的狂傲。这位宇树科技的掌舵人再次向世界抛出了他的断言:即便是在20年后回头看,发布于2024年的G1人形机器人依然会是一款无法绕过的经典。
这种自信并非无本之木。从2009年大学宿舍里那个摇晃的小型人形机器人,到如今在春晚舞台上表演醉拳、空翻,甚至进入工厂“自己制造自己”的进化体,王兴兴用了17年时间,试图在冰冷的金属与复杂的算法之间,寻找某种属于生命的律动。
2009年的种子与2026年的野心
在王兴兴的叙事里,时间总是有着奇妙的重叠。当大多数人还在惊叹于ChatGPT带来的语言震撼时,他的目光却始终钉在那个“会动的实体”上。[^1]
“机器人要干活,运动能力是前提。”他在多个场合重复这句话,语气平实得近乎枯燥,背后却藏着一套类似生物进化的深层逻辑。在他看来,自然界的蚂蚁、老鼠未必有发达的大脑,但其运动智能却足以支撑生存。[^1]这种“由外而内”的路径,构成了宇树科技独特的技术底色。
采访中,王兴兴谈及G1机器人时,眼神中闪烁着《名利场》式人物特有的那种对作品的迷恋。他强调G1的紧凑、易用与高性价比。在他眼中,G1不仅是一个产品,更像是一首用硬件写就的短诗——在1.3米的身躯里,塞进了高自由度的腿部和手部,以及完整的感知系统。这种对“比例”和“工业美感”的苛求,让他看起来更像是一个追求极致的工匠,而非单纯的生意人。
“蚂蚁”的哲学:先稳住,再谈智力
如果你近距离观察过宇树的H1机器人在田径场上跑完1500米,或者目睹它在受到外力冲击后如何踉跄几步迅速恢复平衡,你就能理解王兴兴对“稳定性”的近乎强迫症般的痴迷。
“机器人大规模应用,最重要的一点就是稳定性必须足够好。”[^1]在王兴兴看来,一个一摔即碎、或者在陌生环境中不知所措的金属架子,谈不上任何智能。
这种理念在2026年的春晚背后得到了最极端的检验。为了那场震撼全球的机器人功夫秀,王兴兴梳理了上百个传统武术动作,从醉拳到双截棍。他放弃了早期的单动作策略,转而采用一种“预训练的全身RL(强化学习)模型”。[^1]这让机器人可以在瞬间静止,并无缝切入下一个动作,而不会像笨拙的木偶那样因为惯性倒下。
“这不再是单个动作的训练,而是整套系统能力的爆发。”他如是评价。这种从硬核工业控制向艺术化表达的跨越,本质上是他对机器人“肉身表达能力”的一次深度挖掘。
寻找机器人的“ChatGPT时刻”
即便已经站在行业巅峰,王兴兴依然保持着一种清醒的危机感。他直言不讳地指出,具身智能距离真正的“临界点”还有2到3年的航程。[^2]
他提出了著名的“80%准则”:如果有一天,机器人能在80%的陌生场景里,仅凭语言指令完成80%的任务,那才是具身智能的“ChatGPT时刻”。[^1][^3]
为了抵达这个时刻,他正在进行一场豪赌。相比于目前主流但天花板可见的VLA模型,王兴兴更看好“世界模型”或“视频生成模型”。他试图让机器人先在虚拟的“想象”中生成动作,再将其与物理现实对齐。[^1]
“视频模态与真机模态的对齐,哪怕差一毫米,结果都完全不同。”王兴兴说这句话时,眉头微蹙,这是整场专访中他表现得最为焦虑的时刻。这种对“一毫米”的计较,正是他作为科技先驱在无人区行走时的常态。
时代的“拓荒者”
王兴兴并不避讳谈及竞争,但他更强调“协作”。在他看来,具身智能是一个历史性的命题,需要全球性的算力、数据和人才共同破解。[^3]
在宇树的工厂里,人形机器人已经开始尝试装配自己的同类。这听起来像是一出科幻电影的开场,但在王兴兴眼中,这只是通往未来生活的必要路径。他希望未来的As2机器狗能帮徒步者背起行囊,希望H1能走进千家万户承担重体力活。[^1]
采访结束时,谈及对未来的预判,王兴兴表现出了一种《纽约客》特有的冷峻观察:“AI这件事多少带点运气成分,也许某个天才明天就能做出那个完美的模型。但在此之前,我们需要把每一颗电机、每一行RL代码磨到极致。”
他站起身,动作干练,像极了他亲手打造的那些精密机器。在这个算法横行的时代,王兴兴依然相信:真正的智能,必须要在真实的土地上,站得稳,跑得远。