人形机器人突破临界点:英伟达、中国先行者如何以“物理AI”重塑万亿市场

温故智新AIGC实验室

TL;DR:

人形机器人商业化突破关键在于通用智能模型与仿真合成数据,而非硬件成本;英伟达以全栈算力与平台赋能,携手宇树科技、银河通用等中国企业,正加速其从信息世界向物理世界迈进,有望重塑万亿级产业格局。

在一次全球机器人产业的关键对话中,NVIDIA Omniverse和仿真技术副总裁Rev Lebaredian,与宇树科技创始人王兴兴、银河通用创始人王鹤罕见同框,共同探讨了人形机器人的“命门”与“钱途” 1。这场深度对话不仅揭示了该领域从技术瓶颈到市场爆发的核心路径,更彰显了中国在全球物理AI版图中的独特地位,以及AI如何深度融入物理世界,重塑人类文明的深层思辨。

破局:商业化“命门”从成本转向智能泛化与效率

长期以来,人形机器人的商业化路径被高昂的硬件成本所阻碍。然而,宇树科技创始人王兴兴的观点刷新了这一认知:“成本和硬件并不是关键问题。” 1 真正棘手且限制大规模部署的瓶颈,在于“具身智能模型不够泛用性”和机器人“干活的能力还不够强,能完成的任务类型比较有限” 1。银河通用创始人王鹤进一步指出,当下迫切需要突破的是机器人精准的“抓取”和“移动”能力,尤其是在工业场景中对“速度”的极致追求。

以工厂车间为例,人形机器人已开始在搬运任务上接近人类水平,银河通用甚至预计今年底将有数十台机器人进入工厂实测 1。但从搬运到码垛的“闭环”能力,再到更具挑战性的“分拣”效率,仍面临巨大挑战。熟练工人毫秒级的反应和操作速度,对当前机器人的模型与硬件结合提出了更高的效率要求,特别是在对节拍和精度要求极高的汽车制造等工业场景。这清晰地表明,人形机器人从实验室走向规模化应用,核心驱动力已从单纯的硬件堆叠,转向了由通用具身智能模型所赋能的泛化能力与作业效率

形态之辩与市场雄心:人形机器人何以成为通用智能载体?

关于机器人形态的争议,两位中国行业领袖给出了明确的未来指向。王鹤强调,从长远来看,人形机器人必须能够融入人类生活环境,其**“除了人形态,没有别的形态”** 1。人形的优势在于其通用性,能够适应为人类活动设计的复杂空间,并且在移动和操作上具备无可比拟的灵活性。王兴兴将人形机器人视为“通用机器人的重要载体”,认为当通用AI成熟时,其硬件设计反而相对简洁,甚至未来每个人都能像组装电脑一样制造人形机器人 1

尽管目前轮式底盘在某些工业开阔场景中表现稳定且能耗低,但王兴兴坚定地认为**“腿是未来”**,因为双腿能实现上半身所有可达空间,并灵活调动腰部,提供更强的通用性。这一形态选择背后,是基于对AI能力发展的深刻洞察:一旦具身AI模型足够强大,移动能力将成为附属,腿部控制自然水到渠成。

这种对形态的笃定,源于对未来市场规模的巨大预期。王鹤大胆预测,人形机器人产值将以**“每三年乘10”**的速度增长,未来十年内,其市场规模将超越当前所有工业机器人总量,达到千亿人民币级别 1。再往后十年,更有望突破万亿大关,直逼甚至超越汽车、手机等万亿级消费品市场。这不仅预示着技术层面的爆发,更揭示了一个由物理AI驱动的、前所未有的经济增长引擎。

赋能之核:英伟达的全栈算力与仿真生态

实现上述愿景,离不开强大的底层基础设施。NVIDIA副总裁Rev Lebaredian强调,机器人是“最难的问题之一”,为此英伟达打造了**“三台计算机”**来应对挑战 1

  1. 机器人本体计算机:以专为人形机器人设计的Jetson Thor为代表,提供边缘实时的强大计算能力。其相比上一代Jetson Orin在计算能力、每瓦性能、CPU性能和I/O吞吐量上均实现了数倍提升,满足机器人高速移动和复杂操作的严苛需求 1
  2. AI工厂计算机:以DGX和HGX系统为核心,用于处理海量原始数据、训练具身AI模型和神经网络,是机器人“大脑”诞生的温床。
  3. 仿真计算机:利用Isaac Sim、Isaac Lab等平台进行环境、传感器仿真、机器人测试和合成数据生成,是构建安全可靠机器人系统的唯一途径。NVIDIA Cosmos作为“世界基础模型”及框架,正致力于构建理解物理世界的AI,并与Omniverse等模拟器结合,生成更精确、更大规模的数据 1

Rev Lebaredian指出,仿真在应对真实世界中极少发生但后果严重的“特殊情况”时,具有不可替代的价值。为弥合仿真与现实的**“域间隙”(sim-to-real gap),英伟达正从提升仿真器精度、利用AI辅助生成虚拟环境**(打造“机器人艺术家”)以及直接捕捉现实世界进行数字化三个方向全面发力 1。这三条路径共同构建了一个强大的数据管道,将极大地加速具身智能模型的训练与验证,克服当前多模态大模型面临的“数据不足”瓶颈。

中国优势:从研发到应用的全链路加速器

中国在全球物理AI和机器人领域展现出“独一无二”的优势,成为Rev Lebaredian眼中的**“实现这一跨越的最佳地点”** 1。这得益于:

  • 顶尖AI人才储备:拥有大量受过良好教育、充满热情的AI研究人员和开发者,全球近一半的顶尖AI人才汇聚于此。
  • 电子与计算技术能力:不仅具备强大的技术研发能力,更拥有全球无可匹敌的电子制造产业,为机器人所需关键部件提供了深厚的专业能力和规模效应。
  • 庞大的制造业基础:提供大规模部署和测试机器人的真实场景,加速数据收集、算法迭代和机器人进化。

这种独特的综合条件,使得宇树科技、银河通用等中国企业能够快速将研发成果转化为规模化生产和落地应用,形成一个高效的创新闭环。这种“中国速度”与“中国规模”的叠加效应,正成为全球机器人产业发展的重要加速器。

先行者实践:宇树科技与银河通用的商业化探索

在中国这片沃土上,本土先行者正将具身智能的愿景变为现实。

宇树科技,作为国内知名的机器人独角兽,其人形机器人R1以3.99万元的售价和年底前量产的预期,展现出极强的市场竞争力 1。宇树在足式机器人领域深耕,其足式人形机器人架构已成为全球主流设计。其自研的20自由度灵巧手,目标在未来一到两年内实现机器人与环境的“自然交互”,例如无需预先适配就能指令机器人倒水 1。通过NVIDIA Isaac Sim平台进行动作学习,宇树掌握了舞蹈、跳跃、空翻乃至机器人格斗等复杂动作,最终目标是实现**“任意动作的任意实时生成”**,这标志着从预设编程向通用智能的质变。

银河通用则以其轮式+双臂+双手的G1机器人,在高续航、工业级安全性方面进行突破。作为全球首批搭载NVIDIA Jetson Thor芯片的人形机器人之一,其运动性能和实时视觉处理能力显著提升,被誉为“最快的人形机器人” 1。银河通用在具身大模型VLA(Visual Language Action model)上的深耕是其核心竞争力,其导航大模型可一句话指令自主运动,抓取基础大模型Grasp VLA能实现零样本抓取,应对各种形态物品。值得注意的是,银河通用训练数据中99%为合成数据 1,这验证了Rev Lebaredian关于仿真重要性的论断。在商业应用上,银河通用已成功落地全球首个24小时无人药房解决方案和无人零售店,并计划下一代机器人采用纯双足设计,进一步拓展其通用性。

这两家企业的实践,共同勾勒出中国在物理AI落地上的两条典型路径:一条以宇树为代表,深耕足式和人形本体的运动控制与操作,强调硬件与AI的深度协同;另一条以银河通用为代表,以具身大模型为核心,通过合成数据实现快速泛化,并积极探索实际场景的商业化落地。

未来图景与深层思辨:物理AI重塑人类文明

英伟达高层Rev Lebaredian描绘了一幅宏大的未来图景:过去几十年,计算的力量主要局限于5万亿美元的信息市场,而现在,随着AI尤其是具身智能的兴起,它终于能够进入高达100万亿美元的物理世界市场 1。机器人,正是连接这两个世界的“桥梁”。

这不仅意味着经济模式的巨大变革,更将对人类社会产生深远影响。Rev Lebaredian认为,在许多国家面临人口缩减的当下,打造机器人以创造“人工人口”,辅助完成各类工作、提升生产力,是“刻不容缓的任务” 1。这不仅能维持现有生产力水平,更能推动社会进一步发展,甚至改变GDP的增长逻辑。

从哲学层面来看,AI与机器人的发展,正如电力与蒸汽机的发明一样,是驱动人类文明迈向新高度的又一次伟大飞跃 1。它将重塑劳动分工、生活方式乃至社会结构。然而,随之而来的伦理、安全、就业等深层问题也将日益凸显。王兴兴指出,家用机器人最大的难题并非技术,而是伦理和安全等极高的要求,这预示着未来技术普及的复杂性。

因此,物理AI和机器人的发展,要求全球范围内的持续协作,共同攻克技术难关,平衡机遇与风险,确保这项革命性力量能以负责任的方式,真正服务于人类的福祉和文明的进步。我们正站在一个由物理AI所定义的崭新时代的前沿,其影响将超越我们当前的想象。

引用


  1. 英伟达高层与王兴兴、王鹤罕见同框,深聊人形机器人的“命门”与“钱途”·智东西·ZeR0(2025/8/12)·检索日期2025/8/12 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎