TL;DR:
2025世界机器人大会揭示人形机器人正从展示走向实用,深度融入科研、工业和商业场景。其核心驱动力是具身智能模型(如VLA),而真实场景数据的匮乏与积累正成为决定商业化成败的关键“护城河”,预示着一个由数据驱动的具身智能新时代正在加速到来。
在2025世界机器人大会(WRC)的喧嚣中,人形机器人不再满足于“秀肌肉”式的舞蹈或表演,而是集体“变忙”,积极投身于各类工作场景,展现出前所未有的商业化决心与技术成熟度。从科研平台到工业产线,再到日益复杂的商业与家庭环境,人形机器人的落地步伐正以惊人的速度加快,其背后是具身智能(Embodied AI)技术从理论走向实践的深层驱动,以及对高价值数据的强烈渴求。
具身智能的具象化:从舞台到流水线
本届WRC最直观的趋势是人形机器人应用场景的显著拓展。它们正从实验室的象牙塔和展馆的橱窗走向更为广阔的现实世界,并初步形成了三大核心应用场景:科研、工业和商业1。
在科研场景中,人形机器人被视为稳定的硬件平台,供高校和研究机构部署和验证其自研算法。例如,逐际动力首次展出的全尺寸人形机器人LimX Oli,以15.8万元的起售价和31个自由度,成为业内首款20万元以下的全尺寸科研级产品,其对成本、稳定性和可扩展性的侧重,反映了科研界对高性价比实验平台的需求。
工业场景则强调结构化、标准化的工作环境。人形机器人在产线上承担巡检、分拣、搬运等重复性任务,旨在无缝融入为人类设计的现有作业流程。优必选的Walker S2与Cruzr S2通过群脑网络2.0调度,协同无人物流车完成物料入库到智能分拣的全流程作业,并通过3分钟自主换电技术实现7×24小时续航,展现了工业机器人极高的效率和实用性。
而商业场景则挑战机器人在高动态、非结构化环境中的人机交互能力。从导览、导购到零售、家庭服务,应用场景最为丰富。银河通用的Galbot机器人在零售场景中展示了购买接待、点单支付等功能;擎朗科技的XMAN系列能制作爆米花、调制饮品;优理奇的Wanda 2.0/3.0则演示了从打鼓演奏到冰淇淋制作的复杂任务。这些商业化探索不仅证明了人形机器人的多才多艺,更揭示了市场对其服务潜力的巨大需求。
值得注意的是,展会上的“秀肌肉”环节,如宇树科技的机器人拳击赛、加速进化的足球表演,并非单纯的娱乐。正如王兴兴所言,“赛事本身就是一种经济场景”1。这些表演在技术验证的同时,也在潜移默化中培养了公众对机器人的认知和接受度,为未来的大规模商业落地奠定社会基础。
VLA模型:人形机器人“智慧”的深层引擎
人形机器人能够从“秀”走向“做”,其核心在于“智商”的提升,即其“大脑”和“小脑”的技术飞跃。如果说“小脑”负责运动规划和姿态控制,确保躯体的灵活与平衡,那么“大脑”则承载了感知环境、理解语言、学习与决策等高级智能。
本届大会上,**视觉-语言-动作模型(VLA)**成为各大厂商争相展示的核心技术。智平方的通用智能机器人“爱宝”搭载了全栈自研的端到端具身大模型GOVLA,通过“快慢双系统”实现复杂任务规划与高速控制的统一,展现了搬箱码垛、制作饮品等多样作业。星海图首发的G-0 VLA模型则采用单一端到端架构,实现从视觉感知到全身关节控制的直接映射,使得机器人仅凭一句指令就能在任意布局的卧室中自主完成铺床。星尘智能的DuoCore-WB模型和Astribot S1机器人则通过毫秒级低延时动作复刻,展示了高精度人机协作和非遗漆扇制作等复杂手部操作。
然而,尽管VLA模型取得了显著进展,关于其是否为具身智能终极解决方案的讨论仍在继续。有观点认为,当前基于Transformer的大语言模型架构在具身智能领域仍有优化空间,未来可能需要原生、多模态、多维物理世界驱动的模型架构2。例如,北京人形机器人创新中心发布的具身世界模型体系,基于超过5000小时的视频数据训练,赋予机器人“看见未来”的能力,并提升其在未见场景下的泛化能力3。这表明行业正在积极探索更强大的模型架构,以解锁具身智能无限数据的可能性。
数据:人形智能落地的“护城河”与“拦路虎”
当被问及人形机器人落地的最大难点时,行业内的共识指向了高质量、大规模真实场景数据的稀缺性1。尽管模型能力日益增强,机器人适应不同场景的速度随之加快,但缺乏对应场景的训练数据,无疑限制了机器人的“进化”速度和泛化能力。
然而,这枚“拦路虎”也蕴藏着巨大的商业机遇,成为未来的**“护城河”**。谁能在特定垂直场景下积累更多高价值数据,谁就能在该领域构筑深厚的竞争壁垒。这种“数据飞轮”效应——数据的积累促进产品落地,落地产生更多数据,进而加速产品迭代——正驱动着人形机器人产业的专业化与垂直化。
傅利叶公司凭借其在医疗康复机器人领域的深厚积累,推出了主打社交陪伴与辅助陪护功能的Care-bot GR-3机器人,其55个自由度、亲肤材质和全感交互系统,正是基于其在医疗场景中积累的大量用户交互和功能性数据。赛那德的iLoabot-M物流机器人则凭借在设备阶段积累的海量数据,构建了物流行业首个VLA垂直大模型,据称每个包裹的装卸过程能产生200多条有效数据,使其成为国内唯一实现商业化落地的具身智能装卸货机器人1。
为解决数据难题,乐聚等公司也推出了人形机器人训练场方案,提供数据采集工具链、训练框架和部署工具链,旨在帮助科研人员和企业更高效地收集、处理和利用数据,加速模型训练和部署。这预示着数据基础设施的建设将成为人形机器人产业生态中不可或缺的一环,甚至可能催生新的数据服务商业模式。
未来图景:具身智能重塑人机共生社会
人形机器人的崛起,不仅是技术层面的突破,更预示着对未来社会结构和人类生活模式的深远影响。当人形机器人真正成为各行各业的“打工人”,其对劳动力的替代效应将是显而易见的。重复性、危险性和脏累差的工作将逐步被机器人接管,这既带来了生产效率的巨大提升,也对人类的就业结构和技能需求提出了新的挑战。社会需要思考如何进行劳动力再培训、如何构建新的就业形态以适应这种变革。
从哲学思辨的角度看,当人形机器人不仅能执行任务,还能通过具身大模型展现出“类人”的认知、预判和交互能力时,我们与机器之间的关系将进一步模糊。它们不再是单纯的工具,而是可能成为某种意义上的“伙伴”。这种人机共生的社会图景将引发对“智能”本质、人类定义以及伦理边界的深刻反思。
然而,这条道路并非坦途。数据隐私、算法偏见、责任归属以及机器人的安全可控性等伦理与治理问题,将伴随具身智能的广泛应用而日益凸显。社会各界需要共同努力,在技术发展的同时,构建健全的法规体系和伦理规范,确保人形智能的进步能够造福人类,而非带来不可控的风险。
总而言之,2025世界机器人大会传递出清晰的信号:人形机器人已然站在了从“演示”到“实用”的拐点。在模型智能的驱动下,以及对真实场景数据的渴求与积累下,它们正加速渗透到生产生活的方方面面。虽然“道阻且长”,但一个由具身智能重塑的、人机共生的未来已然在望,而“工作中的机器人”终将变得“见怪不怪”。