擎朗KOM2.0:具身智能的“快慢”哲学,重塑服务业的未来劳动力图景

温故智新AIGC实验室

TL;DR:

擎朗智能发布KOM2.0模型,通过结合“快慢双系统”架构和海量行业数据,构建了服务具身智能的通用智能底座与岗位化垂域能力。这一突破性进展不仅预示着服务机器人从“功能机”向“智能体”的跃迁,更将深刻影响全球服务业的劳动力结构和商业模式,推动具身智能迈向规模化商业落地。

在具身智能浪潮席卷全球之际,物理世界与数字世界的融合正以前所未有的速度发生。擎朗智能(KEENON Robotics)发布的自研VLA模型KOM2.0(KEENON Operator Model2.0),不仅是其在服务机器人领域深耕多年的技术结晶,更是具身行动智能从理论走向大规模应用的关键一步。它所展现的通用性与专业性并举的路径,为我们描绘了服务业乃至更广阔领域中未来“智能劳动力”的清晰图景。

技术原理与创新点解析

擎朗KOM2.0的核心在于其模仿人类“大小脑”的_快-慢双系统架构_,这是一种在具身智能领域极具前瞻性的设计理念。

  • “慢系统”K-Mind(KEENON Mind):作为多模态视觉语言模型(VLM),它承载着机器人的“思考”功能。K-Mind通过对环境的深度感知、自然语言任务的精确理解以及多模型推理,负责高层任务的规划与决策。这要求机器人不仅能“看”到物体,更能“看懂”场景语义,理解人类意图,甚至预测行为。其卓越性能源于擎朗构建的、涵盖数亿级服务场景数据的K-Infinity(KEENON Infinity Dataset),这些数据资产通过高还原度的数字化场景仿真与真机数据结合训练而来,为模型提供了强大的鲁棒性和泛化能力,使其能应对高频交互、突发干扰和高动态变化等复杂商业场景。
  • “快系统”K-Act(KEENON Act):作为动作专家模型,K-Act负责将K-Mind输出的高层决策转化为精细、连续的物理执行动作。它基于海量真机数据训练,确保了机器人运动的拟人化、安全性和精准性。这种快慢系统的异步协同,实现了高层任务规划的可靠性与低层运动执行的高效性,如同人类大脑中意识与潜意识的协同,是具身智能迈向真正“智能体”的关键一步,实现了从“识别局限”到“意图理解与行为预测”的突破,以及毫秒级实时决策的能力。

KOM2.0在此基础上构建的四大核心能力——更深度的环境认知、更敏捷的实时决策、更拟人的人机交互和更高效的规模部署——共同推动机器人从简单的“功能机”向能够理解世界、自主行动的“智能体”跃迁。

产业生态影响评估与商业敏锐度

擎朗智能不仅停留在通用模型层面,更开创性地提出了**“岗位化”理念**,并落地为垂域模型KEENON ProS。这体现了极强的商业敏锐度和对产业需求的深刻洞察。

“岗位化垂域模型ProS是面向具体服务岗位的深度专业化垂直领域模型,可有效提升通用具身大模型在特定垂直领域中的适用性和效率,使得擎朗具身服务机器人掌握餐饮、酒店、商超等场景中具体岗位的技能。”

  • 市场价值与盈利前景:ProS模型通过预置岗位专家能力,让机器人在特定任务中实现效率、精度和稳定性的显著提升。这意味着机器人可以更快速地融入现有业务流程,减少人工调试和定制需求,大幅缩短部署周期,降低启动成本。擎朗智能CEO李通指出,其单台终端机器人的综合成本控制在人工成本的_三分之一至二分之一区间_,这在全球劳动力成本高企的背景下,为企业提供了巨大的经济吸引力1
  • 全球化战略与产业赋能:擎朗智能的机器人已覆盖全球60多个国家、超600个城市和地区,海外市场销售额占比超过50%1。这种“通用+专用”的多形态具身服务机器人矩阵,能够通过跨场景任务迁移与泛化,有效应对全球范围内因人口老龄化和劳动力短缺带来的挑战。它不仅为海外服务业提供了一种可持续的解决方案,也为中国智能制造出海树立了典范。
  • “耐心资本”与生态构建:李通强调,科技创新离不开“耐心资本”的支持,这使得企业能够进行长期的研发规划,而非被短期盈利压力所困扰1。擎朗的经验是,将主要经营利润投入科技创新,并通过“数据采集-模型训练-场景部署-性能反馈-模型优化”的闭环系统,持续推动模型进化,形成强大的飞轮效应。这种对生态和长期价值的重视,而非仅关注“专利数量”(“专利只能保护过去,无法守护未来”),是其构建核心竞争力的关键。

未来发展路径预测与社会影响洞察

KOM2.0和ProS的发布,预示着具身智能将以更快的速度、更深的程度渗透到人类社会的方方面面,尤其是在服务领域。

  1. 通用智能与垂直专业化的协同进化:未来的具身智能将不再是单一的通用模型或特定功能机器,而是通用底座(如KOM2.0)与无数垂域专家(如ProS)的有机结合。这种模式将使机器人能够快速适应不同场景的需求,并在特定岗位上展现超越人类的效率和精度,从而实现“通用+专用”多形态具身服务机器人矩阵的规模化落地。
  2. 劳动力结构的深刻变革:服务机器人将承担更多重复性、高强度或危险性的工作,改变现有的人力构成。这并非简单的替代,更是人机协作新范式的建立。人类将从繁琐事务中解放出来,从事更具创造性、情感交流和复杂决策的工作。长远来看,这将推动社会对技能需求的变化,加速教育体系的转型以适应未来工作需求。
  3. 伦理与治理的长期挑战:随着机器人越来越智能和拟人,如何定义其社会角色、确保决策的透明性、以及保障数据隐私和安全将成为必须面对的伦理挑战。人机交互的拟人化提升了用户体验,但也可能引发关于情感连接和责任归属的深层哲学思辨。
  4. 中国在全球具身智能竞赛中的战略地位:擎朗智能的成功,以及中国在供应链、算法创新、数据积累和工程师人才储备方面的综合优势,使其在服务型机器人领域建立起全球领先地位1。这与国家推动的“新质生产力”发展方向高度契合,即通过科技创新提升产业附加值,实现从制造大国向智造强国的质变。具身智能作为AI技术在物理世界的重要落地,将是中国在全球科技竞争中占据高位势的关键领域之一。

具身智能的未来图景,并非由单一技术或公司所能描绘。它需要资本的耐心、技术的持续创新、产业的协同发展以及社会对变革的适应与规划。擎朗KOM2.0的发布,是这一宏大叙事中的一个重要里程碑,它以其独特的架构和商业化路径,为我们揭示了具身智能如何跨越“概念热潮”迈向“实用落地”的坚实一步。

引用


  1. 专访“小巨人”擎朗智能CEO李通:中国向智造强国迈进离不开持续的 ... · 证券时报网 · 许凯 张聪(2025/7/26)· 检索日期2024/7/26 ↩︎ ↩︎ ↩︎ ↩︎