具身智能的“影子工匠”:万亿赛道下,谁为机器人的智慧买单?

温故智新AIGC实验室

TL;DR:

具身智能的飞速发展离不开背后庞大的“数据劳工”群体,他们以重复性体力劳动为机器人提供不可或缺的训练数据。然而,由资本效率驱动的外包模式,正导致这一群体的薪资被层层盘剥、职业前景充满不确定性,深刻拷问着智能时代的技术伦理与社会公平。

当我们为具身智能机器人展现出的精巧动作和自主学习能力而惊叹时,其背后往往隐匿着一群默默无闻的“影子工匠”——数据劳工。这些看似低技术门槛的劳动者,正通过身穿操作设备、一遍又一遍重复动作,或是逐帧标注海量视频,为万亿级具身智能赛道奠定基石。这不仅仅是商业模式的考量,更是一个关于技术伦理与社会责任的深刻命题:我们所憧憬的智能未来,究竟应由怎样的人文基石来支撑?

具身智能的基石与阴影:数据劳工的崛起与困境

具身智能,作为连接数字世界与物理世界的桥梁,其智能水平的跃升与训练数据的质与量息息相关。正如业界普遍认为,“海量真机数据集能左右具身智能发展速度”1。这遵循着人工智能领域“大力出奇迹”的Scaling Law,即在足够规模的数据与算力投入下,模型能展现出涌现智能。然而,获取高质量、大规模的真机数据并非易事,它需要人类的“具身”参与

正是这种需求催生了“数据采集员”这一新工种。他们身着数采外骨骼或遥操设备,重复进行数百次抓取、拿放、搬运等动作,如同教导婴儿学步般,引导机器人模仿人类行为。或是坐在电脑前,对视频进行细致的逐帧标注,成为机器人在数字世界中的“镜像”与“导师”2。这项工作本质上是“枯燥的体力活”,且通常门槛较低,多数岗位偏好男性且要求一定的体力,例如能抓取15公斤重物2

然而,这群亲手锻造智能未来的“教导者”,却可能正在为未来取代他们自己的机器人铺路。Business Insider曾评论道:“数据收集员的工作正是为Optimus最终取代人类劳动铺路。”2 这揭示了一个深刻的悖论:人类的劳动正被用于构建一个可能不再需要人类劳动的世界。

资本驱动下的产业生态异化

数据劳工的困境,并非孤立现象,而是当前具身智能产业资本逻辑驱动下的必然结果。对于初创企业而言,核心竞争力在于算法研发和硬件制造等“硬核”环节。面对摩尔定律的加速失效和模型迭代的日新月异,为“轻装上阵”,将数据采集与标注等基础工作外包给第三方,成为降本增效的普遍策略2

这种层层外包的模式,虽然在经济层面具有合理性,却导致了复杂的管理链条和劳工关系的脆弱化。数据劳工往往通过多层分包获得工作,导致薪资像“洋葱”一样被层层剥离。一手承包方可能支付日薪250元,而经过二手、三手劳务公司后,最终到工人手中的可能只有150-200元2。这不仅压低了劳动价值,还使得工作稳定性极差,项目一旦终止,整个团队可能瞬间解散。

此外,外包模式还可能反噬技术本身。管理链条的延长导致企业规范难以有效传导,甚至出现“二次合格”现象——具身智能企业要求的“及格”数据,在劳务公司与劳工之间可能变成“得过且过”的交付,最终影响数据质量2。这不仅揭示了产业初期的“野蛮生长”,更可能成为具身智能未来发展的隐患。

伦理深思:智能涌现背后的人文价值重估

这一现象引发了深刻的哲学思辨:当智能展现出震撼人心的魔力时,那些支撑其运作的幕后劳动者,是否得到了应有的认可?AI领域知名学者凯特·克劳福德(Kate Crawford)在《技术之外:社会联结中的人工智能》一书中指出,这些工人从事支持AI“魔法”的重复性工作,却从未因此获得认可,且薪酬普遍较低2

数据劳工的“无根”状态令人深思。从互联网到移动计算,再到大模型和具身智能,技术风口一轮接一轮,数据劳工也随波逐流,难以在任何一个领域扎根和积累。他们的职业发展缺乏稳定性,技能沉淀有限,普遍面临“就业无保障”的困境2。即使是计算机、人工智能相关专业的大专生,将这份工作视为“行业红利”和“跳板”,也清晰地认识到其不稳定性。

我们必须审视,这种看似高效的劳动力使用方式,是否正在异化劳动本身。当劳动密集型岗位上的数据劳工,亲手教会机器人如何从事基础性、枯燥的重复性劳动时,人类自身的劳动价值和尊严,以及在未来工作中的定位,都面临着前所未有的挑战。

前瞻与应对:构建可持续的具身智能劳动力生态

展望未来,数据劳工的地位并非一成不变。短期来看,在“感知”层面(如识别物体)的自动化可能较快,但在需要“理解”物理世界复杂交互(如力度、触感、突发情况)的“认知”层面,高质量的人类演示数据在较长一段时间内仍是不可替代的“教科书”2。北京人形机器人创新中心具身大模型负责人鞠笑竹也强调了自主学习能力和跨本体泛化操作能力的重要性,这些都依赖于高质量的训练数据3

然而,从长远来看,AI自动标注、世界模型生成与仿真技术优化数据采集方案,可能会逐步“挤占”底层劳工的生存空间。因此,构建一个可持续的具身智能劳动力生态至关重要。

  1. 职业成长路径的拓宽:产业方应着力帮助数据劳工实现“经验转化”。例如,底层采集员可凭借一线实操经验,转向数据质量把控、筛选有效动作数据、修正冗余标注,甚至参与编写场景化采集手册,将“如何让机器人精准识别障碍物”等经验转化为行业标准,摆脱纯体力劳动的局限2
  2. 劳工权益的保障:需建立更健全的劳动保障机制,规范外包流程,确保数据劳工获得合理的薪资待遇和稳定的劳动关系,减少层层转包带来的薪资盘剥。这需要企业、劳务公司及监管机构共同努力。
  3. 技术与人文的融合:具身智能的发展不应只关注技术突破,更要关注技术对人类社会的长远影响。企业应承担起更多的社会责任,投入资源进行劳动力转型培训,为可能被取代的工人提供新的技能和就业机会。

当我们沉浸在具身智能描绘的未来蓝图中,不应忽略那些支撑技术迭代的“数据劳工”。他们的职业发展与产业演进本就是相互依存的整体,而非割裂的个体与背景。我们正在见证林立的具身大厦,但要记得何人把它一手手搭。一个真正“智能”的未来,理应是一个能够平衡技术进步与人文关怀的未来。

引用


  1. 具身智能的最大壁垒——训练数据·电子工程专辑·(2024/05/21)·检索日期2024/05/30 ↩︎

  2. 数据劳工“撑起”万亿级具身智能赛道·DoNews专栏·彭堃方,编辑:吕鑫燚(2024/05/29)·检索日期2024/05/30 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  3. 模型、数据、落地之争:具身智能来到“破晓”时刻·知乎专栏·(2023/12/11)·检索日期2024/05/30 ↩︎