万亿具身智能赛道,被数据卡住了

数据瓶颈成为具身智能发展的核心制约

在当前具身智能领域中,数据短缺已超过硬件成为主要瓶颈。不同于语言大模型依赖互联网文本数据,具身智能需要的是高精度、多模态、时空对齐的“人类行为数据”。这些数据必须能完整还原“意图 – 行为 – 结果”的因果链条,才能支撑机器人真正理解动作背后的意义。

  • 数据类型复杂:包括视觉、听觉、力觉、触觉、关节角度、动作轨迹等多维信息。
  • 采集精度要求高:毫秒级的时间同步和高分辨率的空间定位是基本要求。
  • 数据标注成本飙升:传统人工标注无法支撑指数级增长的数据量。

例如,一个简单的“拧瓶盖”动作,机器人需要通过数据学会感知物体材质、判断旋转方向、控制抓取力度、识别完成信号等,每个环节都依赖大量真实场景数据。

采集技术革新:从柔性穿戴到刚性结构

为应对数据采集难题,企业开始从硬件构造到数据处理的底层技术栈进行全面重构。

硬件革新方向:

  • 骨骼仿生设计:采用刚性连杆和高精度磁传感器,取代传统柔性穿戴结构,减少因形变导致的测量误差。
  • 轻量化无感佩戴:新型采集终端更加注重佩戴体验,避免影响操作者的自然行为。
  • 集成多模态传感:结合视觉导航与惯性测量模组,在遮挡等复杂环境中仍能实现毫秒级校准。

数据处理升级:

  • 专用 SoC 芯片:确保数据采集过程中硬件时钟严格同步。
  • 自动化语义清洗:利用云端基础模型处理原始数据,实现语义关联与清洗,减少人工标注需求。
  • 小型团队替代人工:将过去需要数千人标注的工作压缩至数十人的技术团队完成。

这些创新标志着一场将“碳基生命体验转化为硅基可用资产”的基础设施革命正在行业内部悄然发生。

数据孤岛、标准缺失与生态封闭

即便采集技术有所突破,行业仍面临多重系统性挑战:

万亿具身智能赛道,被数据卡住了

数据孤岛问题:

  • 各家企业采集设备不同,数据格式不统一,形成信息孤岛。
  • 硬件异构导致数据复用性差:五指手与三指手、旋转执行器与线性执行器,采集到的数据无法通用。

标准体系未建立:

  • 缺乏统一的数据格式、标注规范、安全协议,采集数据难以流通。
  • 技术路线未收敛,如触觉传感器的电磁方案与柔性电极方案并存,导致数据无法兼容。

数据壁垒加剧生态封闭:

  • 企业出于竞争考量,将数据视为核心资产,不愿开放共享。
  • 数据绑定硬件方案,一旦硬件被淘汰,数据资产也随之失效。

这些问题使得具身智能无法形成闭环反馈与持续进化,阻碍了通用能力的构建。

数据生态建设:国家与企业协同推进

为破解上述难题,国家层面和企业正同步推进数据生态的构建。

国家战略推动:

  • 2024年发布《人工智能 具身智能数据采集规范》,推动数据标准化。
  • 建设“2+N”数据训练体系,北京、上海建成国家级训练场,多地推进人形机器人创新中心。

企业多维布局:

  • 真机采集:如智元机器人推出 AgiBotWorld。
  • 灵巧手采集:灵巧智能推出 DexCanvas,记录真人操作数据。
  • VR遥操采集:远程操控机器人执行任务,获取高质量交互数据。
  • 合成数据:构建三维仿真环境,快速生成训练样本。

这些路径虽各有优劣,但正在融合形成互补的数据供给体系。

走向泛化能力的关键:构建完整数据价值链

要实现具身智能的真正泛化,行业必须构建从采集、处理、标注、共享到模型训练的完整价值链。

数据泛化的挑战:

  • 环境差异:同一动作在厨房、仓库、办公室表现不一。
  • 任务割裂:传统“分体式”采集难以支撑全身协同能力。
  • 模型绑定:当前模型多与特定数据集、本体结构绑定,无法适应变化。

未来发展方向:

  • 统一采集与训练:打破“移动”与“操作”的模块割裂,实现全身动作的统一采集。
  • 动态数据适配:构建可转产、可适配多场景的数据处理能力。
  • 规模化数据供给:从“能不能做”转向“一个月能出多少小时数据”,产能成为新竞争要素。

据海天瑞声透露,2025年行业目标是将数据供给提升至百万小时级。数据要素的产业化趋势正加速成型,央国企与地方国资的投入也日益增强。

“数据要素价值释放年”——国家数据局局长刘烈宏指出,2025年将是数据要素进入产业化的关键节点。
张哲也表示:“未来五年,数据将成为具身智能发展的核心燃料。”

在硬件持续演进、资本加速涌入的当下,只有构建起高质量、标准化、泛化能力强的数据生态,具身智能才能真正从“表演型机器人”迈向“通用型智能体”。