当200位具身从业者被拉进同一个屋子

具身智能沙龙:数据是通向物理世界的桥梁

本次沙龙汇聚了来自具身智能产业链各环节的专家,包括模型、数据、评测与本体设计等方向的研究者和工程师。讨论的核心问题是:具身智能如何真正从实验室走向物理世界?

在这一过程中,数据的采集、标注、评测与模型训练成为核心瓶颈。与传统文本和图像数据不同,具身智能数据的多模态与本体依赖性使其难以复用和标准化。例如,视觉、位姿、力反馈等数据维度的复杂性导致跨本体数据迁移极为困难。

乐聚机器人代表指出,具身智能的数据规模尚未达到Scaling Law起效的门槛,这限制了模型性能的提升。当前,LingBot-VLA等模型的训练依赖真机数据,尽管已整合2万小时数据并覆盖9种构型,但这些数据仍远不足以支撑真正泛化的智能能力。

数据采集与标注:认知对齐是关键难题

沙龙中多位专家强调,数据采集中最难的不是硬件设备或流程,而是“认知对齐”——即如何让一线数采员真正理解算法团队的需求,确保采集到的数据具备模型训练的价值。

北京人形机器人创新中心车正平指出,当前数据采集面临三大不对齐问题:

  • 学习对象与数据不对齐,遥操作动作质量远不及人类自然行为;
  • 任务分布与数据不对齐,采集的往往是基础操作,而用户需要的是更复杂任务;
  • 本体之间不对齐,不同机器人之间的传感器与零位误差差异大,影响数据统一性。

此外,数据的自然性(in the wild)也被忽视。例如,人为设置重复任务反而破坏了数据的多样性与真实性,降低了模型泛化能力。因此,数据采集不仅需要规模,更需要真实场景中的高质量、多样化的交互行为。

评测体系构建:低分是常态,高分是危险信号

评测环节中,上海交通大学李永露分享了GM-100评测基准的设计理念。该基准共包含100项任务,旨在覆盖当前预训练数据中未充分体现的物理过程。

当200位具身从业者被拉进同一个屋子

他强调,一个好的评测基准应该在初期表现“低迷”。正如他在沙龙中所说:“低分未必代表好,但起步就拿高分肯定不行。”如果刚发布就能冲上80分,说明基准本身不具备挑战性,无法推动技术进步。

GM-100评测结果显示,即使是当前主流模型如Pi 0.5与LingBot-VLA + Depth,平均得分也仅为13和17分,整体成功率偏低。这一结果印证了评测系统的有效性,也为未来模型优化提供了明确方向。

数据来源方面,李永露展示了具身数据的低可用性:12万小时人类行为数据中,真正可用于VLA训练的不足5000小时;某机构公开的11万小时工厂视频数据中,可用比例不到3%。

模型训练与架构设计:从单任务到多任务联合训练

在模型训练方面,蚂蚁灵波科技郑可成指出,当前VLA模型的主流范式存在根本性局限:依赖特定本体和特定任务采集数据,再进行微调部署,本质上只是轨迹拟合,泛化能力有限。

为此,蚂蚁灵波尝试引入大语言模型和视觉语言模型的预训练范式,让具身模型在预训练阶段就学习通用的物理交互知识,从而减少具体任务的采集成本与训练时间。

LingBot-VLA采用Pi系列的MoT架构,并结合LingBot-Depth模型,通过知识蒸馏提升深度估计能力,解决透明、反光、密集物体的操作难题。初步结果显示,该模型在多个评测任务中表现优于主流模型。

不过,郑可成坦言,当前数据规模仍不足以验证Scaling Law在具身智能中的有效性。多任务联合训练相比单任务训练虽有一定提升,但真正通用化的操作能力仍需大量数据积累与架构创新。

未来展望:具身数据生态的标准化与协作化

沙龙最后的圆桌讨论环节,由量子位主编金磊主持,来自北京人形机器人创新中心、蚂蚁灵波、智源研究院与库帕思科技的四位专家深入探讨了具身数据的未来路径。

他们一致认为,当前行业最需要的是标准化的数据链路与协作生态:

  • 核心工艺与技术壁垒应通过自研或定制真机数据构建护城河;
  • 通用技能的冷启动可依赖共享数据快速形成基础泛化能力;
  • 长尾场景与边缘案例则可借助仿真合成数据进行补足。

智源研究院姚国才指出,行业“太着急”,对数据目标、采集标准与质量评价尚无共识。北京人形车正平则提出VIP仿真标准:Visual(视觉)、Interactive(交互)、Physical(物理),强调仿真虽不能替代真机数据,但能显著减少依赖。

曹宇预测,未来3-5年,行业将从封闭的全链路模式转向协作生态。场景方、数据方与模型方将分工明确,各自聚焦,推动具身智能进入规模化应用阶段。

相关阅读

图计算如何让AI更聪明?9月7日来外滩找答案

连机器人都有4S店了|WRC 2025

人形机器人放无人机,还能上天入海!有点过于赛博了吧

地瓜机器人再获1.5亿美元投资!B轮累计融资2.7亿美元

让机器人“看清”三维世界,蚂蚁灵波开源LingBot-Depth模型

大厂AI新战场:AQ狂飙,蚂蚁押注大健康赛道