智元开源行业首个聚焦物理交互的具身数据集

6月3日,智元正式开源AGIBOT WORLD 2026数据集第二期主题“多样交互(Rich Interaction)”。这是行业首个聚焦物理交互的开源具身数据集,面向世界模型与神经仿真等前沿研究。与以往仅记录预期成功动作的数据集不同,该数据集刻意捕捉机器人与真实世界之间多样、精细且充满接触的“物理对话”,包括失败、碰撞、滑脱等非理想状态。

不止记录成功,更捕捉每一次失败的物理对话

传统具身数据集多聚焦于演示成功的任务完成轨迹,导致模型在真实环境中遇到意外情况时极易失控。智元此次开源的数据集则贯穿“物理交互”这一核心:不仅包含杯子被平稳拿起、螺丝被精准拧紧这类理想结果,更大量收录了机器人因摩擦力不足导致物体滑落、因力控偏差造成夹具碰撞、因环境动态变化引发路径中断等失败案例。这些“失败”片段并非噪音,而是构成完整物理分布的关键样本——它们真实反映了接触动力学、摩擦力、惯性等真实物理规律,让AI得以学习“什么情况下会失败”以及“如何从失败中恢复”。

智元开源行业首个聚焦物理交互的具身数据集

从模仿到理解:让AI掌握完整的物理分布

该数据集的战略意图在于让具身智能从“行为克隆”跃迁至“物理世界建模”。传统模仿学习仅要求模型复现专家轨迹,但真实物理交互涉及无数连续变量(如接触力大小、表面粗糙度、物体质心偏移),简单的数据增广无法覆盖。通过提供海量带物理标签的交互数据(包括接触力、力矩、关节角度、视觉流等),AI可以构建物理因果模型:例如,当手指施加5N压力时,不同材质的物体形变模式有何差异;当移动速度超过阈值时,物体倾倒的概率如何变化。这种对物理分布的深刻理解,是未来世界模型和神经仿真引擎实现“可预测、可推理”的基石。

面向世界模型与神经仿真:开源生态加速技术落地

数据集明确面向两个核心应用场景:世界模型训练和神经仿真环境构建。对于世界模型,研究人员可利用这些高保真交互数据,让模型学会预测“如果下一步施加某一动作,物体状态将如何演化”——这比单纯预测图像帧更接近物理现实。对于神经仿真,数据集中的真实接触力学参数可作为ground truth,帮助仿真引擎校准其物理引擎的数值精度,从而缩小Sim-to-Real gap。智元将数据集以开源形式发布,并配套统一的数据格式与提取工具,降低了学术界和产业界的接入门槛。这一举措有望像ImageNet对计算机视觉的推动一样,为具身智能领域沉淀出标准化、可复现的评测基准。

从实验室走向真实世界的关键一步

智元此次开源行动,标志着行业从“让机器人完成表观任务”向“让机器人理解物理本质”的范式转变。当数千条细致的物理对话被公开共享,研究者不再需要自建昂贵的真实机器人采集环境,可以集中精力在模型架构和算法创新上。尤其在家庭服务、医疗操作、工业精密装配等高度依赖力控和接触的场景中,理解物理交互的AI将比单纯模仿的AI更加鲁棒和通用。随着数据集持续迭代(第三期主题已开始规划),智元正试图构建一个开放、成长的具身智能数据飞轮——每一次失败的物理对话,都将是AI进化的阶梯。