高德宣布全量开源具身操作基座模型 ABot-M0,可实现一个“通用大脑”适配多种形态具身机器人
背景
近年来,具身智能(Embodied Intelligence)作为AI发展的重要方向,逐步从单一任务向通用操作能力演进。然而,不同形态、结构的机器人往往需要独立开发适配模型,造成资源浪费与技术壁垒。为解决这一问题,高德推出ABot-M0——全球首个基于统一架构的具身操作基座模型,标志着机器人领域向“通用大脑+专用躯体”的标准化迈出关键一步。
关键动因:
- 行业数据孤岛严重,缺乏统一标准。
- 传统模型需针对不同机器人单独训练,效率低。
- 空间理解与动作序列预测成为通用适配瓶颈。
ABot-M0模型详情
ABot-M0以“通用大脑”为核心理念,通过统一模型架构适配多种具身机器人形态,包括双臂、单臂、轮式等。其开源内容涵盖数据、算法与模型三个层面,推动具身智能领域标准化与开放化。
数据层面:
- 开源全球最大规模通用机器人数据集UniACT。
- 整合超过600万条真实操作轨迹。
- 提供从原始异构数据到标准化训练数据的全流程处理管线。
- 统一动作表示、坐标系与控制频率,提升预训练效率。
算法层面:
- 创新提出动作流形学习(AML)算法,提升动作预测效率。
- 采用双流感知架构,融合VLM(如Qwen3-VL)与即插即用3D模块(如VGGT)。
- 有效弥补标准视觉语言模型(VLM)在3D空间推理上的短板。
模型层面:
- 开源端到端预训练模型与完整工具链。
- 开发者无需从零搭建训练框架,即可适配工业、家庭等场景。
- 成功验证“一个大脑驱动多种形态”的技术可行性。

技术表现与测试成绩
ABot-M0在多个权威基准测试中表现优异,展现出强大的空间理解与任务执行能力。
- 在Libero-Plus基准测试中,任务成功率达到80.5%。
- 相较业界标杆方案Pi0,性能提升近30%。
- 在Libero与RoboCasa测试中也取得SOTA成绩。
这些结果表明ABot-M0在复杂任务规划与动作生成方面具有显著优势,尤其在多模态输入与动作解码效率方面表现突出。
对行业的影响
高德的全量开源行为将极大促进具身智能的生态发展,推动技术标准统一,降低研发门槛。
对开发者而言:
- 可直接使用预训练模型与工具链,快速部署。
- 免去重复搭建与训练成本,提升开发效率。
对企业与产业而言:
- 有助于形成“通用大脑+专用躯体”的标准化架构。
- 加速机器人在工业、服务、家庭等场景落地。
对整个AI行业而言:
- 标志着具身智能从封闭研发走向开放协作。
- 为未来“通用智能体”演进提供基础架构支持。
未来展望
随着ABot-M0的开源,具身智能的发展或将迎来转折点。高德表示将持续优化模型,扩展数据集,并推动其在更多实际场景中的应用。未来,模型或将支持更复杂任务与更高自由度的机器人形态,进一步向通用人工智能(AGI)的目标靠近。
发展方向可能包括:
- 增强多模态输入处理能力(如音频、触觉)。
- 推动模型与云平台深度融合。
- 构建开发者社区,完善工具生态。
- 与更多硬件厂商合作,实现软硬件协同进化。