让机器人拥有“肌肉记忆”,智元推出新一代二阶段 BFM-2 基座模型

从“大脑”到“小脑”:BFM-2为何要分两阶段训练

传统的机器人控制模型往往将感知、规划、控制“一锅端”,导致模型在应对动态环境时反应迟滞。智元推出的BFM-2(Bio-Fidelity Motor 2)基座模型借鉴了生物运动控制原理,将训练拆解为两个连续的阶段。第一阶段专注于“运动原语”的学习,即让模型从海量真实和仿真数据中提取出诸如“抓取”、“旋转”、“按压”等基础动作单元,类似于婴儿学会挥手、握拳。第二阶段则将这些原语进行组合与泛化,使机器人能在未见过的物体或环境下,像人类依靠肌肉记忆完成打字、弹琴一样,自动调用最合适的动作序列,而无需每步都经过高层推理。

数据驱动“肌肉记忆”:模仿学习与强化学习的深度融合

BFM-2实现“肌肉记忆”的关键在于其独特的数据利用策略。在预训练阶段,团队构建了一个包含百万级规模的“运动剧本”数据集,内容涵盖日常家务、精密组装、服务交互等场景。模型首先通过模仿学习快速掌握这些动作的“形”,即动作的空间轨迹和时序关系。随后,BFM-2引入混合强化学习模块,在仿真环境中让机器人“自我对抗”——例如在端一杯水时故意施加随机扰动,迫使模型调整肌肉扭矩以维持平衡。这种“先模仿、再优化”的机制,让BFM-2不仅学会动作,更学会了在干扰下如何靠“身体感觉”自动修正,这正是肌肉记忆的本质。

让机器人拥有“肌肉记忆”,智元推出新一代二阶段 BFM-2 基座模型

参数效率革命:低算力下的实时响应

不同于依赖云端超大模型的做法,BFM-2在设计上极度关注部署的实时性。通过稀疏激活技术与动态计算图裁剪,该模型能在边缘算力(如NVIDIA Orin或国产算力芯片)上以200Hz以上的频率输出关节控制指令。这意味着从传感器读取到电机执行的整个闭环延迟被压缩到5毫秒以内,接近人类反射弧的速度。智元表示,BFM-2的参数量仅为同类模型的1/3,但任务成功率(特别是在非结构化场景下的即时避障与柔顺操作)提升了47%。

从“学会动作”到“记住感觉”:多模态感知闭环

“肌肉记忆”的另一核心在于本体感觉的编码。BFM-2首次在基座模型中融合了关节扭矩传感器、六维力传感器与触觉阵列的原始信号流。模型不仅“看”到杯子,还“感觉”到手指与杯壁之间的摩擦力,并在提杯瞬间预判其重心偏移。在公开演示中,搭载BFM-2的机器人可以蒙眼完成拧螺丝任务——仅依赖触觉和力反馈,通过连续调整手腕角度直至螺丝完全旋入。这种将感知直接映射为运动习惯的能力,使机器人能像人一样在视觉被遮挡时依然流畅操作。

应用前景:工厂与家庭的无缝通用化

智元认为BFM-2标志着机器人控制从“脚本执行”向“习惯养成”的关键转折。在工厂产线中,这意味着机器人只需演示一次即可学会新工件的组装,并在后续生产中自动适应来料的微小尺寸误差;在家庭场景中,机器人能像家人一样记住汤勺的握法、开冰箱门的力度,做出自然连贯的动作。智元已计划在2025年第四季度向开发者开放BFM-2的微调接口,允许第三方通过少量演示数据定制专属的“肌肉记忆”模型,进一步推动具身智能从实验室走向千行百业。