让机器人拥有“肌肉记忆”，智元推出新一代二阶段 BFM-2 基座模型

1 个月前

AI资讯

73 阅读

从“大脑”到“小脑”：BFM-2为何要分两阶段训练

传统的机器人控制模型往往将感知、规划、控制“一锅端”，导致模型在应对动态环境时反应迟滞。智元推出的BFM-2（Bio-Fidelity Motor 2）基座模型借鉴了生物运动控制原理，将训练拆解为两个连续的阶段。第一阶段专注于“运动原语”的学习，即让模型从海量真实和仿真数据中提取出诸如“抓取”、“旋转”、“按压”等基础动作单元，类似于婴儿学会挥手、握拳。第二阶段则将这些原语进行组合与泛化，使机器人能在未见过的物体或环境下，像人类依靠肌肉记忆完成打字、弹琴一样，自动调用最合适的动作序列，而无需每步都经过高层推理。

数据驱动“肌肉记忆”：模仿学习与强化学习的深度融合

BFM-2实现“肌肉记忆”的关键在于其独特的数据利用策略。在预训练阶段，团队构建了一个包含百万级规模的“运动剧本”数据集，内容涵盖日常家务、精密组装、服务交互等场景。模型首先通过模仿学习快速掌握这些动作的“形”，即动作的空间轨迹和时序关系。随后，BFM-2引入混合强化学习模块，在仿真环境中让机器人“自我对抗”——例如在端一杯水时故意施加随机扰动，迫使模型调整肌肉扭矩以维持平衡。这种“先模仿、再优化”的机制，让BFM-2不仅学会动作，更学会了在干扰下如何靠“身体感觉”自动修正，这正是肌肉记忆的本质。

让机器人拥有“肌肉记忆”，智元推出新一代二阶段 BFM-2 基座模型

参数效率革命：低算力下的实时响应

不同于依赖云端超大模型的做法，BFM-2在设计上极度关注部署的实时性。通过稀疏激活技术与动态计算图裁剪，该模型能在边缘算力（如NVIDIA Orin或国产算力芯片）上以200Hz以上的频率输出关节控制指令。这意味着从传感器读取到电机执行的整个闭环延迟被压缩到5毫秒以内，接近人类反射弧的速度。智元表示，BFM-2的参数量仅为同类模型的1/3，但任务成功率（特别是在非结构化场景下的即时避障与柔顺操作）提升了47%。

从“学会动作”到“记住感觉”：多模态感知闭环

“肌肉记忆”的另一核心在于本体感觉的编码。BFM-2首次在基座模型中融合了关节扭矩传感器、六维力传感器与触觉阵列的原始信号流。模型不仅“看”到杯子，还“感觉”到手指与杯壁之间的摩擦力，并在提杯瞬间预判其重心偏移。在公开演示中，搭载BFM-2的机器人可以蒙眼完成拧螺丝任务——仅依赖触觉和力反馈，通过连续调整手腕角度直至螺丝完全旋入。这种将感知直接映射为运动习惯的能力，使机器人能像人一样在视觉被遮挡时依然流畅操作。

应用前景：工厂与家庭的无缝通用化

智元认为BFM-2标志着机器人控制从“脚本执行”向“习惯养成”的关键转折。在工厂产线中，这意味着机器人只需演示一次即可学会新工件的组装，并在后续生产中自动适应来料的微小尺寸误差；在家庭场景中，机器人能像家人一样记住汤勺的握法、开冰箱门的力度，做出自然连贯的动作。智元已计划在2025年第四季度向开发者开放BFM-2的微调接口，允许第三方通过少量演示数据定制专属的“肌肉记忆”模型，进一步推动具身智能从实验室走向千行百业。

让机器人拥有“肌肉记忆”，智元推出新一代二阶段 BFM-2 基座模型

从“大脑”到“小脑”：BFM-2为何要分两阶段训练

数据驱动“肌肉记忆”：模仿学习与强化学习的深度融合

参数效率革命：低算力下的实时响应

从“学会动作”到“记住感觉”：多模态感知闭环

应用前景：工厂与家庭的无缝通用化

链接失效反馈