机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑

1 个月前

AI资讯

20 阅读

开源]训练框架 [机器人运控 UniLab

另辟蹊径：打破“GPU包揽全部”的潜规则，CPU+GPU异构架构诞生

传统机器人强化学习训练框架，如IsaacLab、MuJoCoPlayground等，默认将物理步进与策略学习全部塞进GPU显存，导致高性能显卡和多核CPU出现严重的“一方计算、一方闲置”资源浪费。清华大学智能产业研究院（AIR）DISCOVER Lab联合多所高校及企业，推出全新训练架构UniLab，大胆重构系统结构，打造了“CPU高效仿真+GPU策略训练”的异构高吞吐底座。这一变革打破了NVIDIA生态的绑定，在多项运控任务上实现数倍效率提升。

共享内存无锁缓冲区：榨干每一份硬件算力，速度暴涨10倍

UniLab的核心创新在于数据流的深度重叠（Overlapping）。团队利用共享内存建立无锁运行时缓冲区，当GPU执行当前Batch的网络更新时，CPU阵列已异步并发跑完下一步环境仿真。这种设计消除了昂贵的数据跨总线搬运延迟，让仿真和训练真正并行。在4090搭配9950×3d CPU的系统上，UniLab仅用12秒即可训练出四足行走策略，人形机器人G1学会走路只需3分钟，端到端墙钟时间相比传统框架暴增10倍，彻底让机器人运控训练迈向“分钟级”时代。

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑

Mac也能训人形：跨平台全后端兼容，Apple Silicon成训练神器

UniLab原生支持CUDA、Apple、AMD及Intel等多种后端，无缝适配PPO、APPO、SAC、TD3等主流强化学习算法。在Mac（Apple Silicon）平台上，借助统一内存架构（UMA）的低延迟特性，CPU仿真与GPU学习之间的数据传输无需跨越PCIe总线，传输开销大幅降低。这使得Mac本地训练人形机器人成为现实，彻底颠覆了以往只能在顶配NVIDIA显卡上工作的局面。

全品类任务覆盖：从四足翻跟头到灵巧手精细操作，真机验证闭环

UniLab基于统一任务接口，不仅支持四足和人形行走，还完美覆盖高动态人形动作跟踪（如G1 Flip、翻跟头、攀爬）、高维接触的灵巧手精细操作（Sharpa hand）以及复杂的全身手脚协同任务。团队已将UniLab训练的策略成功部署到六类真机任务上，覆盖四足、人形全身运动追踪及灵巧手操作，完成了从仿真到真机的完整闭环验证。工业级成熟代码架构让开发者零成本上手，3分钟配好环境，5分钟运行第一个demo，实现模型与算法迁移“零摩擦”。

工业级开源生态：加速人形机器人从实验室走向规模化应用

继北京人形机器人创新中心开源Tien Kung-Lab（基于Isaaclab）后，UniLab以更极致的效率和更低的硬件门槛，进一步推动行业进步。其开源的代码仓库、项目主页和论文已全面上线，开发者可快速复用分钟级训练能力。UniLab的出现不仅解决了高维动作空间、强域随机化导致的训练周期冗长问题，更让Mac电脑用户、多平台开发者平等参与机器人技术研发，为人形机器人在复杂工厂、救灾现场、户外场景的规模化应用提供了坚实基础。

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑

另辟蹊径：打破“GPU包揽全部”的潜规则，CPU+GPU异构架构诞生

共享内存无锁缓冲区：榨干每一份硬件算力，速度暴涨10倍

Mac也能训人形：跨平台全后端兼容，Apple Silicon成训练神器

全品类任务覆盖：从四足翻跟头到灵巧手精细操作，真机验证闭环

工业级开源生态：加速人形机器人从实验室走向规模化应用

链接失效反馈