机器人运控训练步入分钟级时代!清华AIR开源UniLab:3分钟训好人形,速度暴涨10倍,Mac上也能跑
另辟蹊径:打破“GPU包揽全部”的潜规则,CPU+GPU异构架构诞生
传统机器人强化学习训练框架,如IsaacLab、MuJoCoPlayground等,默认将物理步进与策略学习全部塞进GPU显存,导致高性能显卡和多核CPU出现严重的“一方计算、一方闲置”资源浪费。清华大学智能产业研究院(AIR)DISCOVER Lab联合多所高校及企业,推出全新训练架构UniLab,大胆重构系统结构,打造了“CPU高效仿真+GPU策略训练”的异构高吞吐底座。这一变革打破了NVIDIA生态的绑定,在多项运控任务上实现数倍效率提升。
共享内存无锁缓冲区:榨干每一份硬件算力,速度暴涨10倍
UniLab的核心创新在于数据流的深度重叠(Overlapping)。团队利用共享内存建立无锁运行时缓冲区,当GPU执行当前Batch的网络更新时,CPU阵列已异步并发跑完下一步环境仿真。这种设计消除了昂贵的数据跨总线搬运延迟,让仿真和训练真正并行。在4090搭配9950×3d CPU的系统上,UniLab仅用12秒即可训练出四足行走策略,人形机器人G1学会走路只需3分钟,端到端墙钟时间相比传统框架暴增10倍,彻底让机器人运控训练迈向“分钟级”时代。

Mac也能训人形:跨平台全后端兼容,Apple Silicon成训练神器
UniLab原生支持CUDA、Apple、AMD及Intel等多种后端,无缝适配PPO、APPO、SAC、TD3等主流强化学习算法。在Mac(Apple Silicon)平台上,借助统一内存架构(UMA)的低延迟特性,CPU仿真与GPU学习之间的数据传输无需跨越PCIe总线,传输开销大幅降低。这使得Mac本地训练人形机器人成为现实,彻底颠覆了以往只能在顶配NVIDIA显卡上工作的局面。
全品类任务覆盖:从四足翻跟头到灵巧手精细操作,真机验证闭环
UniLab基于统一任务接口,不仅支持四足和人形行走,还完美覆盖高动态人形动作跟踪(如G1 Flip、翻跟头、攀爬)、高维接触的灵巧手精细操作(Sharpa hand)以及复杂的全身手脚协同任务。团队已将UniLab训练的策略成功部署到六类真机任务上,覆盖四足、人形全身运动追踪及灵巧手操作,完成了从仿真到真机的完整闭环验证。工业级成熟代码架构让开发者零成本上手,3分钟配好环境,5分钟运行第一个demo,实现模型与算法迁移“零摩擦”。
工业级开源生态:加速人形机器人从实验室走向规模化应用
继北京人形机器人创新中心开源Tien Kung-Lab(基于Isaaclab)后,UniLab以更极致的效率和更低的硬件门槛,进一步推动行业进步。其开源的代码仓库、项目主页和论文已全面上线,开发者可快速复用分钟级训练能力。UniLab的出现不仅解决了高维动作空间、强域随机化导致的训练周期冗长问题,更让Mac电脑用户、多平台开发者平等参与机器人技术研发,为人形机器人在复杂工厂、救灾现场、户外场景的规模化应用提供了坚实基础。