大晓机器人开源 ACE-Ego 具身操作 VLA 模型，能稳定完成塑料袋打包、鞋子装入鞋盒等操作

6 天前

AI资讯

18 阅读

具身智能机器人 [开源 VLA模型]

塑料袋打包与鞋盒装配：人本采集数据颠覆传统遥操

传统遥操作让工人佩戴设备模仿机器人动作，成本高且技能严重绑定硬件。大晓机器人的ACE研发范式则从根源革新：通过跨视角多模态设备，融合视觉、触觉、语音和力学规律，捕捉人类在超市打包、整理鞋盒等场景中的自然动作。在即时零售仓储测试中，该方案覆盖数万种SKU，自动萃取“人-物-场”全要素数据，使模型学会塑料袋封口、鞋盒入箱等毫秒级的精细放置动作，无需重复人工标注，一年可积累千万小时真实交互数据。

环境式数据引擎：一年千万小时真实交互数据筑基

在AI 1.0和2.0阶段依赖人工标注或互联网文本，而具身智能面临数据断崖——当前真机数据仅10万小时，远不及自动驾驶的百万小时级训练。ACE核心的环境式数据采集技术搭建了“人-物-场”物理级3D资产生成器：通过时序对齐、动态轨迹预测和仿真校正，将人的自然操作（如分拣、打包、折叠）转化为动态场景数据。该引擎已实现超10个视角、8种模态、亚像素级精度，让模型从海量人类行为中直接理解摩擦力、重力等物理规律，为塑料袋打包等复杂任务提供训练基础。

大晓机器人开源 ACE-Ego 具身操作 VLA 模型，能稳定完成塑料袋打包、鞋子装入鞋盒等操作

开悟世界模型3.0：从“看”到“懂”到“预测”的物理因果链

基于环境式采集数据，开悟世界模型3.0构建了跨本体的统一世界理解框架。作为首个“多模态理解-生成-预测”开源模型，它通过视觉、3D轨迹、触觉等多维输入，解构“塑料袋受力如何破裂”“鞋盒开合角度”等因果逻辑，生成高保真长时交互视频。开发者输入“将鞋子放入鞋盒”等简单指令，模型即可自动生成虚拟场景并预测数十种失败或成功路径。12月18日模型面向全行业开源，已适配沐曦、壁仞科技等国产芯片，性能对标国际顶尖水平。

具身超级大脑模组A1：纯视觉VLA让机器狗自主“知行合一”

搭载纯视觉无图端到端VLA模型的具身超级大脑模组A1，使机器狗无需预采高精地图即可在货架间自主移动、定位、抓取。云端模型实时解析自然语言指令（如“把左边塑料袋的鞋子装入鞋盒”），生成“前进50厘米”“降低夹爪角度”等中间指令。结合Insta360全景感知与商汤方舟视觉平台，模组覆盖超10个行业、150个场景，在安防仓储等复杂环境中稳定完成自主巡检与精细化操作。

开源生态与国产适配：全链条协同加速具身智能落地

大晓机器人以开源世界模型3.0为纽带，打通“模型-硬件-场景”闭环：芯片端联合沐曦、壁仞科技等完成适配，硬件端绑定Insta360、帕西尼等强化感知，云服务与数据端联合商汤大装置、腾讯云降低中小厂商研发成本。在智元机器人、银河通用等本体厂商的配合下，ACE范式正推动塑料袋打包、鞋盒装配等精细场景从实验室走向工业与零售前线，让机器人真正理解并执行人类日常的复杂操作。

大晓机器人开源 ACE-Ego 具身操作 VLA 模型，能稳定完成塑料袋打包、鞋子装入鞋盒等操作

塑料袋打包与鞋盒装配：人本采集数据颠覆传统遥操

环境式数据引擎：一年千万小时真实交互数据筑基

开悟世界模型3.0：从“看”到“懂”到“预测”的物理因果链

具身超级大脑模组A1：纯视觉VLA让机器狗自主“知行合一”

开源生态与国产适配：全链条协同加速具身智能落地

链接失效反馈