大晓机器人开源 ACE-Ego 具身操作 VLA 模型,能稳定完成塑料袋打包、鞋子装入鞋盒等操作
塑料袋打包与鞋盒装配:人本采集数据颠覆传统遥操
传统遥操作让工人佩戴设备模仿机器人动作,成本高且技能严重绑定硬件。大晓机器人的ACE研发范式则从根源革新:通过跨视角多模态设备,融合视觉、触觉、语音和力学规律,捕捉人类在超市打包、整理鞋盒等场景中的自然动作。在即时零售仓储测试中,该方案覆盖数万种SKU,自动萃取“人-物-场”全要素数据,使模型学会塑料袋封口、鞋盒入箱等毫秒级的精细放置动作,无需重复人工标注,一年可积累千万小时真实交互数据。
环境式数据引擎:一年千万小时真实交互数据筑基
在AI 1.0和2.0阶段依赖人工标注或互联网文本,而具身智能面临数据断崖——当前真机数据仅10万小时,远不及自动驾驶的百万小时级训练。ACE核心的环境式数据采集技术搭建了“人-物-场”物理级3D资产生成器:通过时序对齐、动态轨迹预测和仿真校正,将人的自然操作(如分拣、打包、折叠)转化为动态场景数据。该引擎已实现超10个视角、8种模态、亚像素级精度,让模型从海量人类行为中直接理解摩擦力、重力等物理规律,为塑料袋打包等复杂任务提供训练基础。

开悟世界模型3.0:从“看”到“懂”到“预测”的物理因果链
基于环境式采集数据,开悟世界模型3.0构建了跨本体的统一世界理解框架。作为首个“多模态理解-生成-预测”开源模型,它通过视觉、3D轨迹、触觉等多维输入,解构“塑料袋受力如何破裂”“鞋盒开合角度”等因果逻辑,生成高保真长时交互视频。开发者输入“将鞋子放入鞋盒”等简单指令,模型即可自动生成虚拟场景并预测数十种失败或成功路径。12月18日模型面向全行业开源,已适配沐曦、壁仞科技等国产芯片,性能对标国际顶尖水平。
具身超级大脑模组A1:纯视觉VLA让机器狗自主“知行合一”
搭载纯视觉无图端到端VLA模型的具身超级大脑模组A1,使机器狗无需预采高精地图即可在货架间自主移动、定位、抓取。云端模型实时解析自然语言指令(如“把左边塑料袋的鞋子装入鞋盒”),生成“前进50厘米”“降低夹爪角度”等中间指令。结合Insta360全景感知与商汤方舟视觉平台,模组覆盖超10个行业、150个场景,在安防仓储等复杂环境中稳定完成自主巡检与精细化操作。
开源生态与国产适配:全链条协同加速具身智能落地
大晓机器人以开源世界模型3.0为纽带,打通“模型-硬件-场景”闭环:芯片端联合沐曦、壁仞科技等完成适配,硬件端绑定Insta360、帕西尼等强化感知,云服务与数据端联合商汤大装置、腾讯云降低中小厂商研发成本。在智元机器人、银河通用等本体厂商的配合下,ACE范式正推动塑料袋打包、鞋盒装配等精细场景从实验室走向工业与零售前线,让机器人真正理解并执行人类日常的复杂操作。