从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层
卧安OneModel 1.7:LIBERO评测平均成功率断层领先
卧安机器人近期正式推出其核心模型底座“OneModel 1.7 FrontoStria-RL”,面向家庭与服务机器人的真实部署场景。在具身智能标准评测基准LIBERO上,该模型的平均成功率大幅超越现有主流模型。这组成绩的背后并非单纯依赖更大的参数规模,而是一套全新的模型架构设计思路——它不再将“看懂世界”和“做对动作”视为两个独立模块,而是通过一条隐式传导通路将其无缝衔接。这一突破标志着机器人走进千家万户又迈出了关键一步,深圳宝安这家机器人企业正在推动具身智能规模化落地。
主流范式分岔口:VLA与World Model各有短板
当前具身智能的主流模型范式主要分为两条路线:一条是VLA(视觉-语言-动作)端到端模型,试图直接从视觉和语言指令映射出动作序列;另一条是World Model路线,强调先学会预测世界的变化规律,再据此规划动作。然而这两种路线都存在悬而未决的问题:VLA模型往往在复杂动态环境中缺乏对物理因果关系的理解,动作鲁棒性不足;World Model虽然能学好规律,但将预测转化为精准动作时常常出现翻译断层,导致机器人“看懂了世界但不会做对动作”。卧安OneModel 1.7选择跳出这两条传统路径,用一条「隐式通路」同时解决“理解”与“执行”的割裂。

破局之道:一条隐式通路连接“看懂”与“做对”
OneModel 1.7的核心创新被命名为Predictive Policy Latent(预测性策略隐空间)。这条“隐式通路”不再显式地将世界模型与动作策略分开训练,而是在同一个神经网络的中间层构建一个隐向量空间——该空间同时承载外界变化规律的表征和机器人动作策略的编码。当机器人观测到现实世界中的状态变化时,这个隐层会直接“感知”到变化趋势,并隐式地激活一系列适应性的动作参数,而非先触发一个独立的物理预测模块再去查询动作库。这种端到端的隐式传导,使得从“看懂世界的规律”到“做对介入动作”之间的延迟大幅缩短,动作精准度也因此提升。
强化学习闭环:让动作策略在真实数据中自我进化
任何一种模型若只靠离线训练,都难以应对家庭环境中千变万化的个体场景。卧安为此构建了持续进化的RL(强化学习)闭环机制:OneModel 1.7在实际部署后,机器人会根据执行任务的结果(成功/失败、效率、安全性等)不断产生偏好数据,这些数据反馈回隐式通路,通过强化学习算法微调Predictive Policy Latent中的策略权重。这个闭环使得模型无需重新离线训练整个参数,就能在每天的真实互动中逐步修正动作策略,从而让“看懂-做对”的通路越来越精准、普适。正是这一机制,让OneModel 1.7在LIBERO等静态评测之外,具备了面向真实家庭和服务环境的持续适应能力。
从实验室到千家万户:卧安的规模化底座
OneModel 1.7 FrontoStria-RL的发布,并非一次孤立的学术实验,而是卧安机器人推动具身智能规模化落地的核心底座。该模型面向家庭与服务机器人的真实部署,意味着它必须同时满足低成本计算、低延迟响应和跨场景泛化的要求。通过隐式通路与RL闭环的组合,OneModel 1.7在不显著增加算力需求的前提下,解决了以往机器人“看见杯子但抓不稳”、“听懂指令但动作笨拙”的痛点。卧安机器人表示,基于该模型底座的机器人有望在2025年内进入更多家庭场景,执行整理物品、辅助家务、环境维护等复杂任务。当“看懂世界”与“做对动作”之间的关键断层被隐式通路彻底打通,下一代家庭服务机器人将真正具备从感知到执行的流畅本能。