从看懂世界到做对动作，卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层

1 个月前

AI资讯

42 阅读

具身智能卧安机器人 OneModel 1.7 隐式通路

卧安OneModel 1.7：LIBERO评测平均成功率断层领先

卧安机器人近期正式推出其核心模型底座“OneModel 1.7 FrontoStria-RL”，面向家庭与服务机器人的真实部署场景。在具身智能标准评测基准LIBERO上，该模型的平均成功率大幅超越现有主流模型。这组成绩的背后并非单纯依赖更大的参数规模，而是一套全新的模型架构设计思路——它不再将“看懂世界”和“做对动作”视为两个独立模块，而是通过一条隐式传导通路将其无缝衔接。这一突破标志着机器人走进千家万户又迈出了关键一步，深圳宝安这家机器人企业正在推动具身智能规模化落地。

主流范式分岔口：VLA与World Model各有短板

当前具身智能的主流模型范式主要分为两条路线：一条是VLA（视觉-语言-动作）端到端模型，试图直接从视觉和语言指令映射出动作序列；另一条是World Model路线，强调先学会预测世界的变化规律，再据此规划动作。然而这两种路线都存在悬而未决的问题：VLA模型往往在复杂动态环境中缺乏对物理因果关系的理解，动作鲁棒性不足；World Model虽然能学好规律，但将预测转化为精准动作时常常出现翻译断层，导致机器人“看懂了世界但不会做对动作”。卧安OneModel 1.7选择跳出这两条传统路径，用一条「隐式通路」同时解决“理解”与“执行”的割裂。

从看懂世界到做对动作，卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层

破局之道：一条隐式通路连接“看懂”与“做对”

OneModel 1.7的核心创新被命名为Predictive Policy Latent（预测性策略隐空间）。这条“隐式通路”不再显式地将世界模型与动作策略分开训练，而是在同一个神经网络的中间层构建一个隐向量空间——该空间同时承载外界变化规律的表征和机器人动作策略的编码。当机器人观测到现实世界中的状态变化时，这个隐层会直接“感知”到变化趋势，并隐式地激活一系列适应性的动作参数，而非先触发一个独立的物理预测模块再去查询动作库。这种端到端的隐式传导，使得从“看懂世界的规律”到“做对介入动作”之间的延迟大幅缩短，动作精准度也因此提升。

强化学习闭环：让动作策略在真实数据中自我进化

任何一种模型若只靠离线训练，都难以应对家庭环境中千变万化的个体场景。卧安为此构建了持续进化的RL（强化学习）闭环机制：OneModel 1.7在实际部署后，机器人会根据执行任务的结果（成功/失败、效率、安全性等）不断产生偏好数据，这些数据反馈回隐式通路，通过强化学习算法微调Predictive Policy Latent中的策略权重。这个闭环使得模型无需重新离线训练整个参数，就能在每天的真实互动中逐步修正动作策略，从而让“看懂-做对”的通路越来越精准、普适。正是这一机制，让OneModel 1.7在LIBERO等静态评测之外，具备了面向真实家庭和服务环境的持续适应能力。

从实验室到千家万户：卧安的规模化底座

OneModel 1.7 FrontoStria-RL的发布，并非一次孤立的学术实验，而是卧安机器人推动具身智能规模化落地的核心底座。该模型面向家庭与服务机器人的真实部署，意味着它必须同时满足低成本计算、低延迟响应和跨场景泛化的要求。通过隐式通路与RL闭环的组合，OneModel 1.7在不显著增加算力需求的前提下，解决了以往机器人“看见杯子但抓不稳”、“听懂指令但动作笨拙”的痛点。卧安机器人表示，基于该模型底座的机器人有望在2025年内进入更多家庭场景，执行整理物品、辅助家务、环境维护等复杂任务。当“看懂世界”与“做对动作”之间的关键断层被隐式通路彻底打通，下一代家庭服务机器人将真正具备从感知到执行的流畅本能。

从看懂世界到做对动作，卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层

卧安OneModel 1.7：LIBERO评测平均成功率断层领先

主流范式分岔口：VLA与World Model各有短板

破局之道：一条隐式通路连接“看懂”与“做对”

强化学习闭环：让动作策略在真实数据中自我进化

从实验室到千家万户：卧安的规模化底座

链接失效反馈