“龙虾”们正在改造机器人,具身智能的下一步是什么?
Agent的出现彻底改变了机器人与物理世界的交互方式。在杭州良渚古城遗址公园,具身智能机器人已开始执行清扫任务;而在开发者社区,一场名为OpenClaw的黑客马拉松中,有项目成功将该Agent框架接入真实机器人,用户仅需在Telegram或Discord上发送一条消息,远端的机器人便能接收指令、处理传感器信息并完成抓取和移动操作。这类项目揭示了一个深刻的转变:机器人不再仅仅是被预设程序操控的执行体,而是正在进化为由Agent驱动的“自主行动系统”。
范式重构:从“以机器为中心”到“以人为中心”
在博鳌亚洲论坛2026年年会上,大晓机器人董事长王晓刚指出,具身智能正处于底层范式重构的关键时期,核心在于研发方式与数据获取逻辑的根本性改变。
- 数据采集的革命:传统的研发主要依赖在实验室中“以机器为中心”采集数据,效率低且场景封闭。现在的趋势正转向“以人为中心”的环境式数据采集(Ambient Data Collection)。通过让大量真实用户在生产生活环境中佩戴传感器,数据得以在真实场景中自然产生(如保洁人员日常工作时同步采集),无需额外成本,场景也从封闭走向开放。
- 数据量级的跃升:这种转变将引发数据量级的爆发式增长。行业过去多年积累的机器人训练数据约在10万小时量级,而预计未来一到两年内,将跃升至千万小时量级,增长数百倍。

技术路径的演变:从VLA模型到世界模型
随着数据体系的重构,机器人的“大脑”也在经历技术路线的升级,核心是从单一的映射转向对物理规律的理解。
- 旧范式(VLA模型):过去主流的技术路径是基于“指令到动作”的映射,即给定指令,模型直接输出机器人的动作参数。这种方式对真实物理世界的理解相对有限。
- 新范式(环境式数据采集+世界模型):新的技术路径旨在让模型学习人类在真实环境中的物理规律和行为逻辑。
- 短期协作关系:目前来看,两种路线并非完全替代,而是形成协作。
- 世界模型作为“大脑”,负责预测和规划,在任务执行前在“脑海”中预演场景。
- VLA模型作为“小脑”,负责具体的动作执行。
- 反馈闭环:当执行结果与世界模型的预测不一致时,系统会重新调用世界模型进行新一轮规划,形成“规划+执行”的分工体系。
产业链重心的转移:从硬件竞争到模型与数据的博弈
Agent时代的到来,正在重塑具身智能产业的竞争格局,核心驱动力的转移迫使产业链重心发生倾斜。
- 竞争焦点的转移:竞争正从传统的“硬件能力”比拼,转向“模型能力+数据能力”的综合竞争。谁掌握了更具规模和质量的数据体系,谁的模型生态更具影响力,谁就更可能主导行业。
- 开源与生态构建:为了推动行业形成统一的技术生态,大晓机器人选择开源其“开悟”世界模型3.0,这不仅有助于吸纳开发者反馈、加速迭代,也是为了更好地适配国产算力体系,通过影响力反向推动算力生态的选择。
- 算力需求激增:千万小时级的数据增长和复杂的模型训练,将显著拉动对算力与存储基础设施的需求,成为行业新的基础变量。
通往“ChatGPT时刻”与商业化落地
尽管具身智能前景广阔,但业界对于其实现“跃迁时刻”的时间点仍存在分歧,商业化落地路径也已逐渐清晰。
- “ChatGPT时刻”的定义:这一时刻不应被简单理解为机器人全面进入家庭的时间。它更侧重于具身智能“大脑”的突破,即模型在通用性和泛化能力上实现跃迁,出现“智能涌现”,使得技术路径具备高度确定性。
- 落地路径:人形机器人进入家庭仍面临极高的安全性、法律法规及伦理挑战,尚需5-10年甚至更久。更现实的路径是To B垂直场景(如零售、职场办公)率先落地,在验证技术成熟度和安全性后,再逐步向家庭场景渗透。
- 安全隔离:为了将Agent从数字世界延伸至物理世界,必须建立类似“机管平台”的中间层,实现用户需求与机器人执行过程的分离。只有经过平台验证、安全可靠的任务才会被下发,从而确保物理世界的安全。