融了数亿美金的「大晓机器人」,其创始人揭开了具身行业的割裂一面

技术路线摇摆:VLA模型遭质疑,世界模型成为新答案

大晓机器人董事长、商汤科技联合创始人王晓刚在采访中直言,当前火热的VLA模型(视觉-语言-动作)存在明显缺陷。“VLA模型是以机器为中心,通过输入指令、图像和视频直接输出动作,它不太需要理解真实的物理世界和物理规律。”他认为,特斯拉和Figure AI在过去两三个月内,都放弃了以真机为主的技术路线,转向以视觉为主的技术路线,但这并非终极方案。大晓机器人提出的ACE研发范式,核心在于构建环境式数据采集与“开悟”世界模型,让机器人先理解物理规律再执行动作。其最新发布的Kairos 3.0在4项全球具身智能基准测试中取得SOTA,并率先实现在端侧直接驱动具身设备,用户可选择智元、银河等不同机器人本体,通过世界模型合成数据训练其“大脑”。

融了数亿美金的「大晓机器人」,其创始人揭开了具身行业的割裂一面

场景落地断档:情绪价值有余,生产力不足

尽管机器人赛道火爆,王晓刚却指出一个尴尬现实:“能够成规模量产的场景,主要在于提供情绪价值的表演性质产品,或者用于科研平台,尚未出现大幅提升生产力的规模化应用。”在商业服务领域,他看好前置仓、闪购仓这类标准化场景:“中国有十几万的前置仓,未来几年还在快速增长。如果机器人能解决前置仓的难点,就是十万级的规模了。”大晓机器人已与智元机器人达成战略合作,展示面向即时零售场景的机器人,以及搭载“具身超级大脑模组A1”的机器狗。不过,王晓刚坦言现阶段机器人要想进入家庭、完成长程复杂任务并保证安全性,“确实需要在未来五年甚至更长的时间才能达到”。

产业链割裂:从芯片到本体,处处需要垂直整合

王晓刚认为,机器人行业的产业链分工尚未完善,从零部件、传感器到计算芯片,都存在很大的垂直整合空间。“当前机器人成本依然很高,质量、可靠性、一致性都处于相对初期的阶段,整个产业格局远远没有确定下来。”大晓机器人自身定位在“大脑和软件”,但发现现有本体硬件与实际需求差距较大,因此选择联合供应链生态伙伴重新设计硬件。例如,为让机器人看清全路,与影石Insta360合作引入全景相机;在芯片适配方面,开悟世界模型3.0已与沐曦、壁仞科技、中科曙光等多款国产芯片完成适配。产业链伙伴覆盖智元、银河通用、钛虎、帕西尼等具身及硬件厂商,形成软硬一体方案的协同圈。

未来五年:即时零售先行,家庭场景仍需耐心

王晓刚判断,机器人产业格局远未定型,但渐进式落地路径已经清晰。“行业原有技术路线存在明显缺陷,当研究范式发生重大转变时,会给产业带来深远影响——类似自动驾驶领域端到端路线的颠覆。”大晓机器人目前已在软件层面(世界模型、具身相关大模型及数据)获得订单,而明年重点推出的软硬一体产品期待大规模落地。他特别强调零售场景的标准化和规模化潜力,认为前置仓是十万级市场的入口。至于家庭场景,则需要更长的时间:“机器人想在家庭中完全取代人,完成各种长程复杂的任务并保证安全性,这确实需要在未来的五年甚至更长的时间才能达到。但这并不妨碍机器人在各种场景中逐渐落地。”