给机器人装大脑的星海图,为何下场干起了物理世界采数的苦活?

拒绝“人形”内卷,星海图押注“一脑多形”

当整个行业都在追逐人形机器人时,星海图却坚持“硬件形态根本不重要”。这家由清华+Waymo背景团队创立的公司,提出了“一脑多形”理念:开发一套通用智能大脑,可适配轮式、四足、人形等各种机器人形态。其核心逻辑是“软件定义硬件”——具身智能的本质是智能,而非躯壳。

团队覆盖了具身智能四大核心环节:感知(CEO高继扬)、空间智能(赵行)、策略学习(许华哲)、工程落地(李天威)。他们研发的EFM-1模型(融合视觉语言大模型与动作模型)、RSR引擎(实现厘米级3D场景重建并生成仿真数据)和DP3算法(基于3D扩散策略的模仿学习),构成了“认知-仿真-执行”的完整闭环。这一技术路线甚至吸引了斯坦福李飞飞团队和Physical Intelligence(Pi)采用星海图机器人作为研究平台。

顶配团队为何“自降身段”?——数据是具身智能的命门

星海图首席科学家赵行坦言:“小模型能做展示,但规模化应用效果不好。” 与大语言模型可轻松爬取互联网数据不同,具身智能的每个有效数据样本都需机器人在真实环境中实际操作。这种“先有鸡还是先有蛋”的困境,迫使星海图必须亲自下场“采数”。

给机器人装大脑的星海图,为何下场干起了物理世界采数的苦活?

数据采集不是简单的“录视频”,而是一套繁琐工程:培训与考核采集员、处理真机遥操作中的突发问题、上传清洗标注……赵行本人也不得不亲力亲为。为了获得真实泛化能力,星海图定义了家庭、酒店、工厂、超市、餐厅五类真实场景,并坚持在“脏乱差”的真实环境中采集,而非窗明几净的实验室。他们开源了500小时数据集,以期构建行业基准,降低重复采集成本。

失效成本与数据成本:从Waymo教训中悟出的商业铁律

CEO高继扬从自动驾驶经历中提炼出核心商业逻辑:AI产品的成败取决于“失效成本”与“数据成本”。Robotaxi一次碰撞赔偿数万美元,失效成本极高;而ChatGPT失效只是浪费用户20秒。具身智能必须选择“失效成本低且数据成本可控”的场景。

星海图的商业化路径随之清晰:避开家庭保姆等高容错场景,聚焦汽车产线精密零部件搬运、物流分拣等工业场景。在这些场景中,将成功率从90%提升到99%,就能创造巨大经济价值。这种“反周期”冷静还体现在团队规模上——即便融资超15亿元,星海图依然保持80人精英团队,“好的创新一般都不是大团队做出来的”。

不做“世界模型”的美梦,死磕“VLA”的执行力

在业界热议“世界模型”时,星海图合伙人罗天奇直言:“世界模型是巨头的游戏,不是创业公司的主战场。” 星海图选择一条务实路径:向上融合——复用谷歌、阿里等成熟VLM模型做“理解与推理”;向下死磕——自研VLA(视觉-语言-动作)端到端模型,掌握从理解到精准动作控制的“执行”能力。

这种“大脑借力,执行亲为”的策略,让星海图在避免与巨头正面消耗的同时,牢牢抓住了具身智能最硬的物理环节。其VLA模型G0在复杂全身移动控制任务上超越Pi 0约20%,靠的就是在真实物理世界中反复打磨的肌肉记忆。

中国硬件红利:数据成本仅为美国十分之一

星海图的“采数苦活”背后,隐藏着中国独特的竞争优势。中国在电机、减速器等领域拥有全球最完善的供应链,其人为导致机器人本体成本极低。罗天奇透露:“同样采集一万小时高质量数据,中国综合成本可能只有美国同行的十分之一。”

在AI的Scaling Law统治下,数据规模决定模型性能。十倍的成本优势意味着中国公司能在相同资本投入下获得十倍于美国的训练数据。这种“数据成本差”有望成为长期结构性护城河——硬件成本会趋同,但数据获取效率的差异将决定下一代具身大模型的高地归属。星海图正在做的,就是通过大规模、低成本的真实数据采集,为物理世界的“AI基座”打下底层泥沙。