刚刚,星海图甩出具身智能全家桶:双足人形、VLA模型、世界模型齐亮相

星海图首款双足人形机器人Kengo亮相

近日,星海图正式发布其首款全尺寸双足人形机器人“行客Kengo”。该机器人身高1.4米,头部搭载曲面屏,以运动小脑与具身大脑为核心,能够完成多种高难度极限动作,并具备动态环境下的自主平衡与地形适应能力。Kengo的发布标志着星海图从“一脑多形”的轮式平台向人形形态跨越,补齐了公司硬件产品线短板。

星海图CEO高继扬此前将2026年定义为聚焦场景落地与商业化的阶段。Kengo并非孤立硬件,而是与自研AI大模型(机器人大脑)同步研发推进,覆盖家庭生活、工业、多品类高价值商用等多元场景。与原有轮式机器人相比,双足泛用性、环境适配能力更强。这一动作也呼应了行业趋势:OpenAI、英伟达等巨头纷纷加大人形本体研发,纯软件公司向硬件渗透已成必然。

刚刚,星海图甩出具身智能全家桶:双足人形、VLA模型、世界模型齐亮相

G0.5模型:颠覆传统VLA的“边思考边行动”

几乎与Kengo同步,星海图推出了新一代具身基础模型G0.5。该模型在VLA架构内部做了彻底“底层重构”:让同一个模型、同一套权重在自回归token序列中同步生成推理token与动作token,使VLM的链式思维、上下文学习等生成式能力原生作用于动作生成,不再经过信息压缩瓶颈。

G0.5引入跨本体动作编解码器,将18种机器人本体数据统一到27维动作空间,并通过“活跃自由度预测”机制避免为静止关节浪费token,在双臂任务中节省近一半token量。原生思维链机制让模型在生成动作前先输出子任务分解、目标框等推理token,推理结果与动作token受同一损失函数约束,真正实现“边思考边行动”。

在真实机器人数据集DROID的10项桌面任务中,G0.5未经任何微调即达82.5%的平均成功率,较前代提升25个百分点;在SimplerEnv-Bridge跨数据集迁移测试中取得87.3%的成绩;在双臂协调测试RoboTwin 2.0中取得93.3%的平均成绩。最关键的检验来自BEHAVIOR-1K——包含50个完整家庭场景的长程任务,单次演示平均时长6.6分钟。G0.5仅用单个预训练模型训练1个epoch,即以0.2904的任务成功率超越前代训练4个周期的成绩,更胜过使用4个模型集成的冠军方案。

G0.5还具备零样本泛化能力:机器人无需针对特定任务、物体或场景进行任何额外训练或人工示例,仅凭一句自然语言指令,就能在完全陌生的环境中一次性执行复杂的长序任务。

世界模型Fast-WAM与行业“大脑”之争

早在2026年3月,星海图已先行发布世界模型研究成果Fast-WAM。该模型通过对底层逻辑的深度重构,将单步推理延迟压缩至190毫秒,在保持SOTA性能的同时实现4倍提速,彻底告别“先想象、后执行”的传统低效范式。这一成果与自变量机器人发布的全球首个“事件级预测”世界模型WALL-WM形成呼应——两者分别从“架构内部重构”和“换道世界模型”两个方向撕开裂缝,让业界看到机器人大脑不再只有一种答案。

行业趋势正在加速:6月9日,智元推出行业首个开放完整的具身智能生态技术体系AIMA,五年投入20亿元;OpenAI正式从纯软件进入机器人本体深水区;英伟达发布全能模型Cosmos 3并推进人形机器人参考设计。当资本逐渐冷静,数据壁垒与模型架构的分水岭愈发清晰,真正的护城河已从关节灵活度与量产规模,转向代码深处的大模型能力。星海图的“大脑先行”战略,在这一节点显得尤为关键。