国产厂商第一,全球第二!我用海外最强生图模型,试出了这匹黑马的真实段位
双榜封神:零宣发黑马拿下国产厂商第一
大模型竞技场突现新王。生数科技的MotuBrain在没有预告、没有预热的情况下,一举拿下两张顶级榜单的冠军。在WorldArena中,它以63.77的EWM Score排名第一;而在RoboTwin2.0的实操测试中,Clean场景95.8、Randomized场景96.1,成为唯一一个在随机环境下平均分超过95的模型。这两张榜单互不交叉——一张考“是否真正看懂世界”,另一张考“是否能在世界里稳定干活”。MotuBrain同时登顶,意味着它既是理论上的王者,也是实战中的巅峰。业内此前猜测它是阿里、字节或华为的暗手,最终确认来自生数科技,国产AI就此迎来一个真正的通用机器人大脑。

大一统架构:把五种割裂范式拧成闭环
传统具身智能依赖“上层脑”拆解指令、底层驱动执行,容易断档且泛化差。MotuBrain的颠覆在于架构创新——它将VLA(视觉-语言-动作)、世界模型、视频生成、逆动力学、视频-动作联合预测五种范式统一为“看-想-动”闭环。核心是混合Transformer(MiT)架构,融合视频生成、语义理解、动作生成三个基座模型,相当于让模型同时拥有“想象力”“理解力”和“执行力”。配合潜动作变分自编码器(Latent Action VAE),它能从无标签互联网视频中提取通用运动规律,再通过六级具身数据金字塔(从互联网数据到目标机器人演示)逐级提升任务相关性。实验证明:任务越多、数据越丰富,MotuBrain在新任务上的成功率反而越高,彻底打破了传统VLA模型过拟合任务轨迹的瓶颈。
实战碾压:动作质量与物理真实度双料冠军
在WorldArena中,MotuBrain不仅总分第一,更在Motion Quality和Motion Smoothness两个单项上夺魁。这意味着它生成的机器人动作真正“在动”,且符合真实物理规律——不会出现突然抖动或加速。对于一个未来要服务机器人的世界模型而言,画面再美,执行时一抖手汤就洒了,等于零。而在RoboTwin2.0的随机扰动场景下,对手JEPA-VLA、Pi-0.5的平均分均低于90,MotuBrain却拿到96.1的高分,展现出极强的抗干扰能力和系统级鲁棒性。这不是单点强,而是从理解物理世界到驱动行动的完整能力链优势。
跨本体多任务:一脑多能的通用性实证
现实中机器人形态各异:双臂、移动、人形、机械臂。传统方法“一个机器人一个模型”,换了本体就要重新训练。MotuBrain展示了卓越的“一脑多能”——一个模型即可应对抓取、移动、放置、组合、连续操作等多种任务,且能直接完成超过10个原子动作的长序列执行,无需上层任务拆解。它学到的是跨任务的通用世界知识:物体会受力、动作有先后、环境会变化、错误需要调整。随着数据总量增加,MotuBrain稳压Pi-0.5一头,证明它已经接近“通用机器人大脑”的能力特征。
产业落地:从实验室SOTA到真实机器人生态
MotuBrain并非停留在论文中的技术验证。生数科技已将其商用版本适配多个头部机器人本体(无界动力、深朴智能、星尘智能等),完成从“插花到浇水”等长程任务的一镜到底执行。这背后是生数科技“通用世界模型”战略的完整闭环:以U-ViT架构为基础,通过世界生成模型(WGM)打造视频大模型Vidu(服务200多个国家和地区),再通过世界行动模型(WAM)构建MotuBrain,实现“预测世界、生成世界、行动于世界”。产业侧,国内机器人产业正从比拼“身体”(电机、传感器)转向争夺“大脑”(操作系统入口),MotuBrain的双榜第一证明了:通用机器人大脑这件事,中国团队已经走在第一梯队。