国产厂商第一，全球第二！我用海外最强生图模型，试出了这匹黑马的真实段位

1 个月前

AI资讯

48 阅读

大模型国产AI 生数科技 MotuBrain

双榜封神：零宣发黑马拿下国产厂商第一

大模型竞技场突现新王。生数科技的MotuBrain在没有预告、没有预热的情况下，一举拿下两张顶级榜单的冠军。在WorldArena中，它以63.77的EWM Score排名第一；而在RoboTwin2.0的实操测试中，Clean场景95.8、Randomized场景96.1，成为唯一一个在随机环境下平均分超过95的模型。这两张榜单互不交叉——一张考“是否真正看懂世界”，另一张考“是否能在世界里稳定干活”。MotuBrain同时登顶，意味着它既是理论上的王者，也是实战中的巅峰。业内此前猜测它是阿里、字节或华为的暗手，最终确认来自生数科技，国产AI就此迎来一个真正的通用机器人大脑。

国产厂商第一，全球第二！我用海外最强生图模型，试出了这匹黑马的真实段位

大一统架构：把五种割裂范式拧成闭环

传统具身智能依赖“上层脑”拆解指令、底层驱动执行，容易断档且泛化差。MotuBrain的颠覆在于架构创新——它将VLA（视觉-语言-动作）、世界模型、视频生成、逆动力学、视频-动作联合预测五种范式统一为“看-想-动”闭环。核心是混合Transformer（MiT）架构，融合视频生成、语义理解、动作生成三个基座模型，相当于让模型同时拥有“想象力”“理解力”和“执行力”。配合潜动作变分自编码器（Latent Action VAE），它能从无标签互联网视频中提取通用运动规律，再通过六级具身数据金字塔（从互联网数据到目标机器人演示）逐级提升任务相关性。实验证明：任务越多、数据越丰富，MotuBrain在新任务上的成功率反而越高，彻底打破了传统VLA模型过拟合任务轨迹的瓶颈。

实战碾压：动作质量与物理真实度双料冠军

在WorldArena中，MotuBrain不仅总分第一，更在Motion Quality和Motion Smoothness两个单项上夺魁。这意味着它生成的机器人动作真正“在动”，且符合真实物理规律——不会出现突然抖动或加速。对于一个未来要服务机器人的世界模型而言，画面再美，执行时一抖手汤就洒了，等于零。而在RoboTwin2.0的随机扰动场景下，对手JEPA-VLA、Pi-0.5的平均分均低于90，MotuBrain却拿到96.1的高分，展现出极强的抗干扰能力和系统级鲁棒性。这不是单点强，而是从理解物理世界到驱动行动的完整能力链优势。

跨本体多任务：一脑多能的通用性实证

现实中机器人形态各异：双臂、移动、人形、机械臂。传统方法“一个机器人一个模型”，换了本体就要重新训练。MotuBrain展示了卓越的“一脑多能”——一个模型即可应对抓取、移动、放置、组合、连续操作等多种任务，且能直接完成超过10个原子动作的长序列执行，无需上层任务拆解。它学到的是跨任务的通用世界知识：物体会受力、动作有先后、环境会变化、错误需要调整。随着数据总量增加，MotuBrain稳压Pi-0.5一头，证明它已经接近“通用机器人大脑”的能力特征。

产业落地：从实验室SOTA到真实机器人生态

MotuBrain并非停留在论文中的技术验证。生数科技已将其商用版本适配多个头部机器人本体（无界动力、深朴智能、星尘智能等），完成从“插花到浇水”等长程任务的一镜到底执行。这背后是生数科技“通用世界模型”战略的完整闭环：以U-ViT架构为基础，通过世界生成模型（WGM）打造视频大模型Vidu（服务200多个国家和地区），再通过世界行动模型（WAM）构建MotuBrain，实现“预测世界、生成世界、行动于世界”。产业侧，国内机器人产业正从比拼“身体”（电机、传感器）转向争夺“大脑”（操作系统入口），MotuBrain的双榜第一证明了：通用机器人大脑这件事，中国团队已经走在第一梯队。

国产厂商第一，全球第二！我用海外最强生图模型，试出了这匹黑马的真实段位

双榜封神：零宣发黑马拿下国产厂商第一

大一统架构：把五种割裂范式拧成闭环

实战碾压：动作质量与物理真实度双料冠军

跨本体多任务：一脑多能的通用性实证

产业落地：从实验室SOTA到真实机器人生态

链接失效反馈