刚刚,国产AI自己造了AI,全球首例!
全球首个AI自写的预训练框架ForgeTrain出炉
就在近期,一套名为ForgeTrain的预训练框架悄然亮相,它的特别之处在于——这套框架完全由AI自己编写。这是全球首个完全由AI编写的生产级大模型预训练框架,性能甚至超越了英伟达的Megatron。更值得关注的是,ForgeTrain已经在华为昇腾平台上完成了预训练,这意味着国产AI不仅在“造AI”这件事上实现了自动化,还在国产硬件生态中跑通了全流程。这一突破让“AI自己造AI”从概念变成了现实。
生数科技MotuBrain零宣发登顶双榜,一镜到底封神
短短数小时后,另一则消息引爆业界:生数科技的MotuBrain以零宣发的方式直接拿下WorldArena和RoboTwin2.0双榜第一。在WorldArena中,MotuBrain的总体EWM Score达到63.77,排名第一;在RoboTwin2.0的Clean和Randomized两个场景下,分别拿到95.8和96.1——成为榜单上唯一在随机环境下平均分超过95的模型。这两个榜单一个考“是否真正看懂世界”,另一个考“能否在世界里稳定干活”,MotuBrain同时登顶,意味着它打通了视觉理解与物理执行的鸿沟。

核心技术:五种具身智能范式拧成“看-想-动”闭环
MotuBrain在架构上实现了颠覆性统一——它将视觉-语言-动作(VLA)、世界模型、视频生成、逆动力学、视频-动作联合预测这五种原本彼此割裂的范式,拧成了一个闭环。模型通过联合建模视频与动作,学到的不是机械反应,而是任务目标、环境变化以及动作后果之间的深层世界知识。具体来说:
- 潜动作变分自编码器:从无标签互联网视频中提取通用运动规律,将视觉动力学与控制信号衔接。
- 混合Transformer(MoT):融合视频生成、语义理解、动作生成三个基座模型,相当于同时拥有“想象力”、“理解力”和“执行力”。
- 具身数据金字塔:从互联网数据到目标机器人演示数据的六级层级结构,任务相关性逐级提升。
实验证明,随着任务数量增加,MotuBrain成功率持续上升,而传统VLA模型(如Pi-0.5)不断下降——说明它学到了跨任务的通用世界知识。
从实验室SOTA到多本体适配:MotuBrain的产业落地
MotuBrain不仅技术指标领先,更展现出极强的落地方向。它实现了“一脑贯通”:无需额外的视觉语言模型辅助,仅凭自身即可直接建模复杂长程任务,比如“从插花到浇水”的逻辑转换如同人类本能。更重要的是,它适配了多个头部机器人本体,包括双臂机器人、移动机器人、人形机器人等,实现“一个模型,多种本体”的零样本泛化。生数科技已与无界动力、深朴智能、星尘智能达成战略合作,将MotuBrain从实验室推进到工厂、家庭、商业场景。
背后战略:通用世界模型连接数字与物理世界
生数科技创始人朱军曾提出:“通用世界模型是连接数字世界与物理世界的桥梁。”围绕这一战略,生数科技搭建了完整体系:
- 数字空间:基于通用世界模型和U-ViT架构,推出视频大模型Vidu,服务全球200多个国家地区,合作好莱坞工作室制作动画短剧。
- 物理空间:Motus/MotuBrain作为世界行动模型(WAM),为真实机器人提供统一大脑。
两条线形成“预测世界、生成世界、行动于世界”的闭环。MotuBrain的双榜第一,意味着中国团队在下一代机器人操作系统入口的卡位战中已经走在了第一梯队。