以小博大登顶全球榜单:一款中国世界模型凭什么跑赢Google和NVIDIA?
全球榜单惊现黑马:中国小团队把谷歌英伟达拉下马
5月29日,被誉为世界模型“终极试金石”的WorldArena榜单公布最终结果。成都考拉悠然联合上海码极客、同济大学空间智能团队打造的“考拉悠然无界世界模型”一举震惊业界:其开源版本BLM斩获Track-1(视频质量赛道)全球第一,闭源版本BWM-Fast也以67.87分拿下全球第二,与榜首分差仅为0.39分。这意味着,在检验AI对物理世界理解与预测能力的最前沿赛道上,一支来自中国西部、产学研深度融合的团队,已经站到了世界舞台的中央,直接击穿了谷歌、英伟达等科技巨头的算力神话。与此同时,由极佳视界推出的GigaWorld-1也在同一基准中夺得综合榜第一,成为唯一综合得分突破60分的具身世界模型,在物理遵循、3D准确度等维度断层领先。
数据“精算”革命:不靠天价算力,靠榨干每条训练样本
在当前世界模型领域,一种近乎“肌肉崇拜”的惯性认知根深蒂固:高保真生成必须依赖海量数据、超大模型和天价算力。但考拉悠然团队给出了截然不同的路径。他们独创的训练数据增强与智能增广策略,将每一份数据的训练价值“压榨”到极致——不是堆砌数据量,而是提高数据利用率。正是这种“精算”打法,让开源模型以远低于巨头的算力成本,跑出了更逼真的物理模拟。模型精准捕捉了门轴等铰链结构的动力学约束,在“开门”动作的旋转过程中,门与框的几何连贯性毫无失真;在长达数十秒的动作序列中,即便物体被短暂遮挡,也不会出现“漂移”或“瞬移”的物理错误。这些能力证明:高保真生成并非只能靠堆算力,聪明的数据策略同样能改写规则。
物理世界预言家:机器人执行前先虚拟预演千万次
“我们不是在训练一个只会生成好看画面的‘视频生成器’,”考拉悠然董事长、同济大学计算机科学与技术学院院长申恒涛院士强调,“我们的目标,是让AI真正理解物理世界如何运转,让机器人能像人一样预见‘如果我这么做,世界会发生什么变化’。”无界世界模型的核心能力指向一个未来:在机器人执行真实任务前,模型可以在虚拟空间中预演千万次,提前回答“这个策略行不行?”,极大降低现实世界中的试错成本。极佳视界的GigaWorld-1同样专为具身场景打造,引入显式动作建模机制和可微分物理引擎,通过上万小时真实机器人操作数据训练,实现了对复杂物理交互过程的真实模拟与动作遵循。这些模型正在让机器人从“看视频”进化到“懂物理”。
成都“卧龙九条”养出黑马:从实验室到产业链的奇迹
2017年,考拉悠然在成都高新区一间办公室成立。回顾创业历程,申恒涛深切感受到成都对科技企业成长的助推作用:成都经常组织场景需求对接会,为科技企业提供宝贵的市场验证机会。空间智能的普及必须依赖场景化落地——不是一次性展示所有功能,而是通过低空经济、应急防灾、城市治理、机器人、随身设备等具体案例,让市场逐步理解技术的生产力价值。截至目前,考拉悠然已累计服务政府、半导体、烟草、交通、生态环保等500余家客户,获国家级专精特新“小巨人”企业等荣誉。更关键的是,成都依托国家超算成都中心、成都智算中心“双中心”算力优势,每年提供最高算力券和场景专项资金,落地西部地区首个AI人才专项政策“卧龙九条”。2025年成都人工智能核心产业规模超1500亿元,同比增长超39%,企业超1200家。考拉悠然正牵头制定多模态世界模型技术标准,联合省内机器人、无人机企业共建空间智能产业链。一流企业做标准——这家成都黑马不仅跑赢了全球巨头,更在重新定义世界模型的游戏规则。