全球首个:高德发布 3D 原生城市世界模型 ABot-Earth0.5,单图 10 分钟重建 3D 城市

10分钟生成公里级3D城市,高德亮出“3D原生”王牌

6月8日,高德正式推出全球首个3D原生城市世界模型ABot-Earth0.5。这一模型的核心能力在于:用户只需输入一张卫星图像或一段文字描述,系统就能在短短10分钟内,在一块消费级GPU上自动构建出公里级、符合物理规则的3D城市场景。更关键的是,模型输出的是可编辑的3DGS(3D Gaussian Splatting)格式素材,允许后期直接调整和二次创作——这与传统只能看不能改的渲染成果截然不同。

目前,ABot-Earth0.5模型已成功构建覆盖全球190多个国家和地区的3D地图,将数字孪生从“单点示范”推向了“全球可用”的量产阶段。

从数千人数年手工到单GPU十分钟,成本骤降数个数量级

传统3D城市建模是一项极度“重”的工程。通常,构建一座完整3D城市模型需要数千名美术团队耗时数年手工建模,或者动用昂贵的专业激光雷达、航拍设备进行扫描。据高德团队介绍,传统航拍设备的成本动辄数百万,且需要专业飞手和后期处理,时间周期以月为单位。

全球首个:高德发布 3D 原生城市世界模型 ABot-Earth0.5,单图 10 分钟重建 3D 城市

ABot-Earth0.5彻底打破了这一局面:它借助北京大学与高德联合研究的生成式摄影测量方案Orbit2Ground,以及ABot-World底层仿真引擎,将建模全流程压缩至纯算法端。系统通过“粗建模、高保真修复再到蒸馏回环”的自动化流程,将低质量视频或卫星图直接转化为高质量3D场景。高德表示,这一模型的引入使得城市3D重建的数据成本被压缩了数个数量级,让任何团队或个人都能以近乎零门槛的方式复刻实体都市。

3DGS格式+物理引擎:数字城市既真实又可操控

ABot-Earth0.5不仅追求“看起来像”,更强调“能用、能改”。模型输出的是3DGS(3D Gaussian Splatting)格式——一种基于点云高斯分布的可编辑三维表征。这意味着用户可以对生成的建筑、道路、植被进行单独编辑、替换甚至重置物理属性,而无需重新渲染整个场景。

更重要的是,ABot-Earth0.5继承了ABot-World的物理学合规性设计。在模型层面,高德首创了Diffusion-DPO物理偏好对齐框架:由大视觉语言模型(VLM)自动生成物理规则清单,并以此构建优劣样本对,驱动模型主动抑制违反重力、碰撞、光照等物理规律的行为。每一帧画面都成为包含质量、摩擦、接触力等属性的可微分物理快照,使得生成的3D城市在视觉与动力学层面都与真实世界高度一致。

从城市建模到具身智能,ABot体系完成底层闭环

ABot-Earth0.5并非孤立的产品,而是高德ABot全栈具身智能体系中的关键一环。ABot体系由数据引擎(ABot-World)、基座模型(ABot-N、ABot-M)、执行中枢(ABot-Claw)三个层次深度耦合而成,形成一个“数据驱动模型、模型服务应用、应用反哺数据”的闭环飞轮。

  • ABot-World 作为底层仿真基座,为城市世界模型提供了3DGS冷启动空间基座和物理推理能力。它已在PBench、WorldArena等15项权威基准测试中拿到SOTA,并在物理合规性、动作可控性、零样本泛化上均达全球第一。
  • ABot-N(导航)与 ABot-M(操作)则是机器人在数字城市中“行走”与“工作”的双核。ABot-N实现跨本体导航统一架构,在VLN-CE等7大基准上全面刷新SOTA;ABot-M则统一通用操作基座,在LIBERO、RoboCasa等评测中超越π0.5等顶级模型。
  • ABot-Claw 首创“Map as Memory”集中式Harness架构,将高德地图设为全局认知锚点,让接入的异构机器人零成本继承环境认知。

高德同步宣布将开源ABot全体系,这意味全球开发者可以基于ABot-Earth0.5生成的3D城市,直接训练和部署具身机器人,彻底打通“虚拟训练-真实部署”的闭环。正如高德所言,ABot体系的“转速”来自每日在真实世界中的自动演进,而ABot-Earth0.5正是这个飞轮上最坚实的一环。