刚刚,李飞飞世界模型新成果发布
背景:从图像到3D世界的智能飞跃
李飞飞作为人工智能领域的先驱者,长期致力于计算机视觉与AI空间理解的研究。在斯坦福大学期间,她推动了ImageNet等重要项目的发展,并逐步将研究重心转向空间智能与世界建模。
World Labs作为李飞飞的创业公司,专注于构建能够理解和生成真实世界空间结构的AI模型。这一目标的核心是将视觉信息转化为具有几何、光照、材质等丰富属性的3D环境,从而为虚拟现实、建筑设计、游戏开发等多个领域提供技术支持。
技术亮点:Marble模型的核心能力
Marble是World Labs发布的最新研究成果,它具备以下关键技术特性:

- 单一输入,多维生成:只需一张图像或一句文本提示,即可生成完整3D世界。
- 高精度几何结构:AI能够推理场景中的平面、凸凹结构、空间关系和深度信息。
- 风格多样性:生成的世界支持多种艺术风格与现实还原,适应不同应用场景。
- 持久存在性:生成的3D世界并非短暂展示,而是可保存、可交互、可持续扩展。
这项技术突破了传统3D建模对复杂输入和大量数据标注的依赖,标志着AI在空间智能理解方面迈出了重要一步。
应用场景:潜力广泛,行业前景巨大
Marble的发布为多个行业带来变革性可能:
- 建筑设计:快速从概念草图生成空间模型,提高设计效率。
- 游戏与影视制作:实现从一张图构建完整虚拟场景,加速内容创作流程。
- 虚拟现实与元宇宙:为构建持久、动态、多样化的虚拟空间提供AI基础。
- 机器人与自动驾驶:帮助AI更好地理解真实世界的空间结构与环境关系。
尽管目前模型仅开放限量访问,但其潜在应用场景已引起广泛关注。
当前状态与未来展望
World Labs今日上线了Marble的beta预览版本,并通过全新平台供开发者与创作者试用。目前,该平台提供生成与体验3D世界的功能,用户可上传图像或输入文本快速创建自己的空间场景。
然而,正如李飞飞团队所强调的,“上线了,但没完全上线”。这表明该模型仍处于早期阶段,后续将不断优化性能、扩大可用性,并逐步引入更多交互与编辑功能。
未来,World Labs计划将Marble与更多AI系统集成,构建一个开放的3D生成生态系统,推动AI对现实世界建模能力的持续演进。