首页
登录
当前标签:深度估计
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模
Meta与普林斯顿大学联合提出VLM³,证明标准视觉语言模型天生具备3D理解能力,基于Qwen3-VL-4B实现深度估计、像素匹配等多任务统一建模,深度估计准确率突破0.9。