理想汽车宣布下半年马赫 VLA 能力持续进化,第四季度对齐特斯拉 FSD V14 能力

马赫 VLA 进化:从“理解语言”到“视觉驱动”的质变

理想汽车在本次技术路线中明确,马赫 VLA 模型将迭代至第二代版本。与第一代依赖“视觉-语言”组合预训练的基座不同,第二代 VLA 技术直接砍掉了语言转译环节,让 AI 以视觉信号为核心直接生成动作指令。这意味着系统不再需要将摄像头看到的画面先翻译成自然语言再转换为控制信号,而是像人类司机一样,“看到”即“做到”,大幅缩短反应链路、提升实时性。这种“纯视觉驱动”的架构,正是理想对齐特斯拉 FSD V14 端到端大模型的关键技术路径。

自研硬件底座:马赫 M100 芯片与星环 OS 护航

实现高级别 VLA 能力的背后,是充足的算力与带宽支撑。理想汽车已自研马赫 M100 芯片,并搭配“完全体”线控底盘、800V 主动悬架以及星环 OS 操作系统实现量产。值得注意的是,FSD V14 模型对内存带宽和算力的需求,已远超 HW4 设计预期,下一代 HW4.5 仍在开发中。理想则通过自研芯片和星环 OS 的全栈垂直优化,在软硬一体层面为 VLA 模型提供持续进化所需的算力基础。同时,理想研发投入达 27 亿元,同比增长 8.3%,为后续模型参数量级提升与数据飞轮构建提供资金支持。

理想汽车宣布下半年马赫 VLA 能力持续进化,第四季度对齐特斯拉 FSD V14 能力

数据飞轮与 corner case 挖掘:确保“极端情况”不抓瞎

行业内头部玩家都在强调数据质量而非单纯数量。理想汽车同样构建了自己的数据闭环体系,但关键差异在于对“corner case”的挖掘与仿真生成。根据行业共识,光有大量的日常驾驶数据,缺少极端场景的多样性,模型极易过拟合——平时顺畅,遇到突发情况就失控。理想利用其全球超过 60 万台的量产车辆数据池,结合仿真引擎不断生成恶劣天气、异形障碍物等边缘案例,使马赫 VLA 模型在追求参数翻倍(参考特斯拉 FSD V14 参数翻 10 倍)的同时,确保每一轮训练数据都具备高质量梯度。

对标 FSD V14 的第四季度目标:物理图灵测试与专属司机愿景

理想汽车计划在今年第四季度使马赫 VLA 能力与特斯拉 FSD V14 对齐。特斯拉 FSD V14 正在从单纯的端到端自动驾驶,向“物理图灵测试”演进——要求模型不仅会开车,还要像人一样理解物理世界的交互逻辑。理想则提出“VLA 司机大模型”概念,强调同时具备空间智能(理解三维环境)、语言智能(听懂用户指令)和行为智能(学习驾驶风格),并不断成长为你专属的“司机”。这种从“工具”到“伙伴”的转变,正是理想对齐 FSD V14 愿景的人机交互表达。

行业格局:自研体系成为活到 L4 的关键

马赫 VLA 并非孤军奋战。当前中国头部车企已形成多极竞争:华为 ADS 5.0 采用 WEWA(世界引擎模型+世界动作模型)架构,小鹏 VLA 2.0 将世界基座模型参数规模推至 720 亿,吉利则通过星睿智算中心 2.0(23.5EFLOPS)和 WAM 世界行为模型构建体系化闭环。理想汽车选择的是一条与特斯拉类似的自研体系路径——自研芯片、自研 VLA 模型、全栈垂直整合。在智能辅助驾驶下半场,决定谁能活到 L4 的三把尺是:模型参数量、数据飞轮质量、以及世界模型的体系基座。理想通过马赫 VLA 的持续进化和第四季度目标对齐,正在这三把尺上全力追赶。