3 月 17 日,理想汽车基座模型负责人詹锟在 NVIDIA GTC 2026 大会发表主题演讲,正式发布下一代自动驾驶基础模型 MindVLA-o1,标志着该品牌自动驾驶技术从模块化架构向统一模型范式的根本性跨越。
据官方介绍,MindVLA-o1 以原生多模态 MoE Transformer 为核心,通过五大技术创新构建核心能力:3D 空间理解技术融合视觉与激光雷达数据,实现三维物理空间精准感知;多模态思考能力借助隐世界模型提前预演场景演化;统一行为生成机制通过并行解码与离散扩散优化,保障行驶轨迹稳定流畅;闭环强化学习框架结合高保真模拟器,使模型训练成本降低 75%;软硬件协同设计则将架构探索周期从数月缩短至数天,适配 Orin、Thor 双平台。
该模型的核心突破在于实现视觉、语言与行动的统一融合,已超越传统自动驾驶模型范畴,逐步演进为面向物理世界的通用智能体。理想汽车明确表示,同一套 VLA 技术框架未来可扩展至机器人等多物理系统,而车辆作为 "最大号的机器人",成为该技术生态的核心载体。
对用户而言,MindVLA-o1 将通过蒸馏技术实现老车主 OTA 升级,延续技术普惠承诺。此前 VLA 司机大模型已积累 80% 月使用率、1225.4 万次累计指令使用量,2026 年春节期间辅助驾驶总里程达 2.5 亿公里,为新技术落地奠定坚实数据基础。
据悉,MindVLA-o1 是理想汽车核心 AI 框架的关键组成,该框架包含 MindData 数据引擎、MindSim 世界模型及强化学习基础设施,形成 "感知 - 思考 - 行动 - 进化" 的完整闭环,相关技术成果已在 CVPR、ICLR 等国际顶会发表。