理想发布下一代自动驾驶架构李想：通往L4上最重要的一步

2025年03月20日 09:29:34 人气: 17100 来源: TechWeb.com.cn

　　3月18日，理想汽车发布下一代自动驾驶架构MindVLA。

　　理想汽车CEO李想在微博表示，它将空间智能、语言智能和行为智能统一在一个模型里，让自动驾驶拥有感知、思考和适应环境的能力，是我们通往L4路上最重要的一步。

　　MindVLA能为自动驾驶赋予类似人类的驾驶能力，就像iPhone 4重新定义了手机，MindVLA也将重新定义自动驾驶。

　　理想汽车自动驾驶技术研发负责人贾鹏表示：“MindVLA是机器人大模型，它成功整合了空间智能、语言智能和行为智能，一旦跑通物理世界和数字世界结合的范式后，将有望赋能更多行业。MindVLA将把汽车从单纯的运输工具转变为贴心的专职司机，它能听得懂、看得见、找得到。我们希望MindVLA能为汽车赋予类似人类的认知和适应能力，将其转变为能够思考的智能体。”

　　据了解，MindVLA不是简单地将端到端模型和VLM模型结合在一起，所有模块都是全新设计。3D空间编码器通过语言模型，和逻辑推理结合在一起后，给出合理的驾驶决策，并输出一组Action Token(动作词元)，Action Token指的是对周围环境和自车驾驶行为的编码，并通过Diffusion(扩散模型)进一步优化出最佳的驾驶轨迹，整个推理过程都要发生在车端，并且要做到实时运行。

　　MindVLA将为用户带来全新的产品形态和产品体验，有MindVLA赋能的汽车是听得懂、看得见、找得到的专职司机。

　　“听得懂”是用户可以通过语音指令改变车辆的路线和行为，例如用户在陌生园区寻找超市，只需要通过理想同学对车辆说：“带我去找超市”，车辆将在没有导航信息的情况下，自主漫游找到目的地；车辆行驶过程中，用户还可以跟理想同学说：“开太快了”“应该走左边这条路”等，MindVLA能够理解并执行这些指令。

　　“看得见”是指MindVLA具备强大的通识能力，不仅能够认识星巴克、肯德基等不同的商店招牌，当用户在陌生地点找不到车辆时，可以拍一张附近环境的照片发送给车辆，拥有MindVLA赋能的车辆能够搜寻照片中的位置，并自动找到用户。

　　“找得到”意味着车辆可以自主地在地库、园区和公共道路上漫游，其中典型应用场景是用户在商场地库找不到车位时，可以跟车辆说：“去找个车位停好”，车辆就会利用强大的空间推理能力自主寻找车位，即便遇到死胡同，车辆也会自如地倒车，重新寻找合适的车位停下，整个过程不依赖地图或导航信息，完全依赖MindVLA的空间理解和逻辑推理能力。

　　总结来说，对于用户而言，有MindVLA赋能的车不再只是一个驾驶工具，而是一个能与用户沟通、理解用户意图的智能体。

关键词：理想,自动驾驶架构,L4

上一篇：AMD董事会主席及首席执行官苏姿丰：AI是50年来最具变革性的技术 下一篇：通用汽车与英伟达合作研发自动驾驶技术

全年征稿/资讯合作 联系邮箱：1271141964@qq.com

版权与免责声明: 1、凡本网注明"来源：智能制造网"的所有作品，版权均属于智能制造网，转载请必须注明智能制造网，https://www.gkzhan.com。违反者本网将追究相关法律责任。; 2、企业发布的公司新闻、技术文章、资料下载等内容，如涉及侵权、违规遭投诉的，一律由发布企业自行承担责任，本网有权删除内容并追溯责任。; 3、本网转载并注明自其它来源的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。; 4、如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。

企业推荐