作者:周雅
15日下午,理想汽车开了一场信息量极大的发布会。理想汽车董事长兼CEO李想走上台,抛出了一个激进观点:“今天的智能手机和智能汽车,谈不上真正的智能。”
![]()
但真正让这场发布会有戏剧性的,还不只是李想的这句话,而是理想汽车基座模型负责人詹锟提到的一次经历。
一个月前,詹锟去了一趟硅谷。他把特斯拉最新的FSD V14.3连开了两个星期。回国之后,他给团队留下两句话:“第一,特斯拉真的太强大了。第二,压力也真的太大了。”他回国紧急召集了核心算法团队复盘,也直接催生了这次的马赫VLA更新。
近两个小时的会议,理想汽车同时发布多个产品:一颗自研车规芯片马赫M100、一套自研操作系统星环OS、两个自研模型马赫Mind-Pro和马赫Mind-Edge、还有升级的马赫VLA、一组现场跑通的Livis Agent演示、一份2026年OTA计划表、以及一个新概念——具身智能汽车。这四样产品,被装在同一台量产车上,从底层硬件到顶层产品体验,全栈自研。
理想正在试图用“具身智能”的标准,重做一遍“智能汽车”这个品类。
![]()
/01/ 用三个新维度,重新定义智能汽车
敢于全盘否定过去,李想的逻辑是什么?
他指出,过去十几年,行业公认的“智能汽车”普遍遵循三要素:软件定义硬件、联网且实时在线、系统可以持续升级。智能汽车是这样,智能手机也是这样。
李想在台上明确指出,这三要素已经不够用了。“虽然名字上挂着智能,但今天的智能手机和智能汽车,都不是真正的智能,它们本质上还是功能驱动的,而不是一个有生命力的智能体。”
判断一辆车是否真正智能,李想给出三个维度:安全、能力、效率。
先说安全。李想说,传统智能汽车对安全的定义,是“功能安全、免责优先”,在简单道路上表现很好,一旦遇到复杂路况、极端天气、从未见过的场景,它最常见的做法是退出,把方向盘交还给驾驶员。这种处理“从法规上讲合规,但对于人类,恰恰是最危险的瞬间”。李想提到一个数据,接近一半的智驾事故,发生在系统把方向盘丢给驾驶员的那一瞬间。
再说能力。李想指出,传统智能汽车是“特定功能、特定场景”,有很多功能,开导航、开空调、放音乐、辅助驾驶,但它只是在“调用一个个功能”,但它并不真正掌握人类司机在复杂场景下的倒车、腾挪、靠边停车、礼让能力。
最后说效率。李想说,传统智能汽车是“人机共驾、人机协同”。他在现场问观众,“你们通常什么时候「不用」智驾?”台下有人答:赶时间、要迟到了、胡同窄路。这个答案很真实,这也从侧面说明,关键时刻,人类其实并不相信智驾,所以智驾要做的工作还有很多。
这三个维度结合,就是李想给智能汽车定下的标准:保护人类安全、独立完成任务、比人效率更高。
李想自己也很清楚,从旧定义跳到新定义,不是修修补补能解决的。“它比从大语言模型到今天的Agent要难得多,我们必须重构整个系统。”
那么这次重构,从哪里开始?理想正式提出一个新概念:具身智能汽车。
“我们要用具身智能,打造一辆能够保护人类安全、独立完成任务、比人类更高效的具身智能汽车。”李想如是说。
![]()
/02/一个新定义:具身智能汽车
理想汽车将具身智能汽车定义为“四位一体”:
它是一辆电动车。具身智能汽车要服务真实世界,需要有身体,能移动,能达到目的地。
它是一位职业司机。理解道路、风险、交通规则,能完全可靠完成出行以及生活任务。
它是一台AI计算机。比旗舰智能手机和电脑有更强的AI算力,更大的内存,内存和显存一体化,专为大模型设计。
它是一个生活助手。不需要研究怎么操作各种软件,只需要把任务告诉它,它来帮你完成。
李想强调,“这不是四个产品,这应该是一个产品”。过去新势力车企做的事,大多是把这四样东西分别做好:智驾团队做智驾、座舱团队做座舱、底盘团队做底盘、车机系统做应用。理想这次要做的,是让这四样东西同时长在一个底层架构上。
![]()
李想给出了一个类比:“在iPhone出现以前,没人知道自己需要触摸的屏幕。在特斯拉Model S出现之前,没人相信电动车这么让人心动。所有没有被展示出来的可能性,往往会被误以为是不存在的需求。”
把这套定义落到工程上,意味着理想汽车至少要重做三件底层的事:一颗自研芯片、一套自研操作系统、一组自研模型。
/03/大脑:三个自研模型
具身智能的大脑,被理想汽车拆成了两支:语言智能负责“听得懂任务”,机器智能负责“开得到目的地”——前者由两个自研大模型马赫Mind-Pro和马赫Mind-Edge承担,后者由自研马赫VLA承担。两支共享同一套底层认知,共同构成一个完整的大脑。
![]()
先看语言智能这一支。
这一次,理想正式推出两个全新模型——马赫Mind-Pro与马赫Mind-Edge,分别走云端和端侧两条路径。根据理想汽车基座模型负责人詹锟介绍:
马赫Mind-Pro走云端,定位是Agent智能体模型。在IFEval指令跟随、LongBench-v2超长文本理解、AIME26高阶数学推理、BFCL-v4工具调用等行业基准上,稳居第一梯队;放到Agent专项领域,Claw系列榜单、PinchBench-v2实景实测,综合性能超越大多数主流Agent模型。
![]()
詹锟强调“实验室跑分终究只是纸面数据”。理想拿出来的实战数据是,依托Livis Agent全场景体系,在Token生成速度、任务完成质量、Token使用成本、端到端响应时延四个商业核心维度,实现全面领先。通过Token压缩技术,任务完成率零衰减的前提下,Token平均消耗降低38%,工具调用冗余轮次减少47%;TPS峰值达到208 Token/s,推理效率是主流Agent模型的2倍以上。
![]()
这背后是一套「混合强化学习并行训练体系」。理想搭建了数百套真实业务沙箱环境,高精度模拟工具调用环境;同时并行运行三套差异化训练环境,覆盖单步强化学习、长链路多步强化学习、在线环境强化学习。
![]()
马赫Mind-Edge走端侧,主打端侧原生具身智能体。现场播放了一个演示视频,用户问“我的耳机找不到了,你能帮我找一下吗?”系统答:“找到了,你的耳机在扶手箱上。”
詹锟解释,马赫Mind-Edge采用多模态流式时序建模,能够连续理解动态的物理世界,具备因果推理和自主决策能力。再加上大量车载专属的行为特化训练,让模型摆脱传统AI“只回答不行动”的模式,它可以直接输出动作,实时调用车辆硬件。
它的一系列能力,包括Always On全天候主动感知、人车交互、自主控车、多模态问答,全部在车端本地实现,低时延、高可靠,数据完全不上传。“这不是云端模型的阉割版本,而是从底层就为车载场景原生打造的模型。”詹锟强调。
以上,云端马赫Mind-Pro负责复杂Agent任务调度,端侧马赫Mind-Edge负责实时人车交互。两个模型,共同构成了具身智能的语言智能层。
接下来,机器智能这一支是「马赫VLA」。
![]()
在讲VLA的时候,詹锟就讲了文章开篇所提到的体验特斯拉FSD V14.3的事迹,他随后补了一句说:“真正感受到压力,才证明我们是在平视这个星球上最强大的对手,而没有在国内的内卷中自我麻痹。”
这种压力,直接催生了马赫VLA系统的全面升级。它的三个维度,正好对应李想前面立下的智能汽车三条标准:保护人类安全、独立完成任务、比人效率更高。
![]()
安全维度。理想给了一组背书数据:截至2026年6月14日,理想全系智能驾驶主动避险总次数17273307万次,其中重大避险55671次。从2022年至今1400余天,平均每日主动避险1.2万次。“用户出行每遇到100次道路险情,就有一次会直接酿成车祸。我们硬生生把灾祸从命运边缘拉了回来。”
AEB和AES的迭代路线也铺了出来:2022年激光雷达首次落地主动安全;2023年AEB完成全速度段覆盖;2024年行业首发AES,同时实现360度低速全方位防御;2025年AES升级支持多车连续避让和防硬躲避被撞;2026年新增悬空障碍物识别,夜间刹停上限提升到130公里。
![]()
效率维度。普通人从发现危险到踩下刹车的反应时间是0.45秒(权威论文数据)。如果在查看导航或回复消息,反应时间会到秒级。地表最强F1车手的极限反应是0.25秒。“我们全新一代马赫VLA系统的反应耗时是0.28秒,无限逼近人类的生理极限。”
多出来的0.17秒意味着什么?在120公里时速下能提前6米完成刹停。6米是一台幻影劳斯莱斯的整车长度,也是“刹停到相撞、生存到毁灭”的全部距离。
这0.28秒不是单一模块快出来的。视觉输入时延降低47%,模型推理链路缩短43%,线控底盘响应降低38%,操作系统调度编排降低28%,端到端总时延降低40%。“不是哪个模块变快了,是整个链路从头到尾都变短了。”
能力维度,理想拿了几段真实场景视频做证据:施工区域绕行、挖掘机爪臂动态避让、对向窄路主动切倒挡礼让、识别穿黄马甲保安的手势、低矮异形物体识别、广州傍晚雨夜的城中村小路。最后那段广州城中村的视频最关键。路宽不到3米,没有车道线,没有交通标识,路边打伞行人、外卖骑手、占道小贩混杂。“很多广州老司机开起来都头皮发麻。但马赫VLA开得极其从容,根据对向来车、行人、电动车的位置主动辗转腾挪,给每一个参与者都留足空间。”
马赫 VLA 这一代的能力从哪里来?詹锟把它归纳成三个变量的同时跃升:“这背后是数据、算力、模型规模同时暴增下,Scaling Law带来的能力涌现。”
算力方面,双马赫M100让车端算力达到2560TOPS。数据规模方面,模仿学习数据量增加50%,强化学习数据量增加15倍,训练算力增加5倍。模型规模方面,行泊一体模型彻底统一,参数量提升10倍,每秒Token计算量提升15倍。
![]()
但比涌现更关键的,是架构层的重构。理想直接把感知、预测、规划三个模块统一成「原生多模态MoE大模型」。“过去模块化的模型结构有一个致命缺陷,感知、预测、规划三个模块各玩各的,就像一家公司,市场部说这事能干,研发说我压根没收到消息,财务说我还不知道有这个项目。功能都没错,但整体意图完全不一致。”
围绕这个统一的大模型,理想还做了两件配套的事:一件是马赫 World Model,一个能模拟真实物理世界的世界模型,给马赫 VLA 提供训练所需的虚拟环境;另一件是 RL Infra,强化学习的训练基础设施,让 VLA 能在世界模型里持续试错、迭代。如此一来,马赫 VLA、马赫 World Model、RL Infra 三位一体,构成一套完整的具身智能模型训练体系。“看见、理解、思考、行动,从一开始就在同一个框架里彻底对齐。我们从第一天起就是为具身智能而生。”詹锟说。
![]()
新架构搞定了,但具身智能还需要真正“看懂”世界,这就涉及视觉方案的选择,业界有的在卷激光雷达,有的在卷视觉方案,詹锟在这里强调:
“行业都在疯狂卷激光雷达的线数。128线、256线、512线,越卷越离谱。但激光雷达的线数再高,它能告诉你红绿灯现在是什么颜色吗?能读懂路牌上‘前方施工禁止通行’这几个字吗?能看懂穿黄马甲的保安手势是让你停还是让你走?都不可能。”詹锟说,“激光雷达只能理解世界的骨架,根本不能理解这个世界。”
理想这次让3D ViT首次上车,现场把镜头切到观众席,3D ViT瞬间重建了整个三维世界,观众姿态、场馆细节、后排文字全部被记录下来。
![]()
模型层面的进展,理想给了两个明确的OTA节点:第三季度,为搭载 Orin 和 Thor 芯片的 AD Max 用户推送全新马赫 VLA 模型;第四季度,马赫 VLA 模型能力对齐全球顶尖水平。后一句“对齐全球顶尖水平”,指的就是特斯拉的FSD V14。“这是我们对自己的要求,更是对用户的承诺。”詹锟说。
/04/心脏:发布马赫 M100,5nm 车规级芯片,1280TOPS 单芯片算力
具身智能汽车的大脑跑在哪里?
于是,理想正式发布马赫 M100。“马赫 M100是一颗用完全不同思路造出来的芯片。”理想汽车CTO谢炎说道。
这颗芯片从2022 年立项,历经三年半打磨,于2026年5月实现量产上车。
![]()
谢炎在台上把芯片高高举起,讲起它的参数。5纳米车规级工艺,单芯片算力1280 TOPS,“是目前全世界量产最强大的车规级算力芯片”;实际运行效率超过 82%,主流基于 SMT 架构的 GP GPU;超过一半的晶圆面积留给神经网络处理器,由56个计算单元和1个数据处理模块构成,采用网格总线加数据环形总线双互联架构;CPU 部分,24 核 ARM A78AE,主频 2.3GHz,车载旗舰级大核,负责安全和系统控制;内存部分,8 通道 LPDDR5X 子系统,273 GB/秒超高带宽,提供片外大容量内存高速通道。
![]()
![]()
但参数本身只是数字。理想拿马赫M100做了两组对比,信号量都很强。
第一组对比,跟全球公认智驾领域最主流的芯片ThorU直接对比CNN Based、UniAD、马赫VLA模型。每一项每一个测试,马赫M100全部超越ThorU,是数倍的性能差距。
![]()
第二组对比更有意思。谢炎在马赫M100上部署了Qwen3.5-35B,跟NVIDIA的DGX Spark桌面超算对比。结果是Qwen3.5-35B-A3B prefill速度,马赫M100是DGX Spark的2.7倍;Qwen3.5-35B-A3B decode速度是1.5倍。一个装在车里的芯片,跑通用大模型比一台4万块的桌面超算还快。
![]()
马赫M100号称"全球首款量产的动态数据流AI芯片"。这里面不一样的,是「数据流」三个字。
传统芯片是怎么干活的?可能是一步一步走的员工,它有一张待办清单(行话叫“指令队列”),从清单第一项开始,做完一项做下一项,顺序严格不能乱。这种方式的问题是,清单本身要写、要管、要排序,芯片很大一部分晶体管不是在算东西,是在管理这张清单。算AI模型这种海量并行的任务时,管理成本越来越高,效率上不去。
但谢炎说,AI计算其实根本不需要这张清单。“AI计算天然是并行的,数据是确定的、关系是清晰的、流动路径是固定的。”翻译一下:AI 模型在做什么、下一步要处理什么数据、这些数据要流向哪个计算单元,在模型设计的时候就已经写好了。既然路径是固定的,就不需要一个中央调度员去现场指挥。
所以理想汽车做了一件颠覆传统的事:把那张待办清单和清单管理员全砍掉,让数据自己驱动计算的发生。数据流到哪里,计算就在哪里发生。
“马赫M100的能力远不止于智能驾驶,它今天已经跑通了车上所有的智能化场景。它能运行语言大模型,它能支撑Agent,它将驱动具身智能,它还会支持更多我们今天还没有想到的AI场景。”谢炎说。
这套架构也拿到了一个学术层面的背书。谢炎在台上宣布,今年马赫 M100架构的论文被ISCA 2026工业分区收录。同期入选的是谷歌、美光、Meta、安培、MegaBlast。“理想汽车是汽车行业中第一家,历史上第一家在ISCA工业分区获得论文录取的企业。”
![]()
谢炎特意申明:“我们入选 ISCA 从来不是因为造了一颗芯片,是因为提出并实践了一种创新的架构思路。”马赫 M100 架构团队将于6月30日在ISCA 2026会议现场进行主题分享。
“冯·诺依曼架构用七十年推动了通用计算的辉煌。今天我们以马赫 M100 为起点,希望用数据流架构,接过历史的这一棒,继续推动 AI 计算再辉煌七十年。”谢炎最后立下宏愿。
/05/神经系统:星环OS与芯片到算法的全栈自研
光有芯片不够。具身智能需要一套完整的系统,把心脏、大脑、眼睛、手脚组织起来协同工作,这套系统的“神经系统”,叫做「星环OS」。
![]()
“星环OS是理想汽车为具身智能专门设计的神经系统,从设计的第一天起,它就是为 AI 原生而生。”谢炎介绍,“感知、决策、执行全链路深度融合,结合全线控底盘的极速响应,我们把端到端的延时压缩到了0.28秒,反应速度比人类快40%。这就是系统协同的力量,它不是芯片快,也不是软件快,是整个系统一起快。”
![]()
这套系统里,马赫M100芯片是心脏,全车感知系统是眼睛,自研马赫模型是大脑,全线控主动底盘系统和能源系统是手脚,星环OS是神经系统,把它们串成一个整体。
为什么连操作系统也要自己做?谢炎向台下问了一个问题:“苹果和安卓哪一个更安全?”台下答“苹果”。“为什么?因为苹果把芯片和操作系统放在一起设计。安全,不是系统启动之后才开始,安全是从芯片上电那一刻就已经开始了。手机芯片被攻击,泄露的是隐私;车的芯片被攻击,威胁的是生命。”谢炎讲出背后逻辑。
理想汽车把密钥保护、设备身份、可信启动链、关键权限管控全部前置到芯片设计中,再通过全栈自研软件实现统一调度。让芯片、编译器、操作系统、AI 算法在同一套可信的基础上协同运行。
![]()
到这里,理想汽车完成了一个少有车企能完成的动作:芯片、编译器、操作系统、AI算法、域控制器,全栈自研。
![]()
/06/量产路径:让具身智能成为日常,Livis Agent现场实操
底层架构讲完,真正的问题来了,这一切到底能不能落到一台普通用户开的车上?
现场,理想直接做了一场真实的Livis Agent演示,展现了它的多项车载智能体能力。“请相信我,这些展示都是真正运行在模型上的Agent,绝不是提前写好的程序。”谢炎强调。
演示中,这个Agent可以根据一句自然语言指令,完成接机、餐厅推荐、路线规划等连续任务。甚至,可以根据“孩子困了”等场景需求,联动车内音乐、灯光、空调、悬架等系统,完成座舱环境调整,随后汽车轻微摇晃,化身一个摇篮。现场实际来看,整体体验确实比较丝滑,没有翻车。
![]()
最后,理想公布了今年下半年完整的OTA路线图,分三个节点:7月份、9月份、12月份。
![]()
?理想汽车2026年7月OTA计划
![]()
?理想汽车2026年9月OTA计划
![]()
?理想汽车2026年12月OTA计划
发布会最后,李想留了两句话作为收尾。
一句关于产品:“过去10年,我们创造了一个移动的家。在第二个10年,我们会给车和家赋予生命”。
另一句关于姿态:“理想汽车坚持做最好的自己,不要期望我们变成别人”。





京公网安备 11011402013531号