拆解李想的具身智能战略：上半场造车、下半场造人

IP属地中国·北京 21世纪经济报道 时间：2026-05-20 20:18:29

“自动驾驶是具身智能的上半场，通用人形机器人是具身智能的下半场。”理想汽车董事长兼CEO李想用这句话为整个汽车、具身智能产业划下了一条时间轴。这不是一句口号，而是一个创业者在经历多次“反共识”之后，对科技演进规律的笃定判断。
当大多数车企还在观望具身智能，或将其视为遥远未来时，早在2025年，李想便已经宣布理想汽车的目标是成为一家具身智能企业。
战略一经官宣，便出现很多不解的声音。直到今年，马赫M100芯片、基座模型、操作系统等底层自研技术全栈落地，并在全新理想L9 Livis上搭载，大家才相信此前的公开宣言并非“泡沫”，而是一直以来对趋势的深刻洞察。
过去十年，理想通过一款又一款车型，向市场证明了理想能够造出一台真正懂家庭用户的车。当前，摆在理想面前的问题便是：如何让车具备和人一样的感知、判断和行动能力？
全新一代理想L9，便是处于战略转型期的理想向市场拿出的第一个结果。“ L9 Livis，是我们历经 4 年打磨，面向具身智能时代的开山之作。”李想表示。
在这台车上，理想也第一次把自研的芯片、马赫VLA、线控底盘、主动悬架和操作系统，都放进同一款产品里。
L9 Livis依然是一台家庭SUV，依然要面临激烈的市场竞争。但它的量产落地，也标志着理想已经从一家造车公司蜕变成了一家具身智能企业。

“做 AI 不是冒险，不做才是冒险”
过去10年，理想经历了一次又一次的反共识。理想汽车的发展历程，是一部反共识的战略决策史。
2015年，新能源汽车浪潮初起，几乎所有的创业玩家都押注纯电路线，只有理想坚持增程方案，用更实用的方案解决家庭出行痛点。当时“增程不是新能源”“增程是落后技术”的声音铺天盖地，直到2024年这一论调也没有消失。而当理想用L9、L8、L7、L6四款增程产品打破市场固有认知后，车企们先后跟风，纷纷推出自家的大增程SUV产品，面向家庭用户。
2022年，在大家还在争先恐后用“性能参数”“续航里程”作为卖点时，理想汽车在车里装上了冰箱、彩电、大沙发。虽然被外界批评“不务正业”，理想却洞察到了中国家庭用车的真实场景——一辆SUV承载的不只是驾驶需求，更是家庭出行的生活空间。这一判断，让中国车第一次在40万元以上的全尺寸SUV市场站住了脚跟。
而现在又来到了历史的转折点。当外界质疑理想没有专心造好车时，李想用一句“做 AI 不是冒险，不做才是冒险”回应外界的质疑，坚定发展具身智能。
理想为什么要做具身智能？
过去十年，AI主要改变的是信息世界。文字、图像、代码、搜索、知识管理，都已经被大模型重新塑造，但物理世界的变化相对缓慢。人们日常生活中的环境交互，仍然依赖人来完成。
汽车正是AI进入物理世界的关键入口之一。相比人形机器人，汽车拥有更成熟的产业链、更明确的使用场景以及更大规模的数据闭环。它天然具备“具身智能”的底层技术：有传感器感知环境，有计算平台处理信息，有控制系统执行动作，有操作系统协调各个模块。从这个意义上说，一辆具备高阶自动驾驶能力的汽车，本身就是一种具身智能产品。
李想认为，不一定是人形机器人才能叫“具身智能”，物理世界的所有机器在加上模型、大脑以及眼睛之后，能用 AI 来进行操作的这些硬件，都可以称为具身智能。事实上，这也是行业对于具身智能的主流定义。在这种定义下，李想认为具身智能的形态可以是机器人，也可以是飞机，同样也可以是车。
“不用非得把车和机器人分开，这两个产业连接得非常紧密。”李想称。他认为，在后续各种各样的具身智能中，汽车和人形机器人会是两块最大的市场，一旦市场成熟，市场规模都在五万亿美元以上。
目前具身智能还在发芽阶段，产业链并不成熟，距离大规模量产落地还有很长一段时间，还需要跨越成本、可靠性、泛化能力和安全性的多重门槛。
相比从零开始打造机器人，汽车本身已经具备了完整的“硬件”基础：动力系统、主动悬架、线控底盘、摄像头、传感器以及高算力平台，天然拥有感知与行动能力。这相比重新组装一套机器人系统，技术路径更现实，也更容易率先实现商业化。
汽车作为一个成熟的万亿级产业，极有可能先成为具身智能产业走向规模化的前置试验场。
先定义时代，再创造时代
李想已经把具身智能的发展拆成了一条较清晰的产业路线图：上半场是自动驾驶汽车，下半场是通用人形机器人。
上半场的自动驾驶在李想看来分为三个阶段：
1、第一阶段是2018年—2023年，属于L2阶段，这时辅助驾驶的关键技术刚刚成形；
2、第二阶段是2023年—2028年，为L3阶段，这一阶段需要人依然坐在驾驶舱里，因为纯依靠车的聪明程度和泛化能力，还不能够处理各种未知的场景；
3、第三阶段是2028年至2033年为L4阶段，这时的无人驾驶才算是真正的机器人。
而进入到下半场，李想同样以泛化能力为标尺划分成三段：
1、第一阶段是2030年—2035年，达到6岁人类的泛化能力；
2、第二阶段是2035年—2040年，达到12岁人类的泛化能力，经过第一阶段之后，机器人的商业就已经基本成立了；
3、第三阶段是2040年—AGI实现期间，达到18岁人类的泛化能力。
要实现L4级别的无人驾驶，需要做到三点：第一，感知上要和人类眼睛一样，能看到三维的世界；第二，要有一个聪明的大脑，模型必须是一个面向物理世界的预训练模型；第三，所有的控制系统都要比人类反应更快、更安全。
按照技术划分，2023年至2028年的L3阶段，对应的是2D ViT感知、预训练模型、端到端控制，以及约2000TOPS级别算力；而2028年至2033年的L4阶段，才进一步走向3D ViT感知、稳定的预训练模型、全线控系统，以及接近10000TOPS级别算力。
这样来看，上半场积累的感知、模型、芯片、操作系统、控制能力，未来都可能成为下半场机器人的底层能力。理想将自动驾驶汽车和通用人形机器人都视为具身智能产品的核心形态，并判断未来L4自动驾驶用户与通用人形机器人用户存在较高重合度。
因而，在L9 Livis上，真正值得市场关注的是，理想不仅自研了芯片、量产了全线控底盘，更为重要的是这些技术能力已经让汽车提前进入到L3甚至L4阶段对技术的基本要求，它代表着理想对未来蓝图的重新规划。
过去几年，理想汽车最擅长的事情，是把复杂的技术包装进一个足够具体的家庭场景里。
但全新理想L9 Livis的上市，透露出一个新的信号——理想这一次想讲的，已经不只是“家庭旗舰SUV如何再升级”。在李想最近关于具身智能的表达中，全新理想L9 Livis更像是一个阶段性样本，理想试图把过去围绕家庭场景建立的产品能力，进一步延伸到更底层的具身智能技术和组织体系中。
李想“上下半场论”的真正价值在于：
它跳出了短期竞争，从终局出发，前瞻性地定义了具身智能的产业格局。当不少企业还在追赶当下、纠结短期销量时，李想已经完成了对未来十年的定义。
在下定义的同时，它还能以极快的节奏、极强的执行力，把战略判断转化为可交付、可体验、可规模化的量产技术与产品。当多数公司还在论证机器人、具身智能的可行性时，理想已经把芯片、底盘、模型全部落地。
别人做纯电，它做增程；别人做工具，它做家庭空间；别人观望 AI，它全栈自研具身智能。在行业普遍追逐短期红利时，理想已经用“定义+落地”的双轮驱动，走在了通往未来十年的正确道路上。
“自动驾驶是上半场，通用人形机器人是下半场”——这句话的重量，不只在于前瞻，更在于：李想定义的方向，正在被理想自己快速变成现实。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

各大车企上半年KPI完成率

Meta也来卖铲子了！小扎：模型可以慢，GPU必须赚

华为在苏州有新布局！

芯片涨破天，报价半日废，华强北囤货陷两难

天下苦DRAM久矣

苹果Siri AI秋季上线：仅限iPhone 15 Pro及以上机型

全站最新

各大车企上半年KPI完成率

Meta也来卖铲子了！小扎：模型可以慢，GPU必须赚

华为在苏州有新布局！

芯片涨破天，报价半日废，华强北囤货陷两难

热门推荐

乘联分会崔东树：车船税调整是油电同权改革落地标志性一步

鸿蒙智行享界MPV新车谍照再曝，支持后轮转向

李飞飞、Jim Fan、徐丹飞联手，给具身智能指了一条新路

创维光伏在清远成立新公司

各大车企上半年KPI完成率

Meta也来卖铲子了！小扎：模型可以慢，GPU必须赚

华为在苏州有新布局！

2026年中国空间站迎转折：首位外籍航天员将首飞，桂海潮期待再征太空

上亿用户真实选择！餐饮行业“真心动”成新竞争护城河

山姆中国被约谈当日变更董事长

北京信息光电子芯片平台在经开区通线投产，降低对外进口依赖

投资 25 万亿韩元，三星 SDI 扩产全固态、钠电池

芯片涨破天，报价半日废，华强北囤货陷两难

天下苦DRAM久矣

苹果Siri AI秋季上线：仅限iPhone 15 Pro及以上机型