在解决自动驾驶问题的这场高风险竞赛中,多年来已经出现了深刻的哲学和技术分歧。
一边是几乎整个汽车和科技行业,他们倡导一种叫做传感器融合的概念——一种双保险的方法,将摄像头、雷达和激光雷达结合起来,构建一个冗余的、多层次的世界视图。
而另一边,特斯拉孤军奋战,大胆而有争议地押注于单一模式——纯粹的、基于摄像头的视觉。
特斯拉主动移除并禁用车辆上的雷达等硬件的决定遭到了广泛的质疑,但这一举措源于其对人工智能和自然智能本质的深刻理解和根本信念。要理解特斯拉为何做出这样的抉择,首先必须了解特斯拉究竟摒弃了什么。
什么是传感器融合?
传感器融合的概念相当简单。它旨在利用不同类型传感器的独特优势,构建一个统一且高度鲁棒的车辆周围环境模型。每种传感器都有其自身的优缺点,理论上,融合它们可以弥补每种传感器的不足。
摄像头能够提供最丰富、最高分辨率的数据,像人眼一样感知世界的色彩和纹理。它们可以读取路标上的文字,识别交通信号灯的颜色,并理解复杂的视觉环境。它们的主要缺点是容易受到恶劣天气和弱光环境的影响,而且难以测量相对速度。
雷达在测量物体距离和速度方面表现出色,即使在恶劣天气下也能正常工作。它可以轻松穿透雨、雾和雪,但其弱点在于分辨率较低。无论如何计算,要达到与单个摄像头在单一方向上相同的分辨率,需要一个12英尺乘12英尺的方形雷达阵列,耗资数百万美元。雷达能够准确地告诉你某个物体在哪里以及它的移动速度——只要它在移动——但它难以识别物体的种类,也难以识别静止的物体。
激光雷达的工作原理与雷达类似,但它使用激光,能够创建环境的精确三维点云地图。它在测量距离和形状方面精度极高,因此可以构建环境的高精度三维模型。其主要缺点是传感器成本相对较高,以及在恶劣天气条件下(尤其是在雾、雪和雨天)性能下降。激光雷达还有一个缺点:采集的数据量非常庞大,仅第一步的数据处理就需要巨大的计算资源。
这是业内公认的方法,Waymo 和 Cruise 等公司都采用这种方法,将来自这三个地方的数据融合在一起,创建一个具有内置冗余的系统。
特斯拉的起源:多传感器方法
对许多人来说,这段历史已被遗忘,但特斯拉最初并非只采用视觉辅助技术。从发布到 2021 年,早期的自动驾驶系统同时配备了摄像头和前置雷达单元,这些雷达单元由博世等汽车传感器专业公司提供。这是一种传统的传感器融合方案,其中雷达作为主要传感器,用于测量前方车辆的距离和速度,从而实现诸如交通感知巡航控制和早期版本的 FSD Beta 等功能。
这种多传感器方案多年来一直是标准做法。即使特斯拉开发了自己的定制版FSD硬件,人们仍然认为雷达会是关键组件,为蓬勃发展的视觉系统提供安全保障。然而,在2021年,特斯拉做出了彻底的转变。
转折点:特斯拉为何放弃雷达
这一转变始于2021年夏季,当时特斯拉宣布将从新款Model 3和Model Y车型中移除雷达,转而采用名为Tesla Vision的纯摄像头系统。此举源于埃隆马斯克的核心论点,即传感器数据冲突的危险性——而他至今仍在坚持这一观点。

当两个不同的传感器系统提供相互矛盾的信息时,汽车会相信哪一个?哪个传感器被认为是“更精确”或“更安全”的?这由汽车根据实际情况决定吗?还是由工程师预先设定?传感器信息不一致会带来风险,因为决策过程可能会使车辆陷入瘫痪,尤其是在安全至上的情况下。
这并非仅仅是哲学层面的争论,特斯拉的FSD工程师们也提供了具体的例子。在同一讨论串中,特斯拉人工智能工程师蔡云达指出,雷达存在根本性的缺陷——它无法正确区分无法产生频率偏移的静止物体、横截面较薄的物体或雷达反射率较低的物体。这正是过去困扰特斯拉的臭名昭著的“幽灵刹车”事件的根源所在:车辆可能会将静止的立交桥或路边的废弃铝罐误认为是停着的车辆,从而导致不必要的刹车。
从特斯拉的角度来看,实现车辆自动驾驶的通用解决方案的关键在于解决视觉问题。人类驾驶时依靠两颗生物摄像头和一个强大的神经网络。特斯拉的策略是,如果计算机视觉能够完美运行,那么任何其他传感器充其量只会分散注意力,最坏的情况则是造成危险的歧义。
如今,每一辆特斯拉新车都完全依赖于特斯拉视觉系统,该系统由八个摄像头驱动。该系统利用复杂的神经网络创建世界的三维矢量空间表示,车辆随后分析该表示并在此基础上进行导航。
关于视觉系统的故事还有一个有趣的注脚。特斯拉发布第四代硬件(现为AI4)时,新款Model S和Model X车型都配备了全新的高清雷达。然而,为了巩固其对纯视觉系统路线的坚持,特斯拉从未将这些雷达用于FSD(完全自动驾驶)功能。
事实上,特斯拉最普及的车型Model Y上的FSD系统才是最先进的,而不是那些配备额外传感器的车型。虽然特斯拉可能确实会从这些雷达收集一些数据并验证系统性能,但它们实际上并不属于FSD套件的一部分。
二元结果
特斯拉放弃传感器融合技术的决定,是其自动驾驶方案与其他厂商方案之间最大的区别。这是一场高风险、成败在此一举的赌博,而到目前为止,他们无疑赢得了这场赌博。
特斯拉、埃隆马斯克、阿肖克马斯克以及特斯拉人工智能团队都认为,要打造一个可扩展的、通用的、能够像人类一样智能地在世界中导航的自动驾驶系统,唯一的途径就是彻底解决视觉问题。如果他们的判断正确,他们将创造出一个比竞争对手那些昂贵且配备大量传感器的车辆更便宜、可扩展性更强的系统。
如果他们判断错误,最终可能会遇到性能瓶颈,而只有这些传感器才能突破这个瓶颈——但到目前为止,我们还没有看到这种瓶颈的丝毫迹象。
如今,特斯拉全力投入其纯视觉识别系统,没有人能否认其取得的进步或具备的能力。





京公网安备 11011402013531号