AI智驾时代降临,端到端奏响“三重奏”
AI智驾时代降临,端到端奏响“三重奏”
文 | 港股研究社
" 追上未来,抓住它的本质,把未来转变为现在 ",俄国哲学家车尔尼雪夫斯曾这样描述未来。而走到今天的新能源汽车,其通向未来的本质就是做好智能化。
呐喊智能化的口号,从 2023 年延续到 2024 年。如今,智能化的落点,从最开始的智能座舱、NOA 智能驾驶等,开始转向新的轨迹。
近日,小鹏在广州举办 " 小鹏汽车 AI 智驾技术发布会 ",向全球用户全量推送天玑系统 XOS 5.2.0 版本;其 XNGP 系统也将实现 " 不限城市、不限路线、不限路况的 " 全国全量开放。
此次发布会上着重突出的 " 端到端 ""AI" 等关键词,也暗示了业内新的共识——智能化的未来将向 AI 智驾看齐。
AI 智驾时代已经到来
新能源车企智能化的步伐,从 2023 年迈出至今,或许已近半程。但时移世易,新的风向标也随之而来。
去年 8 月,广汽宣布正式推出广汽 AI 大模型平台,并将搭载于高端智能轿跑昊铂 GT 亮相;9 月,华为云在华为全联接大会 2023 上发布盘古汽车大模型,并进一步探讨盘古汽车大模型在行业场景中的应用落地。
今年 1 月,比亚迪推出了行业首创双循环多模态 AI ——璇玑 AI 大模型,首次将人工智能技术应用到车辆全领域。同年 1 月,蔚来推送了基于 AI 智能底盘技术打造的智能系统 Banyan 榕 2.4.0。可见,AI 大模型已经开始向新能源汽车渗透。
具体到应用场景上,大语言模型通过赋能语音助手,提升对乘客语音语义的理解能力,从而加速人车交互进化;视觉大模型通过优化感知,然后生成接近于真实的画面,从而降低传感器硬件使用成本,加速自动驾驶普及。
值得肯定的是,大模型在新能源汽车上得以应用,进一步打开了汽车智能化的想象空间,同时也预示着汽车智能化已经实现技术底层的突破。
只是,结合国内复杂的路况,单靠大量 " 小模型 " 堆砌,以及海量人工手写规则代码的辅助,始终难以穷尽驾驶时的各种情境,这也是近来各品牌高阶智驾车辆事故频发的主要原因之一。
此时,车企开始转而启用性能更强的 " 大模型 " 取代 " 小模型 ",原本庞大的模块化结构,也开始变得简洁起来。之所以这样转变,是因为" 小模型 " 堆砌相当于多模块组合后,各司其职,最后汇总处理结果,由于是多个 " 大脑 " 同时决策,处理结果容易发生冲突。
而 " 大模型 " 执行的是端到端的处理逻辑,从感知层的数据输入,到规控层的策略输出,整套流程都由一个或两个大模型搞定,处理效果的冲突性明显渐弱。
加之,AI 可以通过学习和模仿人类的思考决策逻辑,并用端到端数据驱动算法迭代升级,从而取代传统的人工手写算法规则迭代,使得处理效率更高,决策错误率更低。
随着 AI 大模型逐渐成为汽车智驾跃进的解决方案,新能源汽车的智能化之路正式步入 AI 智驾时代,端到端大模型也成为业内争相追捧的热门。
华为、小鹏、特斯拉的 " 路线之争 "
AI 智驾趋势下,端到端大模型应运而生。这一思路最早由特斯拉提出,华为和小鹏紧随其后,抛弃规则、拥抱数据的 " 端到端 " 热潮,逐渐成为业界共识。
对车企来说," 端到端 " 首先是个非常好的营销概念,因为有热度和讨论度,所以发布相关概念产品,于品牌而言百利而无一害。但因为其定义模糊,市场上的端到端概念产品各有 " 特色 ",最先入局的华为、特斯拉、小鹏便已经出现端到端落地路线上的分歧。
最早发声的特斯拉认为 " 端到端 " 应该是 " 一个模型走天下 "。2023 年 12 月,特斯拉的智驾工程师 Dhaval Shroff 向马斯克提出建议,抛掉手写规则,搭建一张神经网络,让它大量观看人类司机的驾驶视频,并自行输出正确的行驶轨迹。直到今年 1 月,采用端到端架构的 FSD V12 正式向北美用户推送。据介绍,这一版本使用的正是单个端到端的神经网络。
而华为的 ADS 3.0 智驾系统,是用两个 " 大模型 ",分别实现感知和规控的 " 端到端 ";小鹏的 XNGP 则被分为感知 XNet、规划 XPlaner、控制 XBrain 三个部分。这一做法等同于将感知、规划和控制三个模块全部揉进一个模型中。
智驾的端到端与模块化方案
回顾过去数年,几乎所有的智驾企业都选择了与端到端 " 对立 " 的另一条路:模块化。在模块化的结构中,智驾系统被拆解为多个上下游连接的功能子模块,各模块彼此接力从而完成整个智驾任务。
由此来看,华为、小鹏的端到端大模型,更近似于模块化方案演变、融合后的结果,由多模块逐渐收缩为 " 感知 - 规划 - 控制 " 三模块,这一方案有进步但未完全突破。
尽管,模块数已经变少,但感知端为了保证规控端的平稳运行,仍有可能出现被迫丢失信息的情况,这是模块化结构一直存在的 " 硬伤 "。
然而,只有保证系统在决策时获取足够全面的信息,其最终的决策效果才有可能达到全局最优。这是避不开的,同时也是与模块化结构最为矛盾的一环。
从技术角度来看," 端到端 " 极其依赖于大模型内部的神经网络结构,而神经网络本身又具备不可解释性,所以端到端的应用和界定一直是各执一词。但归根究底,成功落地、实现量产,提高驾驶安全性和便捷度才是智驾的核心。
过程或许不那么重要,结果才是。
新能源的 " 下半场 ",端到端的 " 三重奏 "
时至今日,端到端大模型的诞生,似乎为新能源车 " 下半场 " 的智能化竞争提供了一个确切方向,但是从进展来看,它还不足以将智能驾驶迅速推至终点。
因为,想要实现端到端大模型效果的最大化,车企和供应商们还有三大关卡需要面对。
1、数据需求激增
据悉,特斯拉从约 32 亿公里的行驶数据中挖掘了数万小时视频数据用于 FSD 训练。同时,也有自动驾驶工程师表示,训练端到端模型时,原始积累的路测数据仅有 2% 可用。可见,端到端模型对数据的需求量之大。
除了数据线需求庞大外,数据质量也是一大难关。小马智行的 CTO 楼天城曾表示,想要训练出高性能的端到端模型,数据质量的要求比一般性能模型高出几个数量级。
单论数据而言,目前国内车企的数据储备基本均落后于特斯拉,还处于初期阶段。加之对数据质量的要求,国内车企离数据积累的 " 长跑终点 " 仍 " 遥遥无期 "。
2、算力需求激增
随着端到端自动驾驶的发展,训练海量数据所需的算力需求越来越高。对此,马斯克多次表示,目前 FSD V12 端到端模型的迭代,主要也是受到云端算力资源的掣肘,并计划重金堆算力。
图源来自汽车之心
眼见算力成了端到端的 " 必过关卡 ",各大车企、供应商争相开始跑马圈地。有意思的是,这条路线上,行业也走向了分叉口。一方是倾向于重投算力的 " 大力出奇迹 ",另一方是深耕算法的 " 工匠主义 "。
从特斯拉、华为等头部车企都在重投超算中心的动作来看,算力提升,对应端到端智驾效果的天花板也会随之被抬高。或许,两条路径选择的背后,不仅有端到端战略规划的差异,也存在资本实力的差距。
可见,进入端到端阶段后,车企对训练算力的需求越高,也意味着需要更多的资金、人力和时间投入。这条路线走到最后,不仅是算力的比拼,也是综合实力的角逐。
3、商业化落地困难
端到端作为一个新的技术路线,堆算力、堆数据、加算法都是高门槛,抬高进场壁垒的同时,试错成本也在明显增加,入场企业需要仔细斟酌效率与成本之间的平衡问题。
即使完成了开发,而最后端到端方案的验证落地,也需要有合理且成熟的验证方式作为前提。直接实车验证显然成本过于高昂,而基于数据测试为主的开环测试,与端到端智驾所看重的可交互性并不匹配。
最后是落地市场的考验。目前,消费者之间普遍存在一种矛盾情绪。一方面对于汽车 " 智能化 " 和自动驾驶功能的兴趣与期望在上升,另一方面他们的支付意愿却在普遍下降。所以,即便完成了端到端智驾的量产,但却不被市场买单,一切愿景仍将化为乌有。
结语
进入 AI 智驾时代后,端到端模型的比拼愈演愈烈。基于算力、数据的需求,越早推出全国都可用的智驾方案,就能收集到更多数据,从而率先提升智驾能力,实现 " 强者愈强 "。
这一路径,是包括特斯拉、华为、小鹏等头部车企正在做的事情,但是正在做不等于有结果。因此,最终局里上演的到底是弯道超车,还是黑马崛起,亦或是强者恒强,这都犹未可知。