对话元戎启行刘轩:端到端技术如何重塑自动驾驶?

严骏 编辑
浏览 · 2024-07-17 17:22 · 发布于北京

    [汽车之家 行业] 自特斯拉针对自动驾驶提出“端到端”技术路径,并在2023年8月25日进行路测直播后,国内自动驾驶行业对此密切关注,并把“端到端”上车提上日程,为何多家企业均将“端到端”视为自动驾驶发展方向?

汽车之家

深圳元戎启行科技有限公司副总裁 刘轩

    在2024中国汽车论坛同期,中国汽车工业协会联合战略合作伙伴汽车之家,特别策划【车界先锋】,邀请行业领军人物,共同探讨中国汽车产业的发展之道,本期嘉宾为深圳元戎启行科技有限公司副总裁刘轩。

    何为端到端?刘轩解释,传统的智驾模型有点像传话筒的方式,数据要通过感知、定位、预测、规划,最终传到控制,每一层都要经过一定的处理,有信息的损失,会带有一些偏见,而现在端到端的模型优点在于世界的数据输入,输出就是最终的控制信号,中间所有的模块信息全部被一个大的端到端模型进行计算,中间过程可以最大程度减少传话过程中信息损失的数据量。

    这也是为何端到端技术为何能够成为自动驾驶领域的一个主要发展方向。“端到端技术的核心优势在于其能够显著提升高级别智能驾驶的落地效率,同时在一定程度上降低成本。而这一技术路径的成功,得益于大模型、大算力和大数据的结合,推动人工智能算法实现质的飞跃。”刘轩指出,端到端技术,本质上是一种驾驶能力的大模型,它能够更便捷地处理复杂场景,相较于传统基于规则的系统,其在新场景的适应性和扩展性上具有明显优势。

    此外,端到端技术不依赖于高精度地图,这一点对于实现全国乃至全球范围内的自动驾驶尤为重要。刘轩解释说,人类驾驶员在开车时并不会在脑海中形成一张高精度地图,而是依靠对道路和路标的直观感知。高精度地图作为中间结果,虽然对于机器理解环境有所帮助,但也带来了维护更新、时效性和数据安全等一系列问题。因此,减少对高精度地图的依赖,是实现端到端算法的关键。

    在传感器方面,纯视觉系统理论上可以达到甚至超越人类驾驶员的水平。刘轩认为,尽管目前许多自动驾驶系统为了快速达到一定水平而采用激光雷达或毫米波雷达作为安全冗余,但随着传感器成本的降低,纯视觉系统将成为未来的趋势。

    在谈及元戎启行与特斯拉等企业的竞争优势时,刘轩认为,特斯拉在数据积累和端到端模型落地方面具有领先优势。然而,元戎启行作为第三方供应商,有机会与不同车企合作,这在一定程度上避免了与车企的利益冲突。此外,元戎启行在中国复杂交通场景中积累的经验,将有助于其端到端算法模型的快速迭代和竞争力提升。

    面对特斯拉FSD可能进入中国市场的挑战,刘轩认为这将对整个行业产生积极影响。特斯拉的技术积累和产品体验将教育市场,提高消费者对智能化体验的期待,从而推动车企更积极地推广先进技术。同时,消费者为软件和人工智能算法付费的意愿可能会提高,这对于智驾供应商来说是一个机遇。

    不过,端到端技术的落地还面临诸多挑战。“技术上,需要足够的数据积累来解决corner case问题,保证安全性。产品上,需要培养消费者对全域、全时、全场景智驾的接受度和使用习惯。此外,智驾公司还需要在保证性能的同时,发挥出更高的效率和成本优势。”刘轩总结道。

以下为对话实录(精编):

    汽车之家:自特斯拉提出了端到端的技术路径后,国内自动驾驶企业对此非常关注,也把端到端作为自动驾驶的一个方向,很多车企业提出了日程,您觉得为何端到端会成为一个行业的方向?

    刘轩:我觉得端到端最主要的优势是在于它能够推动高级别智能驾驶落地的效率,并且它的成本一定程度上会降低,原因主要在于,这几年大家也可以看到在大语言模型上,GPT的巨大成功让大家相信Scaling Law,所谓的大模型、大算力、大数据,有了这些东西其实就能够推动人工智能算法进行质的变化。

    端到端其实本质上就是一个所谓的驾驶领域这样的一个大模型,不是一个语言的大模型,是一个驾驶能力的大模型。它的优势在于,能够更方便处理一些复杂的场景。端到端之前有很多传统的方式,有很多是基于规则式的驱动里面有很大的比例,规则驱动很难适用于全国的各个地方,每当需要进行新开城的时候需要花很大的精力进行扩展,端到端在这方面它的效率会高很多。

    另一方面端到端其实能够更拟人化更像人类驾驶员,让消费者再去选它的时候,它自身的感觉会更好一些,更有可能进行买单。一个是它的效率,一个是它的体验,最终让现在的端到端特别火的一个现状,主要的原因是这些。

    汽车之家:您刚才提到了端到端成本的下降主要是哪些方面?

刘轩:

    采用端到端之后有一个逻辑,它更像人类驾驶员司机,比如说我在北京学完开车之后,我在上海稍微熟悉一下当地的交规,我的迁移成本是比较低的。它的整个模型的智能化程度是更高更像人,整体来讲当它想要进行一个大规模推广在全国的时候其实成本相对来说反而更低一些。

    汽车之家:所以说端到端不需要高精度地图?

    刘轩:不需要高精度地图,高精度地图本身其实是一个中间结果,人开车的时候人脑子里面不会有这么一张高精度地图,人只会说我看到路长成什么样的一些路标。但是具体路标高多少厘米,它的空间绝对位置是怎么样,方向朝向哪一块,脑子里面绝对不会有这个东西,这个东西它其实是处理的一个中间结果,是用你感知到的数据之后通过感知算法转成一个机器能够理解的3D或者有一些局部区域是2D的一种矢量图或者某种信息也好。

    其实人类在开车的时候脑子里是没有这样的一个显式的转换过程,可能是隐式的。在我们理解它是一个中间结果,并不是最原始的输入,它会产生很多的问题,比方说如何去维护这样的一个中间结果,高精地图什么时候是要被更新的,万一修路之后要不要更新,它的时效性如何,数据安全能不能过,这些都是很大的问题。

    所以我认为,你要真的去实现一个比较好的全国都能跑、乃至全世界都能跑的端到端的算法的话,不应该依赖于高精地图,或者尽量减少对它的依赖,越少的信息越好。

    汽车之家:有观点说纯视觉更加适合于端到端,这会不会打击到激光雷达产业?

    刘轩:纯视觉的上线肯定是OK的,因为人开车的时候,人都是被动式的,人眼都是光线照射进来,人是没有办法主动去发电磁波再反射回来,理论上来说只用摄像头,它的上限是有可能,也能达到人相似的水平,或者有可能比人做得更好。

    但是,现阶段大家为了快速达到一定程度智驾的水平会用一些激光雷达或者有一些车用毫米波雷达,作为一些安全冗余或者数据融合的数据源也好,是可以快速达到一定程度的水准。但是在最终为了成本的下降,是不是把它去掉,这个主要还是取决于以后传感器的成本到底能降到多少,现在激光雷达也在降成本,听说下一代都是千元级别的传感器。另外纯视觉的算力以后有多大的芯片能够承载去做纯视觉的智驾,都还在探索中,都有可能,要取决于以后综合各方面,会跟你的算力有关,跟你算法的模型有关,也会根据你的数据量有一定的关系。

    纯视觉应该是可以做,但它肯定是需要海量的数据进行积累。这个逻辑是这样的,它的上限是很高的,可能打平也许有可能更高,但是它的下限你是需要海量的数据进行积累,保证它在任何时候的一个安全性。只有当满足一个最底线的安全性的时候用户才真的愿意去用才能够产生数据。

    达到底线的安全性上,使用激光雷达也许能够快很多。当然也存在一种可能,你使用的激光雷达的车辆本身也在积累数据,因为激光雷达车辆上面也有摄像头,这些数据有可能用来训练纯视觉的算法,训练到一定量之后纯视觉也达到了一个类似的安全性,或者用户可以接受的安全性,那个时候再去切换的话,才会去考虑传感器的价格比获得真的带来安全性的一个提升或者减少。在那个方面也许人们不仅仅是要去强调成本的下降,更多的时候也许在那个时候大家追求的是以后的L3、L4、乃至L5的驾驶,也许传感器需要额外的冗余,单路的传感器都不一定够。这个是以后,现在谈论还有一点过早。

    汽车之家:元戎启行在端到端智驾系统开发中,您觉得相比特斯拉来说,有哪些竞争优势或者说不足?

刘轩:

现在大家都讲端到端,不同的端到端具体的实现路径模型本身是不一样的,实现的过程方式方法是有差别的,我们会针对我们面临的场景针对性训练我们的模型。

    我认为我们的优势有几点:

    第一,我们作为一个第三方的供应商,其实我们是有机会跟不同的车企进行合作的,相比车厂本身可能会有一些兴趣冲突,第三方其实跟车企合作的时候相对来说会车企本身会更放心一些。

    第二,特斯拉目前来讲采的大部分数据还是在美国、欧洲相对来说交通场景比中国简单的地方积累的数据多一些,国内的交通场景说实话复杂程度还是比世界上绝大部分地方还是要高一些,我们在这种比较复杂城区的CBD、拥堵场景我们也积累了相当的经验,我相信这样经验能够帮助端到端算法模型快速迭代到一个具有竞争力的水平。

    汽车之家:现在大家都在猜测特斯拉的FSD要来中国了,这样对我们智驾公司来说压力是不是特别大?

    刘轩:我觉得要从几个方面辩证看这个事情,特斯拉首先肯定是一个鲶鱼,它在纯视觉方面的技术积累是非常多的,而且它在端到端模型上落地也是最早的,肯定是非常优秀的企业,本身技术能力非常强。

    另一方面我认为特斯拉FSD如果在中国落地本身会对整个行业的竞争产生比较正面积极的影响,它会给消费者一个不同的产品体验,比如说能够体验到类似于FSD,如果能够体验到类似于在美国这样的体验的话。因为美国的FSD本身是一个售价相对比较昂贵,现在降价了以后是8000刀的水平,本身对消费者市场能起到一定的教育作用,也许以后在智驾领域用户不会一味追求卷价格,能从一定程度上追求一定的场景的使用体验包含智能化的体验,也许会对我们这样的智驾供应商来说,车企会更积极推我们的最先进的产品落地。

    其次是用户愿意花更多的价钱为软件、为人工智能的算法买单的意愿可能会更高一些,我觉得从这个角度来讲,特斯拉如果进入到中国FSD落地应该还是一件好事,对整个行业有积极正面推动作用。

    汽车之家:除了您刚才提到需要大量数据闭环的挑战之外,您觉得端到端要落地还要面对哪些困难?

    刘轩:端到端落地的话还有面对哪些困难,我觉得还是端到端从技术来讲,它的上限非常高接近于人或者以后超过人,这个是ok的,它的下限主要是你要有足够的数据积累,保证它的cornercase被解决掉,技术上这样是ok的。

    另一方面还是要从产品的角度,最终肯定是终端消费者能够把他培养起来,他们是真的愿意去用全国范围内全域、全时、全场景都能去开启智驾,当你以这样的结果为导向的时候端到端的优势就会很大,因为它的效率比较高,实践起来很快,实践的成本相对来说比传统方案低一些。

    如果只是用户专注在高速跑用一下,这样的话其实相对来说端到端对它的吸引力没有那么高,我觉得对于消费者来讲,如何给他们一个比他们现在自己开车能有一个更好更舒适更智能的体验的话,这个其实也是一个很大的挑战,算是对消费者市场的一种宣传和教育。

    汽车之家:相较于整车出口,智驾出海仍然是一件新兴的事情,这一块的规划能不能再多透露一些细节?

    刘轩:我们在去年慕尼黑车展上已经宣布了出海的计划,第一站是在德国,我们在德国进行智驾算法在当地的落地,以及测试等等工作,包含我们跟一些海外的车企的合作以及我们中国国产车企出海合作都有在进行中。

汽车之家

    后续,我们端到端算法不依赖于高精地图,对于法律法规能够做出海方面有天然的优势,相当于落地遇到的障碍会比依赖高精地图要小一些,我们认为在这一块对我们出海有很大的帮助,这也是包含国外车企或者是国内车企出海他们愿意跟我们进行这方面合作很重要的因素。

    汽车之家:目前欧盟对中国车企贸易壁垒墙比较高,这对于智驾公司来说会有什么影响?

    刘轩:智驾不能作为一个单独发售的产品,必定要在车上面,如果我们跟随中国的车企进行到出海的话,在欧盟这一块或多或少要被关税总体的销量进行一定程度的影响。

    对于我们智驾公司来讲,还是OK的,我们是一个主要以软件为主,大头的开支是在研发还有测试相关的费用,其实出来之后它的销量相当于本身的边际成本可复制性比较强,边际成本没有那么高。说实话我们从不同的车型,不同品牌的车型扩展的时候成本相当于比较低。

    另一方面我们现在跟海外当地的车企有一些合作,因为它的需求量在那里,如果他们减少了对中国电动车的购买也得买当地的车。这一块对于智驾的需求总量在那也不太可能减少,除非当地的车企就摆烂,我就不做智驾,但是我觉得以后的智驾肯定是一个大范围的趋势,对于智驾公司来讲只要我们能够保证我们在全球供应链内的竞争力和一定的技术优势,我觉得机会还是非常大的。

    汽车之家:现在价格战已经持续一年多,车企成本压力非常大,这一块的压力有没有传递到智能化供应链的公司?在这个背景下我们是如何在兼顾性能的同时又要发挥出更高的效率以及成本优势?

    刘轩:我觉得是这样的,首先当所有车都在卷价格,可能有相当一大部分比例的车企平均每辆车都是在亏本卖的时候,其实你很难去想象它愿意在智驾系统上负担超过车总价百分之几的价格,行业内每个车企内心都有一个标准,比如说智驾作为一个单独的零部件,硬件+软件可能不能超过车价的多少,这是在一个合理的范围内,它肯定是受到一定程度的限制。因为硬件的价格会去砍,软件的价格同样也会去砍。这方面对于智驾公司来讲,也是现在行业面临现实的问题。

    只要产品做得足够好,我们相信到未来这部分钱不是车企承担这部分的成本,消费者能够越来越多的接受我愿意为软件买单。今天下午的论坛上也有一位嘉宾的分享,他说过去汽车销售更多是一锤子买卖,本身汽车价值就是硬件、电气化的元器件,动力系统,本身这些是占很大程度的成本。


点击展开剩下93%
打开汽车之家 阅读体验更好
纠错或举报 向本文作者严骏提问
汽车之家问答 我要提问
查看更多问答
原创精选小视频
打开App 查看全部条车友评论
发表评论…
收藏
相关阅读
加载中...