6月6日,华为召开发布会,推出乾崑ADS 3.0智能驾驶解决方案,围绕提升驾驶安全性和为用户释放时间两大目标,致力于打造让AI像人一样开车的智驾系统。
乾崑ADS3.0背后的技术逻辑,成为智驾从业人员及团队领导者关心的话题。
乾崑ADS3.0是对传统智能驾驶技术的一次创新。华为智能驾驶解决方案总裁李文广对虎嗅智库表示:华为在智能驾驶领域虽然算是后来者,但他们有信心并敢于挑战一些别人未曾尝试过的事情,做到领先。
这些创新,主要体现在ADS3.0全面摒弃BEV,完全基于GOD网络实现对道路结构、目标障碍物的感知以及场景的理解,同时,使用PDP神经网络,实现预测决策和规划,做到模块化的端到端网络架构。而同期的业界技术现状还停留在BEV+transformer的感知范式,对于通用障碍物的识别上存在很大缺陷,要通过白名单的机制实现中国这种复杂场景的泛化是不现实的,GOD网络很有效的解决了这个问题。
值得一提的是,ADS3.0不仅是一个前沿的技术解决方案,更是一个面向消费者的产品。华为智驾团队运用IPD(集成产品开发)流程管理体系,并将其与华为一贯的为用户创造价值的企业文化相结合,进行ADS3.0的开发管理,确保产品的质量和用户体验。
为了更深入了解华为乾崑ADS3.0背后的技术逻辑,以及华为是如何运用IPD流程管理体系进行产品开发管理的,虎嗅智库与华为智能驾驶解决方案总裁李文广进行了深度对话。
以下为华为智能驾驶解决方案总裁李文广对话精华部分:
01.把激光雷达用深用好,是多感知融合方案成功的关键
虎嗅智库:华为做自动驾驶解决方案的初衷是什么,围绕这样的初衷,华为选择了怎样的技术路线?
李文广:回归本质,自动驾驶解决方案也是一个to C的产品,我们内部讨论最多的是它作为一个产品,能给用户带来的核心价值是什么。总体来看,是为了达成两个目标,一个是通过减少碰撞提升安全性,一个是帮用户释放时间。
基于这些考量,我们做了很多工作,从传感器能力提升到算法优化,再到数据采集和专题训练等,都有配套相应的措施。华为做智能驾驶的时候,特斯拉已在智驾行业里投入了十几年,是领头羊,他走的是纯视觉路线。但我们基于安全考量,强化安全属性,还是选择走多传感器融合的技术路线,一开始就采用了激光雷达、视觉和毫米波雷达融合的方式。这一点很好理解,在黑夜,特别是对向来车开大灯的场景,视觉检测能力很受限,而这时激光雷达却可以正常工作。
做内部技术决策前,我们也研究了大量碰撞案例,看到很多碰撞案例都是在这种场景下发生的,我们如果选择纯视觉路线,肯定也会遇到同样的问题。这只是视觉不足的一种场景,视觉在明暗快速变化、目标与背景色差不明显以及空间深度感知上都存在不足。加上华为在光产品技术和产品化上有很好的积累,通过自研的激光雷达可以做到ADS系统软件和传感器硬件的深度协同,所以我们选择了多传感器融合的技术路线。
虎嗅智库:多传感器融合的技术路线,国内一些新势力车企也在做,华为的融合感知方案跟他们有哪些不同之处?
李文广:多传感器融合也有很多种方案,包括国内一些新势力也都在走这条路线,但是各家差别也很大,主要是对激光雷达的使用方法和深度不同。简单举个例子,2022年,我们合作激光雷达的伙伴公司跟我们讲,他们的激光雷达在其他车型上都用了大半年,已经很成熟了。结果我们拿来一用,发现很多问题,比如很多场景下存在大量的噪声,如果要深度使用根本就不行的,后来通过持续优化很长时间才解决。
伙伴说其他车企没有反馈这些问题,不知道华为为啥有这么多问题。这个事情说明各家拿到激光雷达的用法不一样,可能华为用的更深度一些。
各家对激光雷达的使用方法和深度不一样,主要体现在对通用障碍物的检测和判断方面。我举个例子,我们的GOD 2.0网络里面深度使用了激光雷达,通过多传感器的融合做通用障碍物的检测,虽然不能识别出障碍物具体是什么,但是它能够告知系统,做出反应动作。这点从主动安全的测试结果就可以看出,都带激光雷达的车AEB表现却差别很大,因为有的车的激光雷达在这种场景下并没起作用。道理都知道,但要让激光雷达深度参与并发挥好作用其实并不容易,这涉及到如何消除激光雷达的各种干扰,涉及到大量的软件和传感器硬件的协同,这块是我们的强项。
虎嗅智库:GOD网络跟特斯拉的Occupancy Network这一套方案有什么不同之处?
李文广:二者想达到的目的应该是一样的。因为特斯拉也发现通过视觉白名单的形式,通过纯视觉技术路线很难识别出各种物体,所以想要通过视觉加上时序的关系来垒。但纯视觉方案天然就不如激光雷达好,因为它对位置的准确性、深度的判断等方面,尤其是在晚上,或者在眩光的情况下都会有很大的问题,激光雷达能很好的克服这些问题。
GOD2.0网络使用了激光雷达,会比Occupancy Network在适用范围、准确度等各个方面表现更好。这一点其实很重要,因为系统准确度或置信度不高的话,就会产生一些误刹或漏报,比如误启动AEB,风险很大,所以把这个东西做准很重要。
02.无图方案需提升自车感知能力,车位到车位是今年智驾比拼重点
虎嗅智库:是否去高精地图仍是业内讨论热点,目前华为的解决方案是怎样的,跟其他车企或自动驾驶方案解决商有何不同?
李文广:是否使用高精地图也是个很重要的技术路线差异,包括是不是走端到端的技术路线。
先说高精地图,其实华为走高精地图这条路线,在城区开应该是国内做的最好也是最早的,我们是在2022年推出的。高精地图方案其实对车端的道路结构认知的要求降低了,相当于不用看路都能够知道前方的静态结构,包括红绿灯、杆子、路沿等要素。但我们在做的过程中也发现很多其它问题,比如地图变更很频繁,且是不可控的,高精地图方案虽然精准,但如果一旦变更就会很危险,因为它要求车端不断的识别出它的变更。
其实二者是有点悖论的,一方面是按照图来开就行,对静态结构感知能力要求不高,另一方面又要能够把道路变更都识别出来,这其实对感知能力要求又很高。我们就想:系统有这么强的感知能力了,是否可以不需要高精地图了?再加上高精地图推进上,投入大,周期也长,更可怕的是花半年好不容易完成制图的城市,上线时就已经变了许多。从这两个方面考量,我们更希望做一个通用化的东西,靠自车感知能力就能够开,所以我们选择去掉高精地图。
智驾行业不存在无图方案,起码导航地图是需要的。无图只是去高精地图的一种说法。对于如何去高精地图也有很多做法,ADS在这块做的与行业不太一样。友商基本是找国内图商合作,做的可能是比高精地图弱化一些,如HD-,或者是比导航地图更精细,车道级的,如SD+,基于这样一个图上去开。我们当时定的方案是完全基于导航地图,更多的依赖自车感知能力来开,属于难度最大的一条路线,实际落地时间比原计划有点延期,原计划是到去年底全网开通,延期到了今年2月。
做智驾是个持久的过程,技术路线的选择我们还是要看什么样的技术路线能够更好的支撑好用户的安全和体验诉求。智能驾驶的需求和方向是明确的,归根结底我们还是要把自身的能力建好,这才是最重要的。
虎嗅智库:AI大模型在这套方案当中发挥了怎样的作用?
李文广:我们在车端叫推理,云端叫训练,现在云端会做一些大模型的处理。车端实时跑出来的一些数据,其实要做一些大量的数据标注和训练,数据的标注和模型的训练对车端跑的结果很关键。这些用于训练的数据,对正确性要求很高,数据标注错误率越高,训练的结果越差,我们就需要思考怎么把这些数据标注的更真更准确,这时候可能就会用大模型去做一些标注,实现自动化和泛化,因为有时候数据量太大了,你也不可能都用人来做。
我们当时做高精地图,需要做大量的数据标注。2022年峰值的时候,仅标注人员就有上千人。后面如果真正的要全国都能开,涉及到的数据量更大,单纯靠人已经应付不过来了,所以我们用大模型来做一些自动标注。
虎嗅智库:前不久刚刚更新的ADS2.0方案,所有搭载了华为智驾的这些车型,在全国之内一下子都能开了,底层能力来源于哪里?
李文广:第一,很关键的就是车端的感知能力要足够的强。我们花了最大量的时间把车端的感知能力,尤其是在道路结构认知各方面的能力做好,当然在规控方面,也要针对各种场景把预测和决策的能力提升上来。
第二,就是要把学习能力提升上来。因为刚开始时,基本能力可能只需要保证用户能够在这里开,但我们想打造的是一个越开越好的系统。可能刚开始比较陌生,智驾表现一般,但是随着时间的推移会越来越好,这也是我们车往软件走、往AI走、往智能化走很重要的一个特点。
虎嗅智库:商用一代预研一代是华为常走的路子,在感知能力提升方面,未来,3.0版本的融合方案将进行哪些优化?
李文广:在2.0版本中,我们引入了GOD网络,旨在提升智驾系统的性能。在即将到来的3.0版本中,我们将进行一次重大升级,将原有的BEV模型及传感器融合信息全部集成到GOD网络中。这一改进将使我们的系统能够更准确地识别各种通用障碍物,即使对于未知物体也能保持良好的识别效果。
此外,3.0版本将大幅提高系统对物体的位置、距离、精度以及速度的判断能力。这些性能的提升,不仅基于GOD网络的优化,也与云端的数据处理和训练能力密切相关。华为昇腾系统的强大性能,将为大模型的构建和智驾系统的完善提供有力支持。
我们计划在今年推出3.0版本,与此同时,2.0版本中的泊车代驾功能预计将在6月份开展外部用户beta。在3.0版本中,我们将进一步提升这一功能,使其可使用范围更广,能够处理更多复杂情况。
目前,我们正在快速迭代城区方案,并预计在3.0版本中实现显著的体验提升。我们的目标是将公开道路和非公开道路完全整合,实现从车位到车位的无缝智驾。这一目标虽然已经被提出多年,但至今仍未有公司实现。我们期待在今年能够率先达成这一里程碑。
虎嗅智库:从单车智能来看,我们离L3的能力还有多远,还需要克服哪些困难和难题?
李文广:春节期间我们余总发的朋友圈,说智驾开了1300多公里无接管,但要真正做到每个人开1300 多公里都0接管,其实还是有难度,尤其是我们从后台数据看到一些小的物体,可能是前车掉下来的,也可能是山上掉下来的,各种东西都有。针对这些小物体,要求L3能检测出来,目前对这些特别小物体的检出还是有难度的,我们还在研究怎样实现。
首先想到解决方案是可以从传感器上去想办法,可以用特别强大的传感器,算法和系统能力也要做提升。就像人开车,人是具备推理判断能力的,当他感受到某些变化时能及时做出应对,比如在地库里要转弯的时候,看到右前方有光,就能推理出那个方向有车要过来,但前提是要能看到光。智驾也是同理,本质上讲还是要先接收到这些变化的信息,不然很难推理出结果。除此之外,路上行驶最容易出问题的就是cut in场景,总会有人不守规矩,在这种情况下,怎么做到比人驾好一些。
L3真正落地,我认为首先要把上面提到的两大难题解决掉。当然L3落地还有一些其他要求,比如风险预警、系统的冗余等,这些可能在技术难度上还好一点。目前国家层面在做L3准入测试,华为也在提供支撑。我们也在为L3的落地做积极准备,预计在明年实现高速L3的商用。
虎嗅智库:L3落地对算力的需求是怎样的,在云端和车端的算力如何分配?
李文广:现阶段来看,L3最先落地的驾驶场景应该会是高速路,高速对车端的算力要求不会太高,主要是把车端冗余能力做好,处理好我刚才说的一些异常的各种小物体、cut in这些场景。对云端的算力需求主要看算法,一般来说要几万倍到几十万倍不等,要看模型规模、数据量的大小、迭代的速度。
对于高速L3的实现,华为目前拥有的算力能力已经足够支撑。城区道路要做到L3,对算力的要求会很高,因为城区的L3可能比高速的L5难度更大,估计还要3到4年。
03.谈谈华为的IPD流程管理
虎嗅智库:华为的IPD流程管理体系是很多企业在学习的,它在智驾团队的管理中发挥了怎样的作用,您作为一名管理者是如何使用这些管理工具的?
李文广:我们团队现在大概涉及三个领域,有做传感器的,有做算力平台的,还有做偏软件的ADS系统解决方案的,大的架构整体是围绕一个智能驾驶解决方案设置的。
IPD就是集成产品开发,2000年我刚进公司的时候,华为就引入IPD试点,第一个项目就是在我的项目,做的是3G基站的试点。最早是IBM搞了这一套理论,核心是告诉大家如何把一个产品开发好,需要做很多集成,把所有的领域的代表拉进来,包括制造、采购、研发等,有一个产品经理(PDT经理)在这,PDT经理带领各个领域负责人来开展一些工作,同时对这些人的工作分不同的阶段进行流程管理,包含前期的产品定义、到后面的产品开发再到上市阶段的管理,不同阶段有不同的投资决策的点,它是这样一套流程管理机制。
在IBM的基础上,华为结合中国的国情以及公司的特点,对IPD做了很多改造,到现在我们也一直在用。对于自动驾驶来说,它本质上也是个产品解决方案,用在车上对安全性要求更高,我们现在也是按照IPD这套体系进行管理,同时按照汽车行业的要求做了适配,我们叫IPD-IAS。
当然,IPD流程管理不是一个简单的名词,对于其他企业可能并不是一学就能会,或者是立竿见影的达到一个理想的效果。华为也是经过了几十年的实践,从一开始很难,到现在跟组织的和企业的文化相融合,他是需要日积月累的。
虎嗅智库:流程管理和企业文化对于华为智驾的成功发挥了怎样的作用?
公司做大了,就需要有一套流程用来管理和规范,但并不是说有了这套流程就能成功,流程只是起到辅助作用,不起主要作用。华为成功肯定也不是因为IPD成功了,它只是一个辅助的工具。
这跟公司的价值观有关系,我们坚持以客户为中心,以奋斗者为本。真正的把这个价值观做好,我认为可能做很多行业都会成功。因为真正的帮用户创造了价值,用户就会喜欢你,买你的产品和服务;真正的让员工得到了回报,员工都充满激情,凝聚力很强。
当然,华为的技术或者方向也不一定都是正确的,比如智驾,我们毕竟是后面来的,特斯拉可能已经研究了十几年,后来者就需要去学习,但只学习也做不到领先,所以要敢于去做一些别人没做过的东西。
华为为什么做很多事情都能成功,就是因为聚焦在为用户创造价值。需要想清楚价值,围绕价值创造敢想敢干,而不是别人做什么我们就做什么,以智驾为例,用户的最终需求,一个是安全,这关系到生命;另一个是时间,从驾驶中释放更多时间给用户,我们就需要围绕这两大需求展开工作。