【核心观点】
智能副驾:以前开发智能座舱时,各种人机交互模式都是相互割裂的,相当于有眼睛,有耳朵,却没有一个统一的大脑。现在技术进步了,可以把这些功能全部放到大模型中训练,机器的识别水平能够做到非常接近于人,真的可以称之为智能副驾。
车端算力:对于手机产业来说,把算力放在云端无疑是比较好的选择;但是对于汽车产业来说,车端必须要有一定的算力,因为汽车是移动的,而网络信号不可能真正实现全方位、无死角的覆盖。
高阶自动驾驶:实现高阶自动驾驶有两条路线:一是直接奔向L4,即Robotaxi路线;二是循序渐进、逐步优化。后者可能更容易实现,我们还是要经历从辅助驾驶到高级辅助驾驶、最后到高阶自动驾驶的渐进过程,逐步实现各种功能的开放。
落地场景:在现阶段最重要的工作是找准合适的场景,然后把落地工作做到位。自动泊车是应该优先落地的第一场景,而自动跟车是第二场景,这两个场景都值得企业全力投入,把产品体验和成本做到极致,这样消费者一定会买单的。
“去地图”不可行:地图是确定位置和进行导航的基础。汽车离不开地图,所以严格意义上的“去地图”根本没有可行性。
先验传感器:高精地图可以动态、实时地更新车辆前方的状况,所以可将其看作是智能汽车的一种传感器——先验传感器,这对于高级辅助驾驶或者高阶自动驾驶都非常重要。
地图实时更新:目前地图生产的各个环节及整个链条已经取得了巨大的进步。地图生产最大进步就是现在数据源比以前实现了数量级上的跨越,而且还在不断增多,每一辆使用导航功能的汽车都在为地图生产做出贡献。第二个进步是数据识别工具链的全面升级,实现了地图局部更新,并且能够及时发布。
【对话实录】
大模型有望让机器智能真正接近于人
赵福全:下面具体谈谈汽车智能化,这实际上是一个综合性的大话题。在通过V2X(车联网)实现汽车与诸多要素互联的基础上,车企的重点工作主要有两项,一是智能座舱,二是自动驾驶。
在我看来,首先要做好的是智能座舱,因为智能座舱可以让消费者充分感受到车辆的个性化,这一点在业界已经形成了共识。而对智能座舱来说,人机交互是最重要的。近年来智能座舱特别是人机交互的相关技术进步得很快,例如当前多种模式相互融合的多模态交互日益成为发展方向。
智能座舱应该也是四维图新的重要业务领域之一吧?毕竟现在围绕着地图的人机交互已经成为智能座舱中必不可少的一部分了。不知道程总怎么看智能座舱?您觉得智能座舱后续将如何发展?其竞争的关键点在哪里?
程鹏:您说得很对,智能座舱与四维图新的业务有非常紧密的关联。这里面的逻辑是这样的:地图告诉用户,汽车在哪里,这是确定A点位置的问题;导航告诉用户,汽车怎样开到目的地,这是从A点移动到B点的问题;而路况监测通过车联网告诉用户,从A移动到B点的过程中会发生什么,如需要多长时间?路上有没有事故?这是如何安全、快速、便捷地从A点移动到B点的问题,也是我们正在研究并希望能够更好解决的问题。
结果我们发现,解决这个问题是极其复杂的。大家都有体会,大中城市特别是一线城市的交通拥堵是很严重的。有数据显示,北京通勤者人均每天要在汽车上耗费1小时40分钟。而一天不过24小时,除去睡眠等时间,这差不多相当于人们可支配时间的10%了。我们常说,时间就是生命,这意味着我们有10%的生命都消耗在了行车的过程中。所以,四维图新决定去做自动驾驶,致力于逐步把人从驾驶中解放出来。这样一来,人在车上的自由时间就会越来越多。所以,四维图新也要做好智能座舱,让用户在车上有更好的体验。这就是我们从地图出发进行业务拓展的内在逻辑。
应该说,我们做地图已经二十年了,深深地感到这是一项艰苦的工作。因为地图需要不断更新,而且用户可能永远都不会百分百满意。只要有一个地方发生了变化,地图却没有及时体现出来,用户就会不满,就会认为地图质量不好。可见,做地图是很有挑战性的。而四维图新二十年来坚持不懈,就是要应对这种挑战,把这项有价值的工作一直做下去。
以地图为基础,我们开展智能座舱相关业务也已经有十多年了。记得我一开始就提出了一个目标,让用户进入到车内就不再用手机了。然而这是一个很难达成的目标,甚至可以说我们很长时间都看不到希望。因为与手机不同,人与车之间最方便的交互方式就是语音。而语音交互技术是很难的,包括机器对人类自然语言的理解、不同音区的识别、环境噪声的处理以及语音引擎的能力等,都不简单。很多时候我们训练了好多次,机器才勉强能听懂一点点。这就导致语音交互的准确率到了一定程度之后,就很难再提高了。我们的测试表明,语音交互的准确率要达到95%以上是非常困难的,而这样的准确率对汽车用户来说还不够。
好在不断有新技术涌现出来,尤其是GPT(生成式预训练模型),即所谓大模型投入应用后,我觉得终于看到了希望。借助于GPT,我们有望实现让人们进入到车内就完全不用手机了。最近我们从GPT-3入手,找专业的团队合作开展了研究。现在我可以有把握地说,在GPT-3.5和GPT-4这种规模级别的大模型的训练下,用户已经感觉不出和他对话的是机器了。
同时,人机交互不只有语音,您刚才也讲到了多模态。有了大模型之后,我们还可以把多模态的交互方式放在一起训练,从而真正实现语音交互与其他交互方式的有机融合。比如摄像头可用于识别人的表情、动作,甚至能准确判断驾驶员有没有喝酒;又如毫米波雷达可用于监测人的心跳、呼吸;再如座椅靠背的传感器可以感知人的体温。这些信息与用户声音传递出的语气、心情等信息结合起来,就可以更全面、精准地把握用户状态,优化用户体验。
以前开发智能座舱时,上述这些交互模式都是相互割裂的。语音交互归属语音系统,摄像头归属乘客监测系统,诸如此类,所有功能都是独立开发的。相当于有眼睛,有耳朵,却没有一个统一的大脑。现在我们把这些功能全都放到大模型中训练,结果发现机器的识别水平能够做到非常接近于人,真的可以称之为智能副驾了。举个例子,驾驶F1赛车需要极快的反应速度,很需要辅助支持;但车内只有一个座位,不可能配备人类副驾。而智能副驾或者说机器导航员可以适时告诉驾驶员,前面多少米需要左转或右转等信息,从而提供很大的帮助。现在已经有一些大模型能够做到这种程度了,四维图新也做出了样品,预计再过一段时间就能推向市场。
赵福全:这样说来,不只是地图领域,程总也是为人机交互领域做出了重大贡献的企业领军人。正是因为有很多像四维图新这样的企业共同努力,我们才得以看到拥有更高人机交互能力的智能座舱由量变到质变的发展前景。那么据您所知,大模型真正走向市场应用还有哪些障碍呢?
程鹏:我认为,障碍主要在大模型的轻量化和网络的延迟上。众所周知,大模型对算力的要求非常高,所以GPU(图形处理器)等功能都集中在云端。未来我们希望能把大模型适当轻量化,至少可以把部分功能放在车端,以实时应对相关的状况。当然,即便大模型实现了轻量化,将其部分功能放到车端,也会对车端的算力提出不小的挑战。此外,还有网络的问题。使用大模型时必然会有大量数据在车端和云端之间传输。而汽车与手机完全不同:手机通常是在网络信号稳定的建筑物内静止使用,出现信息延迟的可能性较小,并且偶有延迟也没什么关系;汽车则是在网络信息不太稳定的室外移动使用,其波及范围更广、场景变化更多,在行驶过程中难免遇到信息延迟,并且一旦延迟就可能导致安全事故。这对于大模型在汽车产品上的应用,确实是一个比较突出的挑战。
赵福全:在您看来,与当前算力主要放在车端的车载交互系统相比,在性能上更胜一筹的大模型,大致什么时间能够量产?现在大模型还不能量产的原因主要是技术问题,还是成本问题?又或者是两类问题兼而有之?
程鹏:最近我们已经把样品拿给客户看过了,这个客户是一家致力于打造高端产品的车企,对智能化有很高的要求。而这家车企看了我们的样品后,应该说是非常震撼。这款样品估计两三年后就可以量产,现在软件本身已经没什么问题了,主要问题还是性价比。我觉得,要提高这类产品的性价比,通信基础设施的建设以及计算芯片的进步也很关键。
赵福全:您认为最终在汽车产品上量产应用的人机交互大模型,其主要算力应该是放在车端,还是云端呢?
程鹏:这个问题我是这样看的:对于手机产业来说,把算力放在云端无疑是比较好的选择;但是对于汽车产业来说,车端必须要有一定的算力,因为汽车是移动的,而网络信号不可能真正实现全方位、无死角的覆盖。我们做地图时需要在各种区域、各个时段测试网络信号的强弱,还要专门研究网络如何优化,所以对全国各个基站的覆盖范围和强度都很了解。我认为,要确保大模型在每一个地点都能正常使用,且体验足够好,完全依靠云端算力实在太难了,还是要在车端部署相当程度的算力才行。
赵福全:您在这方面有丰富的实战经验,非常了解网络系统的实际情况,结合汽车具有移动性的特点,您判断大模型的算力是不能全都放在云端的。那后续会不会是这样的发展过程:现在车载芯片是以计算芯片为主;未来车端的算力将逐步转移到云端,所以车载芯片将以通信芯片为主,同时车端仍适当保留一部分算力。不过这似乎是一个理想化的过程,而且这种转变恐怕需要很长的时间。这是不是因为我们对未来网络和云的发展潜能估计得有些悲观了呢?不少从业者还是期待把车端的诸多业务放到云端来完成,再基于通信手段来实现对车辆的远程控制。您对此怎么看?
程鹏:我觉得这种转变不大可能。我们还是以手机来做对比,现在手机的通信能力无疑越来越强了,那它的算力是越来越强了,还是越来越弱了?显然也越来越强了。同样的,汽车不仅是连接的节点,也是智能的终端,未来车端的算力肯定也会越来越强。而且一旦汽车具备了更强的算力,肯定会涌现出与之匹配的很多新需求。正如您刚才讲到的,未来汽车将是一个母生态,有着孕育和承载更多新产品、新应用、新服务的能力,而算力正是这种能力的重要组成部分。当汽车没有足够的算力时,大家自然不会去研究相应的产品、应用和服务;可是当汽车具备了更强的算力后,就会有人去思考,我能用这个算力来做些什么,于是就会产生一系列的新产品、新应用和新服务。
赵福全:我认为,未来汽车将是一个移动的智能空间,尤其是当车辆逐步实现了自动驾驶、把人从驾驶中解放出来之后,汽车的空间属性将进一步放大。届时汽车既是生活空间,又是工作空间,还是娱乐空间,将真正实现三合一。甚至有人半开玩笑地讲,将来只需要买一辆汽车,就等于拥有了一个可移动的家,各种事情都可以在车上完成。我觉得这并非天方夜谭。事实上,现在英国、荷兰等国家就有人住在船上,这些船还有通讯地址,可以正常收发邮件。在这样的前景下,智能座舱的重要性无疑会愈发突显,我们完全可以畅想更多的应用场景。
刚才程总和大家分享了很多非常重要的观点。您阐释了自己对于地图、自动驾驶以及智能座舱内在逻辑关系的系统认知。您谈到,首先要告诉用户“你在哪里”,即所在的位置;然后要告诉用户“你怎样去那里”,即两点之间的路径;最后要告诉用户“你去那里的过程会怎样”,即在两点之间移动时会遇到的情况,如途中是否堵车等等,以此来确定如何更安全、更快速、更便捷地移动。对于这三个问题,地图无疑都是基础性的支撑,决定着我们能在多大程度上优化车辆的移动过程。而您也谈到了,要做好地图是非常困难的。
为了更好地解决上述第三个问题,我们一方面要努力做好自动驾驶,另一方面也要努力做好智能座舱。对后者来说,人机交互最为关键。因为人的需求总要通过某种方式传递给机器,同时机器必须准确理解相应的需求并做出回应,这样才能确保智能座舱的功能及其体验。但是此前各种不同的人机交互方式都是相互割裂、独立开发的,而且最主要的语音交互方式在准确率上还不尽如人意,这就导致用户的体验始终不够好。归根结底,这是因为机器仍然做不到接近于人,不能像人那样综合、准确、快速地处理和利用各种信息。
不过程总兴奋地谈到,GPT大模型让我们看到了希望。我注意到,您没有讲ChatGPT,即面向聊天的大模型。因为GPT本身并不限于文字,可以是语音,也可以是图像,例如人的表情或手势,还可以是各种方式的组合。有了这样的综合处理能力,机器将非常接近于人。当大模型在车上应用时,就可以通过车内人员的语言、表情、手势以及身心状态等各方面的信息,做出综合的判断和行动。不过,大模型应用于汽车产品还面临一系列挑战。特别是如您谈到的,汽车与手机不同,必须最大限度地确保安全,因此对数据传输的速度和稳定性都有更高的要求。但我毫不怀疑,这场革命性的改变终将实现。而您谈到,四维图新基于大模型的产品在两三年后就会量产,这非常让人期待。
说到底,大模型需要很高的算力,其性价比的提高还有赖于通信能力的升级和计算芯片的进步。展望未来,我认为,智能汽车作为可移动的数据节点和智能终端,必须具备很强的通信能力;同时在满足必要需求的前提下,车端应尽可能少部署算力,而将更多的算力放到云端;并以强大的通信基础设施和车辆通信能力,充分保障大量数据在车端和云端之间的顺畅流通。唯有如此,汽车才能以更低的成本实现更多的功能和更好的体验,进而实现所谓智能时代的科技平权。这才是智能座舱的最高境界,也是很多人都希望把算力转移到云端的根本原因。
发展自动驾驶需要企业保持战略定力,落地重点场景
赵福全:我想刚才这番交流,一定让大家对智能座舱有了更多的理解,也有了更多的期待。那么自动驾驶呢?有了GPT的赋能,自动驾驶在规划行车路线和操控车辆时,会不会也有根本性的改变?我们都知道,自动驾驶需要感知能力、决策能力以及执行能力,那GPT能不能把感知、决策与执行系统打通呢?
事实上对于自动驾驶,当前业内也有不少质疑的声音。曾经自动驾驶的热度极高,很多自动驾驶初创公司的估值都非常惊人,然而今天的状况可以说冷清了许多。具体来看,一是L2+已逐渐成为产品标配,而车企正面临着性价比方面的严峻挑战;二是大家发现量产L3的困难超出预期,之前可以归咎于法规限制,但是现在法规逐步松动了,如何平衡好技术投入和体验升级的问题却并没有得到真正的解决;三是大家普遍认为过去对于L4量产时间的估计太过乐观,一些车企甚至因此中断了对L4的投入。
不知道程总怎样看待自动驾驶技术产业化发展的现状?对于不同级别的自动驾驶技术,四维图新的开发策略是怎样的?
程鹏:前面谈到,四维图新的业务早就已经从地图拓展到了智能座舱和自动驾驶,甚至可以说,我们现在是以自动驾驶为龙头来拉动其他相关产品的研发。从2015年开始,我们做自动驾驶也已有八年了。在这期间,我从来没有悲观过,也没有过分乐观过。我觉得,对于自动驾驶我们应该管理好自己的期待值。那些过分乐观的人就是期待值太高了;反过来,过分悲观的人期待值又太低了。我记得,早在2015、2016年的时候,就有乐观的人认为,到2021年就能实现L4。而时间到了2022、2023年,还有悲观的人认为,L4永远都实现不了。不过如果我们认真审视这些年来自动驾驶技术的发展历程,可能就不会太悲观,也不会太乐观,更不会受资本市场一时冷热的影响了。
今天我仍然坚信,L4一定能够实现,即人可以彻底脱手,不需要再握着方向盘。也就是说,汽车完全不需要人来控制的时代最终必将到来,只不过是时间早晚的问题罢了。当然,前进的过程注定充满挑战。尤其是因为汽车产业有其特殊性:其他产业的试错成本相对较低;但汽车产品对安全性的要求非常高,事关汽车安全的试错成本极其高昂。因此,任何新增的功能都不能给用户带来行车安全上的隐患,否则无论多么智能都没有意义。事实上,智能汽车的目的就是给用户提供更好的生活,这显然必须以确保功能安全为前提。正因如此,所有开发自动驾驶的公司,即便技术和资金实力再强,也必须步步为营、循序渐进。
而这些年我也确实看到了,自动驾驶技术正在一点一点不断进步,包括我们自己的产品也在不断提升。所以不管外界怎么说,四维图新肯定会继续努力。其实现在已经有越来越多的消费者接受了某些自动驾驶功能,例如辅助泊车。说到底,自动驾驶的最终落地,不在于企业自认为技术有多先进,而在于用户愿不愿意为之买单。只要我们把L4的相关功能及场景都逐一做到位,让用户的接受度越来越高,那L4完全落地的时刻自然就会到来。
在我看来,自动泊车是L4最容易实现的第一场景。所谓L4的自动泊车,就是在抵达目的地以后,人可以下车,由车辆自动寻找停车位并泊好;等到再次用车时,车辆从停车位自动驶出来接人。这个场景中车内无人,所以即使出现一些状况,危害也不大。同时这个场景对时间也不太敏感,车辆可以低速泊入或驶出停车位,在技术上相对容易。更重要的是,这个场景是用户经常遇到的,可以切实为用户带来便利。所以,用户通常愿意也敢于尝试。事实上,高阶自动驾驶的某个场景究竟能否落地,很大程度上就取决于用户敢不敢尝试。相较于用户坐在车内且车速较快的其他场景,自动泊车场景无疑具有先天优势。
自动跟车,也就是自适应巡航,应该是第二场景。当前,这个功能的使用也很普遍。基本上具备L2或L2+功能的车辆,用户都会用到这个功能。因为遇到交通拥堵的时候,驾驶者需要频繁踩踏板,是很累的,这时候使用自动跟车功能就轻松多了。而且无论是在城区内,还是在高速公路上,现在自动跟车功能都做得比较到位了。车辆可以自动跟着前车行驶,并保持安全的车距。
总体来看,实现高阶自动驾驶有两条路线:一是直接奔向L4,即Robotaxi路线;二是循序渐进、逐步优化。我本人一直是第二条路线的坚定支持者。我觉得,我们还是要经历从辅助驾驶到高级辅助驾驶、最后到高阶自动驾驶的渐进过程,逐步实现各种功能的开放。所以,虽然四维图新现在也有开发L4的一个小团队,但我们近期的目标并不是量产;我们全力推进量产的一直是L2+高级辅助驾驶的产品,现在这款产品已经装车量产了,而且在市场上卖得很不错。
赵福全:程总讲得非常好。关于高阶自动驾驶如何发展的问题,实际上是不好回答的。特别是近期业界一直有一种很强的声音,不看好高阶自动驾驶。不少原本致力于L4的企业纷纷转向L2+,大家当然知道L2+不是真正的自动驾驶,但这也是当前情况下企业为了尽早推出产品、回收资金的一种“无奈”量产,或者说是很多自动驾驶初创公司为了生存下去不得不采取的一种折衷办法。
而程总表示,自己从来没有悲观过,也没有过分乐观过。作为进入汽车智能化领域二十年的一名老兵,您并不是因为长时间的磨砺而变得迟钝了,而是深刻理解了技术创新的基本规律。任何前景美妙的新生事物,一开始总是不乏一批狂热的参与者。然而企业管理者不能狂热,因为经营企业需要冷静。程总就是这样冷静的参与者,您既坚信自动驾驶是未来汽车产业的大势所趋,又对推进自动驾驶的长期性和复杂性有足够的认识。所以,既不会盲目乐观地超前发展,也不会因为资本热度的降低或者某些企业的失败而放弃投入。
刚才程总谈到,四维图新原本是一家地图供应商,而现在是以自动驾驶为龙头拉动整个公司的各项业务。这意味着四维图新在地图、人机交互、芯片以及数据等业务上的创新发展,都是围绕着自动驾驶来展开的。这充分说明了,您对自动驾驶长期前景的高度重视和坚定信心,将其视为汽车产业发展的必由之路。另一方面,您认为企业必须一步一个脚印地稳步推进自动驾驶。毕竟企业既要考虑未来的发展,更要考虑眼前的生存。所以,四维图新决定先从L2+入手,现阶段重点做好L2+产品的量产;同时,四维图新很早就成立了L4的研发团队,以提前做好前瞻储备。
实际上,高阶自动驾驶本来也不会一蹴而就,不可能一夜之间就出现了完美的全天候自动驾驶产品。所以,发展自动驾驶一定是一个循序渐进的过程。只不过有些企业是从L2、L2+做起,逐步积累地迈向L4乃至L5;而另一些企业则直接瞄准了L4。但在研发L4的过程中,企业也需要“沿途下蛋”,将某些功能逐一落地,这既是为了验证已有的创新成果,也是为了获得一定的回报,以保障后续的投入。从这个意义上讲,我倒觉得这两种路线其实殊途同归,在现阶段最重要的工作都是找准合适的场景,然后把落地工作做到位。对此,程总给出了很重要的观点——自动泊车是应该优先落地的第一场景,而自动跟车是第二场景,这两个场景都值得企业全力投入,把产品体验和成本做到极致,这样消费者一定会买单的。至于说实现的是L2+、还是L4的功能,或者说是由高到低、还是由低到高来实现的,都无关紧要。
由此出发,我认为,那些认为高阶自动驾驶遥遥无期甚至不可能实现的悲观者无疑是错误的。事实上,现在的悲观者中,可能有不少人正是此前的过度乐观者,因为战略误判而投入过多、过早,以至于没有赚到钱,甚至陷入了企业经营危机。这显然是自身判断的失误,而非产业大势的变化。
在此我还想特别强调,企业家和投资者是有本质区别的。资本追逐热点,追求短线和赚快钱并没有错;但企业家必须有定力,应该追求长线、持续的发展模式和盈利能力,对于认准的方向,切不可随波逐流,更不可朝令夕改。所以企业在引入资本时,也要考虑投资者是不是有一定的战略远见,或者会不会影响自己的战略自主权,以免被纯粹的资本考量所裹挟,导致急功近利,危及企业的长远发展。
“去地图”没有可行性,自动驾驶需要地图赋能
赵福全:程总,谈到自动驾驶,一个不可回避的话题就是高精地图。应该说长期以来大家普遍认为,解决了高精地图的问题,自动驾驶的很多难题就都迎刃而解了。不过现在看来,高精地图的问题也不好解决,无论是成本,还是更新速度等方面,都有挑战。尤其像中国这样地大物博的国家,保持地图的快速更新是很困难的。此外,地图不是随便就可以采集和使用的,因为任何国家都会有很多敏感的地理信息,所以地图供应商不得不面对相关法律法规的限制。这并不是中国特色,全球各国都是如此。
时至今日,一方面,车企感觉高精地图的性价比还不够好,同时受到的限制也比较多;另一方面,市场对自动驾驶产品的需求又非常强烈。所以,就产生了所谓“轻地图”甚至“去地图”的技术方案,对此业界也有很多争论。那么,四维图新作为一家资深的地图供应商,是如何理解自动驾驶与地图的关系的?您觉得高精地图怎样才能做到高性价比和快速迭代,以满足市场需求?
程鹏:我认为,“无地图”或者“去地图”都不太可能发生。第一,现在一些车企提出的“去地图”,本质上只是在车端不安装高精地图而已,但在云端进行全局规划和车道引导时还是要用到地图。如果车企完全不用地图,那就无法知道自己的车辆在哪里,也无法知道要去哪里,更无法知道途中应该怎样走、是否需要切换路线等等。所以,地图和汽车天生就是一对。正如前面我讲到的,地图解决汽车当前在哪里、目的地在哪里的问题;导航解决汽车以什么路线从当前位置移动到目的地的问题;而自动驾驶解决汽车如何更安全、快速和便捷地从当前位置移动到目的地的问题。显然,地图是解决这三个问题的基础。因此,汽车永远也不可能没有地图,或者说汽车是肯定要使用地图的。
第二,也有一些车企提出的“去地图”方案,是依赖强大的实时建图能力,而且这种实时生成高精地图的能力确实在不断增强。前面也提到了大模型,有了规模更大的数据以及能力更强的算法,实时建图的能力当然会提升。不过需要注意的是,肯定还会有一些信息是汽车上的传感器无法实时采集到的,比如一公里以后的车道汇聚或者车流量变化情况。除非车企每天都派出无人机在天上跟随车辆来采集这些信息,但这无疑是不可能的。
所以,我还是希望,想把自动驾驶产品真正做到位的同行们都能认识到,地图对于智能汽车是必不可少的一部分。当然,地图的用法可能会有所变化。一是从技术角度看,可以考虑把高精地图从车端改为布置到云端,或者说在车端由完整的高精地图改为轻量级的高精地图;二是从系统角度看,可以把高精地图看作智能汽车的一种传感器,我将其称为先验传感器,相当于帮助车辆提前看到前方路况的传感器,这对于高级辅助驾驶或者高阶自动驾驶都是非常重要的。既然有这样的传感器,汽车为什么不使用呢?毕竟高精地图可以动态、实时地更新车辆前方的状况。而如果不用高精地图,那就要用别的传感器来采集这些信息,这将带来高昂的成本。试想,使用三个激光雷达与使用高精地图相比,哪个方案成本更高是显而易见的。
赵福全:这还不只是哪种方案成本更高的问题,选择激光雷达的方案,即使用上10个激光雷达,也测不到1公里以外的情况,更不可能掌握50公里以外的情况。在这方面,地图所能发挥的作用是不可替代的。
程鹏:您说得太对了。何况从性价比的角度来看,使用高精地图也是一个非常不错的选择。我觉得,任何一套系统在选择构成时,都不应该只看某个组成部分的性价比,更应该看系统整体的性价比。而在高级辅助驾驶或高阶自动驾驶系统中,综合考虑采购成本和服务费用等,高精地图是性价比较高的选项。
前面我也提到了,做地图不是一件容易的工作,不仅需要持续的投入,而且要做好非常难。但是我们不能因为地图难做就不做了,或者就不用了。就像自动驾驶、芯片等等,也都很难做,可大家还在持续努力。当然,根据产业发展的情况,有时候可能需要适当调整节奏,包括重新评估投入的资源、使用的方式和量产的计划等。不过我认为,努力做好、用好地图的决心不应该有丝毫的动摇。
更进一步来说,长期来看,我判断汽车终究是要使用高精地图的。尽管现在车辆的实时建图能力不断增强,然而至多也只能是在车辆可感知的两三百米范围内发挥作用,无法从根本上解决自动驾驶的功能安全问题。在自动驾驶领域有一个专业术语叫Corner Case,即所谓边缘案例。通常这些边缘案例发生的概率很低,但却正是人工智能不“擅长”处理的。如果没有高精地图,智能汽车将很难决策应该如何做出合理的响应。
举个例子,当汽车在行驶中遇到突发状况已经难以避免碰撞时,是选择追尾前车,还是选择撞向路边的护栏?在这种极端的情况下,智能汽车应该选择危害最小、损失最少的撞击方案。此时,实时掌握护栏是什么形状的、又是什么材料的,就变得至关重要。而包含道路系统几何特征和复杂属性等各种信息的高精地图可以为此提供有力支撑,从而显著增强边缘案例下汽车的功能安全。
总之,我觉得对于自动驾驶技术方案的选择,我们还是应该从全面确保行车安全的前提出发,从能否切实支撑自动驾驶产品量产的角度考虑。
赵福全:程总不仅是地图公司的企业家,也是地图领域的技术专家。您刚才这番话非常重要,从企业和技术的双重维度,为大家阐明了地图的重要作用,特别是强调了我们应该与时俱进地客观看待高精地图的价值。
第一,对于当前业界出现的“去地图”的声音,有些只是自媒体的标题党文章,也有些是发声者带有自身的某种商业目的,当然还有些确实是出于个人的不同理解,但这部分人通常也并不完全否定地图的作用。总体而言,我感觉“去地图”的声音被不合理地放大了。
第二,正如程总所言,汽车是离不开地图的,所以严格意义上的“去地图”根本没有可行性。地图可以告诉我们所在地以及目的地的位置,也可以为我们指示从所在地到目的地的路线。也就是说,地图是确定位置和进行导航的基础。当然,我们日常使用的导航地图与自动驾驶系统使用的高精地图有很大的差别。高精地图不只精度要达到厘米级,而且还要对诸如车道线、护栏等道路情况进行精准的几何标注。而程总认为,这些信息对于确保自动驾驶汽车的功能安全至关重要,因此高精地图和导航地图一样,对汽车来说是不可或缺的。
第三,自动驾驶系统希望高精地图在全域范围内做到高精度,同时做到实时更新。这个目标太过理想化了,很可能永远都无法完全实现。但这并不意味我们不能逐渐接近这个理想目标,事实上,今天的高精地图已经取得了显著进步。现在一些企业提出的所谓“去地图”方案,其实并不是抛开了高精地图,而是出于成本压力,只使用现有的高精地图,不再强求全域覆盖和实时更新罢了。如果真的完全不用高精地图,那就得靠车端的其他传感器来补足相关的信息,这样自动驾驶系统的成本恐怕只会更高,而且还可能导致车辆定位等功能的下降。
所以,正如程总指出的,“去地图”这个说法具有一定的误导性。现在很多车企正使用着地图供应商经过多年努力完善后的高精地图,尽管现有的地图还不是理想状态,但相比之前已经进步了太多。在这样的基础上谈“去地图”,我倒觉得这其实是对高精地图持续进步的一种肯定。
另外,站在当前的时间点上,随着车端各种传感器的能力、数据处理的能力以及信息传输的能力大幅提升,车企确实可以考虑另辟蹊径,通过实时建图的方式来替代高精地图。特别是对于目前日益成为标配、越来越考验性价比的L2+高级辅助驾驶来说,这未尝不是一种可选的方案。然而未来的高阶自动驾驶,恐怕还是不能脱离高精地图。因为唯有高精地图才能提供整个区域内交通状况及道路设施等的精准信息,从而让汽车在一系列危险的边缘案例场景下,能够以相对较低的成本来确保足够的功能安全。我认为,程总的这个观点很重要。
地图生产的各个环节、整个链条都取得了巨大进步
赵福全:接下来我们探讨一下地图的制作。我们知道,原来地图供应商都是依靠地图采集车,就是那种顶着多种传感设备的车辆,到处采集地图数据的;而现在地图采集方式已经发生了很大的改变。利用今天这个机会,请您谈一谈地图的生产技术和模式都有哪些进步?目前还有哪些局限性?比如当前所谓的众源方式,是不是每辆车都能成为地图信息的提供者?但如果某辆车提供的数据存在问题,又该怎么办呢?
程鹏:在过去的二十年中,四维图新做出了不少中国第一,包括中国第一张导航地图、中国第一张实时路况地图、中国第一颗国产化车规级的量产MCU(微控制器)芯片等等。我也有幸成为了亲历者。应该说,这一路走过来,我们确实遇到过很多艰难的技术挑战。
就拿地图来说,我们最早的一版地图就是几个人开着一辆车,带着一张交通图、一个GPS轨迹记录仪、一台照相机,然后走街串巷,拍下一条条道路、一个个路口的照片,最后做成地图的。这就是二十年前地图的生产方式。显然,那个时候是做不到快速更新道路情况变化的。
而现在我们能够做到,中国几百万公里的道路,任何一个地方发生变化,我们当天就能掌握信息,当天就能更新到地图上。这是怎样实现的呢?说起来,做地图本身是一个非常复杂的系统工程,而这个系统工程包含两个关键点:一是增加数据源的数量,即从尽可能多的源头获取地图数据信息。二是快速分辨信息的有效性,即以某种工具尽可能快地识别海量数据中哪些是有效信息、哪些是无效信息。这样才能获取足够的信息,并将其中的有效信息快速提炼出来,然后转变成地图,及时发布给用户。而以这两个关键点为核心,地图生产的各个环节、整个链条目前都已经取得了巨大的进步。
第一个进步,我认为也是最大的进步,就是现在的数据源比以前多得多,而且还在不断增多。以前的数据源就是我们公司的100多辆地图采集车,包括我在内,大家都得成天开着车到处采集数据。而现在每一辆使用导航功能的汽车都在为地图生产做出贡献。由于每天都有千万量级的用户在使用导航功能,所以,数据源的增加实现了数量级上的跨越。
第二个进步是数据识别工具链的全面升级。以前我们制作地图时使用的是型号为880的服务器,将数据上传之后,需要运行一个月才能处理完毕,导致地图的实时性极差。这主要是因为传统的拓扑关系是一个整体,要制作一张地图就要构建一个完整的数据库,通常耗时一个月才能建好,因此地图更新的周期非常漫长。而现在地图编译的整个工具链都已经发生了变化,在新的拓扑关系下地图可以瓦片式地构建和迭代。也就是说,地图可以一小块一小块地更新,并且在更新的同时就能及时发布。毕竟现在多数车辆都已实现了联网,所以,我们能够将更新了的地图第一时间传递给用户。