上汽智己严怡辰:用户视角下地图感知融合的应用实例探讨
9月13日,由盖世汽车主办的2021第三届自动驾驶地图与定位大会隆重召开。本次大会旨在聚集汽车地图定位行业杰出的技术专家分享自动驾驶地图定位领域最新的应用情况、现实挑战、创新理念及未来技术趋势等。下面是上汽智己地图导航&融合感知产品经理严怡辰在此次大会上的发言。
上汽智己地图导航&融合感知产品经理 严怡辰
感谢盖世汽车的邀请,我很有幸参加这次盛会,和业界专家们一起探讨高精地图和融合感知应用的实例,也想借这个机会看一下行业的发展方向。我是智己汽车产品经理,负责地图导航和融合感知,在这个过程中听到了很多专家的分享,很有帮助,也坚定了我们的某些方向。
相信大家对于智己都不陌生,如果感兴趣的同僚可以去北外滩来福士进一步参观。接下来花几分钟介绍一下智己的背景,“智己”取之于《周易》,知周乎万物,而道济天下。是由张江集团、上汽集团、阿里巴巴三大巨头联合打造的车企。我们是一家定位于高科技,融合互联网思维的汽车品牌。从智己本身产品来说,也有它自己另外一个品牌的LOGO——IM,代表理性和感性层面的思考(Intelligence in motion & What I am)。
在介绍导航之前,大概花几分钟简单介绍一下导航发展的趋势。事实上在纸质年代地图就已经产生了,里面基本上是作为行政地图,那个时候没有经纬度概念,更多是以水路或者山脉作为连接,在山脉和水路不同地方标注POI地址;1927年第一款导航手表出现;1930年有了第一款车载导航的出行;1970-1994年GPS定位诞生;第一代电子导航是2000-2013年,那个时候是2D平面,需要离线更新,基础道路属性的;2013年作为电子导航第二代的元年,出现了3D平面,那个时候更多是大数据和云计算的互联,而真正发展起来的是如今我们广泛使用的手机导航,数据的概念也从那个年代被打开;高精地图的诞生代表着导航进入第三个元年,我们说每一个产品爆发背后都需要天时地利人和,随着自动驾驶越来越火,高精地图在这个年节点恰到好处的出现了并呈现爆发式的增长。
现在我们正处于第三代电子导航,那未来电子导航会发展成什么样子?其实也是我闲余时间会思考的问题,所以我大概做了一些分解和分析。
导航一开始出现是带着非常强的功能诉求在里面的,解决了用户的一些基本诉求,即我在哪里?我需要去哪里?如何去?第二代电子导航出现了探索的概念,用户可以发现周边的兴趣点。第三代电子导航是希望最好有一个东西带我去。从产品矩阵当中,一开始导航是工具属性非常强的产品,而经过这么多年的发展会带有更多的娱乐性,从比较严肃的变成更加有趣的。从中,大家可以看得到导航的需求是在不断升级迭代,拥有了偏向理性和感性两面。
理性层面,它是偏向于软件定义汽车,是整车智能和车联网服务的关键输入;感性层面,是提供更多的生活服务与娱乐属性的信息入口。当下我们看不见地图导航的终局,但对于短期内下一代地图导航的发展,我们相信是感性和理性的深度融合,是需要把感性技术科技和生活体验真正的结合起来。
回顾一下当下导航的应用,基本上可以分为六个部分:基础导航、地图语音、周边附近、智能互联、充电地图和智驾地图。我们今天的主旨还是集中在智驾地图应用探讨主题上。
首先回顾一下传统地图和智驾地图的差别。清华大学给了一个很好的模型,把地图分为七个结构。最底层是Roda Layer一直往上爬升到动态高精图层。可以看到不同导航场景里面,我们所需要的数据精度是不太一样的。为了让地图导航有效支撑各种类型的导航应用,从长远来讲,我们认为这需要导航模块提供所有所需的场景的数据和服务。这些数据类型会更加丰富,体量更大,精度范围更广(从10米变成5厘米),更新更加频繁。未来不管SD和HD差别会有多大,从导航应用模块来讲应该是作为一个模块统一服务(One Map)被调用的。
因为智驾地图本身与自动驾驶是紧密相关的,那么最好的结果是可以复用于整个L3-L5的智驾场景。但我们真正探索下,当下智驾地图的形态并非可以支撑L4和L5,因为性能指标大家都在探索阶段当中。而现在我们在L2到L3跨越过程中,智驾地图更多的是作为服务于人机共驾场景中的一个载体,需要通过人驾和机驾的方式将数据储存下来以供学者们来研究,这种状态一直会覆盖到整个L3阶段。还有AVP,它是基于有效的限定区间,但它的自动驾驶等级已经无限接近于L4了,智驾地图会单独对AVP场景做图层定义。而现在智驾地图应用场景更多还是服务于人机共驾场景和有限停车场AVP的场景,这其实也说明了我们的探讨的范围。
我们再来讲一下人机共驾的意义。我们看得见的是自动驾驶会用传感器替代人做一些决策。这张图比较清晰的把它做了拟人化和比喻化的处理。从一开始人作为驾驶员开车的场景,更多是用自己的眼睛去接受对环境的感知,手脚去控制方向盘或者油门刹车片,大脑是做从眼睛感知到手脚最终执行过程的决策者,而自动驾驶则利用摄像头、雷达等各种传感器作为我们的眼睛,感知环境,而直接去控制最终的执行器,类似大脑决策是需要有单独一个模块去承担的。人机共驾真正意义是探索人驾与机驾差异性时的反馈机制,可以让机器找到人机共驾习惯的AI方程式,在我看来人机共驾是暂态的,不会作为智驾地图最终的形态。
再简单介绍一下智驾地图SD和HD融合的做法,现在主机厂更多是把SD和HD分为两个模块来做,一个是智舱域,一个是智驾域,智舱域做法更加关注在如何提升跟人的交互上,需要提升驾驶员对智驾系统的信任度的问题,在真正的决策层面还是放到了智驾域里面,当然,这个过程中也会碰到不大不小的挑战。当我们把SD计算后的路线给到HD智驾域,附上所有的动态的信息从而转变成机驾的规控路线,之后还需要再回到智舱域中渲染展现,其中会预见处理时间和算例消耗的问题。从未来来说,我们希望在SD和HD融合可以有些统一的做法,可以在一个模块中处理所有决策和渲染,这样可以节省很多时间,当然也可以给到用户最直观的高精的体验。
我这里用一个高度自动驾驶的车辆架构来作为SD和HD输入的概念。为什么用高度集成的,只有一个中央计算器的架构来看这个事情呢?我们也都知道,电子架构的发展从分布式到域控制器,再到中央集成,过程其实是不会变的。因为电子架构中是要软硬分离,我们需要把应用层最好放在一个域做完全的处理。传统的架构当中,其实我们会碰到很多贯穿式的升级,导致花很多成本,而跨域处理本来对于融合来讲,也会遇到一些困难。如果我们再加一个相对广义的车联网,也就构成了可能会出现的电子架构。回到人机共驾,我们需要注意的,一方面是底层,油门、制动,转向,换档过程中,当人的判断和机器判断产生负反馈时,这些是可以有助于数据训练以及模型迭代的。另一方面从人机交互上更需要在意的是人机的交流,除了我们需要享受车懂人,也需要让人更懂车,知道车是如何判断的,在什么时间节点会做出怎样的响应,甚至知道说为什么会做出这样的响应,也知道什么样的情况是需要真正接管的,这样会让数据或许可以变得更加真实一些。
智己也是基于这样的考量,我们使用数据驱动的算法,是希望在机器和人交互中可以不断地迭代自己那一套背后数据驱动的算法公式,希望可以覆盖越来越多的场景,提高接管效率,减少接管次数,使其变得更加智能,反过来越来越懂客户,也都知道客户真正需要是什么样的智驾?在真正的智驾上可能每个人的诉求都不一样,每个人的要求也不一样,千人千面。因为每个人驾驶方式不同,所以我们需要在某一个载体上有一个经验的累积,那就需要智驾地图。
简单说一下技术理念,像量产数据,未来众包是一个方向,只是现在众包也碰到不大不小的挑战,比如如何众包,上传是否合规,包括数据的格式。当出现不同众包格式是不是会有统一的平台可以帮助打通,有一个统一格式输出给所有服务方调用?还有数据驱动的算法,开发过程中我们希望它在数据处理上可以实现自动化。再介绍一下IM AD硬件解决方案,有12颗摄像头,5颗五代毫米波雷达,12颗定制化超声波雷达,以及高精度地图和V2X车端技术,相对业界来说这也是比较标准的做法,相信很多主机厂也会这样去设计自己的硬件解决方案。我们未来也会做升级,目前选用的是英伟达的Orin,在芯片行业里面除了华为,Orin是最TOP的一块了,当然我们也会切换激光雷达。
回到这次我想和大家探讨的实例,智驾当下结论还是人机共驾,因为是人机共驾,我们希望它与人有更多的交流,设计理念有以下四种:决策透明的过程,需要让人知道给你的这套系统大概是什么样的方式在做判断,你知道我在做什么,而并不是说突然之间给我做一个反馈,我完全感觉不到或者完全不清楚意义。希望我们的服务是贴心的,真正可以给到一个准确的智能接管的过程,还有在最终终态情况下,当数据训练到一定程度可以根据个人驾驶习惯提供拟人化的体验。可以用几个例子看一下,这也是行业里面做的比较多的做法。我们会做一些信任增强的体验,可以看见前方的道路,拥堵的时候把前方预警信息以更加明确的方式告知你。包括在进入路口的时候,告知你现在这部车在做什么,你又应该怎么做。懂你的体验,未来如果有一个更加好的冗余和积累下,希望可以提供更加适合你的驾乘体验。
从用户视角下地图融合感知的应用实例探讨,高精地图作为的未来前景之一,发展到最终还是聪明的车和车路协同,其中智慧的路是未来的基础导航的常态。实时的高精路况透出替换路口放大图,帮助驾驶员更加安全地处理复杂路口信息,路侧盲区的预先识别,使得驾驶更加安全。三维可视化视角下超视距渲染,POI信息立体呈现,提供更多内容服务,跟视觉融合之后还可以进行AR导航的切换,等等。下面两张图是苹果地图发布的效果图,它其实已经有基于高精地图做基础地图的趋向,开车的体验肯定比我们现在基于2D视角画面的地图导航更好。地图未来可以真正做到从2D世界切换成3D世界的镜像,在虚拟世界得到真实的感觉,以更加上帝视角的状态看一下周边的世界在发生什么,这也是高精地图可以给到地图导航发展的方向之一。
在做智驾地图的过程中,我们也遇到了很多挑战:
l 高精数据的质量和完整性,众包采集是方向;
l SD-HD数据的融合难题,缺少统一数据格式。现在基本上是在两个域里面做不同的事情,可能碰到的挑战是数据来源是几方不同的,要做打通所有数据的融合感知。对于数据的格式其实现在是没有一个标准的,我们也会碰到数据融合的问题,也会花很大的成本、很长的时间、很长的链路把所有数据集中在云端处理,做一些车云交互;
l 地图导航功能安全的要求(ISO26262-ASIL),从长远来说电子架构还是趋向于统一到一个模块里面,本来我们地图导航应该在娱乐域不需要有很强的功能安全需求,但是如果和智驾真正紧密联合的时候,其实地图导航的要求就从非安全件变成了安全件。好在这块其实是可以拆分的,可以把本身ASIL-B拆解成A和B,可以做这样的解耦;
l 中国法规限制高程信息采集,2D坐标还原3D智驾地图模型存在难度;
l 在线升级压力与信息安全要求。
好,以上就是我所有的介绍,感谢各位。