智驾科技MAXIEYE郭恩庆:解码人人可享的智能驾驶
7月1日—2日,由盖世汽车主办的“2021第四届全球自动驾驶论坛” 于上海隆重召开。本次论坛主要聚焦自动驾驶关键技术,如自动驾驶感知、智能驾驶域控制器、芯片、计算平台、无人驾驶不同的落地场景等话题展开讨论,以促进自动驾驶相关技术进一步发展、完善。下面是智驾科技MAXIEYE CTO郭恩庆在本次大会上的发言。
智驾科技MAXIEYE CTO郭恩庆
大家好,我们是一家年轻的科技创业公司,主要做L3及以下的智能驾驶产品和解决方案。我本人是从2007年(前德尔福/安波福中国区主动安全总工程师)开始做到现在,见证了国内ADAS产业的发展和成长。我今天将分享四个方面的内容:回顾我们过去十年,ADAS经历了什么?我们接下来要怎么做?作为年轻的科技企业如何在产业转型中适应新的合作方式?如何在这个赛道上胜出?
首先讲第一点:以十年为周期,思考中国自动驾驶的产业变局。(德尔福)从2007年开始陆陆续续在国内引入ADAS,当然主要是基础的控制,包括ACC,还不能做全速ACC,横向只是报警。从2011年开始国内车厂尝试去做,到2015年是导入期,雷达视觉方案已经有了基础的应用,主要是双预警或者基础的纵向控制。2015年开始出现数据融合的产品,1R1V数据融合。2020年处在一个爆发期,如果看2019年之前的数据,整车厂ADAS装配率是不高的,2021年又出现一些新的趋势。随着大算力平台的出现,单单做低速(场景)或者单单做高速(场景),对大算力运力平台都是一种浪费,所以就要求大家在大算力平台上多装入一些东西,同时硬件和软件深度解耦,主机厂有更多的参与度来主导整个系统集成。
如果我们回过头看之前我们做的那些L1、L2系统,很多主机厂使用的是一种完整解决方案。但是我们再看一些新的造车势力,比如说Tesla或者小鹏,他们是把硬件装上,把这个采回来,采用数据迭代。所以我们敏锐的感觉到在接下来的时间,一个是软硬解耦,一个是数据迭代,是推动ADAS向前迈进的风火轮。
我们看一组数据,这是工信部统计的2020年市场渗透率在15%左右,也就是说实际上没有那么乐观,但是已经开始规模化落地,开始大规模的预装。比如说我知道有一个主机厂以前装配率大概在10%以内,去年下半年由于竞争压力装配率提高到45-50%,当然不是说所有车型了。
我们再看一下2020年智能网联汽车的技术路线图,到2025年L2要达到50%,L3也要达到50%,也就是说从15%到50%还有一个很大的成长空间,这也是我们真正要落地的地方。另外到2030年要达到70%,也就是说在这里面没有提到L4,我们理解L4和L5主要是从运营和部署角度来讲,相对于大部分车厂规模化应用来讲,我们还是更倾向于说到L3或者L2++。
根据高工智能数据,目前中国的车装配率相对国外来讲也不是很高,主要集中在10-15万车型范围内。也就是说,L2生长空间是非常大的,同时这个点上面临着转型。就是传统的交钥匙方式完全自上而下,有一个大的tier-1整装方式不利于向L3迈进。
L2十年了,为什么到现在装配率只有百分之十几?比如急弯的稳定性,有些时候能保持住,有些时候保持不住,那你让用户去猜,或者用户在这个弯道上胆战心惊的,系统开的比人开的还累。还有车辆Cut-in识别比较晚。我们系统开发的目标是要不停地提高处理能力。
但是有些场景,系统处理不了,你要能告诉我系统处理不了,用户也不会时时刻刻去担心,去猜这个系统的行为,我们这里分为两种,系统感知边界,警告驾驶员。
大家看看这些瓶子,前面三张照片是啤酒瓶子,雪和石头,现在它能感知到,但是它不能识别是雪,还是石头,还是啤酒瓶子。那如果这个路口封了,你可能是减速或者请求驾驶员接管,但问题是这个雪是可以过去的,实际上停住风险可能比过去风险更大。我们在尝试扩大系统能力的前提下,还要把边界锁清楚,现在L2最大问题是边界不清楚,需要你去猜、去测试、去体会。
还有高速公路上所谓的L3,这个Tesla没少被怼,还有突然遇到水把路给淹了,这些场景让我们觉得,真正做到一个稳定的L3或者把L3边界定义清楚还有挺长的路要走。随着L2的普及,我们在L2这个节点上应该做什么事情?就是说L2实际上它的普及是给大家在数据的回归上提供了非常好的机遇,但是这个机遇就要求大家必须要全栈式研发,深度挖掘传感器的能力。
那我们可不可以跳过L2,直接做L4,L5?这是一个问题,今天我没有答案。我们以视觉为前提分析了一下,感知系统包括前视,后视,侧前视,侧后视在所有功能中的作用,大家可以看到,前视在其中发挥得作用非常大,也就是说我们仅仅靠硬件累计,不深度挖掘传感器能力,这个性价比会慢慢降下来,如果依靠堆砌传感器来试图提高系统能力,那么系统在集成所有传感器的优势同时,实际上也耦合了所有传感器的短板,比如说下暴雨的时候所有激光雷达失效,原来基于激光雷达的缺点都凸现出来。所以我们认为应该不断挖掘传感器的能力,我们认为这是一个正确的发展方向。
那么是否要跳过L2,直接做L3呢?这个其实没有答案,但是我们认为L2是基础。如我刚才说的这些场景,所有你的训练,所有的深度学习都是以历史数据为基础的,你不知道会发生什么,只有真正跑一段时间之后以数据说话,所以在L2基础上软硬解耦,数据回归是关系到主机厂与科技创新企业合作的一个非常关键的点。
十年了,L2只有15%的普及率,我们主机厂拿到了什么东西?我理解主机厂主要得到的是集成经验、应用经验,但对处理感知下一步是我们急需补充的。相对来讲L2没有拿到这个数据,你想把L3这个东西做好,结合我们刚才讲的特殊情况,你有信心把这个东西交出来吗?我们说可以OTA,OTA不是对安全的妥协,你不能说拿这个东西去以牺牲用户的安全为代价来做OTA。我们觉得L2相对来讲比较成熟可用,但是我们有优化的空间,在优化的同时积极探索L3边界,逐步向L3迈进。
那想想我们自己怎么办,我们新科技公司如何在这场变革当中更好的与主机厂合作?我们要开发一个更好的L2(系统),挖掘L2(系统)的潜力,挖掘感知的潜力。首先从消费者视角来讲,我们要保证这个系统安全舒适,有相匹配的购买预算,我们极其不赞成叠加硬件,就是系统应该就是这个样子,车厂角度来讲就是安全,有持续获利空间,包括(降低)成本。从技术供应商角度来讲就是技术挖掘,功能体验,前瞻技术与工程落地的平衡,持续的价值成长。因为作为软件供应商或者算法供应商,在中国软件一直不太受到特别的重视,我们也需要与主机厂找到一种长期共赢的方式。这里得出一句话:人人共享,那必须就要用得起,我们反对堆砌硬件。愿意用,就是我们要把系统做到它应该有的样子。
针对这个目标,我们花了大力气在三点上。1、全栈式开发。你要做到什么程度?挖掘到什么样的数据?比如说检测率,漏检率,误差精度,我们只有做全栈式研发,才能把感知和规控高效协同起来。如果主机厂愿意去做一些控制,我们这个研发是可以和主机厂一起合作的。2、极致化体验,我们充分挖掘传感器能力,增加系统能力SCOPE,明确系统边界。3、规模化应用。
L2是基础,要全栈,极致,规模化,这里给大家举几个例子。有人做1R1V的融合,为什么要做1R1V融合?就是因为单传感器可能会有漏检误检的情况。
可以看一下图,左边是传统融合,右边是视频检测,底下还有一个线,也就是说传统基于外观的,看这个车像车就把它看作是车,但是容易误检。那我们用另外一个是接地线,用两种特征对这个物体进行冗余性检测,这样可以使你的视觉系统更可靠更稳定。
另外一个就是Cut-in的问题,左图可以看到车头刚露一半,Bonding box形成之前,Heading angle还不稳定,根据车辆的lane assignment,进行图像级别检测。
大家可能也有过这种情况,就是S弯,三阶曲线在比较远的地方,小S弯识别不好,我们就针对小S弯用分段解释,而且我们用了一个优化的思想,很多人开着小S弯并不是沿着车道中心线走。
大家可以看前面的路,向左的分岔也是这样,根本拐不过去,或者到前面摄像头检测到了(方向盘)猛打一下,让人觉得挺吓人。我们是分段拟合,分段拟合之后重新生成轨迹。
还有分岔路,我们发现右侧的线不会断,我们的系统每次都会顺着这条线走过去。
这个路是不对齐,普通的L2都过不去,但Tesla可以过得去。那我们怎么做的呢?我们会提前分段表示,我们会按照当前稳态情况下保持车辆稳定最小的轨迹去做,以后这个系统过这种弯,70米之内都不会退出,也不会给你猛打。
这是基于纯视觉,一个摄像头挖掘的东西。左边摄像头分岔点有一个小黄点,这个对地图定位非常有好处。也就是说我们现在对车道线检测不单单检测一根两根车道线,让你顺着车道线走,我们会把车道线脱铺图都给做出来,方便地图定位,方便我选择哪个线之后立即控制,几乎所有的线路都能检测出来,当然它对算力有一定的要求。也就是说,在充分挖掘的情况下可以做到性价比最高。
我们讲工程化与性价比的平衡落地,我们不想堆砌硬件,我们是想深度挖掘传感器感知的能力。另外,大家都在提落地,大家想想,如果我能解决从北京到上海,上到高速,点到点不需要接管,可以花1万块钱搞定,还是5万块钱你去开L5之类车,你选择哪个?没有一致的答案。但是短期之内第一个比较靠谱一点。
简单介绍一下智驾科技,(视频上)我们所有传感器都是装了,有时候装它不是为了装上它而是去掉它。装上它是想探索系统边界,因为有些车撞了都不知道,它没有意识到危险,我们可以通过这个来做差异化,数据回归。
这是我们深度学习的路径,公司规模不大,但是我们在国内做深度感知时间还是比较早,目前主流产品是IFVS-500,2020年商用重卡出货10万台。另外我们现在也在规划多R多V的方案。
卡车目前是我们很大的业务,但是卡车车头跟小轿车不一样,导致盲区很大,所以我们公司自己开拓了150度和50几度摄像头可以最大幅度地覆盖盲区。
同时今年也会有(乘用车)量产项目,开始数据回传打通这个链路,包括场景和系统测试数据,和驾驶行为数据,高精度地图采集点的数据。
我们认为感知和规划必须统一,这个统一并不是一定由一家公司来做,而是深度合作。也就是说ADAS十年做到这个模式,无论是市场成熟度,还是技术成熟度都使得我们给客户的合作模式已经不简简单单是交钥匙模式,而是深度的合作,共同进行迭代。这是从L2真正迈向L3,而且做出来极致舒适的L3的基础。
欢迎关注我们公司,谢谢大家。