非田
2023年7月11日,美国加州旧金山,自动驾驶出租车
无图智能驾驶,是汽车行业贯穿2023年的热词,也是各家车企和智驾公司秀自家技术肌肉的最新方式,在年内纷纷喊出“不依赖高精地图,快速大规模落地”的口号。
去年年底,小鹏宣布,自11月首次落地无图城市导航辅助驾驶功能以来,全国累计有52城可实现无图智能辅助驾驶功能。问界、理想等曾也先后表示,要推出自家的无图智驾方案,业界正经历着一场“无图”+“开城”(指在更多城市实现无图智能驾驶)的大战。
有图智能驾驶,指的是在高精地图的辅助下,进行智能驾驶决策,即通过AI完成变道、超车、转弯等一系列驾驶操作—而有了高精地图的辅助,这些操作就会变得更为简单。
但特斯拉CEO埃隆·马斯克却在2019年就提出,过分依赖高精度地图,会让自动驾驶系统变得极其脆弱,普及起来更加困难。3年后,特斯拉AI日活动上,特斯拉提出了高精地图的替代方案,拉开了智能驾驶从有图到轻量化地图再到无图智驾的序幕。
“重感知、轻地图”,是实现真正意义上无人驾驶的重要一环。随着各大企业的发力竞逐,不久的将来,无图智驾有望在绝大多数场景下得到普及。但即便实现了无图智驾,梦想中的自动驾驶离我们依然还有一定距离。
如果按照精度来划分,电子导航地图大致可以分为标准地图(SD Map)、车道级地图(LD Map)、高精地图(HD Map)三个类别。SD Map主要由驾驶者使用,可显示道路基本情况,精度在米级即可;而HD Map要精细的多,其精度要达到厘米级。
此外,按照中国自然资源部发布的《道路高精导航电子地图数据规范》规定,智能驾驶系统使用的HD Map要含有道路网、车道网、道路标线以及道路设施的几何、属性与关系。
如果用游戏场景来类比智能驾驶,“无图”就好比在一个视野全无的场景上进行分析探索,而提前或即时加载的“高精地图”,就如同在即时战略(RTS)和多人在线战术竞技(MOBA)游戏里,开了全图视野、消除了战争迷雾一样,能让车辆“看”清四周,从而更快做出响应。因此,高精地图也被智能驾驶行业称为“上帝之眼”。
智能驾驶可分为感知、规划、执行这三个步骤,即AI的所见、所思、所行。某汽车媒体主编Q先生告诉《看世界》,如果把智能驾驶的AI比喻成一个近视患者,那么地图就好比戴上了一副近视眼镜,使其能正常行走;而无图就如同做了一场视力矫正手术,彻底摆脱眼镜—这一过程中,“矫正”的用具就是算法的优化。
Q先生认为,同样是智能驾驶,如果单纯从当前的乘坐感受上来说,“有图”多少会比“无图”略好一些,“带图就好像开卷考试,需要处理的内容会相对较少”。
高精地图更像游戏里疯狂氪金的“人民币玩家”,可“钞能力”虽好,限制也少不了。
首先是资质。近年来,国家逐步收紧了导航电子地图制作甲级资质,没有资质的车企,只能向地图类企业采购。
再就是钱。一方面,高精地图采集车需要搭载激光雷达、摄像头、GPS接收机、数据储存计算等专业设备,车辆成本在百万元乃至千万元级别,这就注定了地图使用费不会便宜。
更令車企无法接受的是,由于地图数据需要更新维护,地图并非一次性费用,而是持续收取,这也就意味着,在车辆使用期间,只要涉及智能驾驶,车企都得额外支付地图的费用。
特斯拉专属的计算机视觉系统“特斯拉视觉”处理画面
高精地图也被智能驾驶行业称为“上帝之眼”。
退一步说,即便车企愿意掏这一笔钱,现有高精地图的鲜度(即更新频率)和开通高精地图的城市都相对有限。清华大学与百度等联合编写的《智能网联汽车高精地图白皮书2020》数据显示,厘米级的高精地图测绘效率大致为100km/车/天,这与全国535万公里的公路总里程相比,无异于杯水车薪。
这也就意味着,如果单纯依赖有图,一旦车主离开“带图”的城市,智能驾驶必然受限。
Q先生透露,据他了解,当前城市级高精地图更新频率,通常只能做到按季度计算,能按月更新的就已不多,而这远远满足不了驾驶需求。“获取北上广深等一线城市的高精地图并不困难,但又有多少企业愿意花大价钱,去小城市采集和快速更新高精地图呢?”
“有图”的种种限制,催生出了“无图”,但高精地图始终有不少拥趸,推进“无图”的进程中,充斥着口水战。
“部分车企之所以强调‘无图,主要是因为无地图资质、无知识产权、无安全敬畏。”
国际数据公司IDC发布的《中国高精地图市场份额》报告显示,2021年中国高精度地图市场规模为6.46亿元,同比增长36.3%。IDC认为高精地图规模化应用已经具备一定的基础,已经到了落地的前夜。
去年10月,地图龙头企业“四维图新”CEO程鹏怒批:“部分车企之所以强调‘无图,主要是因为无地图资质、无知识产权、无安全敬畏。”
据他透露,该公司做了相当多调研,发现一些自称实现了“无图”的车企,在遮挡全部传感器之后,仍然能正确读取地图信息。这也就意味着,一些车企很可能是自诩“无图”,但暗中“有图”。
持有类似思路的,还有美国智能驾驶服务企业Waymo,这是一家隶属于谷歌母公司Alphabet的公司,谷歌能为其提供其他厂商难以企及的高精地图。
但同为行业龙头的特斯拉却对高精地图嗤之以鼻,并推出了自己的解决方案。英特尔旗下的Mobileye和国内一些厂商也在这一思路下,摸索出了属于自己的无图智驾方案。
早些年,特斯拉的“无图”采用摄像头+雷达模式,但从2021年5月起,特斯拉在北美版Model 3和Model Y的智能驾驶方案中,弃用了雷达和超声传感器,转为采用纯视觉方案。
为此,特斯拉推出了专属的计算机视觉系统“特斯拉视觉”(Tesla Vision),车辆只需配备8个360度摄像头用以代替雷达,通过摄像头提取,再由计算机处理并转化为3D数据。
在后端,特斯拉有千人级别的标注团队,对超过百万辆特斯拉收集的数据进行标注,通过训练计算机识别和解释视觉世界,以实现无图智驾。
特斯拉的底气来自近年兴起的“BEV+Transformer”技术。BEV名为“鸟瞰图视角”(Bird's-eye-view),是一种AI算法。
这一算法在谷歌推出的深度学习模型“Transformers”的加持下,可以将车载摄像头拍到的画面进行坐标转换,模拟出在车辆正上方10~20米处,向下俯视车辆及周围环境的“上帝视角”画面。智能驾驶的所有决策也都基于这一“上帝视角”进行,从而实现“无图智驾”。
简单而言,在AI的帮助下,特斯拉利用“上帝视角”击败了“上帝之眼”。但在现阶段,这一方案也并非无懈可击。由于缺乏雷达,特斯拉也发生过多起因算法失误而出现的“幻影制动”事件。
另一方面,止不住的官司也从侧面说明了,无图离成熟尚有一段距离。Q先生也认为,欧美国家人口密度远不如中国,路况也相对简单,“特斯拉视觉”等在欧美适用的“无图”能力,能否适应国内包含大量电动车、摩托车等在内更为复杂的道路环境,还有待验证。
麦肯锡咨询在一份报告中指出,对于全球车企来说,基于中国法律法规要求、消费者习惯、车况路况及基础建设方向的不同,自动驾驶技术栈需要进行不同程度的本土化适配。
挣脱来自地图的束缚,是智驾探寻新可能的基础。但翻过“地图”这座山丘,见到的就是理想中的自动驾驶吗?恐怕未必。
《汽车驾驶自动化分级》国家标准将汽车驾驶自动化功能分为L0—L5六级,L3及以上才被称为“自动驾驶”,以下均为驾驶辅助。其中L5为“完全自动驾驶”,即驾驶自动化系统在任何可行驶条件下,持续地执行全部动态驾驶任务和执行动态驾驶任务接管,这与民众理解的全自动驾驶含义基本一致。
目前,能掌握L3级有条件自动驾驶的厂商在逐渐增多,而业界较为领先的厂商技术,则具备实现L4高度自动驾驶的能力。
两者与L5最大的区别在于,其实现功能的前提是“在有限的设计运行条件内”,且L3还可能需要驾驶员接管,不能完全离开人类。
Q先生告诉《看世界》,尽管“无图”的进步让人欣喜,但智能驾驶如同十项全能竞赛,但凡有一处不过关,对于驾驶安全而言都无法接受。
在他看来,目前阻碍自动驾驶的是1%最难的场景,和那些尚未知道的潜藏风险:前者属于“已知的不安全”范畴,可以通过算法和算力升级迭代逐步解决;但后者属于“未知不安全”,不仅需要技术,更需要试错的时间。
不过,从有图到“无图”的速度达到甚至略超行业预期,这与智能驾驶行业诸多不断跳票的技术承诺,形成了鲜明对照,可能也是技术持续平稳进步的写照。
中国乘用车产业联盟秘书长张秀阳在受访时表示,由于道路场景复杂,即使现有技术已经实现了90%以上场景的自动驾驶,但剩下10%的长尾场景问题如果得不到解决,自动驾驶就无法落地。
自动驾驶是一个错综复杂的问题,需要技术实力、大量的测试时间和人力,来收集大量数据和重复改进系统。
从1980年代美国国防高級研究计划局提出陆地自动巡航计划以来,自动驾驶已经走过了约半个世纪的历程,在L5自动驾驶离我们或许只有最后一公里的当下,理应对这一技术有更多的期待。
责任编辑吴阳煜 wyy@nfcmag.com