王健美 邓明荣 胥彦玲
(北京市科学技术情报研究所,北京 100044)
主题词:无人驾驶 智能汽车 IEEE IV 技术创新 技术应用 最新进展
随着信息通信、互联网、大数据、云计算、人工智能等新技术在汽车领域广泛应用,汽车正加速向智能化转变,智能汽车已成为未来汽车工业乃至人工智能产业的战略发展方向。
2015年,国务院印发《中国制造2025》,明确将无人驾驶作为汽车产业未来转型升级的重要方向,“电动化、智能化、网联化、共享化”成为汽车产业发展的新趋势[1]。2017年4月,工信部、国家发改委、科技部发布《汽车产业中长期发展规划》,提出到2020年,汽车DA(驾驶辅助)、PA(部分自动驾驶)、CA(有条件自动驾驶)系统新车装配率超过50%,网联式驾驶辅助系统装配率达到10%,满足智慧交通城市建设需求。到2025年,汽车DA、PA、CA新车装配率达80%,其中PA、CA级新车装配率达25%,高度和完全自动驾驶汽车开始进入市场[2]。2018年1月,国家发改委发布了《智能汽车创新发展战略》(征求意见稿),提出到2020年我国智能汽车新车占比达50%,到2035年中国将在全球范围内率先建成智能汽车强国,全民共享“安全、高效、绿色、文明”的智能汽车社会[3]。
在此背景下,由IEEE智能交通系统协会主办,中国自动化学会等机构承办的第29届IEEE国际智能车大会(IEEE IV 2018)于2018年6月底在江苏常熟召开。大会同期还举办了“智能汽车跨界融合高峰论坛”和“智能汽车产业展(IEEE IV 2018产业展)”。汇集了来自整车、零部件、互联网通信、投资机构、科研院所、政府单位等数百位智能汽车相关领域从业者开展深入研讨、跨界交流,以及数百家智能汽车及零部件企业,分享最新产业成果、展望未来产业动向。
本届大会共邀请了6位学术届和产业界专家,设置了6场主旨报告。报告内容如下:
国防科技大学徐昕教授提出增强学习能够很好地帮助智能车在决策及控制部分实现自我学习,其面临的挑战主要是进行多目标学习和在线学习的效率问题。而新的特征表示方法和滚动优化策略能够比较好地提升学习效率[4]。
慧拓智能机器有限公司CEO陈龙认为平行驾驶的首要概念是平行学习,将其运用于自动驾驶车辆上时,智能汽车就会有一个“影子”,独立于实际的车辆对各种情况进行预测,而自动驾驶系统能够整合智能车本身和影子系统的反馈,找出自动驾驶过程中的最优解[5]。
英特尔自动驾驶解决方案专家Jack Weast讲述了Intel与Mobileye联手之后围绕自动驾驶安全展开思考,提出 Responsibility-Sensitive Safety(RSS)事故责任安全性模型,RSS希望模拟人类的判断,也会考虑到非常复杂的工况进行决策。Intel希望以RSS的解决方案作为起点,提供一个开放的对话机制,大家共同去运作并进行相应的修证,形成一种综合的技术解决方案[6]。
丰田北美研究中心CEO、研究员Gill Pratt从一个更加宏观的角度,提出了“我们为什么要推动无人驾驶?”的问题,并从安全、交通、能耗、收益、方便性、有效性、娱乐性等多个角度,阐述了自动驾驶将为人类生活和社会发展带来的改善。随后,Gill认为我们距离无人驾驶还有相当一段距离,且从环境感知、场景认知、行为预测等技术发展的角度进行了阐述[7]。
吉利集团张晓东研究员介绍了吉利的战略路线与发展愿景,以及在智能车领域的布局,随后重点讲解了吉利近来在智能汽车的验证与测试方面的工作。据介绍,吉利已经发布了其未来10年将要关注的核心战略,即智能互联、智能驾驶,并发布了G-POW⁃ER、G-SAFETY、G-PILOT、G-NETLINK和G-Blue共5项举措来保障这一战略的实施[8]。
格里菲斯大学Ljubo Vlacic教授讲解了智能汽车与智能交通、系统和车辆的关系,以及车辆在系统中以怎样的角色去传输智能驾驶技术。随后分析了L1到L5等级的车辆自动化所面临的主要问题。Ljubo认为从实践的角度无法保证人类不干预智能汽车的自动驾驶。此外,为推动无人驾驶最终实施,车厂还需要为用户解释智能汽车内部决策逻辑等问题。最后从消费者角度分析,人们想购买什么样的无人驾驶车,为智能车辆研发团队提供了新思路[9]。
除了以上六位主旨报告人的精彩分享,大会还分别进行了专题研讨会和教程报告、口头报告、海报展示等智能车论文交流的平台。笔者对本次大会口头报告进行研读,并按主题分类综述,让广大业内外人士更清晰地了解智能汽车领域研究热点和发展趋势,知悉行业最新动态,把握市场发展脉络,促进产业快速发展。
本届会议共收到来自34个国家的603篇论文,确认接收的论文346篇,录用率57.4%。其中276篇Con⁃tributed paper,20篇Special Session Paper,50篇Work⁃shops paper。主会议论文投稿中有153篇(录用69篇)来自中国,83篇(录用64篇)来自德国,58篇(录用46篇)来自美国,这三个国家的投稿量占了近三分之一。美国是自动驾驶的发源地,其技术一直处于世界领先水平,论文录用比例高达79%。德国是汽车技术强国,尽管相比论文他们更看重专利,但本届大会他们也投了很多高质量的文章。近年来,随着国家对智能汽车技术的关注,国内迎来了智能汽车研究热潮,收录的国内学者论文数量排名第一,其中不乏一些国际领先的技术研究[10]。大会从录用的346篇论文中选取了评价最高的33篇论文组成口头报告环节。大会颁发的“最佳论文奖”、“最佳学生论文奖”以及“最佳应用奖”均从口头报告中选出。口头报告以智能汽车六大核心技术为主题,分为视觉传感与感知、车辆运动规划与测试、高级驾驶辅助系统(ADAS)、地图构建和定位、传感器和数据融合、决策和控制6个板块,从一定程度上反映出智能汽车领域新理论、新观点、新方法、新技术及应用。
智能汽车是一个集环境感知、规划决策、多等级辅助驾驶等功能于一体的综合系统。智能车辆运动控制包括感知、动作、行为3部分。感知主要通过车的“眼耳”认知周围环境,实现对环境的精确建模,并将车辆位置、障碍物等信息传输给车辆“大脑”——车辆内部的高性能计算机进行分析和计算,以控制车辆的速度和转向,从而使车辆在遵守交通规则的前提下能够安全、可靠地在道路上自主行驶。
视觉传感与感知是历届会议关注的主题之一。比利时鲁汶大学Davy Neven介绍了一种以50帧/秒进行端到端车道检测方法,可处理不同数量的车道并应对车道变化。该方法摆脱了传统车道检测方法对专业化手工标注的依赖,也解决了利用深度学习模型进行车道分割训练需预定义固定数量的车道的缺陷[11]。
戴姆勒集团Jonas Uhrig提出了一种可以在Cityscapes和KITTI数据集上获得竞争性结果,且速率是现有方法两倍的语义实例分割方法。该方法依赖于单个完全卷积网络(FCN)预测对象边界框,以及像素方式语义对象类和指向相应对象中心的偏移向量。使用这些输出,提供一种有效的后处理,从而实现实时速率获得的实例分割[12]。
罗马尼亚克卢日·纳波卡技术大学Vlad-Cristian Miclea提出一种新的基于卷积神经网络(CNN)的实时深度采样方法,该方法使用语义信息提供的局部上下文,引入了两种基于卷积网络的解决方案,根据深度传感器给出的稀疏程度进行建模。从Kitti数据集中进行的实验,显示出该方法在常规GPU上实时运行的性能[13]。
加州大学伯克利分校Yeping Hu博士提出一种基于语义的意图和运动预测(SIMP)方法,可以通过使用语义定义的车辆行为来适应任何驾驶场景。它利用基于深度神经网络的概率框架来估计周围车辆的意图、最终位置和相应时间信息[14]。
西安交通大学Zhongxing Tao介绍了一种在无GPS信号环境中提高车辆定位精度的方法。针对地下车库特征,提出一种基于局部表面的描述子Cy⁃RoPS,其具有旋转不变、计算快速、对噪声鲁棒等多种优点,可准确选出车库中常见静态物体。还提出一种基于点云匹配的定位框架,定位稳定、结果准确,满足无人驾驶导航要求[15]。
运动规划作为移动机器人的一个重要研究分支,近年来,大量的路径规划与测试技术迁移到自动驾驶领域,并根据所面临的道路网络与驾驶规则要求得以改进。
智能车辆的认知能力评估通常运用经典自动驾驶数据集进行评估,缺乏对驾驶难度的综合考量。西安交通大学Chi Zhang建议使用提出的“级联坦克模型”对驾驶难度进行基准测试,并根据语义描述符获得每段难度的细分等级。通过分级离线评估(GOE)框架,证明无论数据集选择如何,智能车辆认知能力的离线验证更加一致[16]。
运动规划是自动驾驶的主要挑战之一,它需要实时求解两点边值问题(BVP),同时考虑车辆的非完整约束和非凸环境中的障碍。德国Robert Bosch公司Holger Banzhaf介绍了混合曲率(HCR)和连续曲率(CCR)转向:两种新型的转向功能,用于计算类汽车机器人两点BVP的曲率连续解[17]。
西安理工大学Bai Li提出一种多车协同车道变换运动规划的逐步计算框架,通过连接的自动控制系统,协调车辆通信和自动车辆的控制,以改善交通系统的移动性、安全性和可持续性[18]。
北京大学Xu He通过学习自然驾驶数据,提出一种人性化的轨迹规划方法。通过参考人类驾驶员的车道变换决策,不仅包括舒适性、效率和安全性,还包括车道激励,从而制定成本函数。并使用北京高速路上人类驾驶员的自然数据开发数据集[19]。
瑞典林科斯大学Kristoffer Bergman提出一种使用数值最优控制技术计算非凸环境中运动规划问题的局部解的方法。作者将顺序二次规划(SQP)方法与同伦方法相结合,逐步将问题从松弛的方法转换为原始问题,可以计算出与运动规划问题相关的局部最优解[20]。
测距是智能车辆设计中的一项重要任务,智能交通系统中有多种传感器,因此,需要多个测距传感器融合方法。量化车辆中使用的传感器的不确定性对于利用有效的融合系统是必不可少的。埃及艾因·夏姆斯大学Mostafa Osman介绍了一种在线自适应协方差估计方法,并选择了三种情景进行了实验,在自适应协方差和基于真实方差的几个常数协方差之间进行了比较研究。从平移和方位均值误差的四个评估指标来看,实验结果表明该方法具有高性能[21]。
高级驾驶辅助系统是辅助驾驶人进行汽车驾驶的系统,可增加车辆和道路的安全性。利用安装于车上的各种感应器,在第一时间收集车内外的环境状况信息,进行静、动态物体的辨识、侦测追踪等处理,在最短时间内提醒驾驶人注意可能发生的情况。
车辆预警系统对于最大限度地避免碰撞非常重要。日本电装公司Ikuro Sato研究一种可以使用单眼前视摄像机预测真实的自我车辆运动的方法,便于预警。基于观察到车辆的几个未来位置的非确定性,利用机器学习模拟人类驾驶行为,从数据预测多个可能的路径。KITTI数据集的实验表明,该方法可满足4秒的早期预警[22]。
对于无人驾驶汽车来讲,雨天会给视觉识别带来很大的麻烦。德国图宾根大学Alexander von Bernuth提出了一种新的方法来渲染这些雨滴,使用连续最近邻R*树搜索算法。3D场景是由摄像头生成的立体图像,雨滴下落过程遵循物理定律,所得到的图像可用于扩展机器学习的训练数据集,而不必强制获得新的真实图像[23]。
法国高等科技学院Moad Kissai研究了控制集成底盘系统对车辆行为的影响。固定的模型预测控制用于轨迹跟踪,而可调谐车辆运动控制用于提供不同的运动感知。结果表明,可以以不同的方式遵循特定的轨迹[24]。
对周围交通参与者的准确跟踪在自动驾驶中起着重要作用。加州大学伯克利分校Jiachen Li提出一种基于改进混合粒子滤波器的通用车辆跟踪框架,可使跟踪目标的数量适应于实时观测,并在统一的架构中同时跟踪传感器范围内的所有车辆,而无需明确的数据关联[25]。
在高速公路上,人类驾驶员不断做出适应驾驶行为的决定。在自动驾驶车辆上,系统应做出这个决定。德国宝马集团Cristina Menendez-Romero提出一种自动适应驾驶行为,整合其他车辆合并意图的方法。该方法的灵活性能将其集成到不同系统中,能够向其他车辆提供礼让行为,从而提高集体的舒适度和安全性[26]。
自动驾驶汽车的基础是精准导航,地图构建与定位系统是定位技术、地理信息、电子地图、地图匹配、路径规划和路径跟踪的综合体。
西安交通大学Yu Chen提出一种新的环路硬件仿真平台(HiL)。平台实现了多种功能:可以构建和模拟运动车辆模型;对场景感知、路径规划、决策和车辆控制算法进行闭环评估,还具有多智能体交互系统;实现控制和决策算法从虚拟环境到自动驾驶汽车的快速迁移[27]。
德国歌德大学Nolang Fanani提出一种用于从安装在车辆上的单目摄像头中检测独立移动物体(IMO)的方法。该方法采用一个基于CNN的分类器,来生成IMO备选补丁,通过这些补丁中轨迹上的关键点来检测几何标准。然后使用IMO备选补丁的运动信息和基于外观的信息获得运动标签[28]。
为了解决智能车辆“我在哪里?”和“我身边有什么”的问题,大连理工大学Linhui Li提出一种密集的三维同步定位与地图构建(SLAM)系统来评估智能车辆的姿态并构建密集的3D语义地图[29]。
日本金泽大学Keisuke Yoneda介绍了基于76 GHz MWR(毫米波雷达)在下雪时的自动驾驶自定位方法。作者通过对误差传播的不确定性进行建模,开发了基于MWR的地图生成和实时定位方法[30]。
基于立体相机的重建存在两个特殊的挑战。一是以有效方式呈现和压缩数据的需要,二是尽可能多地保留可用信息,且确保足够的准确性。为克服这些问题,慧拓智能机器有限公司Lei Fan提出一种新的3D表示方法,从深度辅助图像分割中提取平面度,然后直接将这些深度平面投影到3D世界中[31]。
美国德克萨斯A&M大学Swaminathan Gopalswa⁃my提出一种新的自动驾驶方法,该方法将重新平衡传统汽车制造商,私人基础设施运营商和第三方运营商之间的自动驾驶相关的责任,且提出了一个基于贝叶斯网络模型的框架,用于评估其风险收益[32]。
目前大多数车辆内的ADAS都是独立工作的,这意味着它们彼此之间几乎不交换信息,只有把多个传感器信息融合起来,才是实现自动驾驶的关键。
清华大学Chijung Cheng提出一种用于非信号交叉口避碰的速度引导驱动模型。基于重复博弈论,利润函数包括安全性、快速性,控制指标被重新定义。采用帕累托最优性来获得最大化利润的策略[33]。
韩国首尔汉阳大学Jaekyum Kim介绍了一种新的相机和激光雷达传感器融合的深度学习架构。方案使用RGB相机图像以及通过将3D激光雷达点云投影到相机图像平面中而生成的深度、高度和强度图像来执行2D对象检测[34]。
英国克兰菲尔德大学Yang Xing提出一种端到端驾驶相关的任务识别系统。识别七种常见的驾驶活动,即正常驾驶、右镜检查、后视镜检查、左镜检查、使用车载视频设备、发短信和接听移动电话[35]。
宝马集团Koyel Banerjee改进了Levinson和Thrun的激光雷达和相机融合方法。依靠强度不连续性以及边缘图像的侵蚀和膨胀来增强对阴影和视觉图案的鲁棒性,作者还使用无梯度优化器进行外部校准。该方法能在汽车的计算机上实时运行[36]。
英国伦敦蓝色视觉实验室Suraj M S准确预测城市密集环境中车辆的未来轨迹。作者为大批汽车配备了摄像头,并进行了城市级规模的运动布局,精确重建了超过1000小时驾驶轨迹。通过将观察到的汽车的当前位置与该区域中先前运动的大数据集相关联,可对其未来位置做出预测[37]。
智能汽车的决策和控制分为行为决策与控制执行两方面。行为决策是依据环境感知和导航子系统输出信息,通过特定的约束条件,在起止点多条可选安全路径中选取一条最优路径作为车辆行驶轨迹。控制执行系统包括车辆的纵向控制和横向控制。
奥地利虚拟车辆研究中心Markus Schratter提出一种将事故数据直接用于制定自动紧急制动系统的制动策略。未来车辆将配备相关技术,可记录危急情况的详细信息。如果有足够的记录数据,则可使用此类数据来改进主动安全系统[38]。
目前自动驾驶在不确定和交互式环境下的各种不同场景的决策仍然存在挑战。加州大学伯克利分校Jianyu Chen提出连续决策(CDM)框架,该框架包含最大交互防御策略(MIDP),其计算在保证安全的同时与随机移动障碍交互的最佳动作[39]。
新加坡高性能计算研究所Bo Yang构建了无人驾驶出租车智能操纵协议,目的是优化出租车系统的效率。根据通勤者的来源和目的地分布的历史模式,为任何地点的出租车提供最佳的选择[40]。
斯坦福大学Xiaobai Ma为提高效率并减少智能汽车的故障,开发了考虑到环境干扰的学习方法。作者研究了两种不同的算法,鲁棒对抗强化学习算法和神经虚拟自我算法,并比较自动驾驶场景的表现[41]。
韩国首尔汉阳大学Seong Hyeon Park提出一种基于深度学习的车辆轨迹预测技术,可实时生成周围车辆的未来轨迹序列。作者采用编码器-解码器架构,利用长时记忆编码(LSTM)对过去轨迹中的模式进行分析,并利用基于LSTM的解码器生成未来的轨迹序列[42]。
随着摄像机在智能车辆中的普遍应用,视觉位置识别已成为智能车辆定位的主要问题。中国科学院大学Jianliang Zhu将图像放在预先训练好的网络模型中得到自动学习的图像描述符,并通过融合和二值化对其进行优化,然后根据位置序列的汉明距离给出位置识别的相似性结果[43]。
另外大会选出Workshop论文共50篇,开展了19个专题研讨会和教程报告。场景理解、自动驾驶车辆的决策与控制、车载传感器、多传感器融合、目标跟踪等专题研讨受到与会人员广泛关注,这或许正是智能汽车未来急需突破的几个方向。
IEEE IV是国际智能汽车领域的顶级大会,其内容理所当然地反映着智能汽车理论研究的前沿、热点和技术应用的最新进展和趋势。
智能汽车已经成为世界车辆工程领域的研究热点和汽车工业增长的新动力,许多发达国家都将其纳入到重点发展的技术领域。本届国际智能车大会汇集了来自全球30多个国家的数百所著名机构的近千名顶尖专家学者,围绕智能汽车技术的最新研究成果开展学术交流,展示最新产业进展,全方位推进国际智能车和网联驾驶学术与产业的交流合作。参会人员和收录论文数量均创新高,会议围绕智能汽车的感知识别、虚拟测试、ADAS、导航定位、传感器与数据融合、决策控制、场景理解、人机交互等多个相关主题进行深入交流,反映了当前智能汽车领域产业研发和学术研究的蓬勃发展。
但同时多位与会专家表示,不仅仅是技术层面(安全性、可靠性),还有交通基础设施、法律、伦理、数据隐私等各个层面的因素,距离实现真正的无人驾驶还有很长的路要走。
本届会议上,笔者了解到众多车企和科技公司开展合作成为研发趋势,如宝马、Intel和Mobileye三方的合作;Waymo(谷歌自动驾驶项目独立子公司)和本田的合作;国内百度Apollo产业生态等。
自动驾驶技术深度介入传统汽车的全球化产业链,进一步拉伸了产业链的纵深,任何一家企业都难以凭一己之力完成技术跃迁。自动驾驶是一次颠覆性技术的产业整合,研发难度可想而知,因此,合作亦成为业内共识。另外,自动驾驶是以人工智能驱动,而其中最重要的养料是数据。考虑到自动驾驶的安全性,理论上需要比智能手机更流畅的数据共享,所以,开放合作在很大程度上可以通过人工智能的收益递增原则获得规模效应[44]。
此外,业内玩家选择合作,还有商业上的现实原因。自动驾驶无法在短期能迎来利润回报,合作共担无疑是分担研发成本、缩短研发时间、降低投资风险的最佳选择。
作为下一个可预见的风口,无人驾驶的前景是诱人的。据统计,2014年至今,全球范围内与自动驾驶技术相关的投资、并购多达200多项,涉及总金额高达1,000亿美元[45]。
在与本届IEEE IV同期举办的“智能汽车跨界融合高峰论坛”上,笔者了解到:智能驾驶领域已逐步形成“主机厂+供应商+自动驾驶技术+交通服务+商用运营”的新行业格局;场景数据是智能驾驶企业制胜根本;多传感器融合技术成为业界共识;随着传感器配置的趋同化,未来的竞争更多聚焦在决策环节,决策算法将成为核心;“单车智能+网联智能”实现终极自动驾驶;自动驾驶创业上游化,单点技术仍有较大的市场机会。行业在风口,但也处处存在泡沫。
虽然实现真正的无人驾驶还任重道远,但与会专家们认为,自动驾驶会在矿区物流、无人驾驶清洁环卫、快递、公共交通等多个垂直领域率先落地。如慧拓智能CSO王健提出矿山无人化机械将是自动驾驶在矿区落地的一个最佳应用场景。Autowise.ai联合创始人叶青认为无人驾驶技术在环卫领域率先“跑起来”,将极大地惠及社会服务性工作者。清华大学邓志东教授认为从AGV(Automated Guided Vehicle)到室外无人货运,最后一公里的无人配送机器人与无人长途货运卡车,有望成为最早落地的自动驾驶汽车产品。此外,本届会议同期举办的IEEE IV 2018产业展上,美团展示了其在即时配送上的研发成果及应用,体现了自动驾驶在快递配送上的落地场景。最后,无人驾驶公交、出租车和共享出行车辆也是本届会议上业内专家提出的自动驾驶将率先落地的几个应用场景之一。
从本届大会论文收录情况来看,来自中国的研究论文排名第一。中国近年来在智能汽车领域掀起了研发热潮,很多研究成果与国外相比差距不大、甚至领先。
本届大会期间成立了国际平行驾驶联盟(iPDA),平行驾驶的创新理念是由国内研究人员率先提出,平行驾驶的概念源于中科院自动化所王飞跃教授提出的基于ACP方法的“平行智能”理论。其次,无人智能驾驶场景,将在中国落地。王飞跃教授认为:“以挖掘、装载和运输为主的采矿作业自动化,是无人车技术最合适、最靠谱的一个应用领域”。且通过会议了解到,慧拓智能的矿山场景应用将在2019年下半年成为现实。此外,在技术上,如对复杂交通环境的感知、行驶目标物的识别、驾驶员特性的建模、复杂的车辆动力性建模、车辆控制算法等,国内都已经做了很深入的研究,均取得了阶段性成果。
另一方面,国内智能汽车产业发展面临诸多挑战。其中最大的挑战是如何促进自主品牌企业的快速、高质量的发展。面对高新技术领域的技术封锁,国内企业必须努力夯实整车技术(尤其是智能驾驶技术)的集成能力,不仅要跟国外供应商合作,还需要加强国内研发机构的合作,培育可长线合作的自主品牌供应商。此外,智能汽车产业链不完整、技术标准体系滞后以及技术积累不足等,都将成为国内智能汽车产业发展的制约因素。
本文从智能汽车领域的重要国际会议IEEE IV 2018角度,分析了当前智能汽车研发的热点和趋势,认为当前国际上智能汽车领域的研发,无论是理论研究,还是技术开发与应用都已取得了非常多的成果,而感知识别、虚拟测试、导航定位、传感器与数据融合、决策控制等将是未来智能汽车研发的主要方向。
另外,面对自动驾驶领域的蓬勃发展态势,本届大会程序主席郑南宁院士表示,包括政府、学界、公众和投资者,都要保持理性和冷静,要脚踏实地地开展基础研究和应用实践。