史晨阳,林燕丹
(1.复旦大学信息科学与工程学院,上海 200433;2.复旦大学电光源研究所,上海 200433)
无人驾驶车辆导航因为在真实环境中需要考虑各种类型的道路场景,特别是在没有位置信息且使用感知传感器时,所以具有很强的挑战性。最重要的是,感应系统需要实时检测道路上的不同情况,比如路面(如车道和障碍物)和道路使用者(例如行人、汽车、摩托车和自行车)。一方面,道路表面探测的导航系统应处理不同的地形和道路状况(例如结构和非结构的道路);另一方面,道路使用者识别的目的是避免发生碰撞严重事故。
路面检测的复杂性主要是由以下因素造成的:①结构化道路和非结构化道路交替出现(如图1所示);②路面均匀性与照给定条件的有区别;③由于天气原因,道路的外形可能会经常发生变化;④道路的曲率并不总是像高速公路那样低[1]。避碰系统(collision avoidance system,CAS)至少包括以下三个主要部分(如图2所示):对象检测;决策;驱动(制动或转向)[2]。
图1 道路场景描述Fig.1 Scene description of road
图2 控制体系结构的阶段Fig.2 Stages of the control architecture
一种实时检测系统涉及一种或多种传感器融合后获得的环境信息的感知任务。不同的功能需要不同的传感器,例如激光雷达(光检测和测距)、声波雷达用于测距、相机、红外相机和激光都是进行机动识别和处理。要实现对特性、模型和通用体系结构的估计,需要提出许多新技术。
在接下来的部分中,将介绍道路检测传感器和相关算法的设计,并对文献中的设计结果进行综述,并指出了今后的研究方向。本文的结构根据不同的检测对象分为两个主要部分。第一部分是路面检测系统,第二部分是道路用户检测系统。最后,根据目前的研究现状,提出了无人驾驶车辆道路检测的展望和未来发展方向。
在过去十年研究中,研究人员提出了AWSTM、Auto Vue、RALPH[3-5]、AURORA[6]、SCAR[7]、GOLD[8,9]、LOIS[10]等几种有效的车道检测系统。
最近,一些研究人员将注意力集中在高速公路和其他结构化道路的车道检测上[11-13]。Wang等[14]构建了一个基于Catmull-Rom样条的车道模型来描述视角对平行线的影响。Jung和Kelber[15]提出了一种用于车道检测的线性抛物模型,在该模型中,近视场采用线性模型,远视场采用二次模型。该方法对有边缘的道路进行了很好的描述,其使用的主要限制是由于摄像头前的车辆对车道标记造成明显的遮挡。为了解决这一问题,Cheng等[13]采用了一种基于颜色信息的方法,在有遮挡的情况下,从尺寸、形状和运动面来识别真实的车道标记。此外,Zhou等[16]引入了一种可变形的车道边界投影模板模型,将车道检测问题表述为后验估计的最大化问题。该模型的参数包括车辆在巷道内的位置、车头方向和巷道局部结构。在文献[17]中,可调滤波器采用鲁棒性和精确的车道检测。带有过滤器的该方法提供了一种有效的方法,用于检测在不同的照明和道路条件下的圆形反射器标记、固线标记和分段线标记。对于更具挑战性的结构化道路,Kim[18]提出了一种基于随机样本一致性(RANSAC)的鲁棒实时车道检测算法,并将其与一种基于粒子滤波的跟踪算法结合使用概率分组框架。Gopalan等[19]还提出了一种基于学习的方法来解决一些具有挑战性的问题,比如由于遮挡、阴影和场景照明条件的改变而导致的车道标记的外观变化。最近,一些研究人员也将注意力集中在保持线路的系统上[20]。激光传感器利用反射强度信息进行车道检测[21]。但是单纯基于反射的车道检测是不够的,需要提供视觉信息[22]。已经有了基于激光扫描的系统,用于车道检测的精度和可靠性都很高[23-25]。激光扫描仪更适合使用距离信息检测路面[26]。
虽然上述算法对结构化道路足够有效,但在车道标记并不总是存在的,且在复杂的现实城市道路环境中,识别效果不能让人满意。最近,研究的重点已经转移到非结构化道路的检测,即次要道路及越野情况。在没有车道标记的情况下,主要使用颜色和纹理特征辅助识别。He等[27]提出两个步骤。首先估计边界,然后根据全彩色图像检测道路区域。Tarel和Bigorgne[28]也提出一种区域生长的分割方法,并对图像进行专门的预表达,并通过辐射校正对该方法进行优化。然而,这是一个离线算法,不能用于无人驾驶。Alvarez和Lopez[29]结合阴影不变性特征空间和基于模型的分类器,建立该在线构建模型,以提高算法对当前光照条件和现场其他车辆的适应性。立体视觉在研究中被频繁应用[30,31]。Caraffi等[30]提出了一种复杂的三目视觉系统用于障碍物和路径检测,其中立体系统用于沥青估计和障碍物检测,单目视觉系统用于检测可移动路径。Wedel等[31]利用参数B样条曲线为路面建模,并利用立体测量来估计路面参数。Fang等[32]也使用了多视角相机,但目标是建立一个精确的地图,而不是实时的道路检测。Danescu和Nedevschi[33]利用来自立体视觉和灰度图像的信息,通过粒子滤波框架检测和跟踪道路上的车道,获取场景的深度信息,提高检测道路上障碍物的感应数据。绝大多数基于视觉的道路检测方法都是复杂且耗时的,因为这些方法必须克服亮度问题,这是机器视觉中的难题。虽然立体视觉提供了一些帮助,但较短的有效距离限制了它的适用性。
除了视觉传感器,主动传感器也被越来越多地使用,如毫米波雷达传感器[34]和激光扫描仪[35]。Fardi等[36]通过激光的融合反射率信息检测道路边界。Wijesoma等[37]提出了另一种单扫描系统,在该系统中引入了一种新的基于连续三次激光数据等角分离的激光特征。Zhao等[38]提出了一种基于激光扫描的方法来感知一个巨大的动态城市环境,它强调解决同时定位和映射问题而不是道路检测。由于传感器检测方法的特点,大多数基于传感器的检测方法主要集中在国道或越野条件下的道路提取和边界检测;对于车道标记,即使借助反射特征评价,主动传感器也很难做到比视觉更好。此外,单行激光扫描仪的一帧数据通常不足以代表车辆前方的大部分区域。因此,一些研究人员将GPS与GIS结合起来提供补充信息。然而,GPS的分辨率有限。此外,GISs经常无法使用,特别是在发展中国家,或者更新不够频繁。由于所有的单级传感器方法都有局限性,因此也提出了基于多传感器融合的道路检测方法[39,40]。文献[39]中使用了光检测和测距(激光雷达)系统、摄像机和GPS。Thrun等[40]添加了GIS信息,但是由于GPS在很多地方都是不可用的,因此问题仍然存在。
根据给定的信息,道路和车道检测系统处理的都是结构化的道路,即有行车线标记的道路;对于无结构的道路,例如没有车道标志的道路。上述道路状况经常出现在我们周围,是自动驾驶的必需满足的要求。
对象检测是指分析一个或多个传感器获得的环境信息的感知任务。虽然目标检测是通过测距传感器进行的,例如激光雷达或雷达,但是计算机视觉研究者在过去几年中对解决这一阶段产生了广泛的兴趣。这个阶段的复杂性取决于具体的交通情况。最后,一个执行系统根据前一阶段生成的目标命令进行调整,并将这些命令转换为相应执行器所需的低级控制信号:油门;制动器;转向;产生的信号必须采取相应的动作避免碰撞,即加速、断裂或转向。
图3 通过制动避免行人碰撞Fig.3 Pedestrian collision avoidance by tracking
图4 行人避碰阶段[2]Fig.4 Pedestrian collisiun cwoidance stages
一些研究人员将雷达信息和相应的融合结构结合起来进行检测。Sole等[41]使用视觉验证方法来验证雷达候选是否为真实目标。Bombini等[42], Haselhoff等[43], Bertozzi等[44]使用雷达信息,在决定基于视觉的探测区域之前使用雷达信息。对于行人检测,Milch等[45]在不处理雷达信息不确定性的情况下进行目标水平融合。Dalal和Triggs[46]对行人检测的图像特征进行了近几十年的研究,重点研究了形状、轮廓、颜色、纹理等的表示。Ahonen等[47]和Wu等[48]利用纹理信息对目标进行建模。
车辆上的传感器系统需要预测车到行人的距离和TTC(碰撞时间,time-to-escape)。相机是最常用的传感器。在过去的十年中,大量基于视觉的行人检测系统被提出。一些引人注目的调查已经被提出,其中一些成果已经发表[49,50]。文献[51-53]总结了大部分关于人体运动的工作,主要集中在智能车辆领域的行人保护应用,包括被动和主动安全技术。
无人飞行器[54]首次提出自动避碰,自20世纪90年代早期起就已经在机载国内运输飞机上使用[55]。虽然自主导航与智能车辆领域的自主导航有很大的不同,但有几个方面可以得到有效的扩展。例如,文献[56]中提出了一种使用冲突概率的超车控制方法,该方法已广泛应用于航空领域[57]。其他的概念(如TTC)和对无人机深入研究的风险评估,也适用于智能车辆。
行人检测使用文献[58,59]中描述的系统进行(见图5)。非密集三维地图使用稳健相关过程进行计算,减少匹配误差[60]。使用所谓的虚拟视差图动态估计相机的俯仰角,它比其他的表现形式(如v视差图或yOz平面),提供更好的性能。通过节距补偿可以实现两个主要的优点。首先,它提高了车辆对行人事故的TTC估计的准确性。其次,它改善了道路点和障碍点之间的分离,降低了假阳性和假阴性检出率。
图5 基于立体视觉的行人检测体系结构概述Fig.5 Overview of the stereo-vision-based pedestrian detection architecture
目前,我们正在观察以前孤立的驾驶员辅助功能合并在一起的趋势,以实现对纵向和横向的更复杂的辅助,驱动支持。在未来几轮高端汽车的创新周期中,部分自主驾驶有望成为现实,即便是高度自动化的驾驶也不再是遥不可及的。为了实现自动驾驶,最重要的是传感系统需要实时检测道路上的不同情况,如路面和道路使用者。本文对道路状况的检测进行了大量的研究。未来,结合各种传感器的特点,基于道路照明提高道路识别效率将是汽车驾驶的发展趋势。完善道路各参与部分之间的沟通,实现道路信息的互动。最后,完全自主驾驶将成为我们生活的一部分,世界的交通将变得更加智能化、信息化和安全。