王庆军
(中北大学 信息与通信工程学院,山西 太原 030051)
道路的识别是智能车辆视觉导航的关键技术,因其较大的复杂性和挑战性而备受关注。基于视觉的导航技术中,主要分为采用多目视觉技术和单目视觉技术两种方式。多目视觉中存在一个无法回避的问题就是图像配准的实时性问题。
道路的边缘检测中,最常见的就是直线。而Hough 变换是图像领域内一种常用的提取直线的方法,因此在实验中我们选择了Hough 变换作为提取直线道路的工具[2-5]。
Hough 变换是Hough 于1962 年提出的一种形状匹配技术,运用两个坐标之间的变换来检测平面内部的直线和规则的曲线。这种变换具有将变换空间所希望的边缘组凝聚在一起形成峰点的特性。这样就把原始图像中给定形状曲线或直线的检测问题变成寻找变换空间中的峰点问题,也即把检测整体特性变成检测局部特性的问题。设在原始图像空间的一条直线可以表示为:y=kx+b,其中k为斜率,b为截距。在同一直线上所有的点有相同的参数(k,b),在以(k,b)为变量的参数空间中,即b=-kx+y,同一直线上的点将相交于一点(k,b),通过(k,b)就可以确定直线方程,这就是Hough 变换方法的指导思想。为了避免斜率k为∞的情况,把直线写成xcosθ+ysinθ=ρ的形式,相应的参数空间就为(ρ,θ),其中ρ为原点到直线的距离,θ为直线与x 轴正方向的夹角。
经过Hough 变换,空间中的一点就可以变换为参数空间中的一条正弦曲线,因为两点可以确定一条直线,所以参数空间中任意两条正弦曲线的交点(ρ',θ')就可以表示一条直线。
以上的算法实现的是单条直线引导线的识别。但是在室外公路中通常是双引导线的识别,因此对Hough 变换做了扩展。同时Hough 变换识别双引导线算法也可用于识别圆和椭圆的情况:
(1)双引导线的识别
在以上的算法中,我们找出的是整幅图像中最长的一条直线,即单条直线引导线的识别。同样,对于两条引导线的情况,这两条线即为整幅图像中最长的两条直线。所以,算法中只要统计出变换域中两个最大值点就找到了两条引导线。
(2)圆和椭圆的识别
椭圆的检测算法可以仿照圆的算法进行。设椭圆方程为:
对于圆或者椭圆的求解,用Hough 变换非常复杂,实时性很难达到要求,因此具有一定的局限性。对于非直线道路边缘的提取,实验考虑了其他的提取方法。
边缘检测是一种提取道路标志线的方法。对于道路线来说,边缘就是指其与像素灰度有阶跃变化或屋顶状变化的那些像素的集合,它存在于目标与背景、目标与目标、区域与区域之间。经典的边缘检测方法是对原始图像按像素的某个邻域构造边缘检测算子。这里以灰度图像作为区域特征进行讨论,而至于其它区域的特征(例如纹理)进行边界提取,其基本原理是相同的,不同的是特征的数目变多了,增加了问题的复杂性。边缘提取在应用中多用于非结构型的道路[1],在曲率非常复杂的道路中进行边缘的拟合。因此,边缘提取对于抗干扰性的能力要比较强。
边界提取的方法多种多样,比较常用的方法可以归纳为:微分方法、拟合方法、统计方法、混合方法以及小波变换方法等。而国外的学者在将边缘检测算法用于导航图像处理时,多是遥感图像。正是由于论文中的逆投影变换的特点,于是启发了在本实验中用边缘算子提取道路边缘的想法[6]。
(1)微分算子法
对于一类图像,在特征区域边界处,灰度要发生较大的变化,如果以灰度作为边界检测的依据,可以运用求微分的方法提取边界,微分的输出值作为该边界的强度。在此基础上,可以根据某一阈值确定其是否为边界点,将边界点连接起来就形成了边界。
偏导数算子:
对于数字图像,应用差分代替相应的微分。一阶差分为:
(2)梯度模算子
我们知道,函数的梯度G 给出了方向导数取最大值的方向:
而这个方向的方向导数等于梯度的模:
式中,G 表示梯度模算子。G[f(x,y)]不依赖于坐标轴的取向,即f(x,y)在点(i,j)处任意两个垂直方向上的变化率的平方和都相同,这表明它具有各向同性,显然它是位移不变的。因此,可以把梯度模作为边界检测算子,梯度模给出了边界强度,梯度的指向给出了边界的方向。
对于数字图像,梯度模及方向为:
我们还可以用Roberts 梯度:
实际应用中常常使用差分近似图象函数导数的算子,常用的几类算子有:
(1)Roberts算子:
Roberts算子是较为古老的算子之一。由于它只是使用了当前像素的2×2 邻域,所以计算非常简单。它的卷积掩模是:
因此边缘的幅值计算如下:
Roberts算子的主要缺点就是其对噪声的高度敏感性,原因在于仅仅只是使用了少数的几个像素来近似梯度。
(2)Laplace算子
Laplace算子▽2是近似给出梯度幅值的二阶导数的常用方法。其中▽2定义为:
有的时候,我们只是对边缘感兴趣而不管它的方向,这时我们就可以使用被称为Laplacian的线性微分算子▽2。Laplacian是各向同性的,因此对图像中的旋转具有不变性。它在数字图像中用卷积和来近似。通常是使用3×3的掩模。对于4-邻接和8-邻接的邻域分别定义为:
有时也使用强调中心像素或其邻接性的Laplacian算子。这种近似不再具有旋转不变性:
式中Laplace算子有一个缺点就是它对图像中的某些边缘会产生双重响应。
视觉导航虽然有显著的优点,但是存在的问题也非常明显,这个时候就需要结合众多传感器的优势条件共同进行环境的识别。例如实验用的智能车辆上已经安装了声纳、雷达、红外、激光测距扫描仪等传感器,对多个传感器采集得到的数据进行数据图像的融合可以发挥多个传感器的优势,能够提高系统的鲁棒性。随着传感器技术以及处理器技术的发展,图像融合技术也会运用得越来越广泛,视觉导航也将得到更多的数据信息从而为导航决策服务。
[1]马颂德.计算机视觉[M].北京:科学出版社,1998.
[2]Axel Gern,Uwe Franke,Paul Levi.Advanced Lane Recognition – Fusing Vision and Radar[J].IEEE Intelligent Vehicles Symposium,2000,10:3-5.
[3]Christian Altmayer.Enhancing the Integrity of Integrated GPS/INS Systems by Cycle Slip Detection and Correction[J].IEEE Intelligent Vehicles Symposium,2000,10:3-5.
[4]Andrew J.Davision.Real-Time Simultaneous Localisation and Mapping with a Single Camera[G].Proceedings of the Ninth IEEE International Conference on Computer Vision,2003.
[5]David Schreiber,Bram Alefs,Markus Clabian.Single Camera Lane Detection and Tracking[J].IEEE Conferences on Intelligent Transportation Systems,2005,9:13-16.
[6]冈萨雷斯.数字图像处理(Matlab 版)[M].北京:电子工业出版社,2004.