康珮珮, 于凤芹, 陈 莹
(江南大学 物联网工程学院,江苏 无锡 214122)
传统的车辆检测方法,如感应线圈检测、红外检测、雷达检测等,因成本较高、维护不便等问题已不能适应当前智能交通的发展。基于视频图像的车辆检测方法[1~5]已成为当今的研究热点。
在基于视频图像的车辆检测方法中,Viola P和Jones M[6]提出的基于特征和级联Adaboost分类器的检测框架应用广泛。在特征方面,文献[2]提取Haar-like特征表示车辆图像,Haar-like特征较为简单但对车辆的描述性较差,导致检测率较低。为提高准确率,文献[3]提取了Haar-like和方向梯度直方图(histogram of oriented gradient,HOG)两种特征描述车辆,取得了较好的检测效果。文献[4]提取了多尺度局部二值模式(local binary pattern,LBP)特征,与单一尺度LBP特征相比包含更多的有用信息,检测率有所提高。综上,多尺度特征包含更多有用信息,多种特征对图像的描述性更好。在分类器方面,文献[2,3]构建了Discrete Adaboost分类器进行车辆检测,但Discrete Adaboost分类器对非典型的正样本权值调整过高导致分类器效率下降。文献[4]使用的Gentle Adaboost分类器则通过修改错误样本权重调整的方法来提高分类器效率,使得训练和检测效率均高于Discrete Adaboost。为了进一步提高检测率和检测速度,文献[2~4]使用了级联形式Adaboost分类器。文献[7]的嵌套级联形式Adaboost分类器因相邻层间有关联使得分类器效率更高。
为快速且准确地进行车辆检测,本文提出了一种基于多尺度特征和嵌套级联Gentle Adaboost分类器的车辆检测算法。首先为了快速得到描述性更好的特征,分别使用积分直方图和积分图像加速提取多尺度HOG和多尺度多块局部二进制(multi-block LBP,MB-LBP)特征;然后分别使用生成分类器和多分支树构建基于两种特征的两种弱分类器,并组合成Gentle Adaboost分类器;最后对Gentle Adaboost分类器采用嵌套级联结构,在级联的前几层使用基于HOG特征的弱分类器排除大部分背景区域,后几层使用基于MB-LBP特征的弱分类器排除与车辆相似区域。仿真结果表明:该算法的检测速度,检测精度和召回率均优于其他车辆检测算法。
图像中的有用信息往往分布在不同尺度,单一尺度下提取的特征包含的有用信息相对较少,因此本文在多个尺度下提取HOG特征和MB-LBP特征,使提取的特征更好地描述图像。但是多尺度的引入增加了计算复杂度,本文分别使用积分直方图和积分图像对两种特征的提取过程进行加速。
HOG是一种图像特征描述算子[8],用描述目标的轮廓信息。本文在4个尺度下提取梯度方向直方图。用不同尺寸的窗口遍历图像,将图像分割为若干个有重叠的不同尺寸图像块(block),block的尺寸有4种:2×2,4×4,8×8,16×16;统计每个block的梯度方向直方图,每个直方图 可定义为hi(xi,yi,si),其中(xi,yi)为直方图i的空间位置,si为尺度,取值集合为{2,4,8,16},si=2时,block的尺寸即为2×2;将不同尺寸下block的梯度方向直方图组合在一起,即得到了多尺度HOG特征。
为了提高多尺度HOG特征的提取速度,本文首先计算积分直方图[9],并将其作为输入图像的中间表示,然后使用积分直方图快速计算每个block的HOG特征。灰度图像的积分直方图定义为
H(x,y,b)=H(x-1,y,b)+H(x,y-1,b)-
H(x-1,y-1,b)+Q(f(x,y))
(1)
(2)
式中b=1,2,…,9,为梯度方向二进制(bin)的值;(x,y)为灰度图像中像素点坐标;Q(x,y)为像素点(x,y)所对应的梯度方向,若梯度方向为b,则Q(f(x,y))的值等于像素点的梯度幅值;否则,等于0。获得积分直方图后,利用式(3)得到block区域T(x-,y-,x+,y+)的梯度方向直方图
h(T,b)=H(x+,y+,b)-H(x-,y+,b)-
H(x+,y-,b)+H(x-,y-,b)
(3)
式中 (x-,y-),(x+,y+)分别为T的左上角和右下角像素点的坐标。与传统直方图的计算不同,积分直方图未重复计算每个可能区域的直方图,大幅提高了计算速度。在计算一个block的梯度方向直方图时,只需4×9个像素点,进行3×9次加减法运算,时间复杂度为O(1)。
MB-LBP[10]使用LBP算子对矩形区域编码,用于描述目标的纹理信息。MB-LBP通过比较中心子块的平均强度gc和周围8个矩形邻域的平均强度{g1,…,gn}得到,其值定义为
(4)
为了快速计算多尺度MB-LBP特征,本文使用积分图像计算每个block的MB-LBP特征。积分图像中的任意一点(x,y)的值等于从图像的左上角到该点所构成的矩形区域内所有点的灰度值之和,即
(5)
任意子区域R中所有像素点的灰度值之和可通过式(6)得到
ii(R)=I(x+,y+)-I(x-,y+)-I(x+,y-)+
I(x-,y-)
(6)
式中 (x-,y-),(x+,y+)分别为R的左上角和右下角像素点的坐标。通过引入积分图像,在求block的MB-LBP特征时,只需进行3×9次加减法和9次除法运算,即可得到block中9个子区域的平均像素值,进行比较即可得到MB-LBP特征,大幅提高了计算速度。
Gentle Adaboost是从训练集中训练不同的弱分类器,然后集合弱分类器,构成一个更强的最终分类器(强分类器)。为提高Gentle Adaboost算法的性能,本文使用生成分类器和多分支树定义了2种弱分类器,分别对应2种特征:多尺度HOG特征和多尺度MB-LBP特征。
2.1.1 基于多尺度HOG特征的弱分类器
对于HOG特征空间,本文构建了一个基于车辆模型的生成分类器[3]。使用训练集中正样本的均值直方图作为模型
(7)
式中P为训练集中正样本的个数。生成分类器用于计算输入图像的直方图hi与模型mi之间的距离。弱分类器gHOG定义为
(8)
式中α1,α2为[-1,+1]之间的小数,代表分类结果的置信度,理想情况下|α1|=|α2|=1表示分类完全正确,+1表示车辆,-1表示非车辆;d(hi,mi)为直方图hi与模型mi之间的巴氏距离;θi为对于特征i在巴氏距离上的最优阈值。
2.1.2 基于多尺度MB-LBP特征的弱分类器
由MB-LBP提取过程可知,其特征值只是表示二值字符串的一个符号,即其不具有可度量性。因此,针对MB-LBP特征空间,本文使用多分枝回归树设计弱分类器[10]。多分枝树共有256个分枝,每一个分枝对应一个特定的离散值(即MB-LBP特征值)。第j个MB-LBP特征对应的弱分类器可表示为
(9)
式中k和al为通过学习得到的回归参数;fkj为MB-LBP特征向量fj的第k个特征值;al,l=0,…,255为分类结果的置信度。每个弱分类器对应一个单一的特征。在检测阶段,对于一个特定的MB-LBP特征,可以通过多分枝树快速得到相应的回归值。
嵌套级联Gentle Adaboost分类器由一些集成(嵌套)层组成,每一层包含一个Gentle Adaboost分类器。嵌套级联分类器的每一层不仅是级联分类器的一个独立结点,同时也是下一层的一个组成部分。假设嵌套级联分类器为C,包含K层,嵌套级联分类器可定义为
(10)
(11)
(12)
基于多尺度特征和嵌套级联Gentle Adaboost的车辆检测流程如图1所示。
图1 基于多尺度特征和嵌套级联Gentle Adaboost的车辆检测流程
实验环境为Intel Core i5—3470处理器、4 GB内存的硬件环境,以及Windows7,MATLAB R2012a软件环境。实验选取BIT车辆数据集[11]和伊利诺伊大学厄巴纳—香槟分校(UIUC)车辆数据集[12]分别进行训练和检测。BIT数据集包含一些复杂环境下的图像,如背景的干扰、光照的变化,以及车辆颜色的不同,图像大小为1 600×1 200,本文首先使用双三次插值方法将图像采样到400×300,然后随机选取其中的5 000张图像进行训练,2 800张图像(共2 890辆车)进行测试,训练时的负样本是收集的5 000张非车辆图像。UIUC数据集是标准化的车辆数据集,包含1 050张训练图像(其中550张是车辆图像,500张是非车辆图像)和278张测试图像(共339辆车),所有的车辆图像都是经灰度化的车辆侧面图像,具有不同的分辨率,有部分遮挡现象,车辆和背景对比度低,并且背景比较复杂。
本文使用精度P(Precision)、召回率R(Recall-rate)以及每幅图像的平均检测时间t作为评价指标。为验证本文算法的有效性,分别与文献[2~4]中的算法在BIT和UIUC数据集上进行了对比实验,实验结果如表1和表2。
表1 本文算法与其他算法在BIT数据集上的比较
表2 本文算法与其他算法在UIUC数据集上的比较
由表1和表2可以看出,本文算法的检测精度和召回率均高于其他3种算法,且检测速度更快。在BIT数据集上,本文算法的检测精度和召回率分别达到了93.8 %和94.2 %,平均检测耗时分别占文献[2~4]中算法的76.0 %,51.4 %,67.9 %。在UIUC数据集上,本文算法的检测精度和召回率分别为91.8 %和89.1 %,平均检测耗时分别占文献[2~4]中算法的61.5 %,38.1 %,53.3 %。基本达到了实时性要求。本文算法在BIT数据集上的效果表现较好,这是由于BIT数据集中的车辆图像相对清晰,且背景较为单一。而UIUC数据集中的车辆图像背景比较复杂,因此,检测精度和召回率相对较低。
图2为本文算法在BIT数据集和UIUC数据集上的部分检测结果。由图2(a)可以看出,本文算法在光照良好和光照较暗的环境下可以有效检测出车辆,较好地应对了光照变化。由图2(b)可以看出,本文算法在复杂环境中仍表现出了较好的检测结果,有效应对了背景干扰。
图2 本文算法的部分检测结果
提出了一种基于多尺度特征和嵌套级联Gentle Adaboost的车辆检测算法。为了快速得到更多有用信息,提取了多尺度HOG和多尺度MB-LBP两种特征,并分别使用积分直方图和积分图像进行加速。基于2种特征为Gentle Adaboost构建了2种弱分类器,并对Gentle Adaboost采用嵌套级联结构,进一步提高了检测率和检测速度。实验结果表明:本文算法相较于其他车辆检测算法,具有较高的检测精度和召回率,且检测速度较快,基本满足实时性要求。
参考文献:
[1] 缪小冬,李舜酩,沈 峘,等.路面车辆的视觉检测方法[J].传感器与微系统,2010,29(2):5-8,12.
[2] Tang Y,Xu Y C,Zhang C Z.Robust vehicle detection based on cascade classifier in traffic surveillance system[J].The Open Automation and Control Systems Journal,2014 (6):349-354.
[3] Negri P,Clady X,Hanif S M,et al.A cascade of boosted generative and discriminative classifiers for vehicle detection[J].EURASIP Journal on Advances in Signal Processing,2008,2008:1-12.
[4] Kovacic K,Ivanjko E,Jelusic N.Measurement of road traffic parameters based on multi-vehicle tracking[C]∥Proceedings of the Croatian Computer Vision Workshop,2015:3-8.
[5] 朱 勇,付彦君.基于多特征融合的车辆检测算法[J].传感器与微系统,2009,28(8):110-112.
[6] Viola P,Jones M.Rapid object detection using a boosted cascade of simple features[C]∥IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2001:511-518.
[7] Verschae R.Object detection using nested cascades of boosted classifiers:A learning framework and its extension to the multi-class case[D].Chile:Universidad de Chile,2010:25-29.
[8] Dalal N,Triggs B.Histograms of oriented gradients for human detection[C]∥IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2005:886-893.
[9] Porikli F.Integral histogram:A fast way to extract histograms in Cartesian spaces[C]∥IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2005:829-836.
[10] Zhang L,Chu R,Xiang S,et al.Face detection based on multi-block lbp representation[C]∥Lecture Notes in Computer Science,2007:11-18.
[11] Dong Z,Jia Y D.Vehicle type classification using distributions of structural and appearance-based features[C]∥Proceedings of the 20th IEEE International Conference on Image Processing(ICIP),2013:4321-4324.
[12] Agarwal S,Awan A,Roth D.Learning to detect objects in images via a sparse,part-based representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(11):1475-1490.