谷灵康 周鸣争
(安徽工程大学计算机与信息学院计算机应用技术重点实验室 安徽 芜湖 241000)
基于Hough森林的多特征快速行人检测
谷灵康周鸣争
(安徽工程大学计算机与信息学院计算机应用技术重点实验室安徽 芜湖 241000)
摘要为了快速检测行人,根据人体头顶特性快速找出头顶候选点,依此为基点利用边缘检测算法提取目标轮廓,将其作为待测区域;然后利用改进的颜色自相似特征、结合区域边缘直方图和一致模式特征,在Hough森林分类器上进行分类检测。实验结果表明,该算法在检测正确率及速率方面都得到了提高,对于复杂动态场景、遮挡现象以及目标自身形变具有较强的鲁棒性和较高的准确性,在多种行人数据集中测试取得良好的效果。
关键词行人检测像素点梯度方向局部颜色自相似特征区域边缘直方图局部二值模式Hough森林
0引言
行人检测是智能视频监控、机器视觉、车辆辅助驾驶等应用的第一步,吸引了大批研究者,取得了一定的研究成果[1]。但是由于行人的特殊性,场景的复杂多样性,若想取得又快又准的检测识别效果,还需要进一步的努力。如果想快速检测行人,通常情况下是选用单一特征,这也是早期行人检测所采用的方法,但是检测效果不理想,不能有效检测行人。为了准确检测行人,近年来很多研究者提出多特征融合的方法,这样固然能提高检测的准确性,但是需要花费大量的时间,不能满足行人检测对实时性的要求。针对这些问题,本文根据人体特性提出一种快速且有效的行人检测方法。
1算法思路
因行人全身包含的信息很多,所以目前的行人检测方法大多是根据行人全身的特征来判断的,但对于复杂场景,特别是有身体遮挡的情况下,要想获得行人全身信息是不太可能的,但这种情况下,通常还能获取行人的头顶信息,本文依此头顶点为基点,利用边缘检测算子获取边缘轮廓,将其作为候选目标,然后利用改进的边缘方向直方图方法提取区域边缘直方图特征。
另外对于行人,身体颜色具有一定的自相似性,衣服颜色以及肤色的相似度很高,且头发的颜色和脸部的肤色不依赖于面部的细节特征,在表情变化、头部偏转等情况下仍能适用,具有相对的稳定性。而且人体颜色有别于大多数背景物体的颜色,因此为了提高检测率对候选目标利用改进的颜色自相似算法进行特征提取。
为了提高检测准确性,仅提取颜色自相似特征还不够,考虑到纹理是反映目标表面色度和亮度变化模式的视觉特征,因此需要选择一种高效的纹理特征提取算法。
为了能够提高检测正确率而提取多种特征,但这样就增加了维度,从而影响检测速度。这就要求选择学习速度快、分类能力强的分类器。随机森林是一个包含多个决策树的分类器、优点是学习速度很快,缺点是存在过拟合[2]。基于Hough森林的目标检测是近期提出的一种新方法,重点考察图像块与目标中心的位置关系,在叶节点处增加计算,输出成为在连续区域上的投票。Hough森林是在随机森林框架上的一个扩展,继承了随机森林的优点并改进了其缺点[3]。根据以上思路,本文算法流程如图1所示。
图1 本文算法流程图
2快速头顶点确定方法
由于人的头顶是椭圆形,且经过计算发现头顶像素点的梯度方向值基本在90°左右[4]。本文利用头顶像素点的梯度方向具有固定范围这一特性在前景中找出头顶候选点,根据该点快速确定人体轮廓域。
算法中像素点(x,y)的灰度值用H代替,G代表梯度幅值,α为梯度方向。采用一维中心算子[-1,0,1],可得到水平和垂直方向的梯度幅值分别为:
Gx(x,y)=H(x+1,y)-H(x-1,y)Gy(x,y)=H(x,y+1)-H(x,y-1)
(1)
则(x,y)像素点的梯度方向为:
(2)
通过计算及实验测试,人体头顶像素点梯度的切线方向在 90°左右,发型的不同对头顶的形状变化会有一定的影响,但是不大。
根据上述计算方法选取前景中梯度方向在规定范围内的像素点作为头顶候选点,然后依此点为基点,利用Prewitt检测算子提取边缘轮廓,且能去掉部分伪边缘,对噪声具有平滑作用。
3改进的EOH特征提取方法
边缘方向直方图(EOH)能较好体现图像的边缘和纹理特征,通过统计图像边缘像素的方向分布来描述图像特征,其计算方法为:1) 对图像进行边缘算子运算;2) 计算各边缘像素的梯度幅值和梯度方向,并判断梯度方向所隶属的直方图子区间;3) 统计隶属于直方图各子区间的所有边缘像素的梯度幅值和;4) 对所得的直方图各子区间取值进行归一化得到最终的边缘方向直方图[5]。
由于传统直方图仅统计图像像素取值的频率分布,所以当两幅图像像素的频率相同时,其无法进行区分。此时,虽然两幅图像像素取值的频率分布相同,但直方图各子区间对应区域的边缘分布是有差别的。基于此,如果用各子区间的边缘复杂度来度量各区间构成的区域的分散程度,即可以得到一组度量灰度直方图各子区间内像素空间分布的数据。利用该组数据对直方图的各子区间进行加权,便可得到一组新的直方图,由边缘复杂度得到的权值数据称为该直方图的空间权因子。如图2所示。
图2 原图及2种算法检测结果对比图
设灰度直方图第k个子区间内所有像素构成的区域的边缘复杂度为φk。将归一化后的数据记为(Ф1,…,Фk,…,Фn),则其为一组体现像素空间分布复杂度的加权直方图数据.对于其第k个子区间的数值Фk。
(3)
式(3)表明,Фk的大小只与该区间对应区域的边缘像素的总数К(Ek)有关,也即计算时只需要统计直方图各子区间对应区域的边缘像素的个数,因此该方法是一种基于区域边缘统计的图像特征描述方法。
区域边缘像素的引入反映了图像的结构信息,检测结果与EOH相比如下图所示,从另一个角度解释了区域边缘直方图具有更强的图像特征区分度的原因,能够对图像进行有效的区分。
4改进的颜色自相似特征及纹理特征提取
人的身体颜色具有一定的自相似性,如:人体衣服颜色以及两臂颜色的相似度很高。基于此,Walk等[6]提出一种颜色相似度特征CSSF(ColorSelf-SimilarityFeature) ,用于行人检测,有效提高了检测精度,但其计算的是全局图像中每两个块之间的相似性,计算量非常大,特征维数高,检测速度较慢。文献[7]对CSSF进行了改良,但该特征维度达到千万级,仍然较高,难以满足实际应用需要。本文结合轮廓特征,提出改进的颜色自相似特征。
4.1传统的颜色自相似特征
传统的颜色相似度特征基于矩形特征,对于矩形块R1,其内部数值和为:
(4)
CSSF特征可由相邻块R1和R2数值和的比值得到:
F(R1,R2)=sumR1/sumR2
(5)
式中,R1和R2大小相等且位置不同(设矩形块宽为w,高为h),该方法可以衡量矩形块之间的相似度。比值越接近1,两矩形块越相似。为此,对F特征进行非线性转换得到F′特征:
(6)
对于传统CSSF特征当两矩形块相距较远时,其光照情况可能相差较大,导致特征对非均匀光照敏感;而如果把矩形块之间的距离限定得太小,又会增加计算量,导致特征空间维度过高。近些年有很多学者试图对CSSF进行改良,如文献[7-9],但特征维度仍然很高,势必会影响检测效率。基于此,本文对颜色相似特征进一步改进。
4.2改进的颜色自相似特征
为了降低特征维度又不至于导致对非均匀光照敏感,本文对矩形块的高宽比及块之间的距离进行约束。
对于分别以点(x1,y1)和(x2,y2)为左上角坐标的矩形块R1和R2,当其满足式(7)时,则计算这两个块之间的相似度。
(7)
其中δ为约束阈值,一般情况下取值为3。在实验过程中可以根据检测效果调整阈值和w及h的值;另外在实验过程中还发现当高宽比(即h/w)为0.68黄金比例时,检测效果最好(如图3所示)。
图3 不同高宽比对应的检测率
由于有了候选区域去除了背景信息且对矩形块的高宽比及块之间的距离进行了约束,相比于文献[7]、文献[8]和文献[9],去除了大量冗余信息,其特征空间进一步降低。
4.3改进的旋转不变性LBP纹理特征提取
LBP特征[10]是由Ojala等在1994年提出的一种高效的局部纹理特征提取算法。LBP特征能够较好地反映像素点局部邻域的空间分布模式,且该特征具有计算速度快的优点。基本的LBP算子的计算公式为:
(8)
5Hough森林检测算法
5.1原理
Hough森 林[13],由一系列决策树h(x,θk) ,k=1,2,…组成,森林中的每棵树都是由一系列的叶节点和非叶节点形成的,节点是由随机抽选的局部图像块来创建的。
Hough森林属于机器学习中的监督学习,通过训练,学会如何将局部的图像块特征与它们在Hough空间H⊆RH内的投票相映射:
(9)
表示图像元素特征到概率Hough投票的映射模型:其中,τ为从输入图像空间y∈Ω⊆RD到特征(I1(y),I2(y),…,IF(y))∈RF的映射,每一个IF是一个特征向量子分量,F为总的特征维数;p(h|L(y))是Hough空间内Hough投票的分布。
5.2收敛性研究
假设训练集{(x,y)}是由随机输入向量x和输出向量y分布所抽取出来的,那么对于给定的k个分类器的集合{h1(x),h2(x),…,hk(x)}可以定义间隔函数为式(1)。
mg(x,y)=kavI(hk=y)-maxj≠ykavI(hk(x)=j)
(10)
用投票和概率平均(表达式如下)得到测试的预测类标签:
(11)
(12)
式中I(·)是示性函数,kav(·)为对k取平均值,ji为森林中的k棵决策树的权重。类标签由投票来决定,得票存在于决策树的给定阈值范围。可以导出泛化误差:
Ep=Px,y(my(x,y)<0)
(13)
当森林中数目较大时,由树结构和大数定律导出随机向量趋向值如式(14):
Px,y(Pθ(h(x,θ)=y)=y-maxj≠yPθ(h(x,θ)=j)<0)
(14)
随机森林边缘函数:
(15)
决策树的分类强度s为:
s=Ex,ymr(x,y)
(16)
设s≥0,根据Chebyshev不等式由式(15)、式(16) 得到泛化误差:
(17)
其中Var(mr)形式如式(18):
(18)
而:
(19)
由式(17)~式(19)知,任意函数h,求其均值与方差,并趋近于方差上限,都有:
(20)
其中ρ是相关系数平均值。推导式(17)可知:
(21)
6仿真实验及分析
6.1实验数据集
拍摄包含多种场所(教学楼、停车场、道路,等)、多种天气(晴天、雨天、雾天)等复杂情况下的行人视频构成本文实验样本之一,该视频库部分场景背景如图4所示。取部分视频制作成正样本(如图5所示),共建正样本4600个,其中2600个用来训练,2 000个用来验证,另外不含行人的背景图称为负样本。
图4 部分场景背景图
图5 部分正样本
为了验证本文所述算法检测效果的通用性,在目前常用的行人数据集[14]中,引入2个国际上常用的数据集:INRIA行人数据集和NICTA行人数据集[15]。其中INRIA行人数据集是目前使用较多的静态行人数据集,包含训练和测试两类,且每类均包含正样本和负样本。训练集含有正样本614张(包含2416个行人),负样本1218张;测试集含有正样本288张(包含1126个行人),负样本453张。NICTA行人数据集是目前规模较大的静态行人数据集,且已划分好训练集和测试集。
6.2实验与结果分析
本文算法程序在Pentium(R)CPU987双核1.5GHz, 64位Windows7系统,4GB内存的计算机上运行。
对于行人样本图如图6所示。按照本文算法流程(如图1所示)进行行人检测,如图7所示为实验中部分行人检测示意图。
图6 部分行人样本图 图7 部分行人检测结果示意图
由于目前分类算法主要还是基于SVM和AdaBoost的,基于随机森林和Hough森林的检测是近期提出的新方法,故为了验证本文算法将其与文献[2]、文献[7]、文献[16]和文献[17]、文献[18]所述方法分别在自建数据集、INRIA、NICTA数据集上实验后比较,实验检测率如图8所示。
图8 不同算法在多种数据集中的检测率
由图8可知,不同算法在各类行人数据集中的检测效果相差较小。通过实验可知本文所提算法平均检测正确率(在三类数据集中正确检测出的人体占整个视频中人体的识别率)为99.07%;文献[2]所述算法HOG+LBP+LAB+Houghforest平均检测率为96.72%;文献[7]所述算法CSSF+AdaBoost平均检测率为98.16%;文献[16]所述算法HOG+Harr+SVM平均检测正确率为98.0%;文献[17]所述算法HOG+IKSVM平均检测正确率为97.65%;文献[18]所述算法Randomforest+SVM平均检测率为96.17%。在这几类算法中,本文所述算法的检测率较高,综合这几种算法在不同数据集的检测率,进一步分析它们的误检率与漏检率,实验结果如图9所示。
图9 不同算法误检率和漏检率比较
在检测速率(对人体识别的平均速率)上,各算法也有较明显的差别,如表1所示。文献[2]所述算法HOG+LBP+LAB+Houghforest平均检测速率较慢;文献[16]所述算法HOG+Harr+SVM平均检测正确率较高,误检率也较低,但是检测的速率相对较慢;文献[17]所述算法HOG+IKSVM平均检测正确率相对较低,但是速率较快;文献[7]所述算法CSSF+AdaBoost,由于特征空间仍为千万级,所以检测速率上也较慢;文献[18]所述算法Randomforest+SVM检测速率较快;而本文所述算法,花费时间相对较少。
表1 不同算法检测速率比较
7结语
参考文献
[1]PedagadiS,OrwellJ,VelastinS,etal.Localfisherdiscriminantanalysisforpedestrianre-identification[C]//IEEEComputerSocietyConferenceonComputerVisionandPatternRecognition,Portland,USA,2013:3318-3325.
[2] 尤玮,戴声奎.基于多特征与改进霍夫森林的行人检测方法[J].计算机工程与设计,2014,35(10):3538-3544.
[3]BarinovaO,LempitskyV,KholiP.Ondetectionofmultipleobjectinstancesusinghoughtransforms[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2012,34(9):1773-1784.
[4] 钦爽,谢刚,饶钦,等.视频中基于LW-PGD和SVM的头肩部检测[J].计算机应用研究,2014,31(3):949-952.
[5] 余旺盛,田孝华,侯志强.基于区域边缘统计的图像特征描述新方法[J].计算机学报,2014,37(6):1398-1410.
[6]WalkS,MajerN,SchindlerK,etal.Newfeaturesandinsightsforpedestriandetection[C]//CVPR2010:Proceedingsofthe2010IEEEConferenceonComputerVisionandPatterRecognition.Piscataway:IEEE,2010:1030-1037.
[7] 曾波波,王贵锦,林行刚.基于颜色自相似度特征的实时行人检测[J].清华大学学报,2012,52(4):571-574.
[8] 饶钦,谢刚,钦爽.基于颜色自相似性和HOG特征的行人检测[J].小型微型计算机系统,2014,35(11):2582-2585.
[9] 顾会建,陈俊周.基于改进颜色自相似特征的行人检测方法[J].计算机应用,2014,34(7):2033-2035.
[10]OjalaT,PietikinenM,HarwoodD.PerformanceevaluationoftexturemeasureswithclassificationbasedonKullbackdiscriminationofdistributions[C]//Proceedingsofthe12thIAPRInternationalConferenceonPatternRecognition.Israel:IEEE,1994:582-585.
[11]SalbergAB,HardebergJY,JenssenR.Rotationinvariantimagedescriptionwithlocalbinarypatternhistogramfourierfeatures[C]//ISCIA2009Proceedings.Heidelberg:Springer,2009:61-70.
[12] 陈东岳,陈宗文,桑永嘉.基于多特征在线模板更新的鲁棒目标跟踪算法[J].哈尔滨工业大学学报,2014,46(7):87-94.
[13] 严明君,项俊,罗艳,等.基于SURF与Hough森林的人脸检测研究[J].计算机科学,2014,41(7):301-305.
[14] 张春凤,宋加涛,王万良.行人检测技术研究综述[J].电视技术,2014,38(3):157-162.
[15]OverettG,PeterssonL,BrewerL,etal.Anewpedestriandatasetforsupervisedlearning[C]//Proc.2008IEEEIntelligentVehiclesSymposium.Eindhoven,Holland:IEEEPress,2008:373-378.
[16]HeFei,LiYali,WangShengjin,etal.ANovelHierarchicalFrameworkforHumanHead-ShoulderDetection[C]//ImageandSignalProcessing(CISP),Shanghai,China,Oct15-17,2011,3:1485-1489.
[17]SubhransuMaji,AleanderCBerg,JitendraMalik.EfficientClassificationforAdditiveKernelSVMs[J].PatternAnalysisandMachineIntelligence,2013,35(1):66-77.
[18] 习文星,汤心溢.基于随机森林和支持向量机的快速行人检测算法[J].计算机应用,2014,34(S2):283-285.
MULTI-FEATURE FAST PEDESTRIAN DETECTION ALGORITHMBASEDONHOUGHFOREST
Gu LingkangZhou Mingzheng
(Key Laboratory of Computer Application Technology,College of Computer and Information,Anhui Polytechnic University,Wuhu 241000,Anhui,China)
AbstractIn order to quickly detect pedestrians, we first rapidly found out the candidates of the top of the head according to the characteristics of human head tops, and according to this base point we extracted the object contour by using edge detection algorithm and took it as the area to be tested. Secondly, by using the improved colour self-similarity character and combining the region edge histogram and uniform pattern characters, we conducted the classification and detection on Hough forest classifier. Experimental results showed that, the algorithm proposed in this paper gained the improvement in both the detection accuracy and speed, and had stronger robustness and higher accuracy against the cluttered dynamic background, occlusion and the deformation of the object itself. In many pedestrian datasets tests it achieved good results as well.
KeywordsPedestrian detectionPixel gradient directionLocal colour self-similarity characterRegion edge histogramLocal binary patternsHough forest
收稿日期:2015-01-14。国家自然科学基金项目(61300170);安徽省自然科学基金项目(1308085MF95);安徽省级自然科学研究项目(TSKJ2014B11)。谷灵康,讲师,主研领域:行人检测,计算机视觉。周鸣争,教授。
中图分类号TP391.4
文献标识码A
DOI:10.3969/j.issn.1000-386x.2016.06.036