黄成都, 黄文广, 闫 斌
(1.电子科技大学 自动化工程学院,四川 成都 611731;2.国家电网四川省电力公司 乐山电业局,四川 乐山 614000)
基于Codebook背景建模的视频行人检测
黄成都1, 黄文广2, 闫 斌1
(1.电子科技大学 自动化工程学院,四川 成都 611731;2.国家电网四川省电力公司 乐山电业局,四川 乐山 614000)
针对视频序列,Codebook背景建模算法能检测出其中的运动物体,但却无法识别行人。而大部分基于支持向量机(SVM)训练的行人分类器,需要通过滑动窗口遍历图像检测行人。为加快行人检测的速度,提出将传统的行人分类器融入到Codebook背景建模算法中,通过背景建模算法为行人检测提供候选区域,减少搜索范围,降低了行人误检率;并根据行人的特点,构建临时块模型定期将满足条件的前景区域更新到背景模型中,解决了Codebook背景建模算法不能应对光照突变的问题。实验结果表明:所提算法能应对光照突变所带来的干扰,实现视频行人实时检测。
视频; Codebook背景建模; 支持向量机; 行人检测
行人检测对于一个智能监控系统至关重要,是异常行为识别[1,2]、行人识别与跟踪[3]、步态识别[4,5]、行人计数[6,7]等智能应用的基础。
行人检测由行人分类和检测两部分组成。行人分类以统计学习为基础,选取合适的特征来描述行人样本,在特征空间中寻找最优分类超平面得到行人分类器[8,9];检测是在整幅图像中寻找行人候选区域的过程,根据搜索方式的不同,可分为全图遍历[8]和根据先验知识减少搜索范围[9]的方式。行人检测即通过计算候选区域特征,送入行人分类器判断是否存在行人,如有则确定出行人在图像中的位置。
本文选用基于直方图交叉核的支持向量机(support vector machine,SVM)和对光照不敏感的方向梯度直方图(histogram of gradient,HOG)特征训练行人分类器,使用Codebook背景建模算法[10~12]提取运动前景,减少检测过程的搜索范围,构建临时块模型,结合行人检测的结果更新背景模型,使其能应对光照突变,实现行人检测。实验表明:该算法能克服Codebook背景建模算法对光照敏感的问题,能满足像变电站等场合(人少且危险)智能监控的需求。
构建码本模型的算法流程:
1)设置码本φ为空集,包含码字L为0
2)对于时间从t=1到N
a.Xt=(R,G,B)
b.在码本φ={ci|1≤i≤L}中寻找是否有cm与Xt满足条件
Colordist(Xt,Vm)≤ε1
c.如果φ为空或者未找到匹配,码字个数加1,并按下面的规则初始化一个新的码字cL如下
VL=(R,G,B)
auXL=〈I,I,1,t-1,t,t〉
d.否则,更新当前匹配的码字cm如下
3)对每一个码字ci,i=1,…,L,循环设置λi=max{λt,(N-qi+pi-1)}
在训练阶段构建码本模型结束后,通过设置时间阈值Tu为训练时间的一半N/2,根据公式(1)得到滤除冗余码本后模型U为
(1)
通过此阶段,滤除背景环境中的噪声。
由于Codebook背景建模算法对光照的敏感性,选择对光线不敏感的特征—方向梯度直方图训练得到行人检测器。
整体框架如图1所示,对属于背景模型的像素,定期剔除对应码本模型中陈旧的码字,并应用KyungnamKim等人[10]提出的自适应更新算法应对光照缓慢变化对码本模型带来的影响;对属于前景的像素区域,用训练得到行人分类器检测,根据检测的结果,对不属于行人的区域构建临时块模型,定期将满足要求的矩形块区域融入到背景模型中。
图1 算法整体框架图
通常对于行人的检测,用其外接矩形来表示其在图像中的位置。而两个矩形间的位置关系无非三种:相交,相离,包含。通过刻画帧间矩形框的相对关系,建立块模型。
对于矩形框一般使用一个点和宽高来描述,矩形框r1=(x1,y1,w1,h1)和r2=(x2,y2,w2,h2)间的位置关系如图2所示。
图2 矩形框间的位置关系图
可得矩形框r1和r2重心o1=(x1+w1/2,y1+h1/2),o2=(x2+w2/2,y2+h2/2),o1和o2间的水平距离dx和垂直距离dt如下
dx=|x2-x1+(w2-w1)/2|
(2)
dy=|y2-y1+(h2-h1)/2|
(3)
由此可界定出矩形框间的位置关系
(4)
将时间轴上相邻两帧间存在包含关系的矩形框定义为重复访问,而相离和相交关系的则在块模型中初始化一个新的矩形框结构。引入最大负运行时间λ,来描述块被访问的最大时间间隔,拥有较小λ的块意味着很有可能是背景,应被学习到背景模型中。如公式(1)所示,设置时间阈值Tu,将临时块模型中满足条件的块中前景区域学习到背景模型中。
当前对检测性能的提高主要从分类器的优化、特征设计与组合两方面着手。选择不受光照改变影响的特征—方向梯度直方图,并通过支持向量机训练行人分类器。支持向量机作为一个经典的分类器,能很好地处理二分类问题,相比于线性核的快速分类能力以及复杂非线性核的高准确率,直方图交叉核(histogramintersectionkernel,HIK)是前两者性能上的综合,既有非线性核的高准确率,在速度上较线性核而言又没太大损失。
对基于直方图的特征向量x,z∈Rn,直方图交叉核定义为如式(5)所示
(5)
实验环境为MicrosoftVisualStudio2008平台,PC配置:Inter(R)Core(TM)2DuoCPUT6600 2.20GHz,RAM2.00GB。调用OPENCV2.4.8及libHIK库[13]函数来实现。
图3中(a)~(d)为测试视频序列中的四帧,(e)~(h)为通过Codebook背景建模算法提取的候选检测区域,(m)~(p)为行人检测器对候选区域检测的结果。(b)~(d)中当行人打开门后,带来局部光照的突然改变,(f)~(h)可看出光照突然的改变对Codebook背景建模算法检测性能带来的影响,(n)~(p)显示在局部光照改变下检测出的行人,(i)~(l)为对未检测到行人的前景区域的自我更新过程。实验表明算法能应对光照突然的改变。
图3 行人检测效果图
通过在Codebook背景建模算法的基础上,引入行人分类器,使其具有检测视频图像中行人的能力,加速了传统行人分类器通过遍历全图检测行人的过程。针对Codebook背景建模算法不能处理光照突变的情况,结合行人检测的结果,构建临时块模型更新背景模型。实验表明:该算法在实际场景中能取得较好的检测的效果。该算法还不能应对摄像头自动旋转的情形,可以结合光流等信息学习并更新背景模型。
[1] Candamo J,Shreve M,Goldgof D B,et al.Understanding transit scenes:A survey on human behavior-recognition algorithms[J].IEEE Trans on Intell Transp Syst,2010,11(1):206-224.
[2] 程 添,杨思思,冯 蓉,等.基于双目标定的独居老人摔倒检测算法[J].传感器与微系统,2014,33(10):100-103.
[3] Guo G,Li S,Chan K.Face recognition by support vector machines[C]∥The Fourth IEEE International Conference on Automatic Face and Gesture Recognition,IEEE,Piscataway,2000:196-201.
[4] Ran Y,Zheng Q,Chellappa R,et al.Applications of a simple characterization of human gait in surveillance[J].IEEE Trans on Syst Man Cybern:Part B—Cybern,2010,40(4):1009-1020.
[5] Cutler R,Davis L S.Robust real-time periodic motion detection,analysis,and applications[J].IEEE Trans on Pattern Anal Mach Intell,2000,22(8):781-796.
[6] Chen D Y,Su C W,Zeng Y C,et al.An online people counting system for electronic advertising machines[C]∥IEEE International Conference on Multimedia and Expo,ICME 2009,IEEE,Piscataway,2009,1262-1265.
[7] Sim C H,Rajmadhan E,Ranganath S.Detecting people in dense crowds[J].Mach Vision Appl,2012,23:243-253.
[8] 程广涛,陈 雪,郭照庄. 基于HOG 特征的行人视觉检测方法[J].传感器与微系统,2011,30(7):68-70.
[9] Cheng Mingming,Zhang Ziming,Lin Wenyan,et al.BING:Binarized normed gradients for objectness estimation at 300fps[C]∥IEEE CVPR,2014:3286-3293.
[10] Kim K,Chalidabhonse T H,Harwood D,et al.Real time foreground background segmentation using codebook model[J].Elsevier Real-Time Imaging,2005,11(3):167-256.
[11] 霍东海,杨 丹,张小洪,等.一种基于主成分分析的Codebook背景建模算法[J].自动化学报,2012,38(4):591-600.
[12] Ilyas A,Scuturici M,Miguet S.Real time foreground-background segmentation using a modified Codebook model[C]∥The Sixth IEEE International Conference on Advanced Video and Signal-Based Surveillance,AVSS’09,2009:454-459.
[13] Wu Jianxin.A fast dual method for HIK SVM learning[C]∥Proc of The 11th European Conference on Computer Vision,ECCV 2010,Crete,Greece,2010:552-565.
Pedestrian detection based on Codebook background modeling in video
HUANG Cheng-du1, HUANG Wen-guang2, YAN Bin1
(1.School of Automation Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China;2.Leshan Electric Power Bureau,Sichuan Electric Power Company of State Grid,Leshan 614000,China)
As for video sequences,Codebook background modeling algorithm can detect moving objects,but cannot recognize pedestrians.Meanwhile, most pedestrians classifiers are based on support vector machine(SVM)training has to traverse through the whole image,by sliding window to detect pedestrians.To speed up pedestrian detection process,algorithm of traditional pedestrian classification device fused in Codebook background modeling algorithm is proposed provide candidate regionals by background modeling algorithm for pedestrian detection reduce the search range and error rate of the pedestrian.According to features of pedestrians,temporary block model is built to regularly update into background model, which solve the problem that Codebook background modeling algorithm cannot suit the illumination abrupt variation.Experimental results demonstrate that the proposed algorithm can deal with the interference caused by sudden light variation,it can achieve the real-time pedestrian detection in video.
video; Codebook background modeling; support vector machine(SVM); pedestrian detection
10.13873/J.1000—9787(2017)03—0144—03
2016—04—13
TP 391.4
A
1000—9787(2017)03—0144—03
黄成都(1990-),男,硕士研究生,主要研究方向为图像处理,计算机视觉。