孙仕柏, 张 勇
(中海网络科技股份有限公司,上海 200135)
基于交通视频的背景建模方法
孙仕柏,张勇
(中海网络科技股份有限公司,上海 200135)
针对交通视频监控存在树影等动态背景的问题,提出一种基于像素的双层背景构建模型来消除动态背景的干扰。首先,统计连续的图像帧,并对其进行形态学预处理;其次,根据对应图像的每个像素位置构造各自的灰度直方图;随后,通过计算得到直方图的峰值并据此将直方图分为两部分,根据该划分结果构造该像素的双层背景模型;最后,根据构建的双层背景模型实现目标前景的检测。试验结果表明:运用该方法能构建较好的背景模型,目标检测效果较好,可有效去除动态背景的干扰。
交通视频; 动态背景; 双层背景; 直方图
随着计算机技术不断发展,智能交通已广泛应用于交通监控领域中。通过视频监控可有效掌握视频道路状况;同时,通过智能分析可有效降低交通隐患。
背景构建对于视频监控而言至关重要。构造好的背景模型并确保背景提取的实时性,是后续分析正常进行的保证。常见的背景构造模型主要有统计模型和结构模型。
1) 统计背景模型源于图像序列像素亮度在时间上的统计特性。混合高斯模型[1-2]通过统计像素亮度的变化情况描述多个背景模式,存在计算复杂度较高、突变光照敏感等问题。统计中值法[3]虽然能解决平均值法可能带来的图像细节模糊的问题,但在车间距小、行驶速度低等情况下,车身容易被误以为是背景。图像平均法[4]结构简单、计算速度快、容易实现,缺点是适用场景局限性大。统计直方图方法[5]对场景自适应能力较好,但是计算较为复杂,且在复杂场景下容易导致背景建模失真。CHANG等[6]给出带有状态标签的滑动窗口,并依据处于滑动窗口内部像素点的状态标签分布建立了基于信息熵图像的背景模型。赵旭东等[7]提取HSV(Hue, Saturation, Value)空间的颜色特征构建了像素级统计度量函数。
2) 结构背景模型源于空间相关性。LI等[8]给出一个用于描述背景时空域和频域特征的贝叶斯框架。KIM等[9]将背景像素亮度量化到压缩编码的码书中,建立了码书模型。CULIBRK等[10]提出一个基于神经网络的无监督贝叶斯分类器,用于构建背景结构模型。徐剑等[11]提取HSV空间的色定义相似性度量函数,并联合区域纹理特征构建结构背景模型。
上述背景模型采用像素的颜色和亮度等时间特性及其空间相关性等特征, 在某些方面呈现出了良好的性能, 但在一些动态背景处理方面并没有表现出很好的效果。
对于事件检测器等智能交通产品的性能指标,要求其能过滤树枝摆动、水波荡漾、闪电及光影变化等各种易引起虚警的干扰源,要求结果的正确率达到90%以上。这表示目标检测的正确率必须达到一定标准,以便有效适应场景的变化。
对此,提出一种用来解决交通监控视频中存在动态背景问题的基于像素的双层背景构建模型。首先,统计连续的图像帧,并对其进行形态学处理;其次,针对各个像素位置构造各自的灰度直方图;最后,计算得到直方图的峰值并据此将直方图分为两部分,根据划分结果构造该像素的双层背景结构。这种基于像素的双背景模型能有效去除动态背景干扰。
1.1预处理
在获取交通视频时,视频图像帧总是不可避免地存在一些可能是由摄像机本身原因和光照原因等导致的噪声。为后续处理过程中避免噪声的影响,首先应该对图像帧进行滤波处理,消除部分噪声。常用的滤波方法主要分为,基于空域的去噪方法和基于变换域的去噪方法两类。
1) 基于空域的去噪方法是直接在原图像上进行数据运算,对像素的灰度值进行处理,常用到的是线性滤波器和非线性滤波器。
2) 图像变换域去噪方法是将图像从空间域转换到变换域后,对变换域中的变换系数进行处理,随后再将图像反变换到空间域来达到去除图像噪声的目的。图像去噪方法都是针对特定图像和特定噪声提出的,常用的有傅里叶变换和小波变换。针对不同场景选取不同的去噪方法,进而达到去除噪声的目的。
1.2图像平均法
该算法的主体思想是在理想场景下将行驶车辆视为背景图像中的一种噪声,由于场景内路面与车辆的亮度值不同,因此在视频序列图像中二者的亮度值与路面亮度值相比会出现例如有的亮度值高,有的亮度值低,以及亮度值相等等情况。若要消除该噪声,可采用多帧图像先累加后平均的方法。基于上述思想,通过对一段场景视频中连续的帧图像进行累加平均来实现该场景的背景提取,其表达式为
(1)
式(1)中:BG(x,y)为像素点(x,y)在背景中的灰度值;Ii(x,y)为第i帧图像中(x,y)处的灰度值;N为统计的帧数。
图像平均值背景生成法的优点是算法简单、容易实现,缺点是适用场景比较局限。由于在实际场景中会有存在树影和镜头抖动等动态背景(见图1)的情况,造成像素点(x,y)处灰度值不稳定,因此若运用多帧平均值法对该段时间内的视频序列进行背景建模,动态背景部分会在目标检测时作为目标出现而造成误检。根据像素点位置是否存在动态背景,可将北景模型分为静态背景和动态背景两类,其变化趋势见图2。
若利用传统的背景差分法,场景的动态背景会被误识别为目标对象,降低了目标检测的正确率。
2.1双层背景构建算法
针对动态背景和静态背景直方图的特点,在平均背景差分方法的基础上,结合直方图提出一种基于像素的双层背景模型构建算法。假设图像的大小为M×N,具体算法步骤如下。
a) 树影
b) 镜头抖动
a) 静态背景
b) 动态背景
(1) 统计连续帧图像,按照式(2)对每个像素进行直方图统计。
(2)
式(2)中:nr为n幅图像中该像素位置出现rk像素度的次数;NUM为图像帧数。
(2) 对直方图进行分析,查找直方图峰值Peak1。
(3) 以峰值为中心查找背景范围,确定区间[n1,n2],若查找背景像素占整个直方图的比例超过阈值T,则为单一背景,转入步骤(5),否则转入步骤(4)。
(4) 从背景直方图中去除第一背景后查找第二峰值Peak2,根据步骤(3)确定区间[m1,m2],并将其作为第二背景区间。
(5) 完成背景模型构建。
该算法充分考虑了动态背景的特点,通过区分动态背景和静态背景来建立相应的背景模型;此外,在确定背景范围时充分考虑了场景的自适应确定及平均方法和直方图方法的特点,复杂度较低,计算速度较快。
2.2背景更新策略
1) 无记忆更新策略:每次确定需要更新像素点的背景模型时,不是直接影响背景模型,而是通过更新像素直方图来达到背景更新的目的。
2) 时间取样更新策略:并不是每处理一帧数据都要更新处理,而是按一定的更新率更新背景模型。当一个像素点被判定为背景时,其有1/rate的概率更新背景模型(rate是时间采样因子,一般取值为16)。
背景模型的好坏直接影响着目标检测结果,因此通过选取典型的视频场景来验证算法的有效性。设计试验选取2种典型交通视频,分别为带有树影的移动及存在镜头抖动现象(试验结果见图3),分别通过人工标定和试验统计获取目标的检测结果(结果统计见表1)。
利用提出的基于像素的双层背景模型,由图3可看出,运动背景的干扰没有导致误识别为运动目标对象的现象出现,该算法有效消除了运动背景对场景目标检测的影响,具有良好的性能,算法构建简单,计算速度快,且具有良好的自适应性。
a) 场景1
b) 场景2
c) 场景3
d) 场景4
e) 检测结果1
f) 检测结果2
g) 检测结果3
h) 检测结果4
场景目标数量(人工)目标数量(试验)查准率/%查全率/%场景19254898797.1294.32场景26744663098.3196.54
由表1可知,利用该算法能到取得较好的检测效果,查准率和查全率分别大于97%和94%,算法性能较好,满足视频分析的要求。
研究了交通视频背景建模方法,根据视频中存在动态背景和静态背景的特点建立了基于像素的背景模型,提出了一种基于像素的双层背景模型的构建方法。试验结果表明,该方法具有良好的性能。这对智能交通的应用具有重要意义,同时可为基于图像背景构建方法提供借鉴。
由试验可知,对于复杂的场景,消除阴影和反光等是进行视频分析的关键,因此克服阴影等现象是值得深入研究的课题。如何有效去除阴影特殊背景是下一步研究的重点。
[1]STAUFFER C, GRIMSON W E L. Adaptive Background Mixture Models for Real-Time Tracking[J]. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 1999.
[2]夏海英, 何利平, 黄思奇.基于时空分布的混合高斯背景建模改进方法[J]. 计算机应用研究, 2015,32(5): 1546-1548.
[3]姜明新, 王洪玉, 沐方顺. 基于视频监控的违章停车检测算法[J]. 计算机工程, 2012, 38(19): 151-153.
[4]CHEN Yenlin, WU Bingfei, FAN Chungjui. Real-Time Vision-Based Multiple Vehicle Detection and Tracking for Nighttime Traffic Surveillance[J]. Visual Commun Image Represent, 2009: 3352 - 3358.
[5]BOGOMOLOV Y, DROR G. Classification of Moving Targets Based on Motion and Appearance[C].British Machine Vision Conference, 2003.
[6]CHANG M C, CHENG Y J. Motion Detection by Using Entropy Image and Adaptive State-Labeling Technique[C]. Proceedings of the IEEE International Symposium on Circuits and Systems, 2007.
[7]赵旭东,刘鹏, 唐降龙,等。 一种适应户外光照变化的背景建模及目标检测方法[J]. 自动化学报, 2011, 37(8): 915-922.
[8]LI L Y, HUANG W M, GU I Y H,etal. Statistical Modeling of Complex Backgrounds for Foreground Object Detection[J]. IEEE Transactions on Image Processing, 2004, 13(11): 1459-1472.
[9]KIM K, CHALIDABHONGSE T H, HARWOOD D,etal. A Multi-Scale Hierarchical Codebook Method for Human Action Recognition in Videos Using a Single Example[C]. 2012 Ninth Conference on Computer and Robot Vision, 2012.
[10] CULIBRK D, MARQUES O, SOCKE D,etal. Neural Network Approach to Background Modeling for Video Object Segmentation[J]. IEEE Transactions on Neural Networks, 2007, 18(11): 1614-1627.
[11]徐剑, 丁晓青, 王生进, 等. 一种融合局部纹理和颜色信息的背景减除方法[J]. 自动化学报, 2009, 35(9): 1145-1150.
Research on Background Modeling of Traffic Video Image
SUN Shibai,ZHANG Yong
(ChinaShippingNetworkTechnologyCo.,Ltd.,Shanghai200135,China)
A two-layer background model is proposed to eliminate the influence of the dynamic background, such as shadow of trees, on the target detection from traffic surveillance video images. For doing so, the successive image frames are collected and processed with morphology processing first. Then, the histograms representing the pixel gray level variation at each point of the image frame are constructed. The peak values of the histograms are found, and the histograms are divided into two groups according to the peak values. The discrimination of the histograms leads to a two-layer background model for detecting targets. The experimental results show that the background model built with the method can effectively eliminate the interference of the dynamic background and improve the target detection.
traffic video; dynamic background; two-layer background; histogram
2015-10-16
孙仕柏(1990—),男,山东日照人,助理工程师,主要从事智能交通中算法的研究。
1674-5949(2016)01-069-04
U491.1+16; TP391.41
A