张永,刘巧玲
ZHANG Yong, LIU Qiao-ling
兰州理工大学 计算机与通信学院,兰州 730050
School of Computer and Communication,Lanzhou University of Technology,Lanzhou 730050,China
运动目标检测是指从视频序列图像中将变化区域从背景图像中提取出来,由于后续的处理,如目标跟踪、目标识别与分类、目标特征的提取等,只考虑图像中运动区域的像素。因此,获得精确的运动目标是非常重要的。
背景减除法[1,2]是目前运动目标检测中最常用的一种方法,其核心是背景模型的建立。目前已经提出了很多的自适应背景模型方法。其中,Stauffer等人[3]提出利用多个高斯分布构建背景模型的方法得到了广泛的应用,但该方法收敛速度比较慢,计算量大,易受光照变化和噪声的影响。近年来,许多学者对其进行了大量的研究。例如,文献[4]提出对均值和方差采用不同的学习速率;文献[5]用混合高斯模型对前景进行粗分割,然后采用结构梯度互相关系数对粗分割结果进行校正,以提高目标检测的精度;文献[6]提出对 混合高斯模型检测出的前景和背景,采用不同的更新策略,以实现背景模型的实时更新;文献[7]针对传统混合高斯背景仅对单个像素建模,而忽略了视频序列在时间和空间上的相关性,提出利用背景时间统计特征和空间区域特征建立模型;文献[8]通过对混合高斯背景模型进行改进,使其适应局部的光照变化,并且对模型引入帧间处理使其适应全局的光照变化。但是,效果仍不是很理想。
针对上述不足,本文对高斯模型的背景学习方法进行了深入的分析,并提出了一种自适应的方法。为了提高模型对不同噪声的自适应性,改进方法对不同高斯分布提出了自适应的阈值,以排除由于噪声或光照引起的误判问题;为提高在静态场景下,背景模型的自适应性,对模型的学习采用不同的速率,建立实时的背景模型。
混合高斯模型是对背景图像中的每个像素点,利用k个高斯分布对其进行模拟,用其概率密度函数的加权和表示该像素点的概率密度函数。则在t时刻,背景图像中某点(x,y)的概率密度为:
其中,It为t时刻的像素值,文中从实时性方面考虑,仅采用YUV颜色空间中的亮度信息;ωt,i为t时刻混合高斯模型中第i个高斯分布的权重;σt,i和µt,i为t时刻第i个高斯分布的方差和均值;ηi(It,µt,i,σt,i)为第i个高斯分布的概率密度函数,其定义如下:
则认为当前像素与第 j个高斯分布匹配成功,并中止与后续模型的匹配。其中匹配阈值γ一般取2.5。
对与当前像素匹配成功的第 j个高斯分布,采用(4)式和(5)式对其均值和方差进
行更新。式中ρ为学习速率,其反映了当前像素融入背景的速率。
对未匹配上的高斯分布,其方差和均值都保持不变。如果k个高斯分布均与当前像素值不匹配,则取当前像素值为均值,给定一个较大的值为方差,建立一个新的高斯分布,代替最小的高斯分布。
对k个高斯分布的权值采用下式进行修正:
式中,当i=j时,Mt,i取值为 1,否则,取值为0。
高斯模型的匹配由均值、方差和匹配阈值γ这三个参数完全决定,对均值和方差的修正通过模型的实时更新来实现,模型匹配阈值一般采用固定的数值,而没有考虑场景中像素值随噪声和光照所发生的变化,因此会产生大量的误检测点。不同的匹配阈值将直接影响模型的精确性、稳定性。
如果噪声和光照使得像素值与匹配模型的均值距离较小,那么采用固定的阈值肯定会将该像素判为背景像素,反之,该像素会被误判为前景像素点。因此,为了处理不同的噪声对检测结果的影响,引入自适应的模型匹配阈值γ。
式中,γ主要依赖于当前所匹配模型的方差。
由高斯分布函数的特性可知,如果方差越大,则说明概率密度函数越扁平,即像素值的分布较为平缓,此时,若采用固定的匹配阈值,将会使大量的前景像素点被误判为背景。若采用本文提出的自适应匹配阈值,当方差越大时,γ值越小,因此可以有效地降低误检测率。反之,如果方差越小,则概率密度函数越陡峭,即像素值的分布较为集中,若采用传统混合高斯模型的匹配阈值,必定会使大量的背景像素点被误判为前景。而采用文中提出的自适应匹配阈值,可以有效地缓解该现象。
注意到视频监控场景中通常只有运动目标区域是比较混乱的,而大部分区域是静止的,静止区域的像素点通常具有相同的像素值,而且该像素值总是和同一个高斯分布相匹配的,则与其相对应的高斯分布出现的概率就越大。经过学习后,该高斯分布应该具有较大的权重。但是,传统的混合高斯模型并没有考虑到这种情况,仅仅关注的是像素点均值的变化情况。因此,为了有效地检测静态背景区域,并提高模型的稳定性和自适应性,引入参数ζ,统计连续帧中每个像素与同一个高斯分布相匹配的次数。
式中,kt为t时刻与该像素匹配的高斯分布,kt-1为t-1时刻与该像素匹配的高斯分布。如果tζ超过阈值ζmin,则利用下式更新权重学习速率。
式中,m是大于 1的常量;α是初始的权重学习速率。
通过统计某点像素与同一个高斯分布连续匹配次数,针对不同的情况,采用不同的权重学习速率,使静态区域具有较大的权重学习速率,可以有效地改善检测的性能,并且提高模型的稳定性。
为了验证改进算法的有效性,进行了大量的实验测试,文中列举了两段视频中的部分结果并进行分析。在普通 PC机(CPU为Core(TM) i3 M 2.13 GHz,内存为4 GB,操作系统为 Windows 7)上的 Matlab R2009a平台上进行仿真实验。其中算法所涉及的参数:k=3,α=0.001,m=10,ζmin=10。实验结果如图1和图2所示。
图1 室内场景下,本文算法与传统混合高斯模型的检测结果比较
图1是室内场景下,改进后算法与传统混合高斯模型的检测结果对比图。采用的视频序列是从网上(http://groups.inf.ed.ac.uk/vision/CAVIAR/CAVIARDATA1/)获取的,共有599帧,分辨率为384×288,帧率为25帧/s。其中,图1(a)为视频序列中的检测图像,图1(b)和(c)为采用传统混合高斯模型和改进方法构建的背景,图1(d)和(e)分别是利用传统混合高斯模型和本文方法所分割的前景图像。由于场景中存在光线的变化,以及前景目标和背景颜色相一致的现象,导致图1(d)中有大量的前景被误检为背景,而观察本文方法检测的结果可知,改进的算法能够很好的克服光线变化对检测结果的影响,而且在室内场景中能够获得更加稳定的背景。
图2 室外场景第462帧的检测结果
图2是选自一段典型的室外场景视频,分辨率为384×288,帧率为30帧/s,特点是运动物体速度快,场景中存在全局的光照变化以及树枝的摇摆。文中采用的是视频序列的第462帧,其中图2(a)是原始图像,(b)和(c)分别为采用传统混合高斯模型和改进算法检测得到的背景图像,比较两个背景图像,可以发现在室外场景中,传统的混合高斯模型不能获得完整的背景模型,而利用本文算法构建的背景模型更加精确,更加接近真实的背景,因此获得的检测结果也更加的精确。
最后,为了更加直观的反映本文算法的有效性,将上述视频序列正确检测出的前景像素点比例 CFP(Correct Foreground Propotion)和背景像素点比例CBP(Correct Background Propotion)的平均值列于表 1中。其中,是检测到的正确目标像素点,P1是实际的目标像素点,P21是检测到的正确背景像素点,P2是实际的背景像素点。
表1 算法检测结果对比表
实验表明,不论是在室内场景还是室外场景,还是相对于传统的混合高斯模型算法,本文方法都能有效地克服将前景像素点误判为背景的现象,并且构建出更为稳定的背景,很好地克服了光照以及噪声对检测结果的影响。
通过研究传统的混合高斯模型算法,文中提出了一种新的改进方法。该方法对不同的高斯分布采用自适应的匹配阈值,克服了由噪声和光照引起的误检测点;并在此基础上,对静态场景中特定像素满足同一高斯分布的次数进行统计,根据其是否超过一定的阈值,对权重学习速率进行不同的更新,从而提高算法的精确性,获得更加稳定的背景模型。实验表明,改进的算法不仅能够有效地抑制光照和噪声对检测结果的影响,而且在不同的场景中能够建立精确的背景模型。进一步要做的工作是研究如何在不降低精度的前提下,提高算法的实时性。
[1]Olivier Barnich,Marc Van Droogenbroeck.ViBe:A universal background subtraction algorithm for video sequences[J].IEEE Transactions on Image Processing,2011,20(6):1709-1724.
[2]Haritaoglu I, Harwood D, Davis L S.W4:real-time surveillance of people and their activities[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2000,22(8):809-830.
[3]Zha Ye-fei,Bi Du-yan.Adaptive learning algorithm based on mixture Gaussian background [J].Journal of Systems Engineering and Electronics, 2007,18(2):369-373.
[4]马义德,朱望飞,安世霞,等。改进的基于高斯混合模型的运动目标检测方法[J].计算机应用.2007,27(10):2244-2246.
[5]原春锋,王传旭,张祥光,等。光照突变环境下基于高斯混合模型和梯度信息的视频分割[J].中国图象图形学报,2007,12(11):2068-2072.
[6]Gang Chen, Zhezhou Yu, Qing Wen, et al.Improved Gaussian Mixture Model for Moving Object Detection.Springer Verlag Berlin Heidelberg 2011:179-186.
[7]陈明生,梁光明,孙即祥,等.利用时空背景模型的快速运动目标检测方法[J].中国图象图形学报,2011,16(6):1002-1007.
[8]李亚玲,徐荣青,聂桂军,等.适应场景光照变化的运动目标检测算法[J].计算机技术与发展,2011,21(2):140-142.