游佩佩, 何建农
(福州大学数学与计算机科学学院, 福建 福州 350116)
基于双向分析的KGMM运动目标检测算法
游佩佩, 何建农
(福州大学数学与计算机科学学院, 福建 福州350116)
针对传统的目标检测算法往往是顺着时间轴方向从过去到现在分析视频序列, 而忽略当前帧之后的逆向视频帧信息, 对于复杂场景下的背景突变或光照变化的运动目标检测等方面存在不足. 提出了基于双向分析的(KGMM)运动目标检测方法. 在KGMM模型基础上, 加入向后分析建立混合高斯模型, 有效解决了较强的背景扰动和环境的复杂变化带来检测效果不好的问题, 提高了算法的适应性. 向前分析模型与向后分析模型共享一个高斯分布集, 减少了高斯分布个数, 保证了算法的运行速度. 实验结果表明, 改进的算法检测效果更理想.
混合高斯模型; 双向建模; 运动目标检测
基于图像序列的运动目标检测是智能视频监控、 交通检测及步态识别等领域的重要研究内容. 目前主要的运动目标检测方法有光流法、 帧差法、 背景差分法. 光流法需多次迭代运算, 计算复杂耗时, 一般难以实现实时检测, 算法抗噪声等干扰能力较差, 实际应用较少[1]. 帧差法检测出的运动目标位置不精确, 一般不能完全提取出所有相关特征像素点, 容易出现空洞现象等[2]. 背景差分法直接通过比较当前帧与背景模型之间差别来实现对运动目标检测, 具有数据运算量较小、 实现简单提取目标比较精准等优点[3].
背景差分法的核心在于背景提取. 经典的背景建模方法有基于统计的高斯混合模型方法[4-6], 能较好地描述多模态的背景分布, 对处理背景轻微扰动等情形有较好的应用效果. 文献[7]提出的在线K均值聚类混合高斯模型(K-means Gaussian mixture model, KGMM)采用在线K均值聚类对混合高斯模型进行初始化, 在一定程度上提高了检测的准确度. 但是对于复杂场景下的背景突变、 光照变化等问题, 上述两种方法只采用当前帧之前的帧信息来检测当前帧的像素点, 而背景的某些变化导致的像素值变化可能在当前帧检测不到却在之后几帧中表现出来[8], 这样会造成检测效果不够准确. 为此, 本文在KGMM模型基础上, 在时间轴上采用双向分析法, 综合考虑当前帧之前以及之后的帧信息对当前帧像素值的影响并进行分析, 建立双向KGMM模型, 提高了算法对复杂背景扰动的鲁棒性. 向前和向后分析共享一个高斯分布集并同时对像素点进行检测, 且根据相邻像素点间的空间位置相关性采用隔点建模, 减少了模型的高斯分布个数, 提高了算法的运行速度.
混合高斯模型是通过多个高斯分布模态的加权混合对每个像素点进行建模来重建复杂变化的背景, 根据像素点在时间轴上组成的序列与背景模型中不同高斯分布匹配的频率, 不断更新模型中各个高斯分布的参数. 其中, 高斯分布的个数K一般取为3~5个, 本文用在线K均值方差聚类法初始化模型参数,K由聚类个数决定, 最大不超过5.
1.1KGMM模型的初始化
(1)
那么把该像素t时刻的值归为第i个聚类, 同时更新第i个聚类的相关参数. 聚类结束后, 根据每个像素对应的聚类个数确定该像素处的高斯分布个数, 并用每个聚类所对应的RGB彩色向量均值、 方差和样本个数来初始化对应的高斯分布的均值、 方差和权重. 其中xt为t时刻某位置处的样本像素值, μi, t为对应的均值,δi, t为方差,T1为样本与聚类中心均值允许的最大误差.
1.2背景的提取与更新
K个高斯分布按照优先级λi, t=ωi, t/δi, t从高到低排序(ωi, t,δi, t分别为各高斯分布的权值和方差), 取前B个高斯分布联合生成背景:
(2)
其中,T2为背景选取阈值(0 在模型匹配过程中, 高斯分布权重按照下式进行更新: (3) 其中:α为权值的更新速率;Mi, t在匹配的分布中取值为1, 其余分布取0. 对匹配的高斯分布的均值和方差按照式(4)、 (5)分别进行更新, 不匹配的高斯成分保持不变. (4) (5) (6) 式(3)~(6)中有两个重要的参数, 分别是权值更新速率α和均值、 方差的更新速率β,α通过式(6)决定β的大小, 它们决定着背景模型的更新速度. 1.3模型匹配及前景检测 将当前像素值xi, t与K个高斯分布按优先级以下式进行匹配: (7) 若xi, t与K个高斯分布中属于背景中某个高斯分布匹配, 则该像素点为背景点. 否则其被检测为前景点. KGMM算法使用在线聚类对各个高斯模型进行初始化, 减少了人工初始化模型带来的误差, 有效地提高了检测的准确度, 但是对复杂场景比较敏感. 为了提高KGMM算法对背景扰动的鲁棒性和检测的准确性, 本文在KGMM算法的基础上, 引入当前帧之后的N帧图像信息, 建立基于向前分析和双向分析的双向KGMM模型. 这里N越大, 向后分析得到的信息就越丰富, 检测的结果更精准, 却增加了算法的复杂度, 所以要权衡N的取值. 分别对N=1, 2, 3进行实验对比, 在实验部分详细讨论关于N的取值问题. 2.1KGMM的向后分析模型 背景的某些突变如光照变化可能在之后的几帧图像里体现出来. 一般光照变化引起的像素值的变化与运动引起的像素值变化是不一样的, 而从当前帧的像素值来看却是一样的, 这些变化在未来几帧的像素值会表现出来[8]. 传统的KGMM方法只向前分析当前像素点显然会忽略掉背景的这些变化, 而向后分析则能检测到. 向后分析模型是读取当前帧之后的N帧视频图像It+n(n=1, 2, …,N,t为当前时刻), 对It+n对应的像素点xi, t+n与高斯模型进行匹配, 对匹配的高斯分布进行参数的更新, 反之则不做任何操作. 其背景提取与前景点的分割与向前分析模型类似. 2.2双向分析KGMM模型 双向的KGMM模型是在所有高斯分布完成在线初始化之后, 向前与向后分析模型分别对像素值进行检测, 综合两个方向分析的结果最后判定像素点为前/背景点, 模型具体流程如图1所示. 分段逆时对称性是指从未来到现在的逆时序来观察视频序列, 由背景变化引起的像素值的变化在一小段时间内往往呈现对称的变化趋势, 例如像素点亮度值变强或者变暗在一小段时间内是重复出现的[8]. 由于背景的变化存在分段的逆时对称性, 向前、 向后分析模型就能共享一个高斯分布集, 从而减少了模型的高斯分布个数, 减少内存开销. 2.3双向分析KGMM实现步骤 1) 建模点的判断. 首先判断读取的当前像素点xi, t是否为建模点, 是建模点则进行下一步的初始化, 反之不做处理. 非建模点的值将根据其四领域内所有点的前/背景点的判定结果而判定为背景点或前景点. 2) 双向分析KGMM模型的初始化. 选取视频序列前M帧进行各像素的在线聚类, 对向前分析模型高斯分布参数进行初始化. 3) 模型匹配与更新. 向前分析模型对当前帧像素点进行匹配, 匹配的高斯分布按照式(3)~(5)对之进行更新, 不匹配的只对权值按照式(6)处理. 同时向后分析模型对It+n帧的对应位置像素点做与向前分析相同的处理. 当某个高斯分布同时被两个模型匹配, 则任选其中一个点对其进行更新. 当两个方向都没有找到匹配的高斯分布时, 只在向前分析模型里加入新的高斯分布. 4) 背景的提取与目标检测. 对各高斯分布的权值进行归一化处理, 然后将其按照优先级λi, t=ωi, t/δi, t从高到低排序, 取前B个分布联合生成背景, 将xi, t, xi, t+n再次匹配检验, 如果存在一个匹配, 则认为当前帧像素点为背景点, 否则为前景点. 对于本文提出的双向KGMM方法, 选取视频分析中常用的三个不同场景视频序列进行仿真实验. 场景1为Samplevideo.avi视频序列包含慢速运动的人(240×360, 15fps), 场景2由http://cvrr.ucsd.edu/aton/shadow提供的标准测试序列包含高速行驶车辆的室外场景(240×360, 30fps), 场景3是选自PETS2001视频库的测试视频PetsD1TeC1(384×288, 25fps)[9]. 实验硬件平台为Pentium(R)Dual-CoreT4500 2.3GHz处理器, 2G内存, 软件平台为Matlab2010b. 为了验证本文方法的有效性, 对于以上三个场景的视频序列分别进行了实验对比. 图2为实验结果对比图. 其中图2(a)、 (d)、 (g)分别为场景1、 2、 3的原始视频第52、 108、 80帧, 图2(b)、 (e)、 (h)分别为KGMM方法对场景1、 2、 3对应帧的检测结果, 图2(c)、 (f)、 (i)分别为文本方法对场景1、 2、 3对应帧的检测结果. 这里本文方法N取1. 从视频检测结果来看, 无论是室内慢速运动目标还是室外快速运动目标或者有强烈背景扰动的复杂场景, 本文的方法检测效果更好. 对于室内慢速运动的人, 当人几乎静止时,KGMM方法检测的结果出现了目标虚影, 这是对背景提取不够准确的结果. 而本文由于加入了向后分析, 充分利用了未来视频帧的信息, 提取的背景更准确, 从而检测结果不会出现虚影, 噪声更少. 对于复杂的室外场景,KGMM方法检测结果都出现了大量噪声, 甚至在背景扰动比较厉害的第3个场景检测中出现误检的现象, 而本文方法仍然保持了较好的鲁棒性. 表1为两种检测方法所消耗的时间和高斯总数的对比结果. 从表1检测所消耗的时间与所需的高斯分布总数来看, 本文方法比传统KGMM检测所需时间和占用的内存更少, 检测效率更高. 表1 传统KGMM方法与本文方法检测总时间和高斯总数的对比结果Tab.1 Comparison of detection time and Gassusion number from KGMM and proposed method 同时对N取1、 2和3, 选取了室内场景1和室外场景2分别做了对比实验,对比结果详见表2. 根据表2中对N不同取值的实验数据可以看出,N的取值越大检测所消耗的时间越多、 占用的内存也更大. 表2 本文方法中N取1、 2和3时检测总时间和高斯总数的对比结果Tab.2 Comparison of detection time and Gassusion number from different N of proposed method 图3为N分别取1、 2和3时对两个场景的检测结果. 如实验结果所示,N取值越大, 对背景扰动的抑制效果越好, 检测结果的噪声也越少, 但是N=3时, 对背景过分学习导致了运动目标的边缘被判定为扰动的背景, 检测出来的运动目标不够完整. 而且对噪声没有很明显的改善,N的取值根据不同的场景而选定, 权衡好检测的实时性与准确性. 本文建议N取1或2比较合理. 针对复杂场景下背景的扰动和变化对运动目标检测鲁棒性的影响, 本文在KGMM模型基础上加入了向后分析功能, 充分利用视频序列上未来帧的像素信息, 建立双向分析的KGMM检测模型, 提高了检测的准确性. 向后分析模型与向前分析模型共享一个高斯分布集, 减少了本文方法的高斯分布总数从而提高了运行速度. 本文还讨论了N的取值问题,N越大检测结果的噪声越少而消耗的时间与存储空间也越多, 还可能出现对背景过分学习的现象, 因此建议N取1或2比较合理. 对多个不同场景的实验结果对比表明, 与传统的KGMM方法相比, 本文方法对各个场景检测出来的目标均更准确完整且噪声很少, 模型高斯分布个数和算法检测所需的时间更少, 具有更好的鲁棒性和实时性, 在后期的跟踪和识别中具有重要的参考价值. [1] 黄士科, 陶琳, 张天序. 一种改进的基于光流的运动目标检测方法[J]. 华中科技大学学报(自然科学版), 2005, 33(5): 39-41. [2] 邱道尹, 张文静, 顾波, 等. 帧差法在运动目标实时跟踪中的应用[J]. 华北水利水电学院学报, 2009(3): 45-46. [3] 李林, 卢焕章, 肖山竹, 等. 基于分级自适应背景差分的运动目标检测[J]. 电视技术, 2013, 37(7): 164-166. [4] QIAO Y L, SONG X R. Moving target detection in complex background[J]. Research Journal of Information Technology, 2012, 4: 195-203. [5] LIN C Y, CHANG W W, CHOU Y C. Bidirectional background modeling for video surveillance[J]. Journal of Electronic Science and Technology, 2012, 10(3): 232-237. [6] VARADARAJAN S, MILLER P, ZHOU H. Spatial mixture of Gaussians for dynamic background modelling[C]// 2013 10th IEEE International Conference on Advanced Video and Signal Based Surveillance. [S.l.]: IEEE, 2013: 63-68. [7] 李 明, 赵勋杰. 改进的基于高斯混合模型的运动目标检测算法[J]. 计算机工程与应用, 2011, 47(8): 204-206. [8] SHIMADA A, NAGAHARA H, TANIGUCHI R. Background modeling based on bidirectional analysis[C]// 2013 IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2013: 1 979-1 986. [9] LIU C, YUEN P C, QIU G. Object motion detection using information theoretic spatio-temporal saliency[J]. Pattern Recognition, 2009, 42(11): 2 897-2 906. (责任编辑: 林晓) The dynamic target detection algorithm based on bidirectional KGMM YOU Peipei, HE Jiannong (College of Mathematics and Computer Science, Fuzhou University, Fuzhou, Fujian 350116, China) For most traditional target detection methods, they prefer to use information observed in past frames when analyzing the video sequences instead of the opposite direction. As for suppressing strong background disturbance and complex environmental changes of background, the performs of KGMM do not so well . In order to solve the problem effectively, we proposed a bidirectional analysis method based on KGMM model which contains a backward establishment of Gaussian mixture model. Furthermore the forward analyzing model and backward analyzing model share one Gaussian distribution set, thus our method can reduce the number of Gaussian model and improve the operating speed. Experimental results show that the improved detection algorithm performs better. Gaussian mixture model; bidirectional modeling; dynamic object detecting 10.7631/issn.1000-2243.2016.01.0040 1000-2243(2016)01-0040-05 2014-03-18 何建农(1960-), 副教授, 主要从事智能图像处理、 信息安全,网络GIS等方面研究, 42566374@qq.com 国家自然科学基金资助项目(51277032) TP391 A2 基于双向分析的KGMM背景建模算法
4 实验结果与分析
5 结语