冯莹莹,赵莎莎
(阜阳师范学院 信息工程学院,安徽 阜阳 236041)
基于智能视频监控系统的运动目标检测和跟踪研究
冯莹莹,赵莎莎
(阜阳师范学院 信息工程学院,安徽 阜阳 236041)
运动目标检测和跟踪技术是视频监控系统中的两大关键技术,本文以智能视频监控系统研究为基点,介绍了智能视频监控系统的兴起及组成部分、运动目标检测与跟踪算法的基本作用原理,阐述了基于智能视频监控系统的运动目标检测方法和运动目标检测方法的实现,分析了包括基于均值偏移的跟踪算法、基于粒子滤波的跟踪算法、融合Mean-Shift的粒子滤波跟踪算法在内的运动跟踪方法,对于后期智能视频监控系统的运动目标检测和跟踪研究具有一定的指导意义.
智能分析;监控;目标检测;目标跟踪
智能监控是一种以计算机视觉以及视频图像分析技术为基础,按照摄像机所记录的图像序列实现自动分析功能,以达到对动态场景中的目标定位和根据为目的的方式.在智能监控领域能够轻易实现对日常状况的监控,加强管理工作.而运动检测与跟踪研究工作是智能视频监控系统中的两大重要课题,其主要存在以下方面的困难:监控图像序列往往较为复杂,光线问题以及监控目标的动态变化状态的获取具有一定的难度,对运动物体的正确检测造成一定难度;在跟踪研究方面,当物体的运动具有不确定性或者目标被遮挡时,想得到物体的运动轨迹变存在一定难度.对此,本文列举了几类智能视频监控系统中的运动目标检测与跟踪研究方法,以供参考.
1.1 智能视频监控系统的兴起
当前,视频监控在安全防范过程中起着十分重要的作用.从古至今,“监控”一词一直被人所提及,但随着科学技术的发展,真正意义上的视频监控直到十九世纪七十年代才真正出现.监控技术发展初期,信息处理工作几乎都是由人工来处理和决策,之后智能视频监控开始尝试用计算机技术实现信息处理,并取得了显著效果.总的来说,视频监控技术具有较长的发展历史,大致可分为三个发展阶段,分别为:(1)模拟化时代:二十世纪八十年代之前,智能视频监控的核心技术在于光学成像技术和电子技术,具有技术成熟、费用低廉的特点,但也存在传输速度慢、图像质量差的缺点;(2)数字化时代:二十世纪八十年代中期到二十世纪九十年代末期,以ISDN网络技术为基础,通过数字压缩、数字硬盘录像机等技术应用的数字视频监控系统可看作是第二代监控模式,其具有图像质量好、实现模块化管理的特点,缺点在于数据存储量大,不便于使用;(3)智能化时代:进入二十一世纪后,随着IP网络技术的到来,视频监控技术随即进入了IP时代.其显著特点在于监控技术的智能化,但分析算法对环境具有较高的要求.
1.2 智能视频监控系统的组成
1.2.1 前端部分
前段部分的任务主要在于进行模拟信号的拍摄、云台控制以及报警等,其主要设备包括摄像头、警笛、云台和防护罩等.其中摄像头用于采集所监控场景的模拟信号,再通过传输介质进行传输,另外还能够通过变焦镜头来改变监控区的远近和大小,同时做到光圈、调焦等技术的调整.云台和防护罩的作用在于保护摄像头免受损坏,并对摄像头的拍摄角度进行适当调整,也可以通过云台的内置解码器达到软件控制镜头和云台的目的,警笛的作用在于发生意外情况下启动报警措施.
1.2.2 传输部分
传输部分通常由多种不同的传输介质组成,其传输方式主要有无线、双绞线、同轴线缆等,对此系统常通过按照前端部分距离监控部分的距离程度来选择传输方式.传输部分需将前端摄像头所拍图像传输至控制部分,这也意味着要求传输部分传输时尽可能耗时少,且质量可信,便于确保控制部分所受到的图像信息可以较清楚地显示.
1.2.3 控制部分
作为视频监控系统的核心部分,控制部分的作用主要包括完成图像压缩、视频图像的记录以及智能分析、发送控制信息等工作,其常有采集卡和一台含有视频监控软件的计算机组成.
2.1 运动目标检测方法
2.1.1 光流法
光流法是一种通过分析图像序列的光流场以实现对运动目标进行检测的方法.光流指的是空间物体在被观测表面上的像素点运动的瞬时速度场,而光流场是以二维图像来表示物体点的速度场.求解运动目标的光流(速度矢量)是该技术的核心部分.事实上,光流计算过程中,会考虑实际物体在空间上的连续运动性,则认为运动过程中,传感器平面上所接受到的图像变化具有连续性,此时,便可认为图像瞬时灰度值相同.
事实证明,光流法能够在不清楚场景信息的状况下检测出运动目标,帧间差分法和背景减法而言,其检测精度更具可靠性,同时也可解决检测目标的重合以及遮挡问题.光流法使用的缺陷在于其计算方法极为复杂,且具有较大的运算量,因此对计算机设备要求较高.
2.1.2 帧间差分法
所谓帧间差分法,指的是通过对连续两帧或者多帧之间的视频图像相减从而得到差分图像的一种方法.在具体应用中,首先是在差分图像上检测运动变化所在的区域,之后再通过区域上的灰度信息来恢复前面的运动目标.在运动目标检测中,帧间差分法凭借其计算简单、检测速度快、适应性强等诸多优点得到了最为广泛的应用.但是,帧间差分法对完整目标的检测具有一定的难度,并且尚不能对检测目标进行比较深入的分析和识别,因此会对后续工作的处理带来一定的困难.此外,帧间差分法作为一种时间差分法,对两帧之间的动态变化的敏感性不足,当运动目标速度较低时,极易导致运动物体内产生空洞现象.
2.1.3 背景减法
背景减法的基本思想是将背景模型同输入图像做出比较,利用灰度特征的变化情况,或统计信息的变化情况来判断异常情况的发生和运动目标的分割.背景减法的难点主要在于为适应实际环境中的变化情况,背景模型的建立和维持具有一定的难度.目前,背景估计方法主要有基于分布模型的方法以及基于自适应的方法两种.背景减法特点在于可以提供较为完整的运动目标信息,但对环境噪声以及光线的变化情况都十分敏感,因此为适应动态场景的变化情况和外界干扰因素,背景图像需要不断更新.对此,我国当前研究较多的是局域统计模型的方法,主要有非参数化模型、混高斯分布模型等.
2.2 运动目标检测实现
2.2.1 问题的提出
众所周知,在运动目标检测的实现过程中,以下三个问题需得到解决:检测目标往往是运动的,检测背景会随着检测目标位置的移动和变化,具有不固定性.因此,每次视频采集时图像背景的获取需得到解决;在得到背景图像之后,需考虑用何种方式触发采集设备,将视频流序列中的图像采集出来;此外,我们也应该考虑到,背景通常会根据光线、天气变化等因素出现改变,不同时刻具有不同的背景图像,若使用相同背景,必然会到来检测结果的偏差,背景更新问题随之出现.
2.2.2 帧间差分法重建背景
将视频流中连续帧的图像进行对比分析,不难看出不同图像分为前景和背景两个部分.其中前景区域像素点的灰度值变化较大,不仅包括了运动目标当前区域也包含原来所在的区域,背景区域像素点的灰度值变化则相对较小.因此,对于系统检测背景不一致,随检测对象运动而变化的问题,我们认为可以在每次进行图像采集之前,用帧间差分法重新获取背景图像信息,重建背景.取一段连续时间的视频图像,将得到的帧图像两两相差,并取各帧中背景像素点的灰度值平均值为背景图像.其中,计算背景像素灰度值的步骤为:首先将得到的背景像素点的灰度值相加,再对对应像素点的灰度值进行累加,除以检测次数,得到了每个背景像素点的灰度值即为对应计算结果,最终得出背景图像.
2.2.3 基于运动对象检测的视频抓图实现方法
我们可通过摄像头得到视频流,图像为每秒三十帧.在得到的背景图像中设置检测区,可选择128×128的区域,当区域内出现运动对象时,视频图像的纹理特征及灰度会出现变化,连续检测视频图像变化,当其变化特征到达一定程度时,随机触发设备并抓取视频帧.对于用何种方式触发采集设备,将视频流序列中的图像采集出来的问题.接着,可以先采用背景差分法来区分运动目标点以及背景点,之后通过滤除检测区内的误差像素点以判断触发采集设备和获得视频帧的时间.
2.2.4 自适应的背景更新方法
背景通常会根据光线、天气变化等因素出现改变,不同时刻具有不同的背景图像的问题.笔者以为可选择使用相减分割方法,将背景定时更新,以达到分割效果.基本原理为利用对视频序列的当前背景以及当前帧加权平均更新背景.通过多次实验可知,帧中可能含有前景目标,因此在更新前需将像素分为前景和背景两个部分,之后再用当前帧的背景像素来修正当前背景.对应于前景目标的像素值为一,而其余像素值则为零,通过对应二值函数来确定应当对哪个图像抽样和更新背景.
3.1 基于均值偏移的跟踪算法
均值偏移,即在完成计算规定的起始点的偏移均值量后,以该数量值作为起始点移动的距离值,之后,再以起始点移动后的位置作为新的起点,并沿密度函数梯度方向移动,最终在一个局部最优点出收敛.均值偏移作为一种连续循环迭代的计算模式,其实质为通过迭代,持续新的目标位置点.事实上,基于均值偏移的跟踪算法的目标末班通常通过图像的颜色特征来确定.该算法主要包括三个步骤,分别为:初始化搜索窗,以设定跟踪目标窗口;对目标模板的质心和中心位置分别计算,并通过均值偏移向量使模板中心移至质心;重复上述过程,指导找到Bhattacharyya系列取得极大值的位置,便为目标真实位置.
3.2 基于粒子滤波的跟踪算法
粒子滤波方法是一种用带权的样本粒子表达后验概率分布的一种方法,而粒子滤波器是基于蒙特卡洛模拟和贝叶斯估计原理提出了实时推理算法.样本点于任意空间状态漂移和扩散等进行循环,随后这些样本的权重乘以测量概率密度以实现重采样过程,进而生成新的样本粒子.实践证明,粒子滤波拥有灵活、简单、并行化的优点,能够较好地解决非高斯、非线性动态系统问题.其中,贝叶斯估计理论中,系统模型和测量模型必不可少,贝叶斯估计的最终目的在于通过系统模型预测状态的已知信息来获得系统状态变量的置信度,即后概率密度.蒙特卡洛采样作为随机模拟方法,是通过随机抽样的方式求解问题的.事实上,当所取样本数较大时,蒙特卡洛特性与后验概率密度近乎已知,蒙特卡洛粒子滤波器十分接近于贝叶斯最优边际.
3.3 融合Mean-Shift的粒子滤波跟踪算法
Mean-Shift算法具有计算效率高、算法相对简单且实用性强的特点,受到了广泛应用.该算法对目标的变形具有一定的适应能力,跟踪的鲁邦性对图像分析结果的可靠程度具有很强的依赖性.此外,Mean-Shift作为一种局部最优方法,易出现收敛于局部极值点的情况.对于目标的跟踪而言,当目标被局部遮挡或受到完全遮挡时,适应能力较差,且对目标单帧的移动距离要求较高.同时,笔者也以为,将Mean-Shift于粒子滤波相结合能够实现互补,主要表现在:Mean-Shift算法具有的聚类作用能够对粒子进行重新配置,进行改善粒子退化情况,提升采样的效率;粒子滤波则能够避免上述提到出现收敛于局部峰值点的线性.
多年来,对于智能视频监控系统的研究工作已取得了初步进展,部分运动目标检测和跟踪技术研究理论已基本成熟.但我们也应当意识到,随着社会的发展,智能视频监控领域作用将越来越突出,对监控质量、效率、精度等要求也必将越来越高.另一方面,持续深入开展智能视频监控系统研究工作依然还有很长的路要走.
〔1〕袁国武.智能视频监控中的运动目标检测和跟踪算法研究[D].云南大学,2012.
〔2〕陈瑜.智能视频监控系统中运动目标检测与跟踪算法的研究[D].江苏大学,2010.
〔3〕黄斯茜,李光.智能视频监控系统运动目标检测技术研究综述[J].信息通信,2012(04):57-58.
TN919;TP277
A
1673-260X(2017)01-0015-03
2016-10-27
安徽省自然科学研究项目:动态多视角下基于计算机视觉的运动目标跟踪理论与方法研究(2015FXTZK02);安徽省自然科学研究项目:复杂视觉场景下基于多摄像头协同的运动目标定位与跟踪技术研究(KJ2016A554)