◎潘梁静
(商丘职业技术学院基础部,河南 商丘 476100)
运动目标检测方法多应用于从视频监控环境中提取出处于运动状态的前景(运动目标),并将其相对静止的背景图像中分离出来,实现复杂动态场景中的运动目标提取与分割[1-3]。将运动目标识别方法应用到居家安全防护中,可以及时发现独居老人的运动状态,提早防范并以最快速度达到制止与降低其损害发生的目的,也能降低人力监控成本。
当前运动目标检测常见算法包括背景差分法、帧间差分法、光流法[4-6]。其中,背景差分法的时间复杂度较小,能够快速检测与识别出运动目标,但需要提前人工设置背景图像或者依托统计模型自适应设置背景图像,对运动目标的空间信息利用不够,提取出的运动目标的轮廓不连续、不完整[5]。帧间差分法利用视频中帧图像的空间特征对运动目标进行检测与提取,但缺少对图像内部特征像素点的关注与提取,提取出的运动目标轮廓同样存在不完整问题[7]。区别于背景差分法与帧间差分法对视频帧图像内部信息的忽视,美国学者Hom 和Schunch 提出了光流法,对图像中运动目标所在像素点的动态行为等作为运动目标检测的依据,着眼于从视频图像内部信息层面对运动目标的运动状态、轨迹等进行跟踪,进而识别出运动目标。所谓光流是指空间中物体被观测面上的像素点运动产生的瞬时速度场,包含了物体表面结构和动态行为等重要信息。基于光流法的运动目标检测采用了运动目标随时间变化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动和景物三维结构的丰富信息,这种方法不仅适用于运动目标的检测,还可以在运动目标跟踪方面使用,甚至在摄像头存在运动的情况下也能检测出独立运动的目标[8]。但是在实际的应用中,由于遮挡、多光源、透明性及噪声等原因,光流法的基本假设条件之一:光流场基本方程——灰度守恒通常无法满足,不能正确求出光流场,算法计算过程也相当复杂,计算量巨大,不能满足运动目标实时检测识别的要求[9]。综上,从实际应用角度来看,帧差法和背景减法相结合的运动检测方法是使用最广泛的一种方法[2]。结合帧差法和背景减法有效地消除了光线突变和阴影,但是对于灰度值接近背景的前景目标检测效果不理想。
总之,当前运动目标检测与识别仍然存在如下问题有待研究:(1)在运动目标分割过程中,背景的提取与更新是比较关键的步骤。如果背景静止不变,则运动目标分割相对容易实现,然而,多数情况下,背景是动态变化的,常存在物体的移入或移出,如果不能很好地处理背景中的干扰现象,则作为前景的运动物体的检测必将受到影响。(2)视频场景中光线变化问题(渐变、突变、反光等),同样会影响背景的提取与更新。必须不断地对背景进行实时估计,才能更好地完成运动目标的检测。(3)背景物体的干扰运动。背景中存在的如风中树叶的摇动、水面波光的闪动、车窗玻璃的反光以及天气的变化等许多细微活动,同样会影响到运动目标的检测。该研究主要对上述问题加以解决,提高运动目标识别的精度与效率。
早期的混合高斯模型法容易受到光影影响导致将光线或阴影分割成前景部分,针对此问题通常是对阴影部分做侦测,将阴影值部分去除,达到前景运动目标大致轮廓提取的目的,其缺点为容易受到背景快速变动影响,或有无反射与强光照射时,将光线等判断成目标对象移动等状况[8]。为了解决这样的问题,借由高斯滤波法提取前景运动目标,达到消除多余噪音且不过多破坏运动目标轮廓的目的;接着针对可能有破碎或是断裂情况的处理采用膨胀与侵蚀的形态学处理,先以膨胀进行修补运算,再利用侵蚀获得原本大致轮廓图。同时,针对背景对象快速移动时,强风致使背景有窗帘飘动或落叶等导致背景误判为前景对象这类情况,采用轮廓面积最大区块作为完整的运动目标轮廓图,实现对运动目标的准确识别。具体实现流程如图1 所示。
图1 运动目标检测基本流程图
在视频图像中如何去追踪出运动目标的移动及轮廓是该研究内容的重点,取得轮廓的完整性同时也影响了整个研究的准确性,利用适应性背景相减法旨在将前景运动目标及背景分离出来,利用获得的背景信息作为背景模型并利用背景相减法达到能区分出前景及背景的效果。
该方法的缺点在于,可能在背景对象变动过快或是风吹导致物品飘动时,前景提取存在误判的情形[10],该研究对此方法加以改进,针对前景阴影的图像信息做进一步提取,提出一种不易受到光影变化影响的方法。混合高斯模型(Gaussian Mixture Model,GMM)是由单一高斯分布模型所改良而来,常用于语音识别、机器学习及图像处理中,其定义的公式如(1)式:
其中XT为图像矩阵{x(t),...,x(t-T)},T 为周期,BG 为背景,FG 为前景,为平均值,为标准差,其参数算法在周期T 内的如下列(2)(3)(4)所示:
通过混合高斯模型对输入图像(图2)做长时间背景适应的训练,从而提取出完整的背景图(图3),并以此背景图作为背景模型,当有对象经过时,便判断为前景(图4),如长时间未移动的对象也将在时间适应下被当为背景。以事先提取好的背景作为第一帧,并以背景相减法的概念去判断前景,基于此得出大致前景对象,以便后续对运动目标进行识别。
图2 输入来源图像图
图3 混合高斯模型适应下的背景图
图4 使用混合高斯模型法得出前景(值255)与阴影(值127)部分图
形态学处理在图像处理中相当常见[11],该研究将其用于对所要追踪的运动目标轮廓进行更准确的描绘。首先将混合高斯模型所提取出的与背景分开的前景图像信息灰阶图进行处理,先以高斯滤波法对噪声加以消除,得出运动目标的大略轮廓图;再利用膨胀与侵蚀法对运动目标颜色与背景相同时所导致轮廓不完全连接的现象做处理;最后对完整运动目标连通部分寻找最大轮廓面积,作为识别出的运动目标。
2.2.1 高斯滤波
高斯滤波法(Gaussian Blur),也称为高斯平滑法,常用来模糊或柔化图像,或是去除图像中多余的噪声。图像的高斯滤波过程即对图像与正态分布进行卷积计算,其所使用的高斯滤波像素权重分布矩阵为基本3*3 矩阵,如式(5)[12]:
高斯滤波法的优点在于能够在取得前景后,对图像中的噪声进行有效消除(图5),且对运动目标轮廓存在的诸如破碎或是断裂等情况不过分消除,减少噪声对运动目标轮廓轨迹的干扰与影响,提高运动目标轮廓提取的完整性(图6)。
图5 使用高斯滤波法消除多余的细微噪声图
图6 高斯滤波下提取的运动目标完整轮廓图
2.2.2 膨胀与侵蚀
膨胀与侵蚀为形态学处理中常用的方法,主要用于解决图像中的目标对象轮廓断裂等问题。当运动目标颜色与背景颜色相似时,可能会产生将运动目标判定为背景或阴影一部分等现象,导致轮廓的完整性有缺失。该研究将膨胀与侵蚀处理应用到运动目标轮廓提取中,通过膨胀与侵蚀对运动目标轮廓进行更细节的处理[13]。
在设置膨胀参数时,一方面考虑到能够修补运动目标轮廓破碎与断裂,一方面又要避免过于膨胀的情况。经过不断尝试,运动目标高度在不超出边界情况下,最大即为输入图像来源的高度。因此可以采用输入图像高度值的百分之一取四舍五入至整数位的值作为膨胀参数,图像来源高度为480,故膨胀参数设置为长宽均为5。
在设置侵蚀参数时,由于需要通过膨胀去修补破碎情况,再侵蚀还原的过程下其参数值不得大于膨胀参数值,而此形态学膨胀处理主要目的也是在于膨胀修补。鉴于此,根据前面膨胀的参数值减一作为侵蚀参数,较符合整个运动目标轮廓提取且不过多侵蚀导致轮廓断裂情况发生的目标[14]。其中侵蚀参数设置为4。如图7 与8 为膨胀与侵蚀处理前后的运动目标。
图7 膨胀与侵蚀处理前的运动目标图
2.2.3 最大面积判断
图8 膨胀与侵蚀处理后的运动目标图
在对运动目标图像进行形态学处理后,处理结果中仍然存在如背景对象快速变动时被误判成前景区块的问题。借由计算轮廓面积去排除这类情形,采用寻找轮廓法,首先对该图像内所有对象轮廓进行提取并记录在轮廓矩阵中,再利用提取出的轮廓矩阵计算区块面积[15]。面积计算公式如(6):
如图9 所示为图像中所提取的运动目标,除挥棒的运动目标外,因风吹飘动的窗帘也被误判为前景;图10 为由最大面积判断后的运动目标轮廓,其将误判为前景的飘动窗帘加以剔除,实现了对运动目标的准确提取与识别。
图9 背景窗帘飘动误判为前景图
图10 经由最大面积寻找后得出运动目标轮廓图
测试所使用系统硬件设备是CPU 为Intel Core i5-4570@3.20GH,RAM 为8GB 的个人电脑,操作系统为Microsoft Windows7 专业版,系统开发工具采用VisualStdio 2010C/C++程序语言,搭配OpenCV2.4.9 版电脑视觉程序库一同开发研究而成。
在性能评估上,将笔者提出的运动目标检测方法与GMM、Zivkovic 版本的GMM(Z-GMM)进行比较,以某监控系统实时拍摄的视频为数据源,验证运动目标检测的效率与精度。每个程序模块皆由MS Visual C++进行编译并且使用单进程执行,整个实验所用的设备为Intel Core i7-2640M(2.8Gz)。在实验数据上,将GMM 模块的参数设置为K=3,Tσ=3,且η=0.01;在提出的运动目标检测方法上,参数设置为△b=256/N,a0=0.01,a1=a/2,β=1-a0。算法的阈值在两方法上皆设置为TF=0.25。图11 中的第一行为部分输入图像,为验证运动目标检测算法的精度,该研究设计了多样化的场景(共计4 个video),增加了图像中运动目标检测的复杂度,其中(a)&(b)为video1,(c)&(d)为video2,(e)&(f)为video3,(g)&(h)为video4。
如表1 所示为测试数据。
表1 测试数据表
利用GMM、ZGMM,提出方法对图像进行前景切割与运动目标检测,结果如图11 所示,图中,行1:输入图像;行2:标准前景切割结果;行3-6:GMM、ZGMM、笔者所提方法(Fixed-point 实现、N=16)以及笔者所提方法(Fixed-point 实现、N=32)的前景切割结果。由图中可知,基于混合高斯模型的运动目标检测方法在运动目标轮廓提取完整性、噪声去除等方面具有较好的视觉效果。
图11 前景切割结果比较图
对GMM、ZGMM,提出方法进行前景切割与运动目标检测的时间统计,分析不同方法的时效性,其结果如表2 所示(以GMM 的速度作为基准速度100%进行比较。单位:FPS)。根据对比可知,基于混合高斯模型的运动目标检测方法计算效率较高,比Z-GMM 快1.3 倍,比GMM 快3.7倍。对此情况进行分析,高计算效率的出现是由于算法使用了内存空间来换取处理时间。在程序执行期间,会有较频繁的内存空间存取的现象。
该研究旨在对监控系统中的运动目标进行识别,在对光流法与肤色等追踪方式研究的基础上,为了能更准确提取出运动目标位置与轮廓,采用了较快速的混合高斯模型法。早期的高斯模型存在容易受到光影影响导致将光线或阴影分割成前景部分的问题,为了改善该方法缺点,提出了高斯滤波、膨胀与侵蚀及面积计算等方式,以提高运动目标轮廓获取的完整性与准确性。