戴 航,郭秀娟
吉林建筑大学 电气与计算机学院,长春 130118
随着我国综合国力不断增强、经济快速增长,城市复杂性越来越高,安全问题逐渐成为人们关心的重要问题.智能视频监控仍有图像模糊、目标捕捉困难及人工筛选视频效率低等问题.但在这三方面中,智能保障有更高的提升空间,也是更快更好提升安全防护的重要保障,在很多领域中发挥着重要作用.随着计算机硬件技术的不断完善,各种环境复杂的地区对智能视频监控的要求也越来越高.目前,此领域在国际上比较有代表性的项目,例如DARPA针对军用及民用特殊情况下视频自动监视、分析与理解;此外,VSAM及AVS项目等也做出了一系列的阶段性成果[1].此外,还有很多与智能视频监控相关的会议,如CVIU,ECCV和ICCV等.我国智能视频监控技术起步较晚,但也取得了一系列的阶段性科研成果.例如GIS智慧校园[2],Canny算子视频监控图像滤波算法[3],以及异常行为在图像帧上标注[4]等.就现有的研究和技术而言,对运动目标的检测仍是目前国内亟待突破的难题.
运动目标的检测目前常用的算法包括光流法、帧间差分法、边缘检测法和背景减除法.这四种方法各有其优势与不足[5]:光流法方法简单但计算量大,易受噪声影响:高精度光流法常用于判断人群异常行为[6];帧间差分法计算复杂度低但准确度也低;边缘检测法对于运动速度缓慢的目标不能准确捕捉目标:背景减除法的优势在于能够获得较为完整的运动目标.本文的核心工作在于应用背景减除法建立高效的检测模型.
背景减除法是将当前的视频帧与建立的背景模型进行比较,通过判定灰度等特征的变化,或直方图等统计信息的变化来分割运动目标,同时判断异常情况的发生与否.要应用背景减除法,首先就是建立输入图像即摄像机拍到的图像的背景模型.
根据目标对象提取的准确性,背景建模的方法可以分为:均值函数法、中值函数法、单高斯背景建模以及混合高斯背景建模4种方法.相邻帧差法相对简单,但其对环境的变化及抗干扰能力比较低,而且检测结果对运动目标的速度比较敏感[7-10].混合高斯模型的背景减除法则可以提供更好的检测效果,能够检测出更完整的运动目标,适应更为复杂的视频监控场景.针对复杂多变的场景,混合高斯模型相比于单高斯[11]及其他建模方式展现出了良好的适应能力,为运动目标分析提供科学性的数据支持.通过对4种常用的运动目标检测方法的分析,本文选取背景减除法中的混合高斯模型进行建模,同时针对混合高斯背景建模这种方法进行深入讨论.
高斯背景建模是将计算机学习后的视频序列,通过高斯概率密度函数来精确量化视频序列,让它们以高斯分布的模型的形态展现出来,从而完成背景模型建立.图像的背景有单模态和多模态两种[12].背景中的每个像素颜色分布集中,缓慢变化的简单场景,称为单模态,采用单高斯背景建模;对于发生突然变化的复杂场景,称为多模态,采用混合高斯背景建模.由于小区有树木,有居民,有车辆等,呈现多模态,故在分析时采用混合高斯背景建模.本文通过对混合高斯建模的参数进行调试,达到对背景图目标精确检测的目的.
背景模型的建立分为以下3种基础建模方式[13]:视频帧建模,区域建模及像素建模[14]方式,具体如表1所示.
表1 基础建模方式Table 1 Basic modeling method
虽然表1所指出的背景建模方式仍有不足,但以视频帧为基础的背景建模方式已经由Wang.L[15]进行了改进,其他两种背景建模方式仍有待更多学者提出优化措施.背景建模效果如何取决于建模方式的鲁棒性.
确定了建模方式以及建模方法,混合高斯建模流程如下[16]:
(1) 初始化高斯背景模型参数定义. 设定背景建模所需帧的个数、每个像素要用到的高斯函数的个数、背景阈值、更新阈值、最小连通域面积、高斯分布的权值和初始化方差.图像(0-T)内每个像素亮度平均值为μ,方差为σ2,则初始化的高斯模型参数如下:
(1)
(2)
(2) 背景模型的匹配. 对于某一帧t,像素点的灰度值为Xt,当满足灰度值与(t-1)时刻第i个高斯分布的期望值的差的绝对值小于等于经验值和标准差的积时,可以认为该像素值与高斯模型匹配.其中,经验值在2.5~3之间,一般取2.5.
(3) 背景的更新. 混合高斯模型更新是为了更快地适应变化的背景以及更强的抗干扰能力.设α为背景更新系数,α∈(0,1),α表示背景模型的更新速度,α的值越大表示背景模型的更新速度越快.
(4) 前景点和背景点的判定. 假设前帧中各点的像素值在某一帧t时,像素点的灰度值为Xt..若该均值满足灰度值与(t-1)时刻第i个高斯分布的期望值之差的绝对值小于等于经验值和标准差的积时,可以认为该帧中的点属于背景点;若上述条件不成立,则属于前景点.
在背景的更新过程中,α值并不是越大越好.如果α太大,将导致背景更新速度比场景更新快,出现运动目标缺失的情况.针对不同环境采取不同的α值.更新公式如下:
μt+1=(1-α)μt+Xt
(3)
σt+12=(1-α)σt2+α(Xt-μt)2
(4)
在模型更新时间和背景学习速度之间,笔者列出了一个表格,时间选取范围在2 s~40 s,速率由1 %~20 %,具体如表2所示.
表2 更新时间和背景学习速度Table 2 Update time and background learning speed
通过Matlab进行拟合,结果如图1所示.
图1 速率和时间的变化关系Fig.1 The change of the relationship between velocity and time
由图1可以看出,在2 s到3 s时,背景更新速率为18 %,故得出α=0.18为场景更新的最优速率.
采用Matlab语言针对该方法编码实现,原图如图2所示,背景图见图3.
图2 原图Fig.2 The original image
图3 背景图Fig.3 Background
通过设置阈值参数来提取图片的背景模型,具体如下.组成混合高斯的单高斯数目为3,阈值为2.5个标准差,学习率决定更新速度取0.2,前景阈值取0.25,初始化标准差取36.通过调节参数,可以获得更多的混合高斯建模方式.方法的难点在于保证合理更新的同时,为复杂场景寻找理想可靠的背景模型,而图3就是我们找到原图的背景.
本文针对视频监控中背景减除法建模的混合高斯模型,设计分析了建模流程及其存在的问题.通过调整设计参数,寻找出最合适的更新时间和背景学习速度,改善了混合高斯模型的更新速率,提取监控图片中的背景图,解决了日常生活中由于背景看不清楚导致监控出现问题的情形.