陈楠 洪峰 邹焕新 葛鲲鹏 侯梦琳
摘要:近年来,随着经济迅猛发展,社会治安问题日益凸显,各种场合对安全防范的需求不断增加,传统的监控模式已经远远不能满足现有需求,结合各监控场景特点的视频智能监控系统是热门发展趋势。本文在查阅大量参考文献的基础上,首先对视频智能监控系统的一般流程进行了概述,然后对智能视频监控系统相应常用技术进行了梳理归类,最后指出了视频智能监控系统存在的一些实际问题和困难,并对将来视频智能监控系统的发展趋势进行了展望。
关键词:智能监控系统 背景分析 目标跟踪 特征提取 特征分析
中图分类号:TN948.6 文献标识码:A 文章编号:1007-9416(2016)07-0012-02
1 引言
随着社会高速发展,突发事件也日益增多,因此人们对安防的要求也越来越高。传统的监控系统通常只具有视频录制功能,大部分监控任务还是由人工操作来完成,这样不仅仅费时费力同时漏报、错报现象还经常发生,这样给警察及相关安防人员带来了极大的不便。因此,视频智能监控系统具有广阔的应用前景,他已成为当今社会迫切需求的一种安放手段。视频智能监控系统是指在几乎不需人工干预的前提下,运用数字图像处理、机器视觉和模式识别等相关技术对监控探头拍摄下的视频序列进行自动处理分析,进而提取所需信息的一门综合性技术。
目前,国内外许多机构和科研工作者对智能视频监控技术有着很浓厚的兴趣,并进行了广泛研究。在航天工程、军事国防、司法领域、公共区域安防和公路交通安全等领域发挥了明显的作用。本文在参考大量文献的基础上,对智能视频监控系统进行了综述,文章的具体结构如下:第一部分为引言部分;第二部分给出了智能视频监控系统的主要流程;第三部分结合智能视频监控技术研究发展现状,对比较常用的系统相关算法进行了分析;第四部分探讨了智能视频监控技术存在的问题同时对下一步的发展方向进行了展望。
2 视频智能监控系统的一般流程
目前,智能视频监控系统的流程主要包括背景分析、目标跟踪、特征提取、行为分析四个主要步骤(图1所示)。
视频监控场景中的异常行为可以归纳为很少发生的事件,或者是以前未发生的行为。有许多不同类型的事件可以被描述为异常的,但常见的描述是这些行为偏离场景中出现的大多数行为。
为了能够建模异常行为,我们通过对视频训练集进行视觉主观分析开始。我们必须了解发生异常事件之前、期间及之后视频序列中发生了什么。通过测试一些相同类型的事件视频,我们发现可以为事件定义一套标准,标准作为阈值。如果符合所有预定义值,则判定相应异常事件发生。
系统提取场景中相关目标的外观特征。这些特征的融合包含了足够的信息可以描述目标进行相应异常事件的特性。
因为能够预定义一个目标的行为,因此能够构建一个系统,该系统用于提取和分析特征,提取的特征与预定义的标准做比较。每个特征通过阈值与每个准则做比较。对于每个特征,系统返回假定目标发生异常的帧数。如果每个特征比较返回相同的帧数,那么特征分析得出相同的结果。在这种情况下,说明每次比较对于目标异常行为的发生有相同的结果。
在目标异常行为发生之前、期间及之后,通过描述上述事件含有什么,我们就能够获得一套预定义准则。如果特征分析达到这些标,则能够确定目标异常行为已经发生,并且能够判定具体是哪一种异常行为。
3 智能视频监控系统相关技术
伴随着越来越多的智能视频监控系统陆续投入使用,视频序列智能化分析进入一个全新时代,计算机技术的发展使智能检测技术从传统的人工判读迈入了人工智能时代,很多学者投入大量精力研究视频序列异常行为检测技术当中,各种检测方法层出不穷,各有所长。目前,异常行为检测方法尚无严格的区分,抛开硬件因素和假想的算法,智能视频监控系统的核心技术一般来有背景提取、目标跟踪、特征提取及特征分析。
3.1 背景提取算法
背景差分法,可说是有效的低水平视觉处理,进而执行像运动分析、运动估计和目标跟踪等高级任务。为此就必须获得背景信息并随着时间推移更新的表示,然后与实际输入进行比较进而确定差异区域,这种方法必须是自适应的,并且能够处理光照条件的变化。当场景中存在运动目标时,图像在某些时间窗口平均是描述静态场景的有效途径,然后进一步描述连续函数,来更好地表现这种场面的光照。在有限和平稳变化的假设下,Christof Ridder等提出卡尔曼滤波器来获得背景特征,而C.R.Wren考虑了单边高斯分布的使用。
Jia等提出了新的基于颜色空间模型的阈值法,并将其应用到背景差法中,此模型使用每个像素的颜色失真和亮度失真来检测变化。颜色失真反应颜色空间中的向量位置,因此它可以有效地处理颜色特征。此外,此阈值法还某种程度地移除了运动的影子,将它应用于背景差法将获得一个比较完整的前景目标。对于相对复杂的背景,借鉴Canny边缘检测算法中滞后阈值的影响并将双阈值引入背景差法中,它实现了含有复杂背景的视频的鲁棒性检测,此法和其他多模型的方法相比,测试结果表明了该算法的可行性。
Friedman等的思想是,从时间平均背景图像中减去当前图像,只剩下非稳定的对象。然而,这只是当前图像分类的错误结果,它不适用于缓慢移动的目标,不能区分阴影和移动目标。对于缓慢目标,使用一个模型将每个像素分类,该模型是当一个像素属于不同类别时,通过使用无监督技术学习每个像素的混合高斯分类模型,这是EM的改进模板。不同于标准图像平均方法,这会根据目标间的可能性自动更新每个类的混合成分,因此能够完美地解决缓慢移动的物体,这种方法也比阈值法等其他方法更有效地标识和消除阴影。
3.2 目标跟踪算法
S.Calderara等提出动态编程技术有效地比较人轨迹的编码方案,此方案同时考虑了运动的方向和速度。其创新点在于采用动态编程技术有效地比较轨迹。此技术借用了生物信息学,将轨迹的编码作为一系列的方向和速度,并以有效的方式成对比较它们。然后,利用动态编程技术计算训练阶段轨迹对时间的总得分,而后通过k中心聚类算法将最终得分聚类。聚类后,每个类成员可以用于距类中心距离的一维高斯分布建模。最后,使用最大后验概率准则为具有最大后验概率的轨迹类分配了新的轨迹。
是一个检测跟踪多目标以及监测室外活动的实时视觉监控系统。它适用于单视灰度视频图像或红外视频图像。对人及其部位(头、手、脚、 躯干)进行形状分析和跟踪定位并创建人的外观模型,以便其可以通过如遮挡等障碍跟踪到目标,它可以判定前景区域是否包含多人,还可以将区域分割成数个人并跟踪他们,还可以判定行人是否携带物体,从其轮廓分割出物体,并为他们构建外观模型,以便可以在后续帧中标识它们。还可以识别人和物体间的行为,如存放物体、交换背包,或移除物体等。
跟踪图像序列中的多个运动目标包括运动检测和分割是一项复杂的任务。图像运动可能在帧间变化极大,如随着监控探头振动图像运动变化较大,由于不能假设时间运动恒常性,这种变化在跟踪长时间序列的时候非常困难。Michal Irani等提出了使用时空一体化而不用假设运动恒常性的检测跟踪方法,将序列中的每一帧与跟踪目标的动态内部表示图相比,在基于运动计算之后,通过瞬时整合帧构建此图像。瞬时整合帧适用于增强某些区域,在这些区域中运动被跟踪,这些效果有助于后续帧的运动分析,便于继续跟踪相同目标和分割相同跟踪区域。
3.3 特征提取方法
特征提取在模式识别、模式分类、数据挖掘、 机器学习上一直是一个重要的研究课题,已被许多研究者广泛研究。大多通用的特征提取方法是使用类间的标准函数或全局函数。虽然这些方法在大多数情况下相对适用,但在多分类问题上却不是最佳方案。为了解决这一问题,Choi等提出一种优化多类别分类问题的特征提取方法,该文章中第一次研究特征空间中多分类问题的分类精度分布,发现存在很多更好的特征集,这些特征集是传统的特征提取算法所不能找到的,该文章提出了发现这种特征的算法。遥感数据的实验结果表明,相比于传统特征提取算法,该算法有更好的性能。
3.4 特征分析方法
Li等[使用多模特征分析提出了异常行为检测框架。在这一框架中,先从视频数据中提取多模特征,然后分析这些特征形成多个中级概念,如视频镜头,人脸外观等。然后采用逻辑回归分析和贝叶斯置信网络这两个方案,将多模特征分析和感兴趣视频行为检测中提取的信息相融合。作者旨在将这个框架作为一个通用模板用于不同视频域中的行为检测。在不同视频域中的不同测试视频上进行实验,结果表明此种方案是可行的。
4 智能视频监控系统发展前景展望
由于智能视频监控系统的现实需求,异常行为检测的研究也越来越深入,许多机构和学者等都做了大量的工作。从现有的智能视频监控系统中我们不难看出,在实际应用上还存在一些问题,具体有以下几个方面:
(1)背景分析作为监控系统运行过程中一个非常重要的步骤,他为目标前景提取奠定了基础,背景分割不好将会导致后续阶段的数据特征生成不足。改进现有方法和算法来进行背景差分法为将来继续研究更高的相关课题提供技术支持。
(2)加强标记过程来改进目标的跟踪。就这点来说,想要改善系统必须改善标记过程,使系统能够在同一时间跟踪同一场景中的几个运动目标。此外为了能够处理场景中的几个物体,只要目标存在于场景中,每个目标应该给一个静态的标记。
(3)系统应能够处理其他类型的异常行为。这将包括为每个新的事件制定新的标准,并在已存在的系统中完成这些功能。
5 结语
本文从视频监控系统的发展史入手,而后对智能视频监控系统的一般流程和方法及现有的方法进行了分类总结,对一些常用的、有代表性的方法进行了梳理分类,并对异常行为检测技术的发展前景进行了展望,分析了现有检测方法上存在的问题和困难,同时对下一步的发展趋势进行了大胆预测。相信随着更高智能化分析系统的出现,应用需求的不断增加,技术手段的持续发展,智能视频监控系统将会得到更广泛的应用。