周灵娟
摘要:针对视频序列中的局部异常事件检测,提出了一种基于稀疏编码模型异常事件检测方法。首先对训练视频序列提取出时空块,然后通过用谱聚类算法对时空块进行学习并得到不同的人群事件。由训练得到的人群事件的类中心建立字典,最后用正交匹配跟踪算法重建测试样本的核矢量。实验结果表明,本方法对人群中局部异常行为能进行检测与定位,且具有较好的识别率。
关键词:谱聚类;稀疏编码;字典;正交匹配跟踪;
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2015)33-0125-04
Local Abnormal Event Detection in Crowded Scenes
ZHOU Ling-juan
(School of Communication Engineering, Hangzhou Dianzi University, Hangzhou 310018, China)
Abstract:This paper proposed a novel approach based on spare coding model to detect abnormal behavior in video sequences.firstly, the video sequence is cropped into spatio-temporal volumes,and then them are studied by spectral clustering algorithm. A dictionary is set up by the class center of the group event,and the kernel vector of the test sample is reconstructed by orthogonal matching tracking algorithm. Experimental results show that the proposed method have better detection performance in detecting the local abnormal events than state-of-the-art approaches.
Key words:spectral clustering;sparse coding ;dictionary; orthogonal matching tracking
视频异常事件检测是指能自动分析视频监控场景中发生的异常事件,并能对其发出报警信号。例如步行街上的骑车、轮滑和车辆通行,广场上人群的恐慌、踩踏等这些异常事件都能及时的被检测到并进行报警。它能提高相关部门的响应和救援效率,从而在视频监控领域有着广泛的应用前景。通常人群异常事件分为局部异常事件和全局异常事件[1]。局部异常事件是指人群中某些目标对象的行为异于其他个体的行为,如步行街上的车辆移动、地铁口入口的逆行等。人群中局部异常事件检测作为计算机智能监控领域的一方面,具有实时、智能、高效的特点,在安防领域发挥着巨大的作用。目前,已经出现了多种针对人群中局部异常事件检测的模型,如文献[2]通过采用混合高斯模型学习与归纳出训练阶段中不同类型的运动特征的规律,根据学到的模型,对每一个输入的测试样本数据计算它的概率估计值,如果其值小于设定的阈值,则该测试样本数据被判为异常事件。该混合高斯模型算法识别率很差。而文献[3]采用混合动态纹理模型用来有效的表达场景中表象和动态信息。混合动态纹理模型虽具有较好的识别率但是其算法复杂度高且效率低。本文采用光流来描述局部特征,然后利用谱聚类算法[4]对其进行特征学习,最后对所有训练得到的人群事件的类中心建立字典。
1 局部异常事件检测算法研究
1.1 方法概述
对人群中局部异常事件检测分为两个阶段:训练阶段和测试阶段。训练阶段是指采用谱聚类算法去学习与归纳出不同类型的局部运动特征,得到所有人群事件的类中心并对其建立相似矩阵来作为字典;测试阶段是指首先提取局部运动特征,然后求出其与训练阶段所得到的每类人群事件类中心的核函数值,并以此来建立核矢量,最后获取它关于字典稀疏的表达重构误差,并将其与已设定的阈值进行比较,如果重构误差大于阈值,则判为异常。
1.2 特征提取
将视频段中每一帧分割成互不重叠且大小为[N×N]的块,并连续取[M]帧,得到大小为[N×N×M]的立方体块,每个立方体块称为原子。设视频帧的分辨率大小为[W×H],每一帧得到块的数量[f_block=(WN)×(HN)],[t]时刻位置[loci]上块的运动信息用一个直方图表示[hloci t=[h1,h2,h3,h4]],[1≤loci≤f_block],其中[hloci t]中的各个分量是根据光流方向按90度间隔量化获得的4个方向上的光流幅值之和。结合历史时刻的直方图信息,t时刻位置[loci]上的原子可以表示为[xloci t=[hloci t-(M-1)/2…hloci t+(M-1)/2]],[M]取奇数,[1≤loci≤f_block]。取一段视频,以[M]帧为单位分成[N1]小段,得到原子数量为[N1×f_block],由这些原子构成原子集合。
2 实验结果
实验的主要参数取值如下:[N=10],[M=3],[N1=7],[th1=-50],[th2=]0.375。所有实验使用Matlab与C++混编,其中VS2008、Matlab R2010b 64-bit、OPENCV计算机视觉库、Armadillo C++ library[6]所使用的操作系统是windows7 64-bit。硬件配置如下:Interl I5 CPU,2GB RAM。为了验证本文方法的有效性,引用最近公布的UCSD[3]数据库进行实验分析。UCSD数据库属于局部异常事件检测,即视频帧中会同时存在正常和异常事件。图3给出了部分测试实验效果图,其中第一排来自ped1的测试视频,第二排来自ped2的测试视频,图中异常事件用红颜色标记出来。通过比较等错误率大小来评判方法的好坏,等错误率越小,表示异常事件检测效果越好。其中,等错误率是指误报率等于漏报率。本文采用基于像素级和图像帧级的等错误率定性和定量地验证本方法的性能。表1给出了基于帧级别的等错误率、表2给出了基于像素级别的等错误率,从表1、表2可知本文方法的效果优于其他几种方法。
3结束语
本文针对视 频序列中局部异常事件检测,提出了一种基于稀疏编码模型的异常事件检测模型。在训练阶段,本文采用谱聚类算法去学习与归纳出不同类型的运动特征,得到所有人群事件类中心并对其建立字典,然后在测试阶段,输入测试样本并求得它的核矢量,最后获取它关于字典稀疏的表达重构误差,并将其与已设定的阈值比较,如果重构误差大于阈值,则判为异常。实验结果表明本文所提出的算法具有较高的异常事件识别率。
参考文献:
[1] 吴新宇,郭会文,李楠楠,等. 基于视频的人群异常事件检测综述[J]. 电子测量与仪器学报,2014(6):575-584.
[2] 独大为. 拥挤场景下视频异常事件检测技术研究[D].成都:电子科技大学,2013.
[3] Mahadevan V, Li W, Bhalodia V, et al. Anomaly detection in crowded scenes[C]//Computer
Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on. IEEE, 2010: 1975-1981.
[4] Kumar S P, Ramaswami K S. Fuzzy K- means cluster validation for institutional quality assessment[C]. Communication and Computational Intelligence (INCOCCI),2010:628-635.
[5] Joel A Tropp, Anna C Gilbert. Signal Recovery from Partial Information via Orthogonal Matching Pursuit[J]. 2000 Mathematics Subject Classification, 2005:1-18.
[6] Sanderson C. Armadillo: An open source C++ linear algebra library for fast prototyping and computationally intensive experiments[R]. Technical report, NICTA, 2010.http://arma.sour-ceforge.net.
[7] Kim J , Grauman K..Observe locally, infer globally: A space-time MRF for detecting abnormal activities with incremental updates [C].Proceedings of the 2009 IEEE International Conference on Computer Vision and Pattern Recognition 2009:2921-2928.
[8] Reddy V, Sanderson C, Lovell B C. Improved anomaly detection in crowded scenes via cell-based analysis of foreground speed, size and texture[C]. Proceedings of the 2011 IEEE International Conference on Computer Vision and Pattern Recognition Workshops (CVPRW) 2011:55-61.
[9] Thida M, How-Lung Eng, Remagnino P. Laplacian Eigenmap With Temporal Constraints forLocal Abnormality Detection in Crowded Scenes[J].IEEE Transactions on Cybernetics,2013,43(6):2147-2156.
[10] Cong Y,Yuan J, Liu J. Sparse reconstruction cost for abnormal event detection[C]. Proc.
IEEE Conf. Computer Vision and Pattern Recognition, 2011:3449-3456.
[11] Adam A, Rivlin E, Shimshoni I, et al. Robust real-time unusual event detection using multiple fixed-location monitors[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2008(30):555–560.