基于核Fisher判别分析视频运动目标的分类

2015-09-09 18:07刘丽红曾志高彭程杨凡稳周丹姚慧
计算技术与自动化 2015年2期
关键词:视频特征提取

刘丽红+曾志高+彭程+杨凡稳+周丹+姚慧丹

摘要:针对线性判别分析只能提取线性特征而不能描述非线性特征的缺点,本文采用将核函数和Fisher判别分析方法的可分性结合起来的核Fisher判别分析的方法对视频中的运动目标进行自动分类,运动目标包含人、汽车和宠物三类。该方法取得了较好的分类效果,且在查全率、查准率和F1 -Measure获得了满意的性能。

关键词:线性判别分析;特征提取;核Fisher判别分析;运动目标分类;视频

中图分类号:TP391.41 文献标识码:A

Classification  of  Moving  Targets  in  Video  Based  on  the  Kernel  Fisher  Discriminant  Analysis.

Liu Li hong1,  Zeng Zhi gao1*, Pen Cheng2, Yang Fangwen1, Zhou Dan1, Yao Huidan1

  • College of Computer and Communication, Hunan university of technology , Zhu Zhou, 412007;

2. School Of energy Power And Mechanical Engineering, Beijing, 102206)

Abstract: In order to overcome the shortage of linear discriminant analysis which can only extract linear features and can not describe nonlinear characteristics, the Kernel Fisher Discriminant Analysis algorithm, which combines the kernel learning and the separation of linear discriminant analysis, is adopted to automatically classify the moving objects in video, and in this paper, the objects include three categories: people, cars and pets. The method has obtained satisfying performance both in this system and in the recall, precision and F1-score.

Keywords: linear discriminant analysis; feature extraction,;kernel Fisher discriminant analysis;moving object classification,;video

1 引言

随着社会的发展人们安防意识的逐步增强,大量的视频监控被安装到小区门口、写字楼、商场、交通路口、车站、机场等公共场所。监控视频得到的海量视频数据靠人为的传统处理方式已经不能满足当前社会的安全需求[1]。

因此,视频监控的智能化给计算机视觉在公共安全领域的应用提供了广阔的前景[2]。视频监控是对场景中的异常事件或人的异常行为进行监控[3]。运动目标检测和分类识别一直是机器视觉研究应用及智能视频监控中的关键技术,一直是研究的热点之一,许多的分类算法被提

出[4]。文献[2]中的分类方法要对目标的实际高度

和宽度等参数进行统计,工作量非常大且不能对空中的目标进行识别分类。文献[5]基于形状特征的运动目标分类方法采用的形状特征受到前景检测的影响,不能使用不同环境下的视频监控应用。周维[6]提出的方法对前景和背景的区分能力比较强,但识别率不是很显著。郭玲[7]采用颜色直方图对目标进行识别,背景对其影响比较大,识别效果不是很好。针对之前的方法识别率不高和操作复杂的问题,本文采用核Fisher判别分析(Kernel Fisher Discrimination Analysis,KFDA)算法[8,9]对视频监控图像中的车子、人以及宠物三类目标进行分类,且取得了较好的分类效果。

2 视频中运动目标的特征提取

对于大多数的实际数据一般的非线性方法不能很好地描述图像中一些复杂的非线性变化[10]。核Fisher判别分析既具有核技巧的非线性描述能力,又继承了Fisher线性判别分析的优点[10]。本文采用核Fisher判别分析来做视频监控中运动目标的分类。

核方法比普通的非线性方法更具有优势,它可以借助核函数,避免“维数灾难”,减少计算量,且需要对输入的空间进行任何直接的非线性映射。下面我们来介绍下核函数。

2.1 核函数

核函数就是把输入样本采用非线性变换将其映射到一个合适的特征空间中,然后应用统计学等方法去解决问题。

一般核函数都是使用Mencer核实现,本文采取的是多项式核函数:

2.2 核Fisher判别准则

KFDA算法简单的说就是将核技巧应用到

Fisher线性鉴别分析中。KFDA算法的基本思想:首先将原始训练样本通过一个非线性映射函数映射到一个高维的特征空间中,再在高维特征空间中进行Fisher线性鉴别分析,这样就隐含的实现了原输入空间的非线性判别。之后只需要在高维特征空间中进行Fisher线性鉴别分析,这样相对于原始空间来说进行的就是非线性鉴别分析。

KFDA算法的核学习方法的技巧就是通过原始空间的内积核函数在进行所有的运算,并没有涉及到具体的非线性映射[9]。KFDA算法能够将图像的非线性特征提取出来,这些非线性特征更有利于分类。

2.3 核Fisher算法实现步骤

基于核Fisher分类要首先实现两类分类,返回最接近待测样品的类别,然后用返回的类别和新的类别做两类分类,又能够得到比较接近的类别,最后得出未知样品的类别。

① 首先创建一个核PCA分量将输入空间映射到KPDA特征空间中,在KPCA空间中计算出类间散布矩阵和类内散布矩阵。

④ 利用最优鉴别向量对映射到空间中的训练样本和测试样本进行投影,对投影后的对数据通过最近邻法进行分类。

3 实验结果

为了验证本文算法的优越性,所以在相同的条件下运用KFDA算法、PCA算法和PCA结合LDA的算法同时对视频静态背景中的三类目标(人、汽车和宠物)进行分类,并且对分类器的性能进行了比较和分析。

实验环境:MATLAB R2012a,Intel(R) Pentium(R) CPUG2030 3.00GHz.训练集中每类

包含10张图片,测试集每类包含174张照片。

3.1 分类结果图

基于KFDA算法的部分分类结果图如下:

图1 基于KFDA算法的部分分类效果图

3.2 分类器性能评价标准

3.3 分类器性能分析

对PCA算法、PCA+LDA(PLA)算法和KFDA算法的分类结果进行比较和分析。下面的表格是对实验结果的记录和分析。

由表(1)可以计算出基于各个算法分类的查准率P,查全率R,F-Measure F,以及总的分类准确率M,数据如下表:

表(2)查准率P,查全率R,F1-score以及

总的分类准确率的比较

为了更为直观的表示数据,我们采用图表的方式对表(2)进行描述,如下图所示:

(A) 查准率P        (B)查全率R

(C)F1-Measure    (D)总的分类正确率

图2 (A),(B),(C),(D)分别代表查准率,

查全率,F1-Measureh和总的分类正确率;

从图(D)中看出本文采取的KFDA算法在总的分类正确率是最高的,从单一的结果来看分类器的性能是不全面的,应该从各个分类器对各个类别的分类性能去研究和分析。查准率标准下的各个算法的分类性能比较:基于PCA算法和PCA+LDA算法的分类对人的分类性能比对车子和宠物的要稍高些,本文采取的基于KFDA算法则对各个类别的分类性能都不错,且各个种类的性能均优于前两种算法。查全率标准下各个算法的分类性能比较:基于PCA算法的分类对车子的分类性能是最佳的,基于PCA+LDA算法的分类对宠物的分类最好,本文采取的KFDA算法对所有的类别的分类性能都比其他两种算法要好。基于PCA算法和基于PCA+LDA算法对人的查准率虽然最高,但是其查全率比较低,所以得到的F-Score则不是最高的。从(C)中我们可以看出PCA+LDA算法对车子的分类性能最好,对人的其次,最差的就是对宠物的分类。从综合的F-Measure可以看出基于PCA+LDA算法的分类性能总体都要比基于PCA算法的分类性能要好,基于KFDA算法的分类性能则比基于PCA+LDA算法的性能高。

4 总 结

本文采用基于核的Fisher判别方法对监控视频中的运动目标进行分类,并与基于PCA和

PCA结合LDA的算法进行了比较分析。结果表明

本文算法取得了很好的分类效果,并且各方面

性能指数要优于其他两种算法。但是仍然有两

点问题,在分类的过程中我们会把受到的外部环境的影响和物体的角度等造成的非线性特征抽取出来了,且KFDA算法一样的要面对小样本问题。如何降低这些问题的影响是我们要进一步研究的内容。本文做的是静态的目标检测,下一步要研究的是将该算法应用到动态场景中。

参考文献:

[1]  李占闯. 监控视频中的运动目标分类算法研究[D]. 西南大学. 2010年.

[2]  陈大海. 智能视频监控系统中目标分类技术研究与应用[D].广西大学. 2011年.

[3]  张建军,黄山,张洪斌,杨权,汪勤.  基于视频的运动目标检测与识别[J].  现代电子技术. 2009, 08(295).

[4]  王建平,刘伟,王金玲.一种视频运动目标的检测与识别方法[J]. 计算机技术与自动化.2007,26(3):78-80.

[5]  李崇辉.视频监控中运动目标的分类方法研究[D].华南理工大学. 2013年.

[6]  周维.视频监控中运动目标发现与跟踪算法研究[D].中国科学技术大学.2012年.

[7]  郭玲.智能视频监控中运动目标检测的算法研究[D].华南理工大学.2013年.

[8]  Volker Roth, Volker Steinghage. Nonlinear discriminant analysis using kernel functions [A]. Proc of Neural Information Processing Systems[C]. Denver,1995:568-574.

[9]  Sebastian Mika, Gunnai Ratsch, Jason Weston, et al. Fisher discriminant analysis with kernel[A].IEEE Workshop on Networks for Signal Processing[C].Piscataway,1999:41-48.

[10]  杜世强;基于核Fisher判别的人脸识别方法研究[D].陕西师范大学. 2007年.

[11]  Volker Roth, Vokler Steinhage. Nolinear discriminant analysis using kernel funtions[C]. In S.A.Solla,T.K.Lene, K.R.Muller, ediotrs. Advance in Neuar Information Processing Systmes12. Cambridge,MA:MTT Press, 2000: 568-574.

[12]  Ming-Hsuan Yang, Kernel Eigenface vs. kernel Fisher: face recongnition using kernel methods. Proceding of the Fifth IEEE International Conference on Autiomatic Face and Guesture Recongnition. Washington D.C, 2002:215-220.

猜你喜欢
视频特征提取
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于曲率局部二值模式的深度图像手势特征提取
一种针对特定无线电信号的识别方法
基于模糊K近邻的语音情感识别
计算机基础课MOOC视频的制作方法
新浪网副总裁谈移动直播如何带来媒体弯道超车新机会
基于IPv6组播技术校园网络视频服务设计