沈 雯 王慧琴 胡 燕 马宗方
(西安建筑科技大学信息与控制工程学院 陕西 西安 710055)
概念粗糙
—支持向量机的启发式火焰特征优化与分类算法研究
沈雯王慧琴胡燕马宗方
(西安建筑科技大学信息与控制工程学院陕西 西安 710055)
摘要针对目前火焰图像特征不能随监控场景自适应选择的问题,提出基于概念格粗糙集—支持向量机的启发式火焰图像特征选择与探测新算法。通过对火焰特征数据离散化,建立概念格的形式背景,计算形式背景的区别矩阵,再利用属性重要性指标对不同属性的重要性进行计算,最后将得到的最简特征分类集输入支持向量机中进行测试。实验证明,该方法的识别准确率明显高于单独应用粗糙集进行特征选择和人工进行特征选择时的识别准确率,达到了提高效率,减少误报等的目的。
关键词特征选择图像型火灾探测概念格粗糙集支持向量机
0引言
图像型火灾探测的基本原理是通过摄像头采集现场的视频图像,对采集到的视频图像进行分割提取,如果提取出区域的特征符合火焰或烟雾的特有特征,则发出火灾报警信号。
近几年来,随着图像型火灾探测技术越来越成熟,支持向量机等技术已广泛应用于火灾探测中,把支持向量机理论应用于图像型火灾探测的成果层出不穷,例如杨娜娟[1]等提出的基于支持向量机的图像型火灾探测,马宗方[2]等提出的快速支持向量机的图像型火灾探测算法,胡燕[3]等提出的基于独立成分分析和粗糙集的图像型火灾探测,但这些研究只是人工选取火焰图像的固定特征,并没有让图像特征根据场景的不同自适应选择。胡燕[4]等提出了基于粗糙集和支持向量机的火灾探测算法,利用粗糙集的属性约简算法对特征进行选择,但是没有考虑单个特征的属性重要程度。针对这类问题,本文提出了概念粗糙——支持向量机的启发式的火灾探测新算法。概念格[5]是一种有效的知识表示与知识发现的工具,是根据对象和属性之间的二元关系建立起来的一种概念层次结构,是数据分析和规则提取的一种有效工具,它的一个重要方面是知识约简。而粗糙集[4]是一种处理模糊不确定型的数学方法,核心问题是属性约简。本文结合二者的优势用于火焰特征分类选择,将特征的出现频率作为属性重要性度量指标,从中自适应选择最佳特征组合,达到提高火灾探测的准确率和效率的目的。
1基本理论
定义1设(U,A,F)是形式背景,其中U={u1,u2,…}是有限对象集,A={a1,a2,…}是有限属性集,F∈U×A为U和A之间的二元关系,若(x,a)∈F,则称x具有属性a,记为xFa,若(x,a)∉F,则称x不具有属性a。这种二元关系成为概念格[6]。
定义2设(U,R)为近似空间,U是对象集,R是U上的等价关系,由(U,R)产生的等价类[7]为:
U/R={[xi]R|xj∈R}
其中[xi]R={xj|(xi,xj)∈R}。
概念格的形式背景通常由二维表来表示,横向表示属性,纵向表示对象,第i行j列的数据为1表示存在该属性,为0表示不存在该属性。这种定义方式可使对象的知识以数据表格形式描述,数据表成为问题的形式背景[8]。
定义3设|U|=n,形式背景的差别矩阵D[6]是一个n阶矩阵,其任意元素mi,j={a∈C:f(xi,a)≠f(xj,a)且w(xi,xj)=1},其中:
显然,D是一个对角线为空的对称矩阵。
定义4设U是一个论域,P为定义在U上的一个等价关系簇,P中所有必要关系组成的集合,称为簇集P的核[6],记作C0。
定义5设决策系统(U,A,F)的核属性集为C0(可以为空),a∈C-C0定义在核属性集中添加某个属性后的互信息再除以该属性的自信息量为关于属性a的互信息分布率(属性重要性)[6]:
2概念粗糙启发式火灾特征分类算法
火焰具有圆形度,尖角数,面积变化率等特征,首先对采集到的视频火灾进行探测,检测不同燃烧材料的不同火焰特征,并对不同燃烧材料的特征数据进行统计,得到火灾探测系统的形式背景。然后建立特征量归类表,对不同火焰特征的数据进行分类、总结,确定特征量归类表。通过特征量归类表对火灾探测系统的形式背景属性值完全相同的燃烧材料归类,简化形式背景。计算简化后数据的区别矩阵。找出差别矩阵中由单个属性构成的元素项,这些单个元素构成了相对核C0。消去差别矩阵D中含有核C0的元素项,再计算剩余元素的SGF(a,C0,D)值,将SGF(a,C0,D)值最大者加入C0,再将差别矩阵中含有C0的元素项消去。重复以上步骤,直到差别矩阵为空时,就得到了一个相对最优属性约简集C0。
输入一个形式背景(U,A,F),其中U为所有火灾数据对象集,A为有限属性集,F为U和A之间的二元关系。
输出一个相对约简集C0。
1) 通过对火焰图像特征的分析研究构造特征量归类表,并通过特征量归类表对获取的样本数据进行离散化,建立数据的形式背景。
2) 利用上述定义2的等价类算法删除形式背景中属性值相同的对象,简化形式背景。
3) 利用定义3计算区别矩阵。
4) 找出区别矩阵中只含有单个属性ak的元素项,令核C0=∪ak。
5) 将区别矩阵中含有核C0的组合项置空;如果D为空,则转7)。
6) 除去核C0中的元素,利用定义5的公式,计算余下元素的SGF(ak,C0,D)值:
6.1) 选择SGF(ak,C0,D)值最大的元素,并入核C0中,将区别矩阵中含有C0的元素项置空;
6.2) 如果D为空,则转7),否则转6.1)。
7) 输出核C0。
3概念粗糙—支持向量机的启发式火焰特征优化与分类算法流程
支持向量机SVM是对于小样本、高维数、非线性的分类问题效果显著。但是只单单将支持向量机应用于火焰的特征识别中,需要对特征逐个进行识别,冗余性高,识别时间比较长。现将概念粗糙约简后的特征输入支持向量机中,对分类器进行训练,达到降维、简化分类器、提高火灾识别速度的目的。基于概念粗糙——支持向量机的启发式火焰特征优化与分类算法框图如图1所示。
图1 概念粗糙—支持向量机的启发式火焰特征优化与分类算法流程
4实验结果及分析
分别在公路边,网球场旁,实验室楼里和大型厂房内提取一段有火视频和一段相应的干扰视频,对视频进行分帧处理,从每段有火视频和干扰视频中取出20帧图像作为训练样本,对它们进行分割和特征提取,所得的实验数据如表1所示。
表1 火焰特征的实验数据表
从上面的实验结果可以看出,有火视频如汽油,柴油,酒精灯等尖角数相对较多,而打火机和日光灯则尖角数少,几乎趋于0。平均圆形度,有火视频的平均圆形度较小,而打火机,日光灯等平均圆形度较大,而这些显著的特征都很容易发现是否有火。
特征量归类表即对上面所测得的特征数据进行离散化的标准。用a1、a2、a3、a4、a5、a6、a7、a8、a9和1、0表示圆形度、尖角数、面积变化率等9种特征和决策结果,属性A={a1,a2,a3,a4,a5,a6,a7,a8,a9},属性值Y= { 0,1}分别代表无火和有火。通过大量火灾图像实验仿真,确定特征量归类表如表2所示。
表2 特征量归类表
(1) 计算区别矩阵
根据简化后的形式背景计算区别矩阵:D=
(2) 利用属性重要性度量指标对特征进行约简
由上面的区别矩阵可知,属性a8已经被约简掉,矩阵的第5行第6列含有单个元素a3,构成相对核。于是消去差别矩阵中含有a3的元素项,消去后差别矩阵不为空,再计算剩余属性a1,a2,a4,a5,a6,a7,a9的SGF值。得到a1的SGF值最大,将a1加入到相对核中。将差别矩阵中含有a1的元素项消去,这时消去后的差别矩阵仍不为空。重复以上步骤,直到差别矩阵为空时,就得到了一个相对最优属性约简集R={a1,a3,a6}={圆形度,面积变化率,偏心率}。
(3) 输入支持向量机中进行测试
根据实验经验,火灾分类模型选用径向基核函σ=0.2和惩罚因子C=100。利用实验室楼里和大型厂房内提取两组视频作为测试数据的来源,从两组视频中各提取120帧图像作为测试数据,分别用本文算法与文献[1]和文献[2]进行对比试验,试验结果如表3所示。
表3 三种方法对比试验结果
从表3的实验数据可以看出,在视频序列1中,本文算法在保证识别速度的前提下,识别准确率比文献[1]高出2.8%,比文献[4]高出了1.1%。同样在视频序列2中,本文算法的识别准确率也略高于文献[1]和文献[4],这是因为概念格粗糙集启发式算法不仅对属性进行约简,而且就单个属性的重要性进行度量,选取了最能够描述火焰图像特征的属性作为火灾分类依据,从而达到了提高效率,减少误报等的目的。
5结语
本文就提高火灾探测准确率和效率等为目的研究了火灾图像探测的特征选择的新方法,即在特征选择过程中将属性重要性的度量指标和粗糙集的中改进的区分矩阵运用于概念格中的属性约简,减少了特征之间的相关性,降低了特征空间的维数。通过仿真实验验证了算法的可行性和有效性。
参考文献
[1] 杨娜娟,王慧琴,马宗方.基于支持向量机的图像型火灾探 测[J].计算机应用,2010,30(4):1129-1140.
[2] 马宗方,程咏梅,潘泉,等.基于快速支持向量机的图像型火灾探测算法[J].计算机应用研究,2010,27(10):3985-3987.
[3] 胡燕,王慧琴,马宗方,等.基于独立成分分析和支持向量机的图像型火灾探测[J].计算机应用,2012,32(3):889-892.
[4] 胡燕,王慧琴,秦薇薇,等.基于粗糙集的火灾图像特征选择与识别[J].计算机应用,2013,33(3):704-707.
[5] 吕跃进,刘洪梅.改进的概念格属性约简算法[J].计算机工程与应用,2011,47(8):146-148.
[6] 王柯,朱启兵.一种基于差别矩阵的启发式属性约简算法[J].计算机工程与科学,2008,30(6):73-75.
[7] 戴上平,何田,谢祥明.概念格与粗糙集的数据分析方法研究[J].计算机工程与设计,2008,6(29):1423-1425.
[8] 王凯,李绍稳,张友华,等.概念格理论与方法研究[J].农业网络信息,2010(3):14-27.
[9]GB15631-2008特种火灾探测器[S].北京:中国标准出版社,2008.
[10]CelikT,DemirelH.Firedetectioninvideosequencesusingagenericcolormode[J].FireSafetyJournal,2009,44(2):147-158.
[11]WirthM,ZarembaR.Flameregiondetectionbasedonhistogrambackprojection[C]//Proceedingsof2010CanadianConferenceComputerandRobotVision.Washington,DC:IEEEComputerSociety,2010:1163-1167.
RESEARCH ON HEURISTIC FLAME FEATURES OPTIMISATION AND CLASSIFICATIONALGORITHMBASEDONCONCEPTANDROUGH-SUPPORTVECTORMACHINE
Shen WenWang HuiqinHu YanMa Zongfang
(School of Information and Control Engineering,Xi’an University of Architecture and Technology,Xi’an 710055,Shaanxi,China)
AbstractAiming at the problem that currently the flame image features cannot be adaptively selected along with the monitoring scenes, this paper put forward a new algorithm of heuristic flame image features selection and detection, which is based on concept lattice and rough set—support vector machine (SVM). Through the discretisation of fire flame feature data, we built the formal background of concept lattice, calculated its difference matrix, and then used attribute importance indexes to calculate the importance of different attributes, and finally we put the derived simplest feature classification set into SVM for test. Experiments proved that the recognition rate of this method was obviously higher than that of feature selection using sole rough set and manual work, and reached the goal of efficiency and false alarm reduction.
KeywordsFeature selectionImage fire detectionConcept latticeRough setSupport vector machine
收稿日期:2014-11-19。陕西省教育厅专项科研计划项目(14JK 1438);陕西省自然科学基础研究计划项目(2012JQ8021);高等学校博士学科点专项科研基金项目(20126120110008)。沈雯,硕士生,主研领域:数字图像处理。王慧琴,教授。胡燕,博士生。马宗方,博士生。
中图分类号TP3
文献标识码A
DOI:10.3969/j.issn.1000-386x.2016.06.051