基于LSA和SVM的火灾烟雾检测算法

2014-07-18 11:53顾小东李大湘
西安邮电大学学报 2014年6期
关键词:分块烟雾特征提取

刘 颖,顾小东,李大湘

(西安邮电大学 通信与信息工程学院, 陕西 西安 710121)

基于LSA和SVM的火灾烟雾检测算法

刘 颖,顾小东,李大湘

(西安邮电大学 通信与信息工程学院, 陕西 西安 710121)

为了解决视频烟雾检测中特征提取难度较大、复杂度较高的问题,提出一种基于潜在语义(Latent Semantic Analysis, LSA)特征和支持向量机(Support Vector Machine, SVM)的烟雾检测算法。该算法首先将烟雾图像库中的每幅图像进行有重叠分块,提取每个分块的小波纹理与HSV颜色特征;再对所有分块特征进行聚类、量化成“视觉字”,并且根据每个“视觉字”在每幅烟雾图像中出现的频率,建立“词-文档”矩阵;然后采用LSA方法获得每幅烟雾图像的潜在语义特征;最后结合SVM,实现视频烟雾检测。对比实验表明,该算法特征提取简便,可以更快检测烟雾的发生,提高了烟雾检测效率。

烟雾检测;潜在语义特征;支持向量机;特征提取;火灾识别

及时准确的烟雾检测,对于预防火灾的发生具有重要的意义。传统的烟雾检测技术,如感温、感烟、感光等技术易受到空间高度、气流、粉尘等因素的影响,不适合在大空间以及户外的环境。可视火灾检测技术由于其反应速度快,检测范围广,监测距离远等优点越来越受到人们的重视。它是将计算机视觉与图像处理相结合,利用烟雾的颜色、频谱、运动、轮廓等特征来检测是否存在烟雾。

目前现有的算法大多集中于运动区域的提取和帧间的特征提取方面。文献[1]利用小波变换分析图像帧在时域和空域的频率特性来检测是否存在烟雾,该算法很透彻地分析了烟雾的小波特性;文献[2]在运动区域提取时引入了烟雾的颜色模型和亮度模型确定烟雾的疑似区域,而后应用小波分析和稀疏光流法进行烟雾识别;文献[3]提出一种基于自适应神经模糊推理系统的视频烟雾检测算法;文献[4]提出基于空间区域生长和模糊推理的视频烟雾检测方法,采用三帧法与三通道区域生长分割算法提取烟雾疑似区域;文献[5]利用RGB和HSV空间的色彩和亮度特征,结合运动主方向检测烟雾;文献[6]通过背景相减提取运动物体,分析其颜色和纹理特点来判断烟雾是否存在;文献[7]应用烟雾区生长速度、区域不规则性、背景模糊性来检测烟雾;郑璐等[8]通过运动目标检测,再引入RGB模型降低误警率;文献[9]提出了一种基于块的视频烟雾检测算法;文献[10]提出一种基于码本模型和多特征的早期烟雾检测算法,该算法码本模型进行前景提取,结合颜色模型、形状模型检测疑似烟雾区域,利用烟雾动态特征识别烟雾;文献[11]提出一种基于最小二乘支持向量机的视频火灾烟雾识别算法。上述算法大多应用多帧差分获取运动区域以及利用烟雾的动态特征,算法相对复杂,代码代价较高。

本文提出了一种基于潜在语义(Latent Semantic Analysis, LSA)特征[12]和支持向量机(Support Vector Machine, SVM)[13-14]相结合的烟雾检测实现方法,即先针对视频中单帧图像提取其LSA特征,再应用SVM分类器进行烟雾识别。

1 烟雾图像潜在语义特征提取

通过对图像分块、特征提取来建立视觉词汇表,进而得到“词-文档”矩阵,之后再对该矩阵进行奇异值分解得到烟雾图库中每幅图像的潜在语义特征。

1.1 图像有重叠分块和特征提取

选取不同场景的烟雾图像和非烟雾图像,建立实验图像数据库。库中任意图像设为:Bi(i=1,2,…,N),其中N为库中图像总数。对每幅图像进行方形有重叠分块,假设第i个图像Bi被分割成mi小分块,其中第j块记作xij(j=1,2,…,mi),则图像Bi可记作:

Bi={xij:j=1,2,…,mi}。

提取每个分块xij的小波纹理特征和HSV颜色特征。(1)小波纹理:采用Daubechies小波对图像进行3级小波变换,每一级均得到一个低频分量cA和三个高频分量:水平cH、垂直cV和对角cD,然后分别计算每级分解三个高频分量的均值与方差,得到18维小波纹理特征。(2)HSV颜色特征:将图像变换到HSV空间,分别计算H、S、V三个分量的均值与方差,得到6维颜色特征。这样每幅小分块可用24维特征来描述。假设用hij表示分块xij的纹理与颜色特征,则图记为

Bi={hij:j=1,2,…,mi}。

1.2 建立视觉词汇表

将烟雾图像库记为

D={(B1,y1),(B2,y2),…,(BN,yN)},

(1)

其中yi为图像标号且yi∈{-1,+1}(i=1,2,…,N),-1表示无烟图像,+1表示有烟图像。将所有分块的特征hij排列在一起,记作

S={ht:t=1,2,…,T},

(2)

在特征空间中,采用K-Means方法将相近的特征聚集到一起,把S中的元素聚成K类,每个聚类中心都代表具有相近视觉特征的图像分块,称之为“视觉字”(visual word,VW),记作vi,将这K个视觉字组合到一起就构成“视觉词汇表”,记作

R={v1,v2,…,vk}。

(3)

1.3 建立“词-文档”矩阵

统计不同“视觉字”在各图像中出现的频数,则库中的每幅图像都可以用分块出现频数表示成一个列向量,记作

Bj=[n1,j,n2,j,…,ni,j,…,nK,j]T,

(4)

其中ni,j表示第i个“视觉字”在Bj中出现的次数,在统计频率时,进行TF-IDF加权,即

ωi,j=ni,j×log2(1+N/dfi),

(5)

其中ni,j表示“视觉字”vi在图像Bi中出现的次数,dfi表示库中包含“视觉字”vi的个数;N为库中图像总数。ωi,j表示了“视觉字”vi在库中图像Bi中的重要程度。

为了将ωi,j控制在相同的变化区间,提高分类性能,将其归一化处理,即

(6)

库中每个图像则可以表示成

(7)

这样将库中所有图像对应的列向量排在一起,可以得到图像库所对应的“词-文档”矩阵,记作

AK×N=[B1,B2,…,BN]=

(8)

1.4 LSA特征提取

潜在语义分析(LSA),作为一种自然语言的处理方法,其核心观点是:通过截断的奇异值分解,把在高维向量空间模型表示的文档矩阵映射到低维的潜在语义空间。根据奇异值分解定理,AK×N可以分解成3个矩阵相乘的形式,即

AK×N=UK×nSn×n(VN×n)T,

(9)

其中UK×N和VK×n为与AK×N奇异值相对应的左、右正交奇异值矩阵,既满足

UTU=VTV=I,

(10)

S是将奇异值按由大到小的顺序排列构成的对角矩阵。K为原特征空间的维数,N是图像总数,并且

n=min{K,N}。

(11)

如果在Sn×n中取前T个最大的奇异值,以及UK×n和VN×n的前T列,即UK×T、ST×T和(VN×T)T,则

AK×N≈UK×TST×T(VN×T)T,

(12)

即是AK×N在T阶最小二乘意义上的最佳近似。

式(12)通常被称为截断的奇异值分解,AK×N降维后变为

(13)

另设一幅测试图像

B=[ω1,ω2,…,ωk]T,

(14)

A=USVTUTA⟹UTUSDT⟹

UTA⟹SVT

(15)

推导出其潜在语义特征

(16)

其中UK×T为T个列向量所张成的潜在语义空间,这T个列向量就是潜在语义空间的基。

2 LSA-SVM算法

支持向量机(SVM)的目标是在潜在语义特征空间寻求最佳分类超平面,将问题转化为求解二次规划问题,即求解

(17)

的最优解,得到最优Lagrange乘子a*。其中K为核函数,C为惩罚参数。

利用样本库中的一个支持向量Bi带入判别函数

(18)

f(B)为其类别值(-1或1),则可得到偏差值b*。

LSA-SVM算法包括两个步骤:

(1)LSA-SVM训练

输入为聚类数目K值和截断维数T,以及样本集合

D={(B1,y1),(B2,y2),…,(BN,yN)} 。

输出为烟雾图像库中所有图像的LSA特征、潜在语义空间的基UK×T以及SVM分类器。

训练步骤如下。

Step1 图像分块及特征提取

对D中任意图像Bi,用1.1节所述方法对其进行分块及特征提取。

Step2 构造“词-文档”矩阵AK×N

利用K-Means方法对D中所有图像所有分块的视觉特征聚成K类,构造“视觉词汇表”,按照式(1)~式(8)得到归一化的“词-文档”矩阵。

Step3 LSA特征提取

对库中任意图像Bi∈D,按照式(9)~式(16),计算出其潜在语义特征,存入训练集中。

Step4 训练SVM分类器。

基于训练图像的潜在语义特征,求解式(17)的优化问题,得到SVM分类器(a*,b*)。

(2)烟雾识别

对任意被检测的新图像Bj,由式(16)计算得出潜在语义特征,送入SVM分类器(a*,b*)中,即由式(18)对其进行识别。

3 实验及结果分析

实验中选取的烟雾视频[15-16]总共包含不同的场景的烟雾视频15个和无烟视频8个。算法实现基于Win7操作系统,仿真软件Matlab2010b,计算机配置Inte l(R)Core(TM)2 Duo CPU 2.0GHz。

每隔20帧读取一幅图像,从中筛选出不同的烟雾图像和非烟雾图像,建立图像库,库中总图片1 735张,烟雾图像826张,无烟图像909张。对库中每幅图像进行有重叠分块,大小取50×50,步长取30,这样所有图像总共被划分成203 194个小分块。

每次训练中均利用“2-fold交叉检验”,寻找最优的SVM参数C(惩罚因子)与g(核函数控制因子)。SVM分类器参数尺度因子g=0.01,惩罚因子c=500。

从库中随机选取N(N可取400)张烟雾图像和N(取500)张无烟图像,作为训练样本,其余的图片作为测试样本,寻求最佳T(所截取的奇异值数目),将T由50取到240,步长为10,观察AUC值,如图1所示。

图1 不同T值下的AUC值

由实验结果可以看出,当聚类中心K=300时,得到T=190,效果最佳。

在取得最佳T值的情况下,统计数据选取库中8组不同场景的有烟测试视频,共8 842帧,6组无烟干扰视频,共2 067帧,分别进行检测。图2和图3分别给出了不同干扰情况下典型的烟雾视频和非烟雾视频的截图。

图2 烟雾图像

图3 非烟雾图像

从图中可以看出,视频中存在人物走动、车辆行进、白色背景、夜晚强光等因素的干扰。表2和表3分别为烟雾视频和无烟视频的检测结果且各参数均取最佳值。结果表明,多种场景下本算法的平均成功率91.31%,在差别较大的背景下平均误警率为0.76%,在有强光和白色物干扰情况下,平均误警率7.65%,训练过后的SVM能够一定程度地辨别强光、白墙等非烟雾造成的干扰,但效果不是很明显。

表2 有烟视频检测结果

表3 无烟视频检测结果

为了验证LSA-SVM算法的可行性,基于相同的训练与测试集,与文献[5]、文献[11]做对比实验,得到平均查准率、误警率(误警率按干扰较大的场景计算),试验结果如表4所示。由表4中数据可以看出,文献[5]中由于处理的烟雾特征较多,相对复杂,所以程序运行较慢;文献[11]平均成功率较低,原因是应用LS-SVM对每一个数据点都加入一个改正量,使不等式约束变为等式约束,只需求解一个线性方程,从而导致准确率下降。

表4 不同算法检测对比

实验提供了解决烟雾检测的新方法,在特定的场景下,应用潜在语义特征训练SVM分类器可以快速检测可能的烟雾发生。实验中,每隔10帧至30帧(对于10~15帧/s的视频)从视频中提取一幅图像,较之利用视频帧间信息、连续地处理图像,减少了一定的计算量。再加上算法复杂度低,运行较快,这样就在很大程度上增加了烟雾检测效率。如果检测到有烟雾出现,可以继续增加其他较复杂的算法再进行识别判断。

5 结 论

基于LSA特征和SVM的烟雾检测算法为一种新的解决烟雾检测的方法。充分利用了帧内图像信息检测视频烟雾,目的是提高检测烟雾的效率,同时避免连续处理帧间特征的运算量。首先对图像分块并且提取分块的小波纹理特征和颜色特征,再利用潜在语义分析方法得到整幅图像的潜在语义特征。然后根据训练集中图像的潜在语义特征以及图像标号训练SVM分类器。对比试验证明,该算法简便可行,在特定的场景中,检测成功率高,但是由于选取特征较少,鲁棒性上有待提高。

[1] 帅师, 周平, 汪亚明,等. 基于小波的实时烟雾检测[J]. 计算机应用研究, 2007, 24(3): 309-311.

[2] 姚太伟, 王慧琴, 胡燕. 基于小波变换和稀疏光流法的火灾烟雾检测[J]. 计算机工程, 2012, 38(6): 204-206.

[3] 王涛, 刘渊, 谢振平. 基于自适应神经模糊推理系统的视频烟雾检测[J]. 计算机工程, 2011, 37(23): 186-188.

[4] 高彦飞, 王慧琴, 胡燕. 基于空间区域生长和模糊推理的视频烟雾检测[J]. 计算机工程, 2012,38(4): 287-289.

[5] 胡燕, 王慧琴, 姚太伟,等. 基于块分割和SVM的视频火灾烟雾识别[J]. 计算机仿真, 2012, 29(9): 170-173.

[6] Calderara S, Piccinini P, Cucchiara R. Smoke detection in video surveillance: a MoG model in the wavelet domain[C] // Proc. of the 6th international conference on Computer vision systems. Berlin Heidelberg: Springer, 2008: 119-128.

[7] Wu Dongmei, Wang Nanan, Yan Hongmei. Smoke detection based on multi-feature fusion[C] // Proc. of the 5th International Congress on Image and Signal Processing(CISP), Berlin Heidelberg: Springer, 2012: 220-223.

[8] Zheng Lu, Chen Junzhou. Smoke detection algorithm of video based on motion and color[J]. Computer Engineering and Design, 2010, 31(21): 4650-4652.

[9] 李文辉, 肖林厂, 王莹,等. 一种基于块的视频烟雾检测算法[J]. 吉林大学学报: 理学版, 2012,50(5), 979-986.

[10] 姜明新, 王洪玉, 蔡兴洋. 基于码本模型和多特征的早期烟雾检测[J]. 中国图象图形学报, 2012, 17(9): 1102-1108.

[11] 贾洁, 王慧琴, 胡燕,等. 基于最小二乘支持向量机的火灾烟雾识别算法[J]. 计算机工程, 2012, 38(2): 272-275.

[12] 李大湘, 赵小强, 刘颖,等. 基于SIFT和MIL的红外人脸识别算法[J]. 西安邮电学院学报, 2012, 17 (4): 15-20.

[13] 杨淑莹. 模式识别与智能计算[M]. 2版,北京: 电子工业出版社, 2011:126-133.

[14] 吴青, 赵雄. 一类新样条光滑支持向量机[J]. 西安邮电大学学报, 2013, 18(6): 68-74.

[15] Signal, Image And Video Processing Group. Index of /VisiFire/Demo/SmokeClips[EB/OL], (2006-05-07) (2014-04-05). http://signal.ee.bilkent.edu.tr/VisiFire/Demo/SmokeClips/.

[16] Piccinini P. Videos for Smoke detection[EB/OL]. (2007-10-12) (2014-04-05).http://imagelab.ing.unimore.it/visor/video_videosInCategory.asp?idcategory=-1.

[责任编辑:祝剑]

A fire smoke detection algorithm based on SVM and LSA features

LIU Ying, GU Xiaodong, LI Daxiang

(School of Communication and Information Engineering, Xi’an University of Posts and Telecommunications, Xi’an 710121,China)

Feature extraction algorithms in video smoke detection are complex with high computational load which make it difficult to realize real-time smoke detection. To solve this problem, a smoke detection algorithm based on LSA feature and SVM is proposed in this paper. In this algorithm, firstly the images in the library are divided into overlapping blocks and both wavelet texture and HSV color feature of each block are extracted. Secondly, the feature of each block is clustered into different class and every block is quantified into a “visual word”. According to the frequency of each “visual word” appearing in each smoke image, a “word-document” matrix is established. Thirdly, latent semantic features of each image are obtained by using latent semantic analysis (LSA) method. Lastly video smoke detection is achieved by the LSA-SVM algorithm combining support vector machine (SVM). Comparative experiments show that this algorithm is simple and convenient in feature detection, can detect smoke more quickly, and therefore can improve the efficiency of smoke detection.Keywords:smoke detection, LSA, SVM, feature extraction, fire recognition

10.13682/j.issn.2095-6533.2014.06.002

2014-06-03

国家自然科学基金青年资助项目(61202183);陕西省自然科学基金资助项目(2013JM8031);公安部科技强警基础工作专项基金资助项目(2014GABJC022);陕西省国际科技合作计划基金资助项目(2013KW04-05)

刘颖(1972-),女,博士,高级工程师,从事图像检索及图像/视频特征分析研究。E-mail: ly_yolanda@sina.com 顾小东(1987-),男,硕士研究生,研究方向为信号与信息处理。E-mail: 836081632@qq.com

TP391

A

2095-6533(2014)06-0006-05

猜你喜欢
分块烟雾特征提取
钢结构工程分块滑移安装施工方法探讨
关于4×4分块矩阵的逆矩阵*
薄如蝉翼轻若烟雾
分块矩阵在线性代数中的应用
影视剧“烟雾缭绕”就该取消评优
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
咸阳锁紧烟雾与尘土
Bagging RCSP脑电特征提取算法
基于MED和循环域解调的多故障特征提取