杨秋霞,罗传文 (东北林业大学林学院,黑龙江哈尔滨150040)
森林作为人类社会最重要的自然资源,经常受到多种因素的破坏,其中森林火灾所带来的危害和损失巨大,是最危险的因素之一。为了保护森林资源,降低森林火灾的损失,需要加强林火监控,将火险控制在萌芽状态。近年来,基于视频图像的林火监控技术因具有实时监控功能,可以获得清晰且直观的图像,预警时间短,能够对林火进行早期预报等[1],已经成为主要的监控方法。智能视频林火监控系统实现的核心模块是林火的自动识别,即将林火与疑似林火物体进行分类识别。目前研究中主要的识别方法有神经网络和支持向量机等,在识别中为了得到较好的识别效果,需要进行参数优化。
稀疏表示理论来源于信号处理领域,主要是用尽可能少的非零系数表示信号来达到压缩表示信号的目的,从而可以简化信号处理过程。2009年,Wright等应用稀疏表示分类器成功实现了在多种干扰情况下人脸的正确识别,将稀疏表示理论引入到模式识别领域[2]。稀疏表示理论成功应用于人脸识别后,一些研究人员尝试将其用于其他问题的分类[3-7]。
为此,笔者尝试将稀疏表示理论应用于林火火焰图像的识别研究中。从视频图像序列中选取林火火焰图像及疑似林火火焰的干扰图像,提取其静态特征和动态特征,运用稀疏表示方法进行林火火焰识别,探讨稀疏表示理论在林火识别领域的应用方法。
1.1 试验数据 到目前为止没有可用于对森林火灾进行模式识别研究的比较完整和权威的数据集,因此该研究所用视频数据来自Bilkent大学火灾视频库、互联网和自行录制视频。视频图像包括林火火焰图像和5组疑似火焰的干扰物体图像,共6组。设置干扰源为林区中可能存在的夕阳、车灯、住户灯光、泛红物体(以红旗为例)等疑似林火物体。为验证该研究算法可行性,同时选取非林火火焰(烛火)作为干扰对象,对研究视频进行分帧处理,获得单帧图像。从每类研究视频中随机选取50帧图像,共300帧图像组成训练样本;随机选取150帧图像,共900帧图像组成测试样本。
1.2 图像特征参数提取 首先对样本图像中疑似火焰区域进行分割,然后对分割区域提取静态及动态特征参数。静态特征包括颜色特征、纹理特征和形状特征。火焰的颜色特征较为明显,可以将林火火焰和大部分背景加以区别。用于表示颜色的模型有很多,该研究选取HSI颜色模型。HSI颜色模型基于人类的视觉系统对颜色的感知机理来定义和描述颜色,HSI模型描述颜色时利用3个量即色调(Hue)、饱和度(Saturation)和强度(Intensity)[8]。林火视频监控获取的图像一般为RGB彩色图像,所以需要将火焰图像的颜色模式由RGB模式转换为HSI模式。在描述林火火焰的颜色特征时采用HSI颜色模型色调分量的一阶颜色矩,公式为:
式中,M表示一阶颜色矩;n表示分割图像区域像素总数;H(pi)表示图像区域p的第i个像素的色调分量值。
纹理特征选取由Haralick等提出的灰度共生矩阵(Gray level co-occurrence matrix,GLCM)得到纹理特征统计量。GLCM能够有效地提取图像的纹理特征,已广泛地应用在众多领域。灰度共生矩阵可提取14个纹理特征[9],该研究选取了对比度、相关、能量和逆差矩4个统计特征。
首先将原始图像灰度化,为了减少计算量,将图像灰度级压缩为16级,然后取 0°、45°、90°和135°4 个方向生成共生矩阵,分别计算4个共生矩阵的主要统计特征,每个特征取4个方向的均值作为最终的林火火焰纹理特征。
形状特征选取圆形度,描述研究对象的形状与圆形的接近程度,计算公式为:
式中,C表示圆形度;A表示分割图像区域面积;L表示分割图像区域周长。
动态特征选取图像序列中相邻两帧图像的面积变化率来表示,公式为:
式中,R表示面积变化率;Ai和Ai-1表示相邻两帧图像中疑似火焰部分面积。
1.3 基于稀疏表示方法的林火火焰识别模型 稀疏表示的基本思想就是所有的测试样本都可以由1个用训练样本构建的过完备字典中的原子的稀疏线性组合来表示。其中,与测试样本类别相同的原子的系数不为0,而其他系数为0。因此,训练样本字典关系到稀疏表示分类的性能。
利用稀疏表示方法进行林火火焰的识别时,首先要构造训练样本特征字典。对每个训练样本分割提取的疑似火焰区域分别求得7个特征参数,并形成描述每个训练样本的特征向量,特征向量可由下式列向量表示:
式中,Fi,j表示第i类样本中的第j个样本的特征描述向量;f1表示样本的颜色特征即一阶颜色矩;f2、f3、f4、f5分别代表对比度、相关、能量和逆差矩纹理特征;f6表示形状特征即圆形度;f7表示动态特征即面积变化率。每类图像训练样本为随机选取50帧图像,则50个样本的特征向量组成每类样本的类特征矩阵,第k类样本的特征矩阵Dk表示为:
所有6组训练样本的类特征矩阵构成训练样本矩阵D,即:
矩阵D为所有训练样本构成的特征字典,其大小为7×300。用同样的方法构建测试样本矩阵。
对于来自某类的一个测试样本向量y,根据稀疏表示最重要的思想,即在训练样本充足的条件下,对于某一个类别的测试样本,可以大致地由训练样本空间中具有相同类别的样本子空间线性表示,此时测试样本的类别未知,因此可以将稀疏表示抽象成如下方程式:
式中,x为投影系数,由下述列向量表示:
式中,xi,j表示测试样本y在第i类第j个训练样本上的投影系数。由于x是稀疏的,所以与测试样本y具有相同类别的训练样本获得的投影系数不为0,而在与y不同类的训练样本上的系数为0,对x的近似解的计算可使用x的0范数,即:
求解0范数是一个NP-hard问题,因此在满足x是足够稀疏的条件下,将求解x的0范数转化为求解1范数,即:
以上的求解都是在没有任何干扰的情况下,而图像一般都会有噪声存在,因此需要考虑误差项,即y=Dx+ε。此时,x的近似解可由下式计算:
式中,αi(^x)表示与第i类训练样本相关的系数,ri(y)表示用第i类训练样本重构y的残差,测试样本y归属于具有最小残差值样本类别。
综上所述,该研究算法主要步骤如下:①采集视频图像并进行预处理,提取疑似火焰区域,得到可供后续试验的训练样本和测试样本;②计算训练样本和测试样本的各项特征参数;③由训练样本特征参数构建特征矩阵D,测试样本特征参数构建测试样本矩阵Y;④对每一个测试样本利用式(11)求解l1最小化范数,得到^x(设置误差阈值ε为0.001,迭代次数为400);⑤对每一测试样本根据式(12)计算用每类训练样本重构的残差值,其中具有最小重构残差的训练样本所属的类型,即残差最小的类别即为该测试样本所属类别。
利用该研究提出的基于稀疏表示的林火火焰识别算法实现了林火数据分类。试验硬件配置为双核2.40GHz Intel Core i5处理器、4GB内存,软件采用matlab R2012b,计算l1最小化范数使用Koh等研制的Matlab软件包[10],同时设计BP神经网络和支持向量机分类模型与该研究算法进行比较。BP神经网络方法采用Matlab软件提供的工具箱,支持向量机方法采用Libsvm软件包[11]。
试验选用300个训练样本、900个测试样本。图1是利用该研究提出的稀疏表示分类识别算法进行识别的一个实例。实例中,测试样本为随机选取的林火火焰y,训练样本共有6类300个,构成特征字典,类别及样本编号分别为:第1类林火火焰(编号1~50)、第2类夕阳(编号51~100)、第3类车灯(编号101~150)、第4类住户灯(编号151~200)、第5类红旗(编号201~250)、第6类烛火(编号251~300)。图1(a)为测试样本y在字典上的投影系数。研究表明,该测试样本在所属类别即林火火焰训练样本(编号1~50)上的投影系数较大,而在其他类别上的投影系数多数为0,由于噪声的存在,也有较少的不为0,但较小,稀疏性得到验证。图1(b)显示了6个类别的残差计算值,比较得到最小的残差值所属类别即林火火焰为该测试样本所属类别。
图1 基于稀疏表示方法识别林火火焰举例
对于分类识别方法性能采用3个指标来评价,分别为识别率、漏识率和误识率,计算公式为:
式中,Ra表示识别率,即林火火焰与干扰因素被正确识别的样本数占测试样本总数的百分率;nr表示正确识别的样本数;na表示测试样本总数;Rma表示漏识率,即未能被正确识别的林火火焰样本百分率;nm表示未能正确识别的林火火焰样本数;nt表示实际林火火焰样本数;Rwa表示误识率,即将非林火火焰样本误识别为林火火焰样本的百分率;nw表示非林火火焰被识别为林火火焰样本数;nf表示非林火火焰的样本数。
基于BP神经网络、支持向量机和稀疏表示3种分类方法的识别结果如表1所示。表1表明,稀疏表示方法识别效果优于BP神经网络和支持向量机,对林火火焰的识别率即正确识别的林火火焰样本数与林火火焰样本总数的比率为95.33%,总的识别率可达93.56%。使用BP神经网络和支持向量机方法进行分类识别时,需要选取和设定参数,同时需要经过多次训练优化才能获取较好的识别效果。应用稀疏表示方法进行识别过程中,只需考虑求解l1最小化范数时需要设置的两个参数,即误差阈值和迭代次数,识别过程简单,稳定性好。
表1 不同分类器对林火火焰识别情况对比 %
该研究将稀疏表示理论引入到林火火焰模式识别研究中。首先提取了研究样本的静态及动态特征参数,使用这些参数构成特征向量来描述不同的样本数据,由训练样本构建字典,通过计算测试样本在训练样本特征字典上的投影系数以及重构残差来进行识别。稀疏表示和BP神经网络、支持向量机(SVM)等方法相比,无需参数优化,具有更强的鲁棒性。对该研究数据分类识别结果表明,识别率可以达到93.56%,为林火火焰的识别提供了一种新的思路和方法。
[1]饶裕平,柴红玲.林火视频监控中烟识别方法概述[J].林业调查规划,2009,30(1):59 -62.
[2]WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210 -227.
[3]杨蜀秦,宁纪锋,何东健.基于稀疏表示的大米品种识别[J].农业工程学报,2011,27(3):191 -195.
[4]ZHANG L,DING Z,LI H,et al.3D Ear Identification Based on Sparse Representation[J].PloSOne,2014,9(4):95506.
[5]CAOH,DENG H W,LI M,et al.Classification of multicolor fluorescence in situ hybridization(M-FISH)images with sparse representation[J].IEEE Transactions on Nanobioscience,2012,11(2):111 -118.
[6]杜彦良,侯哲哲,赵维刚.一种基于稀疏表示的重载铁路路基病害快速识别方法[J].土木工程学报,2013,46(11):138 -144.
[7]SONGB,LIJ,DALLA MURA M,et al.Remotely sensed image classification using sparse representations of morphological attribute profiles[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(8):5122-5136.
[8]梁杰,张丽红,李林.HSI和区域生长结合的火灾图像分割方法[J].计算机技术与发展,2012,22(1):191 -194.
[9]HARALICK R M,SHANMUGAM K,DINSTEIN I H.Textural features for image classification[J].IEEE Transactions on Systems,Man and Cybernetics,1973(6):610 -621.
[10]KOH K,KIM SJ,BOYD S.Simple matlab solver for l1-regularized least squares problems[EB/OL].(2008 -05 -15)http://www.stanford.edu/~boyd/l1_ls.
[11]CHANG C C,LIN C J.LIBSVM:A library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology(TIST),2011,2(3):27.