李 彦,梁正桃,李立京,林文台,姜 漫
(北京航空航天大学仪器科学与光电工程学院,北京100191)
随着光纤技术的不断发展,光纤微振动传感器在周界安防、石油和天然气管道以及通信线路监测等系统中越来越多地得到应用。光纤微振动传感器是利用光纤作为传感介质的一种分布式光纤传感系统,其中,光纤既作为传感介质,又作为光传输介质。其可在传感光纤布设长度内,对一定准确度范围内的突发事件进行远程和实时的监测。目前,主流的分布式光纤微振动传感器方案是基于双M-Z型干涉仪的方案。国内科研单位先后开展了对于光纤微振动传感器的相关研究工作,取得了一定的成果[1,2],实现了对振动进行定位并报警,但还存在误报警的问题。对振动信号进行模式识别是一种降低误报警率的方法。本文针对双M-Z型微振动传感器提出了一种基于小波分解各频段能量信息熵和SVM的模式识别方法。
小波分析方法是一种时间和频率窗口大小固定,但其形状可改变的时频局域化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。
小波变换[3]是把基本小波函数ψ(t)作位移之后,在不同的尺度a下与待分析信号f(t)作内积。信号f(t)的连续小波变换(continuous wavelet transform,CWT)定义为
在实际应用中,采用离散小波变换(discrete wavelet transform,DWT)。而多分辨分析(multi-resolution analysis,MRA)是小波分析中最重要的概念之一,其将一个函数表示为一个低频成分与不同分辨率下的高频成分。它能提供一种构造小波的统一框架,并且能够提供函数分解与重构的快速算法。根据多分辨率分析,Mallat给出了小波分解和重构的快速算法,称为Mallat算法[4],公式如下
信息熵值是对信号不确定度的度量,可以用来估计信号的复杂性,越不确定、越复杂的信号其熵值越大。小波能量信息熵是小波分析和信息熵原理相结合的产物,其基本思想是将小波系数矩阵处理成一个概率分布序列,用该序列的熵值来反映这个系数矩阵的稀疏程度,即被分析信号概率分布的有序程度。
把小波分解得到的各频带信号作为独立的信号,分别对每频段信号进行小波分解,求解此次小波分解各频段的能量 Ejk,令 pjk(i)=Ejk/E,则 ∑kpjk=1,参考小波包香农熵的定义[5]把信息小波能量熵(wavelet energy entropy,WEE)定义为
则每个样本信号有小波能量信息熵向量[E0,E1,…,En],取样本向量中每列E的最大值和最小值,归一化处理:e=(E-Emax)/(Emax-Emin),得到的特征向量[e0,e1,…,en]作为SVM的输入特征向量。
对于给定的数据集{xi,yi},i=1,…,N,yi∈{-1,+1},xi∈Rd,若训练样本线性可分,分类的目的就是寻求最优超平面wgx+b,使两类样本之间的分类距离最大[6]。分界面wgx+b的分类间隔等于2/|w|,要使分类间隔最大,等价于使‖w‖2/2最小。在线性不可分的情况下,可增加一个松弛项ζ≥0,于是问题转化为求解如下二次规划问题
其中,第一个式子体现了结构化风险最小化原则。C为惩罚因子,它实际上控制对错分样本惩罚的程度,C越大对错误的惩罚越重。
对非线性问题,通过在最优分类面选用合适的核函数K(xi,yi)就可使某一非线性经映射后能够实现线性分类。经核函数映射后,引入拉格朗日泛函形式,上述超平面的二次规划问题通常转化为其对偶问题的计算,目标函数为
得到在高维特征空间建立的分类决策函数为
SVM本质上是2类分类器,需对其进行推广以满足多值分类的需要。常用方法有:1)一对多方法(one-againstthe-rest);2)一对一方法(one-against-one);3)多值分类SVM(multi-class objection function);4)二叉树分类决策法。本文选用的方式是一对一方法,通过每两类之间建立SVM模型,在测试过程中以每个SVM模型的结果来投票确定最后的分类识别结果。
④水库涵洞与市政、石油等其他管道相比有其特点和复杂性,建议对管道机器人的爬行装置进一步改进,以提高机器人越障能力,更好地满足水库涵洞检测需求。
目前,SVM软件使用较多的是Libsvm和SVMLight等,本文采用Libsvm[7]对SVM模型进行训练,并基于训练出来的模型测试样品分类结果。Libsvm是台湾大学林智仁等人开发设计的一个简单、易用,且快速有效的SVM模式识别与回归的软件。该软件可以解决C-SVM,ν-SVM,ε-SVR和ν-SVR等问题,包括基于一对一算法的多类模式识别问题,为SVM算法的离线仿真提供了一个高效的解决方案。
Libsvm程序中使用的数据有严格的要求,在使用Libsvm之前需按照指定格式对数据进行转化。本文采用Libsvm软件[8]按下列步骤进行分类器建模:
1)把提取到的特征向量及其对应的分类数据,按照Libsvm的格式要求进行保存。可利用互联网上工程技术人员编写的电子表格FormatDataLibsvm.xsl当中的宏进行转换;
2)对数据进行归一化处理;
3)选取RBF作为核函数,在svm-train.exe使用时,可以通过命令参数指定核函数,默认情况下是使用RBF核函数;
4)使用训练模型的包含多个分类的数据进行Cross-Validation寻找最佳的参数C和γ,C是惩罚因数,γ为RBF核函数的参数,采用tools文件夹下面的grid.py程序查找最佳的参数;
5)根据上个步骤得到的最佳参数,用svm-train.exe程序对包含多个分类的数据进行模型训练,将得到分类器的模型;
6)依据步骤(5)中得到的SVM模型,把待测试的样本通过svm-predict.exe进行测试。
本文考虑现场导致光纤微振动传感器系统报警的主要信号,选取如下几类信号作为模式识别算法的研究载体:敲击光缆、攀爬、大风和未去噪的环境噪声。在外场采集了这几种信号的数据,采样频率为1 MHz,每段信号长度为50000个采样点。敲击光缆的信号为105段,攀爬光缆的信号有76段,大风的信号有73段,环境噪声有114段。依据下面的步骤对信号进行特征提取和SVM建模和测试:
1)采集4种选定的信号类型:敲光缆、爬光缆、大风和环境噪声;
2)在Matlab中对各信号的所有样本进行小波分解,得到各频段的系数;
3)在Matlab中对各频段系数求解能量和,得到小波能量特征向量;
4)同时在Matlab中分别对步骤(2)中得到的各频段系数进行小波分解,求这次小波分解得到的各频段系数的能量,然后求解其信息熵,得到小波能量信息熵特征向量;
5)对得到的能量和能量信息熵进行归一化,得到最终的特征向量;
6)把每一类的特征向量分开两部分,一部分用来建模,另一部分用来测试模型识别率的准确性,求解SVM的最优参数C和γ;
7)采用Libsvm程序对得到的特征向量进行建模和测试。
本文的特征向量基于小波分解的能量信息熵,4种信号的典型特征向量如图1所示。
小波能熵归一化特征向量寻找SVM最优参数的图表如图2所示。
本文提出的基于小波能量信息熵作为特征向量,采用SVM进行分类,并比较了小波能量和SVM的分类结果,结果如表1所示。
基于小波分解各频段能熵的特征向量结合SVM方法,能有效地识别信号的类型,识别率均超过80%(敲光缆:100%,爬光缆:82.76%,大风:87.5%,环境噪声:100%),且其结果略优于小波分解各频段能量作为特征向量对应的识别结果。
而直接以能量值和能量信息熵值为特征向量的识别率结果很低,其主要原因是特征向量内部特征值之间的数值差距过大,某个值掩盖了其他值的作用。
图1 典型信号小波能熵特征向量Fig 1 WEE feature vector of typical signal
本文提出的以小波分解的各频段系数能量信息熵作为特征向量,采用SVM分类器算法的模式识别方法,对双MZ型光纤传感器的信号进行模式识别,可以得到较高的识别率,能有效地区分光纤传感器的信号类型。在现有微振动传感系统阈值检测的报警方法基础上,采用本文提出的模式识别方法将有助于降低系统的误报警率,改善系统性能指标和推广系统的使用。
图2 SVM参数寻优图Fig 2 Parameter optimizing of SVM
表1 基于SVM的分类器识别结果Tab 1 Result of classifier recognition based on SVM
[1]罗光明.分布式光纤周界安防系统的信号检测和定位技术研究[D].北京:北京航空航天大学,2009.
[2]Sun Qizhen,Liu Deming,Wang Jianmin.A novel distributed sensor using long-distance Mach-Zehnder interferometer[J].Optics Communication,2008,281:1538-1544.
[3]程正兴.小波分析算法与应用[M].西安:西安交通大学出版社,1998.
[4]张贤达,保 铮.非平稳信号分析与处理[M].北京:国防工业出版社,2001.
[5]Avic E,Akpolat Z H.Speech recognition using a wavelet packet adaptive network based fuzzy inference system[J].Export Systems with Applications,2006,31(3):495-503.
[6]支持向量机导论[M].李国正,译.北京:电子工业出版社,2004.
[7]Chang Chih-chung,Lin Chih-jen.LIBSVM—A library for support vector machine.[EB/OL].[2012—04—01].http:∥www.csie.ntu.edu.tw/~cjlin/libsvm.
[8]Hsu Chih-wei,Chang Chih-chung,Lin Chih-jen.A practical guide to support vector classificaiton[EB/OL].[2008—10—02].http:∥www.csie.ntu.edu.tw/~cjlin/libsvm/.html.