徐佳伟
(国网上海市电力公司市南集团,上海 20000)
气体传感器阵列检测法可应用于诸多领域,如可燃性泄露气体,有毒气体或易挥发的有机气体的监测、农产品与食品的质量检验、生物医学以及变压器油中溶解气体在线监测等,它是利用气体传感器的交叉敏感性,有选择地将若干气体传感器组成传感器阵列,结合模式识别技术实现对气体成分的检测。模式识别算法在该方法中起着至关重要的作用,其识别效果直接决定着定性、定量分析的准确性。
目前应用最多的BP神经网络模式识别法能够有效地解决非线性映射问题,但是该算法采用梯度下降法,不但网络的训练速度慢,而且容易陷入局部极小值。近年来提出的先用主成分分析(Principal Component Analysis,简称PCA)对数据进行处理,将数据降维以后再通过神经网络对数据进行分析,这样处理以后可以使网络更快收敛并且精度更高。
本文将主成分分析法引入到BP神经网络模式识别中,对传感器检测的油中气油进行处理。采用主成分分析消除传感器阵列信号之间的相关性,将其变换结果作为BP神经网络的训练样本。两者结合应用于传感器阵列信号的模式识别中,通过对比表明,将主成分分析与BP神经网络相结合,能有效地降低气体传感器交叉敏感的影响,提高混合气体的检测精度。
本文所使用的气体传感阵列检测系统由传感器阵列、信号调理与数据采集单元以及神经网络三部分组成(见图1)。其中传感器阵列是整个气体检测系统的基础,由MQ1~MQ6六只气体传感器所组成。六只传感器可分别用于检测H2、CO、CH4、C2H4、C2H2、C2H6六种气体,尽管每种气体的传感单元对各自检测气体的灵敏度明显高于其余气体。但存在交叉敏感的问题,特别是有些性质相近的气体成分(如H2和C2H4、CH4和C2H6)交叉敏感[1]程度较深。若不采用一定的模式识别方法进行处理,则不能准确反映实际气体的浓度。
图1 气体传感阵列检测系统框图
信号调理单元主要由温度检测和加热控制电路组成,通过对阵列中每个气敏传感器工作温度的检测,调节控制传感器的加热电流,使每个传感器都在各自最佳温度状态下工作。数据采集单元将气敏元件的电阻值变换成电压值并放大一定倍数,采集后作为后续BP神经网络的处理对象。
式中 rij——原来变量xi与xj的相关系数。
因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。
首先解特征方程|λI-R|=0(I表示单位向量,R表示相关系数矩阵)求出特征值λi(i=1,2,…n),并使其按大小顺序排列,即λ1≥λ2≥…≥λn≥0;然后分别求出对应于特征值λi的特征向量ui(i=1,2,…n),即
式中 y1,y2,…y3——第1,第2,…,第n主成分。
由此可以进一步计算主成分得分:
本文采用动态配气法中的流量比混合法来配制72组不同组分的混合气体作为训练样本。并且由于气体传感器交叉敏感的影响,使得传感器的电压不仅与所检测气体有关,而且对其它检测气体也有一定的相关性。因此气体传感器的输出电压所反映的各种气体的浓度信息有一定的相关性。我们可以采用主成分分析法消除这种相关性。
白石一文:这世界上所有的人一开始都只是陌生人,但就在发生一些事情或是累积一些莫名的感情之后,你也就无法忽视对方的存在。好比一只气球因为空气而膨胀,好比船帆顺风推动一艘船,人类必须仰赖不具实体的偶然与心情上的变化,才能丰富自己的人生。
对样本进行主成分分析得到六个主成分的特征根,其中特征根按从大到小排序,贡献率和累积贡献率如表1所示。
表1 主成分的贡献率和累积贡献率
通常主成分个数m的取值标准是使得累积贡献率大于85%即可,为此选取前4个主成分。4个主成分的主成分载荷矩阵见表2,其中每一个载荷量表示主成分与对应变量的相关系数。
表2 主成分载荷矩阵
BP网络学习是典型的有导师学习,其学习法则是对简单的(误差)学习规则的推广和发展。一般地,BP神经网络的训练过程如图4所示。
图4 BP神经网络训练流程
其训练的过程如下:
①初始化网络及学习参数,如设置网络初始权值、阈值矩阵、学习因子η等;
②前向传播过程:对给定的训练样本输入,计算网络的输出,并与期望输出比较,若满足误差要求,则保存当前权值、阈值矩阵,若不满足误差要求,则转入③;
③后向传播过程:
1)计算同一层单元的误差δpj;
2)修正权值和阈值;
3)返回②,按新的权值、阈值进行前向传播。
通常,用网络的均方根(RMS)误差来定量地反映学习的性能。其定义为
式中 m——训练集内模式对的个数;n——网络输出层单元个数。
为了对比说明采用主成分分析法对样本数据进行预处理的优越性,本文构造了两种结构的BP神经网络。
神经网络的结构方面,采用单隐层的神经网络。其中输入层神经元个数l=6,分别对应MQ1-MQ6六个气体传感器的输出信号。输出层神经元个数n=6,分别对应H2、CO、CH4、C2H4、C2H2、C2H6六种气体的浓度。隐层神经元个数可通过经验公式确定:
由于学习样本中的气体浓度值过大且分散性也较大,直接使用容易造成神经网络的麻痹,使神经网络不能收敛。为此,在分别采用两种BP神经网络进行训练之前,需对传感阵列的输出电压信号以及期望的气体浓度进行归一化处理:
其中xi、yi为经过归一化处理之后的神经网络训练的输入和输出,Vi、ci为实际的传感器电压信号和气体浓度,Vmax、Vmin、cmax、cmin分别为传感器电压信号的最大值和最小值以及气体浓度的最大值和最小值。
为了验证BP神经网络主成分分析法的优势,配制10组不同组分的气体(见表3)来测试网络的识别性能,这10组测试气体模拟了变压器正常运行,局部放电,低能放电,高能放电,低温过热,中温过热,以及高温过热时的各组分气体含量。分别采用训练好的BP神经网络和BP神经网络主成分分析法进行识别,识别结果见表4、表5。
表3 气体浓度的期望值
表4 基本BP神经网络识别结果
由表6可以看出,采用BP神经网络主成分分析法进行模式识别,其识别精度较基本的BP神经网络有所提高。
论文对气体传感器阵列法中最常用的BP神经网络进行了介绍,并将主成分分析法与之结合,用于变压器油中溶解气体传感器阵列检测模式识别中。采用主成分分析法对传感器阵列信号进行处理,提取4个主成分作为神经网络的输入。构造了两种BP神经网络,分别采用没有经过任何处理的数据和经过主成分分析预处理后的主成分数据进行网络的训练和识别。结果表明经过主成分分析预处理之后的BP神经网络的识别精度和对交叉敏感的的降低明显优于另外一种网络。
表5 基于主成分分析的BP神经网络识别结果
表6 两种方法的识别误差
[1] 佟继春,陈伟根,陈荣柱 .一种在线分析变压器故障特征气体的智能传感器[J].高压电器,2014,40(6):433-435,438.
[2] 赵海霞,武建 .浅淅主成分析方法[J].科技信息,2009-02-070.