王云会,杨 杰,杨佳琳
(京能集团北京京西燃气热电有限公司,北京 100041)
自动控制水平的提高对生产系统的故障诊断技术提出了更高的要求。传感器故障是致使系统异常的常见因素之一,而故障信息的特征提取是诊断识别的关键技术。本研究将类均值核主元分析应用到故障诊断中,分析不同核函数的选取对判断结果的影响。类均值核主元分析脱胎于周东华等[1-2]的丰富研究。主元分析是把相关变量数据转换成部分无关变量数据的分析方法,但是不能解决非线性问题。因此,Scholkopf等[3]提出了核主元分析,不仅能处理非线性数据,而且其计算复杂度由输入数据空间的维数决定。彭红星等[4]提出了基于核的主成分分析(Kernel Principal Component Analysis,KPCA)的非线性过程的监控方法,成功应用于废水处理过程的检测,然而,该方法存在损失部分数据样本信息的缺点。因而,针对这一问题,一种被叫作类均值核主元分析的新方法被提出[5],它在原始数据非线性映射到高维空间后,先求出映射数据的类均值矢量,再进行核主元分析,构建类均值核主元,使之包含了数据样本的全部信息,降低数据维度的同时实现无损。类均值核主元分析已在故障诊断研究中有所应用[6-8],本文的目的在于探究不同核函数对故障诊断结果的影响,分别从故障识别和故障判断角度进行实验,即将类均值核主元分析与BP神经网络结合[9-10],对比不同核函数下特征提取对故障识别率的作用。此外,计算T2和SPE统计量,比较故障判断的准确性和即时性。文章阐述了类均值核主元分析的基本原理,并在此基础上介绍核参数优化方法和实践步骤,对不同核函数进行仿真实践,通过总结分析发现,经粒子群优化后的混合模型在准确性和即时性方面更为优越。
设C的特征值μ对应特征向量为v,则有:
其中,D表示类均值核矩阵,且D为对称矩阵。将矩阵D代入式(5),化简得:
若类均值矢量均值不等于零,则需要对其进行中心化处理得到Dˉ,则有:
1.2.1 核函数选取和优化
分析类均值核主元的步骤可知,核函数的选取决定核主元的最终形式,不需要对数据进行非线性映射操作,只需要选择满足条件的核函数即可。常用的核函数包括:多项式核函数、高斯径向基核函数、神经网络核函数等。本文中采用多项式核函数、高斯径向基核函数及其混合核函数作比较,分析优越性。
多项式核函数:
高斯径向基核函数:
混合核函数:
在核参数的应用中,分别存在d,σ,ρ3个未知参数,人为经验的设定对最终的判断结果存在巨大的影响,本文通过粒子群优化算法(Particle Swarm Optimization,PSO,PSO)寻找各个核函数在类均值核主元分析中的最优参数设置,其算法流程如下:(1)初始化种群。(2)计算各个粒子的种群适应度,求出个体极值和全体极值。(3)更新速度和位置。(4)判别结束条件,若不满足,返回上一步继续执行。
1.2.2 故障类型识别方法
本文采用BP神经网络进行故障类型识别的分类方法。BP神经网络是一种按误差反向传播训练的多层前馈网络,其算法称为BP算法,基本思想是采用梯度下降法,使网络的实际输出值和期望输出值的误差均方差最小。结构如图1所示。
由于基于跨境电商平台能实现了单个企业之间或单个企业与单个消费者之间的交易,所以它已然成为外贸企业的转型的创新途径(任志新、李婉香,2014)。同时,聂林海(2014)也指出电子商务一方面可以带动传统企业加快转型升级,也能为中小企业进入大市场提供更好助力,并为其创造更多的贸易机会和发展空间;另一方面,它也能成为企业开拓海外市场的利器。互联网市场和实体市场协同融合发展将成为世纪经济发展的必然趋势。
图1 BP神经网络结构
BP神经网络拥有很强的非线性映射能力、自学习和自适应能力,实质上实现了一个从输入到输出的高维映射功能,正好映射了类均值核主元分析法中的高维映射过程。具有3层及以上的BP神经网络能够以任意精度逼近任何非线性连续函数。BP神经网络在训练时,能够通过不断地更新并自动提取输出、输出数据间的“合理规则”,自适应地通过网络的权值调整来逼近期望结果。上述两点能保证其作为类均值核主元分析法中故障类型识别方法的合理性。
1.2.3 算法步骤
在进行故障诊断时,一方面,利用类均值核主元分析处理实验数据,实现无损降维;另一方面,通过前者提取出的主元特征映射得到新数据集,采用BP神经网络训练优化,得到诊断模型。整个步骤中,变参数是作为核心的核函数被选取的,改变核函数的种类并通过PSO优化得到最佳参数,进行实验对比,具体步骤如下:
(1)对数据样本进行去噪、平滑、标准化处理。
(2)应用PSO算法优化3种核参数,分别就不同核参数进行类均值核主元分析,计算类均值矩阵,并对其进行中心化处理。
(3)计算中心化后的核矩阵的特征值和特征向量,并计算特征向量在特征空间上的投影,得到降维后的样本数据集Q=H×X,其中,X为处理后的数据集,H为由核主元组成的特征矢量。
(4)确定网络的输入,将被检测的故障状态进行编码和样本训练,计算各神经元之间的权值。
(5)用训练好的网络进行故障识别。
以图2中上下水箱液位以及相关的控制器、执行器输出指令作为检测变量,模拟各故障状况,获取实验数据。取各故障的前1 000组数据作为训练样本,剩下的500组数据作为测试样本,并对故障类型进行独热编码,输出节点如表1所示。
图2 实验平台
表1 故障诊断网络训练样本目标输出编码
续表1
通过粒子群优化算法寻找各个核函数在类均值核主元分析中的最优参数设置,所优化核参数如表2所示。
表2 核参数优化结果
针对上述3种核函数的神经网络训练结果(即故障识别对比结果)如图3所示。
图3 3种核函数的故障识别对比结果
可以直观看到,当传感器发生漂移、超限、恒增益、恒偏差、失效和断线故障6种故障时,上述3种核函数经粒子群算法优化核参数后都能以不低于90%的识别率准确诊断出故障类型。高斯径向基核函数在漂移、超限和恒偏差故障的特征提取中有优势,多项式核函数在其余3种故障的诊断中有优势。而混合核函数则结合二者的优点,其诊断结果明显优于单一一种核函数的结果。
为进一步验证混合核函数的优越性,分别计算T2和SPE统计量,判别故障的发生的原因。其中,T2统计量反映了每个主成分在变化趋势和幅值上偏离模型的程度,是对模型内部化的一种度量,可以用来对多个主元同时进行监测;SPE统计量刻画了输入变量的测量值对主元模型的偏离程度,是对模型外部变化的一种度量。结果如表3所示。
表3 故障诊断结果
表3中数据表示,在采集正常情况下的数据点800个(训练分类器用)之后,开始模拟6种故障的发生。表3中数值即为通过两个统计量指标检测出当前正确显示故障原因的时刻,显然,数值越靠近800表示越能及时发现故障。
通过对比表3中数据可以看出,采用混合核函数时,对漂移故障、恒增益故障以及恒偏差故障的检测及时性明显快于其他两种核函数,分别提高了32次、35次和44次(和相对好的一种结果相比)。
本文针对工业工程中常见的传感器故障类型(超限、失效、断线、漂移、恒增益和恒偏差故障),利用类均值核主元分析法对其进行诊断。分别利用3种核函数不同的故障类型是否发生进行诊断。结果显示,3种核函数对超限故障、失效故障和断线故障具备相近的检测能力,而对于漂移故障、恒增益故障和恒偏差故障,混合核函数的应用具有更高的准确性和及时性。进而通过与BP神经网络结合证明故障识别的准确性,通过T2和SPE统计量证明故障诊断的及时性。