金 星,邵珠超,王盛慧
(长春工业大学电气与电子工程学院,吉林 长春 130012)
基于PCA和IGWO-SVM的水泥回转窑故障诊断研究
金 星,邵珠超,王盛慧
(长春工业大学电气与电子工程学院,吉林 长春 130012)
为实现水泥回转窑故障的精确诊断,提出一种基于主成分分析(PCA)和支持向量机(SVM)的回转窑故障诊断模型。通过引入差分进化(DE)算法的变异、交叉、选择操作来维持种群的多样性,克服灰狼算法易早熟收敛的缺陷,然后采用这种改进的灰狼算法(IGWO)对SVM的惩罚因子c和核函数参数g进行动态的寻优。运用PCA对采集数据进行降维处理,消除非相关因素,降低数据处理难度,然后将特征提取后的数据作为输入建立故障诊断模型,并与普通的SVM建模方法进行比较。实例表明:在有用信息量损失较小的前提下,分类准确率达到96.1538%,模型构建时间为2.9720s,从而验证模型的准确性和高效性。
水泥回转窑;故障诊断;主成分分析;支持向量机;改进的灰狼算法
水泥回转窑作为新型干法生产线上的核心设备,负责完成水泥生料的煅烧[1]。其工作状态会直接影响水泥熟料的质量、产量[2],因而对其故障进行快速精确地诊断就显得尤为重要。通过智能算法建立可靠的故障诊断模型对回转窑进行及时的故障识别,可以克服人工诊断方法的局限性,避免发生重大隐患,对水泥行业的发展具有促进作用。
目前,国内外很多研究都尝试用各种智能方法来解决故障诊断的问题。王兰军[3]针对水泥生产过程中回转窑的故障诊断,提出了应用案例分析结合模糊推理的工况识别方法;高绪伟[4]通过核PCA特征提取方法在航空发动机转子故障诊断中的应用,取得了一定的成果;钟小凤等[5]基于PCA-LSSVM的机车走行部滚动轴承故障诊断,相比其他方法而言分类准确率达到100%,模型构建时间为3.642s,满足机车走行部滚动轴承的诊断要求。另外,Ferat等[6]基于贝叶斯网络和分布粒子群思想开发了飞机发动机故障诊断模型;Khmais等[7]研究了基于支持向量机理论的电力变压器故障诊断。
结合以上研究思路,本文提出了基于主成分分析(principle component analysis,PCA)和支持向量机(support vector machine,SVM)的故障诊断模型,并引入改进的灰狼算法(IGWO)对模型的关键参数进行动态的寻优。首先采集影响故障诊断的现场数据,利用PCA降维原理对样本数据进行特征提取,消除冗余特征,然后使用提取的各主成分变量对优化的SVM网络模型进行训练,并与普通的SVM诊断模型进行对比,从而验证本文建立的模型的准确性和高效性。
主成分分析(PCA)主要是在保证原始数据信息尽可能完整的情况下,将高维数据投影到一个新的特征向量彼此正交的投影空间,实现对复杂过程数据的特征抽取,以便消除变量间的关联特性,从而使得原始过程特性分析的复杂程度得到大幅简化[8]。基于PCA的特征提取方法描述如下:
设X是一个n×p维随机变量:
记 V 的特征值满足 λ1≥λ2≥…≥λk>0,λk+1=λk+2=…=λp=0。 γ1,γ2,…,γp是 V 的特征值对应的标准正交化特征向量。由于V是X的线性函数,满足COV(yi,yj)=0,yi表示第 i个主成分,i≠j,则 X 的线性函数:
其中:L=(l1,l2,…,lp)′是 Rp中待定的常数向量。事实上对于任意的常数a>0,有:
问题归结为在条件 LL′=1 下使 maxLL′=1L′VL=L′0VL0,当 L0=γ1就满足条件,γ′Xy1=γ′X 为 X 的第一主成分。重复以上过程,就可以得到X的k个主成分 yk=γ′kX。
由于 y1,y2,…,yk两两不相关,且满足:
其中 y1存在最大的方差 λ1,yk存在最小方差 λk,这样y1,y2,…,yk就依次体现了X的各分量的主要部分,据此称为第i个主成分的贡献率,而称为前m个(m<k)主成分的累积贡献率。一般认为,前m个不相关的主成分累积贡献率超过95%就可满足要求。
SVM的基本原理就是找到一个满足分类标准的最优化分类超平面,在确保其分类准确度的基础上,使超平面两侧的空白范围达到最大,其距离定义为分类间隔。最优分类线方程为x·w+b=0,并对其进行归一化,得出的线性可分数据集(xi,yi),i=1,2,…,l且x∈Rd,y∈{1,-1},满足:
式中分类间隔为2/||w||,为使其取值最大即要求||w||值最小,这样所得到的最优分类面就是||w||2最小的分类面[9]。
1)给定M类分类问题的训练集:
2)令 j=1,2,…,M,若规定其中一类为正类,则把剩余的M-1类当做负类,利用两类支持向量机解出决策函数:
3)判断要输入x是否属于第J类,这里J是g1(x),g2(x),…,gM(x)内最大值的上标。
GWO最早是由Mirjalili等[10]于2014年提出的一种通过模拟灰狼的社会等级和狩猎行为的新型群体智能优化算法,由于该算法不考虑梯度信息,参数设置少、全局搜索能力强,故被广泛用于神经网络的寻优领域[11]。
假设在D维搜索空间内,种群规模X=(X1,X2,…,XN)由N个个体组成,定义第i只灰狼的位置为,其中表示第 i只灰狼在第 D维上的位置。定义种群中的最优解为狼α,目标函数值第2和第3的最优解分别为狼β和狼δ,其余的候选解为ω[12]。在GWO算法中,狩猎行为由狼α、狼β和狼δ引导,狼ω跟随这3只狼进行狩猎。如下公式描述灰狼包围猎物的行为
式中:t——当前迭代次数;
C——摇摆因子,C=2r1,r1为[0,1]间的随机数;
Xp(t)——第t次迭代后猎物的位置;
X(t)——第t次迭代灰狼的位置。
灰狼位置更新公式如下:
式中 A 为收敛因子,A=2ar2-a;r2为[0,1]上均匀分布的随机数,变量a随迭代次数的增加从2线性递减到0。
为了模拟灰狼的狩猎行为,猜测利用狼α、β和δ去确定猎物的潜在位置。因此,在保存历史获得的前3个的最优值,迫使其他搜索个体(包括ω)根据最优值的位置不断更新它们的位置。数学描述如下:
由式(10)~式(15)可计算出其他灰狼个体与α、β和δ的距离及更新后的灰狼位置,然后由式(16)确定猎物所在的方位。
尽管GWO算法得到了成功的应用,但也存在求解准确度低、易陷入局部最优解的缺点。因此,本文引入差分进化的变异、交叉、选择操作克服这些缺点。如果优化得到的个体目标函数值f(n)大于上一代该个体的目标函数值f(l),则被放弃,反之被接受,公式为
式中:r4——[0,1]的随机变量;
Xn(t+1)——新位置;
Xl(t)——上一次的位置;
p——交叉概率。
SVM的惩罚因子c和核函数参数g是由算法随机给出的,通常情况下,这种模型的分类准确度很低。通过改进GWO算法,可以在保证不遗漏全局最优解的前提下加快搜寻速度,对关键参数进行动态的寻优,可以针对SVM模型建立的随机性进行改进,使得通过设置较少的种群数目和迭代次数就可以达到较高的分类准确度。
本文以吉林省亚泰集团2000t/d生产线为研究对象,结合水泥生产工艺专家的意见,从水泥回转窑生产现场选取窑内结大蛋、窑内结圈、跑生料、红窑、篦冷机堆雪人、飞砂料6类工艺故障,并赋予故障类号:1~6,数据样本为9维106组,并作为诊断模型输入进行验证。鉴于采集数据量纲和单位不一致的问题,对样本进行归一化处理到[0,1]之间的小数[13],公式表述为
式中:xi、——数据样本归一化前后的值;
xmin、xmax——数据样本中的最小值,最大值。
然后将归一化后的样本数据进行PCA降维,通过线性变换的方式将数据转为一组各维度线性无关的组合,消除冗余和不相干的变量关系,方便数据的分析处理[5]。依据累计贡献率不小于95%的原则,如图1所示,由原来的9维降到4维,从而能够消除冗余的特征信息,降低模型构建的复杂度。
图1 样本数据PCA降维
为验证本文所建立的故障诊断模型的准确性,将PCA降维后的故障样本数据集分为训练集和测试集,其中训练集样本为54组,用于故障诊断模型关键参数寻化和模型的建立;剩余的52组为测试集样本,对已建立的诊断模型进行预测。选取狼群数量10,迭代次数30次,参数上限ub为100,参数下限lb为0.01,缩放比例因子F上界为0.8、下界为0.2,交叉概率p为0.3,进行仿真。IGWO-SVM模型的适应度曲线如图2所示。
图2 IGWO-SVM适应度曲线
由图可知,最终故障分类的目标函数值稳定在0.308 9。水泥回转窑故障诊断的训练集和测试集的分类效果图如图3所示,从而可得出训练集的预测准确率为98.148 1%,测试集的预测准确率达到96.1538%,可见基于IGWO-SVM的模型能够对水泥回转窑的故障进行有效的分类。
图3 水泥回转窑故障诊断真实类与预测类对比
表1 采用不同的诊断模型对分类性能的影响
为进一步验证该改进算法的分类效果,本文将其与基于 GWO-SVM、PCA-SVM、PCA-GWO-SVM 等的故障诊断模型的预测准确度进行对比。对于GWO-SVM模型,采用径向基核函数,设置种群规模10,迭代次数30,参数上界ub为100,下界lb为0.01,利用未改进的GWO对核函数宽度g和惩罚因子c进行迭代寻优;而PCA-SVM模型,将原始数据进行降维处理,消除冗余信息,作为SVM模型的输入进行故障分类;对于PCA-GWO-SVM模型,首先进行降维处理,与GWO-SVM模型进行对比。表1给出了采用不同的模型对水泥回转窑故障的诊断所得出的分类效果,可知PCA-GWO-SVM在建模时间方面较GWO-SVM降低,同时准确度提高,这表明进行PCA降维处理,能够提高诊断模型的分类性能;而对于PCA-GWO-SVM模型,虽然其训练时间比PCA-SVM模型长,但测试机准确度高很多;对于改进后的PCA-IGWO-SVM模型,通过引入DE算法,设置交叉概率p、缩放比例因子F,保证种群多样性的前提下,选择目标函数值最优的个体,这对故障诊断分类的性能有了更大的提高。
1)本文提出了一种基于PCA和IGWO-SVM的水泥回转窑故障诊断模型,使用PCA对故障数据进行特征提取,在保证信息尽可能完整的情况下滤除不相关的信息,降低数据维度,突显数据差异。
2)利用IGWO算法对SVM的惩罚因子c和核函数宽度g进行动态的迭代寻优,克服GWO易陷入局部最优、过早收敛的缺陷,使得优化后的SVM分类器能够实现快速准确的诊断。
3)通过仿真对比,本文所提出的故障诊断模型具有快速准确的优势,模型构建时间为2.9720s,分类准确率达96.1538%,可为水泥行业的故障诊断提供新思路。
[1]ABDELAZIZ E A,SAIDUR R.A review on energy saving strategies in industrial sector[J].Renewable and Sustainable Energy Reviews,2011,15(1):150-168.
[2]李轩.基于贝叶斯网络的水泥回转窑故障诊断模型的研究[D].秦皇岛:燕山大学,2014.
[3] 王兰军.水泥回转窑故障诊断系统的研究[D].杭州:浙江大学,2004.
[4] 高绪伟.核PCA特征提取方法及其应用研究[D].南京:南京航空航天大学,2009.
[5] 钟小凤,贺德强,苗剑.基于PCA-LSSVM的机车走行部滚动轴承故障诊断研究[J].广西大学学报(自然科学版),2014,39(2):328-333.
[6]SAHIN F, YAVUZ M C, ARNAVUT Z, et al.Fault diagnosis for airplane engines using Bayesian networks and distributed particle swarm optimization[J].Parallel Computing,2007,33(2):124-143.
[7]BACHA K, SOUAHLIA S, GOSSA M.Power transformer fault diagnosis based on dissolved gas analysis by support vector machine[J].Electric Power System Research,2012,83(1):73-79.
[8]吴翊,李永乐.应用数理统计[M].长沙:国防科技大学出版社,2012:290-292.
[9]WIDODO A,YANG B S.Supportvector machine in machine condition monitoring and fault diagnosis[J].Mechanical Systems and Signal Processing,2007,21(6):2560-2574.
[10]MIRJALILI S, MIRJALILI S M, LEWIS A.Grey wolf optimizer[J].Advances in Engineering Software,2014,69(7):46-61.
[11]罗佳,唐斌.基于收敛因子非线性动态变化的灰狼优算法[J].中国科技论文,2016,11(17):1991-1997.
[12]姚鹏,王宏伦.基于改进流体扰动算法与灰狼优化的无人机三维航路规划[J].控制与决策,2014,31(4):701-708.
[13]邱东,张楠,赵晨旭,等.基于灰色神经网络的中低碳烙铁终点硫含量预报模型研究[J].中国测试,2014,40(4):68-70.
Research of fault diagnosis of cement rotary kiln based on PCA and IGWO-SVM
JIN Xing, SHAO Zhuchao, WANG Shenghui
(College of Electrical and Electronic Engineering,Changchun University of Technology,Changchun 130012,China)
In order to precisely diagnose the faults of cement rotary kiln,a fault diagnosis model based on principal component analysis(PCA)and support vector machine(SVM)is proposed.The variation, crossover and selection operation of differential evolution(DE)are used to maintain the diversity of the population and are introduced into GWO to avoid premature convergence.Improved gray wolf optimizer(IGWO)is used to dynamically optimize the penalty factor (c)and the kernel function parameter (g)of SVM model.PCA is used to reduce the dimension of the collected data,eliminate the irrelevant factors and reduce the difficulty of data processing.Then the data after feature extraction are used as the inputs to establish the fault diagnosis model and the built IGWO-SVM model is compared with the general SVM model.The experiment shows that under the condition of less useful information loss,the classification precision is 96.153 8%and the model building time reaches 2.9720s,which verifies the accuracy and high efficiency of the IGWO-SVM model.
cement rotary kiln; fault diagnosis; PCA; SVM; IGWO
A
1674-5124(2017)10-0092-05
10.11857/j.issn.1674-5124.2017.10.018
2016-12-08;
2017-01-23
吉林省科学技术厅计划项目(20150203003SF)
金 星(1976-),男,吉林长春市人,副教授,硕导,研究方向为测控技术与智能系统。
(编辑:莫婕)