王真,魏琳,金秀章
(1.华电电力科学研究院山东分院,济南250000;2.华北电力大学控制与计算机工程学院,河北保定071003)
基于改进的KPCA和LSSVM飞灰含碳量的软测量建模
王真1,魏琳2,金秀章2
(1.华电电力科学研究院山东分院,济南250000;2.华北电力大学控制与计算机工程学院,河北保定071003)
以华能嘉祥电厂330 MW机组为例,针对火电厂飞灰含碳量影响因素的非线性和耦合性的问题,提出一种优化样本的KPCA(核主元分析)方法,利用加权相似度优化样本,再对其进行核主元分析,建立基于加权相似度的KPCA和LSSVM(最小二乘支持向量机)的炉膛温度软测量模型。现场实测数据表明,运用该软测量模型监测效果良好,不仅避免了在测量装置损坏时影响生产的弊端,满足飞灰含碳量实时测量要求,还为提高锅炉运行效率提供了依据。
飞灰含碳量;加权相似度;核主元分析;最小二乘支持向量机;软测量
飞灰含碳量是燃煤锅炉主要经济指标之一,对锅炉的运行效率有一定的影响。然而由于人为因素和目前工业水平等条件的制约,存在时间滞后性及测量结果代表性较低等问题,不能及时、有效地指导锅炉运行,提高锅炉燃烧效率。闫维平等采用间接估算方法即采用二维列表差值计算模型并结合氧量、负荷、煤种等信息对飞灰含碳量进行估计[1],不仅存在过多的假设条件,而且火电厂锅炉内在的燃烧过程非常复杂,其模型是非线性函数关系,即影响火电厂锅炉飞灰含碳量的因素复杂且有耦合性和非线性,故用机理定量分析有一定的局限性。
现场通常安装微波测碳装置对飞灰含碳量进行实时测量,但运行一段时间后,由于烟气的冲刷该装置极易磨损甚至有可能发生堵塞现象以致装置损坏。采用软测量技术建立飞灰含碳量软测量是解决以上问题的有效途径之一。其关键就是利用易于测量的变量将工艺过程中难以直接获取的变量通过模型推理预测出来。用飞灰含碳量软测量模型代替出现故障失效的硬件测量装置投入现场,对飞灰含碳量进行软监测,给操作人员提供参考依据。采用基于改进核主元分析和最小二乘支持向量机结合的方法进行飞灰含碳量预测。
1.1核主元分析
主成分分析(Principal Components Analysis)的核心是将具有一定相关性的多变量转化成少数相互独立的变量指标,是一种线性的特征提取方法,对于提取非线性特征具有一定的局限性。故Sch lkopf等[2]提出了主元分析的非线性推广——核主元分析(Kernel Principal Components Analysis,KPCA)。基本思想是将样本数据通过非线性映射变换到特征空间,再在高维空间上进行主成分分析,获得非线性特征。非线性映射不易获取,故引入核函数来完成从原始数据到高维特征空间的非线性映射,进而转化为求核矩阵的特征向量和特征值,输入数据在特征向量上的投影转化为求核函数的线性组合,这大大简化了计算[3]。KPCA具体算法步骤见文献[4]。KPCA能够更好地处理样本数据的高阶信息,故其在特征提取上更有优势,而PCA只能处理样本的二阶协方差矩阵[5]。
1.2最小二乘支持向量机
Vapnik在1963年提出支持向量机理论,其采用了结构风险最小化原则和核函数技术,标准SVM算法设计复杂度与训练样本个数有关,当样本数目过大时,求解相应的二次规划问题就变得复杂,计算速度也会相应变慢[6]。
1999年Suykens提出最小二乘支持向量机(LSSVM)算法,其作为标准SVM的发展,可以解决此类问题,将SVM中的不等式约束改为等式约束条件,与标准SVM的主要区别在于损失函数和等式约束
上[7]。
设有n个样本(x1,y1),(x2,y2),…,(xn,yn),xi∈R,表示输入数据;yi∈R,表示输出数据,其中,i=1,2,…,n。
SVM模型就是采用非线性映射把训练数据映射到高维空间,通过引用核函数K(xi,x),避免了数据的高维数带来的计算复杂性。将带有高维核函数的回归问题表示为
式中:b为偏置值,ω为权向量,n为样本个数,其目标函数为
式中:ξ=(ξ1,ξ2,…,ξn)T为松弛变量,c为正则化参数,ε为不敏感系数。
LSSVM在优化目标中的损失函数为误差ξi的二次项。故优化问题可以描述为求解下面问题:
核主元分析在解决非线性及高维的数据处理方面具有一定优势,但是对于处理大量数据具有一定的局限性,耗时甚至在提取主成分时会增加误差率。文献[8]提出一种基于特征子空间的KPCA,虽在特征空间上构建具有较小维数的正交基来简化核矩阵,减小运算复杂度。但每个样本均参与核矩阵运算,并不断计算其行列式,在一定程度上增加了运算复杂度。文献[9]提出相似度的概念,通过数据间的相似度值来优化样本数据。但是现场经常会出现高维空间存在非常相似的数据,它们在大多数维度上的值非常相近,只是在小数维上相差很大,此时就会存在干扰。
为解决该问题,提出基于加权相似度的核主元分析,即在每组相似度函数分别乘以其权重因子。下面详细介绍该方法。
关于相似度的基本计算方法都是基于向量的,即计算两个向量的距离,距离越小相似度越大。常用的算法有皮尔逊相关系数、欧几里德距离、Cosine相似度、Spearman秩相关系数等。一般计算样本数据的相似度采用的公式为:
式中:δ为相似度函数的归一化参数;xi、xj∈R,其中,i,j=1,2,…,n,n为样本个数;Rij为第i组数据与第j组数据的相似程度。样本优化标准如下:
以减小处理误差为原则,根据现场数据由经验一般选取归一化参数δ为
式中:i=1,2,…,m为样本特征数。
本文采用的加权相似度函数为:
式中:ωi∈(0,1),ωi越接近1,说明第i组数据包含的信息越多,在样本中贡献越大。综上,利用基于加权相似度的核主元分析进行主成分提取,即先利用加权相似度剔除相似度高的的样本,再对简化的样本数据利用核主元分析进行主成分提取,既避免了
由于相似数据造成的误判断,又缩短了分析时间。
核主元分析具有能够处理高维的、非线性的特点,而LSSVM简化了SVM的计算复杂度,将两者的优势结合形成软测量建模在工业建模问题上具有一定的意义。建模的基本思想是先利用基于相似度的核主元分析对样本输入数据进行特征提取,得到相互独立的主成分,再利用最小二乘法支持向量机对数据压缩、特征信息提取后的主元进行训练和测试,得到软测量模型。具体流程如图1。
图1 飞灰含碳量软测量建模流程
以华能嘉祥330 MW机组为例,该厂2号锅炉采用上海锅炉厂的SG1036/17.50-M882锅炉,亚临界、一次中间再热、单炉膛、平衡通风、汽包型燃煤锅炉。采用直吹式制粉方式和改造的低氮燃烧器。炉膛前、后墙宽度为14.12 m,左、右墙宽度为12.72 m。根据机理定性分析,影响电厂飞灰含碳量的主要因素有:机组实发功率、煤质(低位发热量、水分、挥发分等)、4台给煤机的给煤量、各二次风门(SOFA、消旋风、周界风等)的挡板开度、炉膛与风箱差压、炉膛出口氧量及影响一次风速的一次差压等。
采用DCS现场采集的3个不同工况(300 MW、270 MW、240 MW)下的600组数据,作为训练样本和测试样本。抽取180个样本作为测试样本,由于现场存在噪声干扰和量纲不一致等现象,故要进行对现场数据先进行3σ法去除异常值,多值一平均进行线性平滑性处理,归一化处理等。
在进行主成分提取时,阈值ε根据经验一般取0.96~0.99之间,根据穷举法当均方误差MSE最小时,ε最合适,本文选取ε=0.97,此时MSE=6.116 9×10-4。选高斯径向基核函数,σ为核函数宽度)作为软测量模型的核函数。
为了说明提出算法的合理性,分别利用核主元分析(KPCA)、相似度的核主元分析、基于加权相似度的核主元分析进一步验证。
基于KPCA和最小二乘支持向量机的飞灰含碳量软测量仿真结果如图2、图3所示。
图2 基于KPCA的真实值与预测值趋势
图3 基于KPCA的绝对误差
基于相似度的KPCA和最小二乘支持向量机的飞灰含碳量软测量仿真结果如图4、图5。
图4 基于相似度的KPCA趋势
图5 基于相似度的KPCA的绝对误差
基于加权相似度的核主元分析和最小二乘支持向量机的飞灰含碳量软测量仿真结果如图6、图7。
图6 加权相似度的KPCA预测趋势
图7 加权相似度的KPCA的绝对误差
从飞灰含碳量的真实值与预测值趋势图2、图4、图6可知,3种不同的建模方法中,基于加权相似度的核主元分析和最小二乘支持向量机的模型拟合效果更好一些。基于加权相似度的核主元分析的模型绝对误差相对集中一些,不存在偏离很大的现象且其相对误差主要集中在(-0.01,0.02)间,而前两种的相对误差主要集中在(-0.02,0.03)间。3种方法的均方误差、绝对误差、平均相对误差见表1。
综上,基于加权相似度的核主元分析的最小二乘支持向量机建模的泛化误差均小于其他两种建模方法,而且运算时间相对短一些。该使用核主元分析的软测量方法具有更好的泛化能力,预测效果更好,是一种有效的建模工具。
表1 基于KPCA、相似度KPCA和加权相似度的LSSVM误差比较
采用基于加权相似度的核主参考文献
元分析和最小二乘支持向量机结合,对燃煤锅炉的飞灰含碳量进行软测量预测,通过电厂现场数据进行仿真,结果表明改进的核主元分析和LSSVM的预测模型具有更强的学习能力和泛化能力,而且运算速度相对快,为火电厂中飞灰含碳量的实时监测控制提供了参考依据,对提高锅炉的效率有一定的作用。关于由穷举法得到的阈值需进一步研究,以便得到更精确的软测量模型。
[1]阎维平,梁秀俊,陈宝康.基于在线检测数据的电站锅炉效率实时计算方法的研究[J].热能动力工程,2001,16(2):77-78.
[2]B Schölkopf,A Smola,K R Müller.Nonlinear component analysis as a kernel eigenvalue problem[J].Neural Computation(S0899-7667),1998,10(5):1 299-1 319.
[3]郑小霞,钱锋.基于PCA和最小二乘支持向量机的软测量建模[J].系统仿真学报,2006,18(3):217-219.
[4]Lee J M,Yoo C,Choi S W,et al.Non-linear process monitoring using kernel principal component analysis.Chemical Engineering Science,2004,59(1):223-224.
[5]L J Cao,K S Chua,W K Chong,et al.A comparison of PCA,KPCA and ICA for dimensionality reduction in support vector machine[J].NeuroComputing(S0925-2312),2003,55(1):321-336.
[6]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer Verlag,1995:181-197.
[7]Suykens J A K,Van Gestel T,Jos De Brabanter.Least Squares Support Vector Machines[M].World Scientific Press,2002.
[8]付克昌,吴铁军.基于特征子空间的KPCA及其在故障检测与诊断中的应用[J].化工学报,2006,57(11):145-150.
[9]张传标,倪建军,刘明华,等.样本优化核主元分析及其在水质监测中的应用[J].中国环境监测,2012,28(2):92-93.
Soft Measurement Model of Unburned Carbon in Fly Ash Based on Improved KPCA and LSSVM
WANG Zhen1,WEI Lin2,JIN Xiuzhang2
(1.Shandong Branch of Huadian Electric Power Research Institute,Jinan 250000,China;2.School of Control and Computer Engineering of North China Electric Power University,Baoding 071003,China)
Taking the 330 MW unit of Huaneng Jiaxiang power plant as an example,the KPCA(kernel principal component analysis)method is proposed to analyze impacting factors on the carbon content of the fly ash in the power plant.The KPCA and LSSVM(least square support vector machine)are used to establish the model of the furnace temperature.Field test data show that the use of the soft measurement model is of considerable result,which helps to avoid the negative affect to the production when any damage occurred to the measuring devices and meets the requirements of real-time measurement of carbon content in fly ash.More over,it also helps to improve the efficiency of the boiler.
carbon content of fly ash;weighted similarity;kernerl principal component analysis;least squares support vector machine;soft measurement
TP274;TK229
A
1007-9904(2015)10-0040-04
王真(1978),女,工程师,主要研究领域为电厂、化工DCS控制及优化;
金秀章(1969),男,博士,副教授,主要从事先进控制策略在大型电力机组控制研究;
魏琳(1990),女,硕士研究生,主要研究领域为先进控制理论与智能算法。