KPCA-LSSVM在磨煤机一次风量预测中的应用

2015-03-09 02:48:13ApplicationofKPCALSSVMinPredictionofthePrimaryAirFlowofPulverizer
自动化仪表 2015年3期
关键词:训练样本磨煤机风量

Application of KPCA-LSSVM in Prediction of the Primary Air Flow of Pulverizer

金秀章 韩 超

(华北电力大学控制与计算机工程学院,河北 保定 071003)

KPCA-LSSVM在磨煤机一次风量预测中的应用

Application of KPCA-LSSVM in Prediction of the Primary Air Flow of Pulverizer

金秀章韩超

(华北电力大学控制与计算机工程学院,河北 保定071003)

摘要:针对建立热电厂磨煤机一次风量软测量模型训练样本多、样本特征维数大等特点,考虑到现场测量所需的实时性和准确性,提出了基于样本优化、核主成分分析(KPCA)和最小二乘支持向量机(LSSVM)相结合的方法进行建模。运用某电厂历史运行数据对模型进行仿真验证,结果表明:基于样本优化的KPCA-LSSVM软测量模型在精确性、跟踪能力和运行速度上均要优于LSSVM、BP和KPCA-BP模型,这为现场磨煤机一次风量的准确、实时测量提供了一定的理论依据。

关键词:软测量样本优化核主成分分析最小二乘支持向量机BP神经网络

Abstract:In accordance with the features of establishing soft sensing model for primary air (PA) flow of pulverizers in cogeneration power plant, e.g., more training samples and sample characteristics with large dimension, and considering the requirements of real time performance and precision in field measurement, the method of establishing model based on the combination of sample optimization, kernel principal component analysis(KPCA), and least square support vector machine (LSSVM) is proposed. The simulation verification of the model is conducted using historical operating data of certain power plant; the results indicate that the method based on sample optimization KPCA-LSSVM soft sensing model is better than LSSVM, BP or KPCA-BP model in accuracy, tracking capability and operating speed, this provides certain theoretical basis for real time and accurate measurement of PA air flow of the pulverizers.

Keywords:Soft sensingSample optimizationKernel principal component analysis(KPCA)Least square support vector machine(LSSVM)

BP neural network

0引言

针对硬件测量仪表对磨煤机一次风量的测量效果差、经常性堵塞等问题,应用软测量技术对磨煤机一次风量进行测量不失为一种好的方法。软测量技术利用一些与被测变量关系密切且易于实时测量的变量,通过在线运算来估计难以测量或不可测量的变量[1]。考虑到热工过程的复杂性,采用机理建立软测量模型难度较大,进而改为采用黑箱建模。基于人工神经网络的磨煤机一次风量预测虽有成功的案例[2],但在模型训练中存在过拟合、训练时间长、易于陷入局部最小和网络结构不确定等问题。最小二乘支持向量机(least square support vector machine,LSSVM)是一种基于统计学习理论的机器学习方法,具备坚实的统计理论和出色的学习能力,已成功运用到工业软测量技术当中。其将标准支持向量机目标函数进行变形,使其由二次寻优转变为求解线性方程组,加快了求解速度,得到了广泛应用[3-4]。

1核主成分分析

磨煤机一次风量软测量模型输入样本特征维数高,各特征之间存在强耦合、非线性等特点,使得模型复杂性增高、精度降低、泛化和学习能力减弱。将统计学理论上的数据驱动方法应用到多相关的样本特征中,将其压缩为少数独立的特征,使得这些相互独立的特征保留绝大部分原特征的信息,从而去除数据样本特征之间的相关性,消除噪声,降低特征维数。核主成分分析可将原始样本特征由非线性变换映射到高维特征空间,再在高维空间中进行主成分分析 (principal component analysis,PCA)[5]。

(1)

它符合特征方程:

Cv=λv

(2)

根据再生核理论,存在αi(i=1,2,…,l)使得:

(3)

引入核函数Kij:

(4)

(5)

将式(1)、式(3)代入式(5),经简化可得下式:

Kα=lλα

(6)

(7)

核主成分个数的选择根据下式:

(8)

式中:η通常大于0.85。

(9)

式中:1l×l为系数为1/l的l×l阶全1矩阵。

对于测试样本同样需要进行核矩阵的变换,变换如下:

(10)

2基于相似度的样本优化

热电厂运行工况多,其一次风量软测量模型的训练样本集规模要大。针对大规模数据集的KPCA问题,为了提高运算的效率,核Hebbin算法、分块核主成分、对数据集进行分割的方法均有应用[6]。上述方法原理复杂,实现起来不是十分方便。 本文运用样本优选的方法优化大规模的训练样本集,从而大幅度减少训练样本的个数,简化模型,适合LSSVM应用小样本学习的特点,提高运算的精确性与实时性[4-7]。

采用一种基于相似度函数的方法,其思想和模式识别中的最小距离法相似,若两样本点之间的欧式距离过小,则认为这两个样本是重复的,重复的样本增加了模型的复杂度,可舍去其一。以此对训练样本进行优化,剩下合理的能代表绝大部分工况的样本点。

选择相似度函数:

(11)

式中:xi∈Rn,i=1,2,3,…l,n为样本的特征维数,l为样本的个数;‖·‖2为向量二范数;Fij为第i个样本点和第j个样本点之间的相似度值。

针对样本数据信息,并考虑到减小数据采集和分析的误差,选择整体的归一化参数δ,计算公式如下:

(12)

式中:Ci为样本第i个特征的值;n为样本特征的维数。

若两个样本值越接近,则经过相似度函数计算后,其相似度值就越接近于1。这样可认为这两个样本含有相同数据信息量较大,若同时作为模型的训练样本,将会造成数据量的冗余,增加计算量,此时去除其一[8]。

3最小二乘支持向量机

支持向量机(supportvectormachine,SVM)[9]是Vapnik等人根据统计学理论提出的一种新的通用学习方法, 它是建立在统计学理论的机构风险最小原理和VC维理论基础上的,能够对小样本、非线性、高维数和局部极小点等实际问题进行较好的处理。

(13)

(14)

式中:ωT为置信空间,对模型的复杂度进行控制;c>0为误差惩罚函数,表示函数的允许误差大于ε的数值和平滑度之间的折中;Remp为经验风险,即不敏感损失函数。

损失函数不同,构造的支持向量机也不同。最小二乘支持向量机将误差ξi的二次项作为损失函数,其优化问题为:

(15)

通过上式的对偶形式可以求其最优解,对偶形式可以根据目标函数和约束条件建立拉格朗日函数:

(16)

根据优化条件:

可得:

(17)

(18)

最后得到最小二乘支持向量机的估计输出函数:

(19)

核函数不同,构造的支持向量机也不同,常用的核函数有:

① 多项式核函数:

(20)

② 径向基核函数:

(21)

③ 感知器核函数:

(22)

④ B样条函数:

(23)

4软测量模型建立

软测量技术主要由辅助变量的选择、数据采集与处理、软测量模型几部分组成。软测量建模是软测量的核心。

4.1 辅助变量的选取及预处理

选取辅助变量在软测量模型建立过程中至关重要,包括辅助变量的类型、数目以及测点的位置。从某电厂获取一天的历史运行数据,由于每台磨的条件相差不大,所以只对一台磨进行软测量模型的建立(假如为A磨),其他磨的一次风量均可利用此模型。根据系统设备流程,结合流量的测量原理和影响流量测量的因素,列出了以下辅助变量,如表1所示。

表1 辅助变量

由于数据在DCS的SAMA图中已进行了滤波处理,在进行模型训练时不需要再进行此环节。但需要用3σ法则将不合理的样本数据剔除。

去除和一次风量相关系数小于0.1的辅助变量,剩下30个一次风量的辅助变量,用这30个辅助变量作为样本的特征。由于还要对数据进行核主成分分析,用核主成分分析对样本数据特征进行去噪,消除数据特征之间的相关性,所以此处应该尽可能保留大部分辅助变量。

4.2 模型的建立

一次风量预测模型如图1所示。经过预处理的辅助变量作为样本的特征,将获取的训练样本经过样本优化,得到优化样本集;再对优化后的样本集进行核主成分分析降维,得到降维后的新特征,将其作为最小二乘支持向量机的输入进行软测量模型的训练、建立,建模流程具体如下。

图1 基于样本优化的KPCA-LSSVM一次风量预测模型

4.2.1相似度函数阈值ε的选择

经过数据预处理,优化处理全部训练样本,剩余样本数随阈值ε的不同而不同。阈值ε的确定要经过所建立的KPCA-LSSVM模型验证,同时兼顾模型的学习能力和泛化能力,得到合理的阈值ε的范围。不同阈值和剩余样本的关系曲线如图2所示。

从图2可以看出,随着相似度函数阈值ε的增大,剩余样本的数量逐渐增多。在区间(0.98,1)之内,剩余样本的变化率较大,说明在此区间内样本的简化效率较高, 同时综合考虑所建立的模型,最终将相似度函数的阈值ε设为0.988,此时剩余的训练样本数为306个。

图2 剩余样本数量和相似度函数阈值关系图

4.2.2样本数据的核主成分分析

对训练样本进行优选后,再对训练样本进行核主成分分析。由4.2.1章节可知,训练样本集最终取优选后的306个样本组成,则会产生306×306维的核矩阵。采用径向基核函数进行核主成分分析,随着σ2增大,核函数矩阵前几个特征值之和占全部特征值和的比重越来越大。当σ2增大到一定程度后,核矩阵的特征值变化得很小,同时可以保证一个很好的特征提取贡献率,则将核函数参数σ2设为1 800。取前5个主成分时,其特征值贡献率已达90.36%。取前7个主成分时,其特征值贡献率已达94.10%。

取核矩阵最大的7个特征值对应的特征向量作为投影向量集。将306×306维核矩阵在投影向量集上投影,得到了经过降维和非线性提取后的306×7维数据(即训练样本集,306为样本个数,7为样本特征维数),样本特征维数由原来的29降为7。测试样本在进行模型的测试验证时,根据章节1求出测试样本的核矩阵,在投影向量集上进行投影,得到了经过降维和非线性提取的测试样本集。KPCA提取主成分的值及累计贡献率如表2所示。

表2 核主成分分析结果

5仿真结果与分析

选择某电厂一天的运行数据,共等间隔采集了5 760组样本,并从中优选出模型的训练样本,同时随机选择60组样本进行模型的测试。LSSVM、KPCA-LSSVM、BP和KPCA-BP模型的训练样本均使用优化后的样本,NOP-BP(未经样本优化的BP模型)的训练样本为全部样本。

本文采用径向基核函数,误差惩罚参数c和径向基核函数参数σ2的取值对LSSVM软测量模型的性能有着重要影响,c用来控制样本偏差和机器泛化能力之间的关系。σ2太大或太小会对样本数据造成过学习或欠学习[10]。本文通过网格十折交叉验证的方法对参数c和σ2进行寻优,直到找到最佳的参数对,使得模型精度最高,最终选取c=18.65,σ2=11.88。

不同软测量预测模型下磨煤机一次风量的测试曲线对比如图3~图7所示。

图3 LSSVM模型测试曲线

图4 KPCA-LSSVM模型测试曲线

图5 NOP-BP模型测试曲线

图6 BP模型测试曲线

图7 KPCA-BP模型测试曲线

为了评价软测量预测模型的精度,分别使用最大绝对值误差、均方根误差(RMSE)、相对均方根误差(RRMSE)、平均误差(AE),对模型的预测准确性和跟踪变化能力进行了分析[11],计算结果如表3所示。

表3 不同模型预测结果分析

最大绝对值误差:

(24)

均方根误差(RMSE):

(25)

相对均方根误差(RRMSE):

(26)

平均误差:

(27)

对于模型的运行速度则用模型测试60组样本所用的运行时间T60作为参考,以毫秒为计量单位。

从表3结果分析可知,KPCA-LSSVM所建立的软测量模型的预测结果在各个评价指标中都是最好的,证明了其在预测准确性和跟踪能力上都要优于其他的软测量模型。

通过对比可知,经过样本优化和核主成分分析后的模型更优。

6结束语

本文共建立了五个软测量模型对磨煤机一次风量进行预测。结合运行数据,进行数据仿真。仿真结果表明:用KPCA和LSSVM相结合的软测量模型在精确性、跟踪能力和运行速度上均要优于LSSVM、BP、KPCA-BP等模型,这为现场磨煤机一次风量的有效测量提供了一定的理论依据,有一定的实用价值。

参考文献

[1] 韩璞,乔弘,翟永杰,等.火电厂热工参数软测量技术的发展和现状[J].仪器仪表学报,2007,28(6):1139-1146.

[2] Yang Yaoquan,Zhao Kai,Zhang Qin.Soft sensor for coal mill primary air flow based on nerual network[C]∥Proceedings of the 3rdInternational Conference on Computational Intelligence and Industrial Application,2010:53-56.

[3] 王强,田学民.基于KPCA-LSSVM的软测量建模方法[J].化工学报,2011,62(10):2813-2817.

[4] 田大中,高宪文,李琨.基于KPCA与LSSVM的网络控制系统时延预测方法[J].系统工程与电子技术,2013,35(6):1281-1285.

[5] 赵欢,王培红,陆璐.电站锅炉热效率与NOX排放响应特性建模方法[J].中国电机工程学报,2008,28(32):96-100.

[6] 史卫亚,郭跃飞,薛向阳.一种解决大规模数据集问题的核主成分分析算法[J].软件学报,2009,20(8):2153-2159.

[7] 许巧玲,林伟豪,赵超,等.基于KPCA-LSS-VM的工业锅炉烟气含氧量预测[J].计算机与应用化学,2012,29(7):121-125.

[8] 张传标,倪建军,刘明华,等.样本优化核主元分析及其在水质监测中的应用[J].中国环境监测,2012,28(2):92-96.

[9] Vapnik V N.Statistical learning thoery [M].New York:Addision Wiley,1998.

[10]谈爱玲,毕卫红.基于KPCA和LSSVM的蜂蜜近红外光谱鉴别分析[J].激光与红外,2011,41(12):1331-1335.

[11]唐春霞,杨春华,桂卫华,等.基于KPCA-LSSVM的硅锰合金熔炼过程炉渣碱度预测研究[J].仪器仪表学报,2010,31(3):689-693.------------------------------------------------------------------------------------------------

中图分类号:TP181

文献标志码:A

DOI:10.16086/j.cnki.issn1000-0380.201503017

修改稿收到日期:2014-08-26。

第一作者金秀章(1969-),男,2006年获华北电力大学控制理论与工程专业,获博士学位,副教授;主要从事先进控制策略在大型电力机组的控制研究。

猜你喜欢
训练样本磨煤机风量
对磨煤机进行8421编码的甩负荷控制优化
湖北电力(2022年6期)2022-03-27 08:54:30
人工智能
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
电视技术(2016年9期)2016-10-17 09:13:41
基于稀疏重构的机载雷达训练样本挑选方法
1000MW机组一次风量测量装置技术改造
广西电力(2016年1期)2016-07-18 11:00:35
MTZ3573型钢球磨煤机应用高铬球的经济性分析
广西电力(2016年4期)2016-07-10 10:23:38
煤矿主通风机风量的测定方法及优缺点分析
山西煤炭(2015年4期)2015-12-20 11:36:16
小风量点火法在电厂循环流化床锅炉的应用
1号炉A侧二次风量频繁波动分析
机电信息(2014年27期)2014-02-27 15:53:53