基于改进Elman神经网络的烟气轮机运行状态趋势预测

2019-05-15 11:06
关键词:步长趋势神经网络

(北京信息科技大学现代测控教育部重点实验室, 北京100192)

0 引言

大型设备故障预测是保障其安全运行和实现科学维护的关键技术。在故障预测中,状态趋势预测技术能够在设备发生故障前预测判断设备运行状态的发展趋势。烟气轮机是将催化裂化再生烟气中所具有的热能和动能通过膨胀做功转变为机械能的高速旋转机械,是具有显著节能和环保效益的石油炼厂关键性设备。烟气轮机的大部分故障不是瞬时发生的,故障从开始发生到发展总有一段出现异常现象的时间,而且有征兆可寻。故障的渐发性使得烟气轮机的状态趋势可以被预测,对烟气轮机进行状态趋势预测能够揭示设备运行状态的发展变化,有利于避免设备恶性事故和续发性事故的发生,对保障烟气轮机的安全运行具有重要意义[1-2]。

随着设备监测诊断系统和工业计算机技术及数据技术的发展,大量的设备运行状态信息的数据被采集并储存起来。以采集的数据为基础挖掘其中隐含信息进行预测的神经网络得到广泛的应用[3-4]。Elman动态递归神经网络具有高度自学习、自组织和自适应能力, 只要有足够的训练样本,就可以通过学习和训练实现以任意精度逼近任意函数。文献[5]将Elman神经网络应用于液体火箭发动机故障预测,并进行多参数多步预测,研究结果表明,Elman预测模型较传统的静态BP网络预测模型预测效果更好,收敛速度更快,精度更高,适合非线性动态系统的预测建模。文献[6]将Elman神经网络用于烟煤与生物质混烧灰熔点的预测,文献[7]将Elman神经网络用于温度的预测,均取得了不错的预测效果。同时,Elman神经网络与其他方法结合而衍生出多种特殊形式的神经网络结构,如小波神经网络、遗传小波神经网络等,因此在预测研究中具有很好的应用效果[8-9]。

目前,基于Elman神经网络的状态趋势预测研究主要集中在预测网络的优化以及与其他方法的结合方面,对基于Elman趋势预测的预测步长多是依经验设定,预测步长的设定没有客观依据,且对Elman神经网络预测的研究大都没有对数据异常值和缺失的数据进行处理,没有考虑所用数据的可靠性。为此,本研究从确保预测所用数据的可靠性和为给趋势预测设定客观有效的最优预测步长两方面出发,提出一种改进Elman神经网络的趋势预测方法,并构建了三层改进Elman神经网络进行烟气轮机运行状态趋势预测实例分析,以验证所提出方法的有效性。

1 基于改进Elman神经网络的状态趋势预测方法

1.1 网络结构

图1 Elman神经网络结构Fig.1 Structure of Elman neural network

Elman神经网络是一种带有延迟反馈环节的动态递归型神经网络,在前馈网络的基础上增加了适合于处理动态特性的机制,使Elman网络系统具有多层前馈网络无限逼近任意非线性映射的能力。如图1所示,Elman神经网络除具有输入层、隐含层、输出层单元外,还有1个特殊的联系单元,即承接层,用来记忆隐含层单元前一时刻的输出值。承接层使Elman网络具有动态记忆的功能,使系统具有适应时变特性的能力[10-11]。

Elman神经网络的非线性状态空间表达式为:

(1)

x(k)=f(w1xc(k)+w2(u(k-1))+b1,

(2)

xc(j)=x(k-1),

(3)

(4)

1.2 最优预测步长的确定

基于Elman神经网络的烟气轮机运行状态趋势预测,通过烟气轮机当前状态和发展趋势内在的联系和惯性规律进行联想预测。烟气轮机运行状态数据是按时间排列的有序数列,序列具有时间依存性,即运行状态两个不同时刻点之间具有相关性。相关程度的大小通过样本相关系数来衡量,相关程度越大,两个不同时刻信号相关程度越高[12]。因此,利用烟气轮机运行状态数据序列具有的时间依存性,计算烟气轮机数据序列不同时延的相关系数,以相关系数最大值点对应的时间延迟为最优预测步长,为预测步长的设定提供科学依据。

烟气轮机运行状态数据序列xi与时间延迟τ后序列的样本相关系数计算公式为:

(5)

样本相关系数ρ的取值范围为[-1,1],相关系数越接近±1则表示烟气轮机运行状态数据序列xi与时间延迟τ后序列的相关程度越大。|ρ|≤0.3时表示烟气轮机运行状态数据与时延τ后样本序列低度相关;0.3≤|ρ|≤0.5表示数据序列实相关;0.5≤|ρ|≤0.8表示数据序列显著相关;0.8≤|ρ|≤1表示数据序列高度相关。|ρ|≥0.3时烟气轮机运行状态可以预测,相关程度越大则说明预测效果越好,对应的相关程度最大值时的时间延迟即为最优预测步长。

1.3 状态趋势预测评判指标

为了评价改进Elman神经网络状态趋势预测的效果,在保证全面评价预测效果又不增加计算量的情况下,选取均方根误差、平均相对误差和平均绝对误差作为预测模型的评价指标。

①均方根误差RMSE为:

(6)

②平均相对误差MAPE为:

(7)

③平均绝对误差MAE为:

(8)

1.4 数据预处理

在烟气轮机状态趋势预测中,由于现场偶然性因素及突发性因素如现场电网电压波动、载荷波动等的影响致使在预测所用的数据存在异常值、缺失等,而异常值和数据缺失会导致样本量的减少,这不仅增加了状态趋势预测的难度,而且会导致趋势预测的结果产生偏差,不能准确预测设备状态发展趋势,因此,必须对异常值、缺失的数据进行处理,以确保预测所用数据的可靠性。

1.4.1 异常值处理

图2 箱线图方法识别异常值示意图Fig.2 Diagram of boxplot method to identify outliers

目前判别异常值的经典方法如莱因达准则(PanTa)、格拉布斯准则(Grubbs)、狄克逊准则(Dixon)等,但这些方法都是以假定数据服从正态分布为前提的,而实际烟气轮机运行状态数据往往并不严格服从正态分布,应用这些经典方法判断异常值其有效性有限[13]。

为有效判别烟气轮机运行状态数据的异常值,引入以四分位数和四分位距为基础的箱线图方法进行异常值处理。箱线图方法判别异常值对数据没有作任何限制性要求,不需要事先假定数据服从特定的分布形式,在识别异常值方面有一定的优越性[14-16]。在箱线图方法中,异常值被定义为小于Q1-1.5IQR(Q1为下四分位数,IQR为四分位距)或大于Q3-1.5IQR(Q3为上四分位数)的值,如图2所示。由于四分位数具有一定的耐抗性,多达25 %的数据可以变得任意远而不会很大地扰动四分位数,因此,箱线图识别异常值的结果比较客观。

1.4.2 缺失数据插补

在烟气轮机状态趋势预测中,若缺失数据过多时,则数据完全失去了可利用价值,任何填充方法都无济于事;若数据缺失在一个能处理的范围内时,但填充方法不恰当也会影响状态趋势预测结果准确度。缺失数据的插补需要选择合理的数据代替缺失数据,插补到原数据缺失的位置上,以便符合数据的分布和规律[17]。

缺失数据插补的目的并不是插补单个缺失值,而是插补缺失数据所服从的分布,因此,计算描述插补后数据分布规律的均值和标准误差、峰度、偏态和变异系数等描述数据分布的指标参数,以插补后数据分布的指标参数与原始数据越接近的插补方法为最优。描述插补后数据分布规律的参数计算公式如下:

(9)

(10)

②峰度因子为:

(11)

③偏态因子为:

(12)

④变异系数为:

CV=σ×100 %。

(13)

2 实例分析

2.1 数据来源

烟气轮机工作状态数据序列中,振动特性数据能够反映烟气轮机的机械动特性,比起其他状态参数更直接、快速、准确地反映设备的运行状态。监测烟气轮机前轴承YT-7702A通道一段连续40 d的振动通频值数据,结果如表1所示,并以此进行状态趋势预测。

表1 烟气轮机振动参数列表Tab.1 List of vibration parameters of flue gas turbine

图3 箱线图判别烟气轮机YT-7702A通道振动数据异常值Fig.3 Boxplot method to distinguish outlier of YT-7702A channel vibration data for flue gas turbine

2.2 异常值处理

利用箱线图方法对烟气轮机YT-7702A通道的振动通频值数据进行异常值判别,结果如图3所示。由图3可以看出,点12为异常值,点40为极端异常值。

对箱线图分析得出的异常值,首先查询烟气轮机工艺有无大的波动或调整,其次查看探头的间隙电压是否真实可靠。由于仪表失灵造成的振动假象不少,通过查看探头的间隙电压来判断仪表是否失灵。在确认烟气轮机工艺无调整后,查看烟气轮机参数列表如表1,点12、点40对应的转速正常,但点40对应时间点的间隙电压(探头的间隙电压)异常,综合判断后将点12异常值保留,剔除点40的异常值,插补适宜的值进行后续的趋势预测。

2.3 缺失数据插补

对烟气轮机前轴承YT-7702A通道振动数据进行分析,发现有效数据33个,占82.5 %;缺失数据7个,占17.5 % ,缺失数据所占比例在合理范围内,可以对缺失数据进行插补。分别应用邻近点中位数、邻近点均值和线性趋势方法进行缺失数据插补,并计算数据分布的均值、标准误差、峰度因子、峭度因子和变异系数。在插补操作中邻近点中位数、邻近点均值插补方法邻近点取6个,各缺失数据差补方法的数据分布指标比较如表2所示。

由表2可知,各种缺失数据插补方法均能使插补后数据的均值、标准误差、峰度因子、峭度因子和变异系数较原始数据的有不同程度的缩小;与其他方法相比,邻近点中位数插补方法的指标和原始数据最为接近,与原始数据分布最为接近,缺失数据插补效果最优。

表2 各缺失数据插补方法的数据分布指标Tab.2 Data distribution index parameters of missing data interpolation method

2.4 烟气轮机振动特性的趋势预测分析

2.4.1 确定最优预测步长及Elman神经网络预测参数

按照式(5)计算烟气轮机前轴承YT-7702A通道振动通频值数据序列不同时间延迟的相关程度,得到的不同时延下序列的样本相关系数结果如图4所示。

从图4可以看出,不同时间延迟下的烟气轮机振动序列的相关系数均表现出明显的波动性,且相关系数从正相关切换到负相关一次,说明不同时延下数据序列的相关关系处于动态变化中的。时延为1时自相关系数最大,为0.639 62,此时数据序列显著相关,选取最优预测步长为1进行循环迭代预测;时延为3时自相关系数次大,为0.604 59;时间延迟为2时自相关系数排第三,为0.566 48;时间延迟为4时自相关系数排第四,为0.530 43。

图4 YT-7702A数据序列的相关系数Fig.4 Correlation coefficient of YT-7702A data series

2.4.2 确定Elman神经网络趋势预测其他参数

为有效进行状态趋势预测,构建目标误差为0.001的3层Elman神经网络。针对振动通道数据的特点,选取输入层神经元个数为5,隐含层根据Kolmogorov定理确定为11,输出设置为最优预测步长1,进行单步循环预测。针对梯度下降算法存在的收敛速度慢、易陷入局部最小值的问题,Elman神经网络采用LM算法进行学习训练。LM算法是梯度下降法与高斯—牛顿法的结合,对于训练次数及准确度,其明显优于共轭梯度法及变学习率的梯度下降法,能够保证权值的每次调整都使误差减小,避免网络的振荡[18]。

图5 不同预测步长的Elman神经网络预测结果图Fig.5 Elman neural network prediction results of different prediction steps

为避免在神经网络的计算过程中发生数值溢出,对网络输入层和输出层的各单元值进行标准化处理。网络选用Tansig函数,其标准的数据输入和输出限定范围是[-1,1],效果比较理想的归一化区间为[-0.8,0.8],[-0.9,0.9]。采用式(14)将样本数据归划到(-0.9,0.9)区间。归一化处理的数据完成训练后,网络输出的结果要进行反变换才能得到实际值,即:

(14)

2.4.3 不同预测步长的预测比较

对插补后烟气轮机前轴承YT-7702A通道全数据序列进行趋势预测,其中,训练数据30个,预测数据10个,进行单步循环预测,并与预测步长为3、2和4的Elman神经网络预测进行效果对比。不同预测步长的Elman神经网络预测结果如图5所示,不同预测步长的Elman神经网络预测误差比较如表3所示。

表3 不同预测步长的Elman神经网络预测效果的比较Tab.3 Comparison of prediction results of Elman neural network with different prediction steps

从图5可以看出,不同预测步长的Elman神经网络预测结果实际值存在上下波动,但Elman神经网络1步预测较其他预测步长更能贴近实际烟气轮机的运行状态趋势。Elman神经网络1步预测在第5、6、8天的预测与实际值的趋势有所不同,主要原因是由于数据量偏少,网络训练不充分造成的。比较表3的1步和3步预测步长的Elman神经网络预测效果,发现1步预测步长的均方根误差RMSE、平均相对误MAPE、平均绝对误差MAE均较比3步预测步长的小,充分说明了1步预测步长比其他预测步长预测精度高,验证了利用数据相关程度确定最优预测步长的有效性。

2.4.4 与其他神经网络的预测效果比较

对插补后烟气轮机前轴承YT-7702A通道振动全数据进行不同神经网络类型的1步最优循环预测,以验证Elman神经网络的预测效果。不同神经网络的预测结果如图6所示,预测性能比较如表4所示。

从图6可以看出,Elman神经网络1步预测较BP网络1步预测和RBF 1步预测更接近实际的烟气轮机运行状态趋势,结合表4的不同神经网络单步预测效果比较,可以发现Elman 1步预测步长的均方根误差RMSE、平均相对误差MAPE、平均绝对误差MAE均比BP和RBF1步预测步长的小,充分说明Elman 神经网络的预测精度比BP和RBF网络的预测精度高,验证了递归型Elman神经网络在趋势预测中的有效性。

神经网络均方根误差/μm平均相对误差/%平均绝对误差/μmElman2.2373.241.817BP2.7714.012.262RBF3.0244.332.440

3 结论

为揭示石油炼化的烟气轮机设备运行发展的趋势,提高烟气轮机状态趋势预测的精度,从确保预测所用数据的可靠性和为给趋势预测设定客观有效的最优预测步长两方面出发,提出一种改进Elman神经网络的趋势预测方法,研究结论如下:

①引入的箱线图异常值判别方法能够简捷快速、直观明了地判别数据中的异常值,对缺失数据进行插补,邻近点中位数插补方法最能反映原始数据的分布,能够为烟气轮机的状态趋势预测提供可靠的全数据序列。

②根据烟气轮机运行状态数据序列具有的时间依存性,计算数据序列不同时延的相关程度,以相关系数最大值点对应的时延为最优预测步长。最优预测步长较其他预测步长Elman神经网络方法预测误差上最小、预测精度更高,同时Elman最优预测步长预测方法的预测精度较BP、RBF神经网络精度更高。

③改进Elman神经网络能够为烟气轮机的状态趋势预测提供一种有效的预测方法,该方法也可应用于其他关键设备的趋势预测中。

猜你喜欢
步长趋势神经网络
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
趋势
基于随机森林回归的智能手机用步长估计模型
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
初秋唇妆趋势
SPINEXPO™2017春夏流行趋势
基于神经网络的拉矫机控制模型建立
基于动态步长的无人机三维实时航迹规划
基于逐维改进的自适应步长布谷鸟搜索算法