基于RF-LSTM网络的风电机组状态参数预测

2021-07-01 02:44:35王喜才
装备维修技术 2021年50期
关键词:风电机组随机森林

王喜才

摘 要:为实现风电机组的早期故障预警,提出一种基于随机森林(RF)结合长短期记忆(LSTM)网络的风电机组状态参数预测方法。结果表明,在不同的输入变量与预测方法下,RF-LSTM均具有较高的预测精度,不仅克服了众多状态参数存在的高维度、非线性等问题,还保证了输入变量的重要信息不会随着时间被遗忘。

关键词:风电机组;随机森林;状态参数预测;长短期记忆网络

1 引言

由于风电场所处位置偏僻,风电机组系统和各部件关联的复杂性,当风电机组出现故障时,所处环境的恶劣会使风电机组维修困难,导致运行维护成本较高。

2 RF-LSTM网络预测方法

2.1 RF原理

RF是以决策树为学习器的集成学习方法。对于回归问题,通过建立每棵决策树,抽取一定数量的特征,从中选择最合适的特征作为分裂节点来划分左右子树,生成多个决策树模型,每一个决策树的预测结果为叶子结点的均值,RF最终的预测结果为所有决策树预测结果的均值。

2.2 LSTM网络原理

LSTM网络是循环神经网络(Recurrent Neural Network,RNN)的一种改进。LSTM网络的计算过程如下:

遗忘门会根据输入的状态决定哪些信息会被遗忘,从而得到遗忘门的输出状态f(t)f(t):

f(t)=σ(Wfaa(t−1)+Wfxx(t)+bf)f(t)=σ(Wfaa(t−1)+Wfxx(t)+bf)(2)

式中,x(t)x(t)为当前时刻的输入,a(t−1)a(t−1)是上一时刻的细胞状态,WfaWfa,WfxWfx是遗忘门权重系数;bfbf是遗忘门偏置;σσ是遗忘门激活函数。

更新门决定细胞状态是否更新。细胞状态的更新是由更新门的输出状态i(t)i(t)与tanhtanh函数激活输出c¯(t)c¯(t)的乘积和上一时刻的细胞状态c(t−1)c(t−1)与遗忘门f(t)f(t)的乘积组成。其输出表达式为:

i(t)=σ(Wiaa(t−1)+Wixx(t)+bi)i(t)=σ(Wiaa(t−1)+Wixx(t)+bi)(3)

c¯(t)=tanh(Wcaa(t−1)+Wcxx(t)+bc)c¯(t)=tanh(Wcaa(t−1)+Wcxx(t)+bc)(4)

c(t)=i(t)×c¯(t)+f(t)×c(t−1)c(t)=i(t)×c¯(t)+f(t)×c(t−1)(5)

式中,WiaWia,WixWix,WcaWca,WcxWcx是更新門的权重系数;bibi,bcbc是更新门的偏置;σσ,tanhtanh是更新门的激活函数;c(t)c(t)是更新后的细胞状态。

输出门决定是否将当前状态传递给下一时刻。

o(t)=σ(Woaa(t−1)+Woxx(t)+bo)o(t)=σ(Woaa(t−1)+Woxx(t)+bo)(6)

a(t)=o(t)×tanh(c(t))a(t)=o(t)×tanh(c(t))(7)

式中,o(t)o(t)是当前单元的隐藏状态,WoaWoa,WoxWox是输出门细胞状态更新权重系数;bobo是输出门细胞状态偏置;σσ,tanhtanh是输出门激活函数;a(t)a(t)是当前时刻神经网络的隐藏状态。

2.3 RF-LSTM网络预测模型

针对风电机组状态参数预测,提出的RF-LSTM网络预测模型的实现流程。RF-LSTM网络预测模型的实现可以分为三个阶段:第一个阶段是数据预处理。采集风电机组SCADA系统监测的状态参数数据作为样本数据,对其进行归一化处理。第二个阶段是输入变量筛选。将处理后的样本数据输入到RF模型进行10折交叉验证训练,记录每次模型得到的均方误差。第三个阶段是预测模型构建。初始化LSTM网络参数,结合评价指标对参数寻优,构建RF-LSTM网络预测模型。

3基于RF-LSTM网络的状态参数预测

3.1模型参数选择

3.1.1 RF参数选择

本实验在MATLAB2018b平台上运行,取采样数据的2/3作为训练集,1/3作为测试集。RF算法有两个主要参数:决策树的数量(CART)和叶子节点数(T)。采用MSE作为RF参数寻优的评价指标,一般是将叶子节点数设置为5。

3.2.2 LSTM网络参数选择

设置LSTM网络的batchsize为64,学习率为0.001,最大迭代次数为30,优化器为adam。为了研究LSTM网络参数对于预测精度的影响,选取记忆单元个数和隐藏网络层数两个参数进行测试,并以MAE和loss值作为评价指标。

以单层LSTM网络作为训练模型,改变记忆单元个数,分析不同记忆单元个数对模型预测精度的影响。

随着记忆单元个数递增,评价指标MAE和loss的数值整体上先升高后下降,当记忆单元个数为32时,单层LSTM网络训练的预测精度较好。

3.2结果分析

3.2.1输入变量筛选结果分析

为了验证RF在输入变量选择方面的优势,引入传统的PCC方法和MI算法对各个状态参数进行分析,共得到3种不同的状态参数组合,将其作为LSTM网络预测模型的输入变量。

依据RF理论计算各个状态参数的重要性值。

将该实验的19个状态参数作为特征。选择基于MI的向后消除特征算法,从全部的特征开始,每一轮消除一个与目标边缘化最大的特征,并记录下所有剩余特征。当没有特征消除时,该算法就会停止。

在第12轮之前,MI损失百分比几乎是没有变化的,表示已消除的12个特征对于目标影响不大。随着轮数的增加,MI损失百分比的曲线开始出现转折,并呈现上升的趋势,说明在第12轮后消除特征会对目标变量信息造成损失。因此,选择第12轮时的特征当作输入变量,即为编号1、3、5、6、11、18和19,共7个状态参数。

根据PCC理论得出各个状态参数与目标变量对应的皮尔逊相关系数。选择皮尔逊相关系数在[0.6,1]和[-1,-0.6]范围内的状态参数作为输入变量,即编号1、2、4、5、6、8、9、10、11、12、13、14、17和19,共14个状态参数。

根据以上结果分析得出:RF筛选出4个状态参数作为输入变量,MI筛选出7个状态参数作为输入变量,PCC筛选出14个状态参数作为输入变量。

3.2.2预测结果分析

取采样数据的前2680组数据当作训练集,后200组数据当作测试集,对比三种不同算法筛选的输入变量对预测结果的影响。

RF-LSTM与真实值的曲线拟合程度要略优于MI-LSTM和PCC-LSTM。

加入未经处理的单变量与全集,综合比较不同的输入变量对于预测结果的影响。

五种输入变量的模型测试时间相差并不大,文中模型效果好。RF-LSTM模型得出的MAE、MSE相对较小,R2较大,综合比较该模型优于其它模型。为验证LSTM网络模型在预测方法中的优越性,与SVR、BP两种方法进行比较,三种方法预测结果的评价指标。

4 结论

本文将RF理论应用到输入变量筛选中,除去与目标变量相关性较小的状态参数,并与MI、PCC进行比较,验证该输入变量的有效性。将其应用到SVR、BP网络中,通过对比验证了LSTM网络在预测模型中的优越性。该模型在一定程度上提高了预测精度,可以将该方法进一步应用到风电机组其他状态参数中,预测未来时刻的风电机组状态参数值,为风电机组的早期故障预警提供更接近于真实值的数据。

参考文献

[1]孙鹏, 李剑, 寇晓适,等.采用预测模型与模糊理论的风电机组状态参数异常辨识方法[J].电力自动化设备, 2017, 37(8): 90-98.

猜你喜欢
风电机组随机森林
基于S能量熵的直驱式风电机组故障诊断方
科技资讯(2016年29期)2017-02-28 09:48:00
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
软件(2016年7期)2017-02-07 15:54:01
拱坝变形监测预报的随机森林模型及应用
含风电机组的配电网的潮流计算研究
基于随机森林算法的飞机发动机故障诊断方法的研究
基于实践应用的风电机组测试与认证教学改革
科教导刊(2015年36期)2016-01-13 02:09:04
风力发电机组电气与控制系统快速检修思路探索
科技视界(2015年25期)2015-09-01 17:45:39
基于随机森林算法的B2B客户分级系统的设计
风电机组典型事故及预防措施分析