基于CAE与BiLSTM结合的风电机组齿轮箱故障预警方法研究

2022-07-30 08:44朱浩伟汤海宁胡爱军

动力工程学报 2022年6期

向玲，朱浩伟，丁显，汤海宁，胡爱军

(1. 华北电力大学机械工程系，河北保定 071003； 2. 鲁能集团有限公司，北京 100020；3. 国电南瑞南京控制系统有限公司，南京 210061)

风能因其清洁、可再生的特点，已成为发展最快的新型能源。由于风电机组运行条件恶劣且受力具有多变性，长时间运行容易导致风电机组重要部件发生故障，造成停机，致使风电机组运维成本较高。为了降低停运时间和运维成本，提高风电机组的运行可靠性，风电机组状态监测技术的发展需求越发迫切[1]。

目前，风电机组状态监测方法主要包括基于模型驱动的方法以及基于数据采集与监视控制(SCADA)系统数据驱动的状态监测方法。基于模型驱动的方法需要建立准确的风电机组及其子系统数学或物理模型，但由于风能的随机性和风电机组复杂的故障机理，参数的多元耦合建模比较困难，实际中难以实现；采用基于SCADA数据进行数据驱动的方法来识别风电机组的健康状态通常不会带来复杂的建模过程，但受风速变化和气温季节性变化的影响，在正常运行情况下SCADA系统的监测数据幅值变化范围较大，这意味着在幅值较大时风电机组或部件不一定出现故障，在幅值较小时运行安全程度不一定更高。

近年来，深度学习由于其强大的数据特征提取能力和非线性表达能力，引起了故障诊断领域内许多专家学者的注意，为风电机组故障监测提供了新方向[2]。Zhao等[3]利用SCADA数据建立深度自编码网络模型，并利用极值理论确定自适应阈值，以此作为判断异常的标准。任建亭等[4]运用深度变分自编码网络融合SCADA数据对风电齿轮箱进行故障预警。Kong等[5]利用SCADA时空特征融合机制建立卷积神经网络(CNN)和门控循环单元的预测模型，并进风电机组早期故障预警。Teng等[6]建立了基于深度学习网络(DNN)的直接驱动的风力机故障监测模型。邓子豪等[7]利用特征选择(ReliefF)算法和核密度-均值法提取风电机组数据特征，进行网络训练。Chang等[8]提出了一种基于并行卷积神经网络(C-CNN)的神经网络。彭道刚等[9]提出了基于长短期神经网络(LSTM)与支持向量机的故障预警方法。林涛等[10]基于改进栈式自编码器实现了对发电机后轴承的故障监测。Chen等[11]通过对深度学习模型长短期神经网络加入注意力机制来监测叶片不平衡故障。Qu等[12]提出了生成对抗网络(GANs)的多重优化小波变换数据估算方法。雍彬等[13]提出基于门控循环网络融合多源数据的风电齿轮箱状态预警方法。Xiao等[14]提出了一种改进的注意八度卷积(Attention Octave Convolution，AOctConv)网络结构。

深度学习算法在风电机组状态监测领域得到了广泛运用，对降低风电机组运维成本具有重要意义，但众多学者的算法在模型精度上有待进一步提升。笔者针对SCADA数据的特点，提出了卷积自编码(Convolution AutoEncoder, CAE)与双向长短期神经网络(Bi-directional Long Short-Term Memory, BiLSTM)结合的风电机组齿轮箱故障预警方法，首先介绍了CAE和BiLSTM模型的特征，基于其特征选择特性和非线性特性构建了深度学习网络模型，之后利用算例将特征参数代入预测模型，并对得到的预测参数偏差进行分析，最后通过设定报警阈值实现风电机组齿轮箱的故障预警。

1 风电机组状态监测模型

深度学习通过模型训练能够准确提取SCADA数据中的隐藏特征，根据这一特点可以建立预测模型，以监测风电机组的运行状态，通过在CAE层后连接BiLSTM层完成时间特征的提取，之后通过全连接层得到目标参数的预测值。

1.1 卷积自编码器

自动编码器(AutoEncoder，AE)是一种典型的无监督神经网络模型，简称自编码器。自编码器基于反向传播算法与最优化方法(如梯度下降法)，利用输入数据X本身作为监督来指导神经网络尝试学习一种映射关系，得到一个重构输出XR。通常算法模型包含2个主要的部分：编码器(Encoder)和解码器(Decoder)。编码器的作用是把高维输入X编码成低维的隐变量h，从而强迫神经网络学习最有信息量的特征；解码器的作用是把隐藏层的隐变量h还原到初始维度，最好的状态就是解码器的输出能够完美或者近似恢复出原来的输入，即XR≈X，其结构如图1所示。卷积自编码器利用CAE层替换了简单自编码器的全连接层，与图像的二维拓扑结构吻合，避免了重构误差的损失，编码过程变成卷积过程，解码过程变成反卷积过程。

图1 自编码器结构Fig.1 Autoencoder structure

1.2 双向长短期神经网络

BiLSTM并没有改变LSTM的内部结构,虽然只是从正反两个方向利用LSTM对数据建模，然后将信息拼接在一起，但是改善了LSTM因模型结构导致前后数据信息重要程度发生改变，从而造成预测精度下降的问题，同时避免了梯度消失和爆炸。LSTM的计算过程可以概括为：通过遗忘细胞状态中信息和记忆新的信息使得对后续时刻计算有用的信息得以传递，而无用的信息被丢弃，其前向传播[15]可以表示为：

ft=σ(Wf·[ht-1,xt]+bf)

(1)

it=σ(Wi·[ht-1,xt]+bi)

(2)

(3)

(4)

ot=σ(Wo[ht-1,xt]+bo)

(5)

ht=ot·Relu(Ct)

(6)

图2 BiLSTM模型的结构Fig.2 Structure of BiLSTM model

2 基于CAE-BiLSTM的风电机组预测模型

对级联神经网络CAE-BiLSTM异常状态监测时的内部结构进行分析，建立了神经网络结构简图，如图3所示。

图3 CAE-BiLSTM网络结构图Fig.3 Structural diagram of CAE-BiLSTM network

2.1 预测模型建立

根据特征选择特性和参数非线性特性建立CAE-BiLSTM模型，该模型实施的具体步骤如下：

(1) 对正常运行状态下的SCADA数据进行预处理。首先剔除停机数据以及有功功率小于0 kW的数据等无关数据的干扰，通过箱线图法对异常数据进行清洗，之后对正常运行状态下的SCADA数据进行相关性分析，选取与齿轮箱轴承温度相关性较大的参数作为输入参数。

(2) 建立预测模型。预测模型的主要结构是CAE层和BiLSTM层，其中CAE层的层数为1，卷积核的大小设置为3，BiLSTM层的层数为2，最后添加了输出维度分别为16和1的全连接层，所有结构的激活函数选择Relu，选择平均绝对误差(MAE)作为模型的损失函数，优化器选择能够使用自适应学习率加快模型收敛速度的Adam。

(3) 训练预测模型。将预处理后正常运行状态的SCADA数据输入到预测模型上进行训练，通过验证集和训练集的损失对比判断预测模型是否发生过拟合和欠拟合来确定迭代次数，通过调整超参数和迭代次数使得预测模型能够得到输入参数与目标参数的逻辑映射关系。

2.2 异常监测方法

均方根误差(RMSE)可以衡量预测值与真实值之间的偏差，常用来衡量预测结果的准确程度，均方根误差越小，测量精度越高，均方根误差R的表达式[15]如下：

(7)

式中：xi为真实值；yi为预测值；N为采样个数。

为了消除预测结果的偶然性，避免报警信息量过大甚至误报导致不能及时发现真正的问题，利用RMSE对风电机组运行状态进行监测，当异常状态的SCADA数据输入预测模型时，由于数据偏离训练的正常数据，使得误差增大，RMSE将会增大，当残差序列的RMSE多次超过设定的安全阈值时，判定风电机组运行状态异常，基于CAE-BiLSTM的状态监测流程如图4所示。

图4 基于CAE-BiLSTM的状态监测流程图Fig.4 Flow chart of state monitoring based on CAE-BiLSTM

3 算例分析

3.1 数据预处理及输入参数选择

研究对象为某风电场并网双馈风电机组，容量为0.75 MW，取2015年1—9月份的SCADA监测数据作为样本进行分析。SCADA数据包含44个与风电机组运行状态相关的参数，主要部件参数如表1所示。

表1 风电机组主要部件参数Tab.1 Main component parameters of the wind turbine

风电机组的SCADA数据记录了设备寿命周期内的所有状态，包括正常运行、故障、停机和检修等状态，一些无关数据会影响模型的预测精度，需要对SCADA数据进行筛选。首先将SCADA数据中显示异常状态的数据剔除，然后根据风速和有功功率对SCADA数据进行处理，得到风速范围集中分布在4～20 m/s的数据，同时删除有功功率为0 kW的数据，最后利用箱线图法对数据中的异常数据进行清洗。

图5为风电机组相关参数的箱线图，其中横轴数字1～6分别表示风速、齿轮箱油温、齿轮箱轴承温度、发电机前轴温度、发电机后轴温度和发电机绕组温度；由于各参数的单位和量程大小不一致，这里纵坐标仅表示数值大小，且所选的相关参数在量程上差距不明显，便于观察到异常点，通过四分位法将离群点剔除后进行相关性分析。风电机组通过不同部件相互配合来完成整个风力机的工作，部件之间的状态参数会相互影响，因此可以选取多个不同的状态参数作为输入量共同表征目标参数，但如果输入模型的状态参数过多，就会造成信息的冗余，使得模型预测的准确性降低。对各部件状态参数进行相关性分析，选取输入参数，将齿轮箱轴承温度作为目标参数，采用距离相关系数(DC)方法计算出齿轮箱轴承温度与其他状态参数的相关系数，结果如图6所示。从图6可以看出，A相电压、B相电压和C相电压等状态参数与齿轮箱轴承温度的相关性很低，将其作为输入参数会导致模型精度下降，据此选取相关系数大于0.5的状态参数作为输入参数。

图5 风电机组状态参数箱线图Fig.5 Box diagram of state parameters of the wind turbine

图6 风电机组状态参数与齿轮箱轴承温度的相关系数Fig.6 Correlation coefficient between state parameters of the wind turbine and bearing temperature of the gearbox

3.2 CAE-BiLSTM模型预测残差统计分析

根据该风电机组2015年1—4月份和9月份的正常运行数据对上述监测方法进行验证，绘制1—4月份齿轮箱轴承温度图(见图7)。由图7可知，在正常状态下齿轮箱轴承温度在30～80 ℃内变化，幅值变化范围比较大，因此直接对齿轮箱轴承温度设定安全阈值来判断风电机组的异常状态可能会出现误报警的情况，通过将其与风电机组的其他状态参数进行联合分析，能够提高监测的准确性，降低误报警次数。

图7 正常月份齿轮箱轴承温度Fig.7 Gearbox bearing temperature in normal months

针对该风电机组从1—9月份共182 852个数据样本，经四分位法清洗后剩下158 751个数据样本，由于数据样本丰富，取前50 000个数据样本作为训练集，随机抽取训练集的30%数据作为验证集，最后将全部数据样本作为检测集用于检验网络的可靠性。

利用CAE-BiLSTM模型对正常状态齿轮箱轴承温度进行预测，通过对学习率等超参数和迭代次数的调整，得到训练集的训练损失和验证损失，如图8所示。根据图8将学习率设置为0.001 6，学习衰减率设置为0.001，经过多次训练将迭代次数确定为100，批量数设置为64，得到如图9所示的齿轮箱轴承温度预测残差序列图。由图9可知，残差大部分分布在-6～6 ℃，但也存在过大的点，因此不能根据突变的残差判断风电机组运行状态，需要进一步根据残差分析指标来判定机组运行状态。

图8 训练损失和验证损失分布Fig.8 Distribution of training loss and validation loss

图9 正常月份齿轮箱轴承温度预测残差Fig.9 Residual prediction of gearbox bearing temperature in normal months

3.3 风电机组异常时残差分析

该风电机组于2015年7月14日发生齿轮箱故障，该故障是由齿轮磨损严重导致断齿造成的。取1—9月份(共219 d)SCADA数据作为研究数据，其中第191天为停机维修后9月份重新启机后的第一天。对SCADA数据进行数据筛选，将筛选完的数据输入预测模型得到目标参数的预测值，计算齿轮箱轴承温度的残差序列，得到滑动窗口为100的均值和方差(见图10)。

(a) 均值

(b) 方差图10 CAE-BiLSTM模型预测结果Fig.10 Forecast results of CAE-BiLSTM model

正常状态的均值是在0 ℃附近上下波动，正常状态的方差则表现出数据波动性小。从图10可以发现，在样本数100 000时残差的均值下降很大，残差的方差波动性也很大，由此可以判断出风电机组发生了故障，但要提前准确地监测出故障需要对残差进行进一步分析。

通过计算全年的齿轮箱轴承温度的RMSE可以判断风电机组的运行状态，RMSE是以天为单位计算的，由于残差存在噪声，选用指数加权移动平均法(Exponentially Weighted Moving Average，EWMA)确定RMSE阈值Re并监测其趋势变化，该方法适用于监测连续数据的趋势变化[16]，EWMA控制线的统计量zt为：

zt=λRet+(1-λ)zt-1

(8)

式中：λ为历史阈值Re对当前统计量的权重，λ∈(0,1]，该分析过程中λ取0.2；Ret为t时刻的RMSE；当t=1 d时，z0为风电机组齿轮箱轴承温度残差运行在正常状态一段时间内RMSE的均值。

EWMA统计量zt的均值和方差为：

(9)

式中：μRe为该风电机组齿轮箱轴承温度残差的RMSE均值；σRe为Re的标准差；ns为采样长度。

风电机组齿轮箱轴承温度的EWMA控制图基于t时刻的阈值UL(t)为：

(10)

式中：k为系数。

待监测样本的RMSE变化趋势如图11所示。风电机组在正常状态工作时，预警阈值Re应高于RMSE曲线，通过调试，选取系数k=20，采样长度ns=40，RMSE从开始至第135天都处在EWMA设定的预警阈值以下，在第135天第一次超过设定的预警阈值，达到了1.80 ℃。在第135～190天RMSE在阈值范围上下剧烈波动，通过平滑曲线可以发现，RMSE在故障区间波动严重，同时在第191天回落到预警阈值以下，这与风电机组齿轮箱发生故障、在7月14日停机维修并在9月份正常运行的行为符合。基于CAE-BiLSTM模型和RMSE的监测方法能够提前发现风电机组齿轮箱早期故障，为风电场工作人员的日常维护和检修提供了参考。

图11 待监测样本的RMSEFig.11 RMSE of the sample to be tested

3.4 深度学习预测模型对比

将BiLSTM模型、CNN-BiLSTM模型与本文CAE-BiLSTM模型的RMSE预测效果进行对比，如图12所示。

(a) BiLSTM模型的RMSE预测效果图

(b) CNN-BiLSTM模型的RMSE预测效果图

从图12可以发现，由EWMA设定的预警阈值中，在调整系数k和采样长度ns的情况下，通过观察RMSE平滑处理后的曲线可以发现， BiLSTM模型、CNN-BiLSTM模型及CAE-BiLSTM模型均明显表现出齿轮箱轴承温度的异常，能够提前发现风力机故障。但当系数和采样长度固定时，即预警阈值都在1.584时，BiLSTM模型出现了超过预警阈值的现象，造成误报警，CNN-BiLSTM模型和CAE-BiLSTM模型没有超过预警阈值，但CAE-BiLSTM模型在风力机正常时更加平稳，有一定的阈值限度保障，降低误报警的风险。

计算3种模型的预测精度后，利用RMSE和MAE 2个预测评价指标对不同模型进行评价，结果如表2所示。由表2可知，CAE-BiLSTM模型的评价指标优于BiLSTM模型和CNN-BiLSTM模型。通过上面的分析，基于CAE-BiLSTM模型建立的输入参数与目标参数之间的逻辑关系更加精确，能够提前发现风电机组齿轮箱早期故障，降低误报警的风险，证明该模型优于BiLSTM模型和CNN-BiLSTM模型。

表2 不同模型预测评价指标对比Tab.2 Comparison of prediction evaluation indexes among different models

4 结论

针对风电机组工作环境复杂导致故障频发的问题，提出了基于CAE-BiLSTM模型监测风电机组齿轮箱故障的方法，该方法具有越限报警功能，利用该方法对目标参数的残差进行统计分析，观察残差的变化趋势能够了解风电机组的运行状况，并降低了误报警的风险，最后将该模型应用于某风电场的算例分析中，并与其他模型进行对比，结果表明所提方法预测效果更好，这对于降低风力发电成本、提高风电机组并网运行的可靠性、保障风电机组安全运行具有重要意义。