赵茗羽, 陈洪磊, 孙泽贤, 张 怡, 刘晓悦
(1.华北理工大学 国际合作处, 河北 唐山 063000; 2.华北理工大学 电气工程学院, 河北 唐山 063000)
随着风能、 传感器技术和无线通讯技术的快速发展, 风机的健康度评估已经从低级的人为判断阶段向以人工智能技术为基础的大数据智能化的方向发展。
目前在设备的预诊断和健康管理领域已有多项研究。 文献[1]引入迭代算法—匹配解调转换分析收集数据的时域信息,实现轴承的诊断和预警。文献[2]搭建了马尔可夫非线性系统,根据发电机所处运行状态的不同,实时动态地调整系统参数,进而追踪发电机性能退化踪迹。 文献[3]提出了一种基于深度置信网络的暂态稳定评估方法, 利用深度置信网络将原始输入空间映射到低维可分空间, 采用支持向量机和线性分类器对电力系统的暂态稳定进行分类评估。 文献[4]采用非线性状态评估技术实现风机齿轮箱故障变化趋势模型化。文献[5]结合了时域流信息分析和稀疏信号重构技术,改进了轴承故障信号的提取性能。 文献[6]基于BP 反向传播神经网络和最小支持向量机,建立了最优的组和预测模型, 比较预测值和实际值间的残差, 通过信息熵理论实现风电机组状态参数的异常识别。 文献[7]通过风机出力相关性分析与模糊故障Petri 网相结合,对机组运行状态进行分类。 文献[8]提出一种双向循环神经网络,并结合局部特征提取技术,实现设备的健康预测。文献[9]基于深度置信网络的集成模型,实现了对所用系统剩余有效寿命的预测。
本文首先剖析层次化、机构化的风机结构,为风机的健康度量化分析提供结构知识信息元。 基于“离线分类,在线匹配”的思想,从不同电气信号的波动性分析出发, 采用变点理论将相近波动水平的电气信号进行空间划分; 运用长短期记忆神经网络学习电气信号的内部依赖关系, 在预测阶段首先匹配测试样本的波动范围, 再结合相应的回归器实现电气信号的有效预测; 最后提出了一种加权评估方法, 整合多个重要部件电气信号预测值与实际值间的残差值, 展开对风机运行健康度的量化分析。
本文主要分析双馈式风电机组, 其基本参数如表1 所示。
表1 双馈式风电机组基本参数Table 1 Basic parameters of doubly fed wind turbine
由于风机自身复杂的非线性结构, 风机的失效过程会呈现多态渐变特征。 在评估风机健康度的过程中,需要综合考量多个子系统。
在时间序列中具有突变性质的数据项称为变点,本文采用数据项的方差搜索变点,进而实现时间序列数据的分类。
单个SCADA 参数的时间序列可以表示为(x1,x2,…,xn),时间序列的方差由式(1)计算得到。
式中:vi为时间序列第i 个数据点的方差;pj为第j 个数据项;pˉi为该时间序列从第1 个数据项~第i个数据项的均值, 可以有效评估第i 个数据与前i-1 个数据的偏离程度。
计算时间序列每一个数据项的方差后, 依据方差对时间序列进行升序排序,通过式(2)分析数据项的方差变化情况。
式中:k(i)为第i 个时间序列与第i-1 个时间序列的变化值;si为第i 个时间序列;si-1为第i-1 个时间序列。
为了分析在时间序列中突变点的具体位置,本文采用多线性回归模型在数据空间中搜索变点。
权重wi与样本k(i)的误差方差呈反比关系,权重间的比例关系为
式中第j 个数据项即为时间序列中的首个变点。确定首个变点后,在其左右两侧的场景数据中按照上述方式搜索,确定所有变点位置。根据变点理论实现时间序列的离线分类流程(图1)。
图1 基于变点理论实现的时间序列的离线分类流程图Fig.1 The steps of classifying the time series by the changepoint algorithm
对于给定的时间序列X=(x1,x2,…,xn),采用标准的循环神经网络,通过式(9),(10)计算隐含层输出ht和输出层输出yt。
式中:f 为激活函数;Wxh为连接输入层神经元与隐含层神经元的权重;Whh为连接上一时刻隐含层神经元状态与目前神经元状态的权重;bh为隐含层神经元偏置;by为输出层神经元偏置。
循环神经网络能够有效实现时间序列模型化,但受困于梯度爆炸的问题,可能忽视时间序列内部的长期依赖关系。为了解决这一缺陷,长短期记忆神经网络(LSTM)模型在非线性映射的设计中引入了门函数的概念, 模型细胞结构如图2 所示。
图2 LSTM 隐藏层细胞结构图Fig.2 LSTM cell structure in hidden layer
在LSTM 模型中,遗忘门、输入门和输出门作为保存历史信息的控制器,其前向计算式分别为
式中:W,U 和b 为LSTM 的参数;It,Ft,Ot,Ct分别为输入门、遗忘门、细胞状态和输出门输出状态;σ 为sigmoid 激活函数。
输入门接收当前样本的信息, 并传送到记忆单元。遗忘门决定记忆信息存储的程度,即从历史数据中需要提取多少有效的信息。 输出门结合输入数据xt和上一时刻的隐含层状态ht-1,计算4 个控制门后确定输出值。
LSTM 模型的训练过程与反向传播算法基本类似,可以分为3 个步骤:
①前向计算,按照式(11)~(15)计算LSTM 细胞的输出值;
②反向传播,计算LSTM 细胞的误差值,按照时间、网络层级两个方向传播;
③更新权重, 基于梯度优化算法更新连接权重,本文选用适应性动量估计算法进行梯度优化。
风机是一种具有复杂结构的非线性系统,发电机、齿轮箱、叶轮等重要组成部件对其正常运行均有一定的影响。对风机整体进行健康度评估,需要充分考虑各个子系统的运行情况, 由于运行特征的差异,各子系统的健康状态也会有所不同。因此,为了充分考虑对各子系统的劣化过程,进而实现风机健康状态的有效分析, 本文采用模糊度函数设计加权评估方法的权重。
式中:Δd 为SCADA 属性的监测值与LSTM 预测值之间的欧氏距离,二者间的距离越大,则对应子系统包含故障信息量越大, 对风机健康维持作用越小,则相应的权重越小。
因此,风机的运行健康度评估方式为
式中:hj为风机在j 时刻的健康度;n 为风机包含子系统的数量。
本文提出的风机健康度评估模型整合了变点理论、LSTM 和加权评估模型,模型构建主要分为离线和在线两部分, 离线训练和在线评估的具体步骤如下。
离线训练包括:
①选取风机SCADA 监测数据作为训练样本;
②对每一个SCADA 选取属性并进行标准化处理;
③根据变点理论对SCADA 属性的时间序列进行离线分类;
④基于每一类别的样本数据, 训练相应的LSTM 预测模型;
⑤输出每组LSTM 的参数集合。
在线评估包括:
①对测试数据进行标准化处理, 并进行在线匹配,将测试样本映射到对应的类别中;
②获取相应的LSTM 模型对测试样本的预测值;
③计算SCADA 系统的监测值与LSTM 预测模型输出值之间的差异;
④按照式(15),(16)对风机运行健康度进行评估。
以正常运行数据作为输入, 整合各子系统属性的预测值, 计算与实际监测值的偏差以加权的形式评估风机运行健康度。 选取某风电场一台风机作为实验对象,训练样本包括14 690 个正常运行数据,测试样本包括295 个数据,其中包含部分故障数据。
对预测结果的误差分析能够有效地评定预测方法的优劣, 不同的误差计算公式可以反映预测模型的不同特性。 因此, 本文采用均方根误差(RMSE)、绝对平均误差(MAE)、偏差(BIAS)以及标准偏差(SDE)4 种评判指标评价预测模型的性能。
为了验证本文方法的适应性和准确率, 采用本文所提方法、 原始LSTM、ELMAN 神经网络和ELM 神经网络对风机的4 个SCADA 属性进行预测分析, 其中LSTM 的网络结构设定为5 个输入层神经元,学习速率为0.1,迭代次数为300。 图3~6 分别为1 号风机发电机转速、主轴转速、液压站压力和顶控柜温度预测结果曲线。
图3 发电机转速预测结果Fig.3 The generator speed prediction results
图4 主轴转速预测结果Fig.4 The spindle speed prediction results
图5 液压站压力预测结果Fig.5 The hydraulic station pressure prediction results
由图3~6 可知:在发电机转速、主轴转速、液压站压力曲线的前半部分中, 本文所提方法与实际值产生了较为明显的误差, 发电机转速和主轴转速突降为0 而液压站压力降低了大约1.5 MPa;顶控柜温度也呈现类似的波动,此时风机健康度可能出现下降趋势;ELMAN 神经网络和ELM 模型在4 种对比模型中性能较差, 且ELM模型极易出现过拟合问题。
为了进一步验证本文所提模型的预测性能,分别计算RMSE,MAE,BIAS 和SDE 4 种指标(表2)。
表2 采用本文所提方法预测风机参数的性能指标Table 2 The index for forecasting the SCADA parameters of wind turbine by the proposed model
由表2 可知,发电机转速、主轴转速、液压站压力具有最大的误差。结合图6,顶控柜温度的预测曲线和实际曲线几乎拟合。 此时风机运行健康度的波动极有可能受到发电子系统或者偏航子系统运行的影响。通过调取风机维修记录证实,此时风机液压站出现电压不正常, 风机故障停机的情况, 即偏航子系统出现劣化导致风机健康度出现了波动。此外,为了从数字化的角度验证本文所提方法的优越性,表3~5 分别记录了传统LSTM、ELMAN 神经网络、ELM 神经网络的预测性能。
图6 顶控柜温度预测结果Fig.6 The predicted results from proposed model and benchmark models for the top box temperature
表3 采用传统LSTM 预测1 号风机参数的性能指标Table 3 The index for forecasting the SCADA parameters of wind turbine1 by the traditional LSTM
表4 采用ELMAN 神经网络预测1 号风机参数的性能指标Table 4 The index for forecasting the SCADA parameters of wind turbine1 by ELMAN
表5 采用ELM 神经网络预测1 号风机参数的性能指标Table 5 The index for forecasting the SCADA parameters of wind turbine1 by ELM
由表2~5 可知:本文所提方法在4 项SCADA属性预测领域性能要优于其他3 种模型; 相比于未进行波动性分类的原始LSTM 模型, 在发电机转速预测中,本文所提方法在RMSE,MAE,BIAS,SDE 4 个指标上分别提高了0.013,0.021,0.014和0.014; 在 主 轴 转 速 预 测 结 果 中, 在RMSE,MAE,BIAS,SDE 4 个指标上分别提高了0.151,0.058,0.027 和0.127;在液压站压力预测结果中,在RMSE,MAE,BIAS,SDE 4 个指标上分别提高了0.010,0.021,0.021 和0.008。
综合风机SCADA 属性预测结果, 按照式(15)计算权重,采用SCADA 属性所对应的发电机转速权重、主轴转速权重、液压站压力权重和顶控柜温度权重分别为0.083,0.114,0.153 和0.650。图7,8 描述了同一时段的风机健康度曲线与有功功率曲线的变化情况。
图7 风机健康度曲线Fig.7 The trend of the health degree for wind turbine
图8 风机风电功率曲线Fig.8 The wind power series in the testing period for wind turbine
由图7,8 可知,风机在前半部分出现故障时,有功功率从1 600 kW 突降为0,其余大部分时刻风机健康度均大于0.6。 结合图3~6 和表2~5 可知,在此时段内风机可能处于故障状态,故障的部件可能为发电子系统或者液压站。
本文基于“离线分类,在线匹配”的思想,将变点理论嵌入到LSTM 中,建立了风机SCADA 正常运行数据的点预测模型, 提高了预测模型的泛化能力与精确度。然后提出了一种加权评估方法,计算子系统参量预测值与实际值的偏差, 偏差较大的子系统权重较小,偏差较小的子系统权重较大,从多维空间考虑风机运行的健康水平。 整合风电机组的多个子系统,共同评估风机运行健康度。最后,将两台风机作为训练对象,从图形化、数字化的角度共同验证了本文所提方法在训练精度方面的优越性。