尹 诗, 侯国莲, 于晓东, 李 宁, 王其乐, 弓林娟
(1.华北电力大学 控制与计算机工程学院,北京 102206; 2.中能电力科技开发有限公司,北京 100034)
近年来,风能在世界能源结构中的地位越来越突出,风电将逐步成为火电、水电之后的第三大常规能源[1].由于风电机组运行环境恶劣,受气象、设备老化等多种不确定因素的影响,容易出现性能劣化与运行状态恶化问题,导致运维费用居高不下.统计资料表明,陆上和海上风电机组的运维费用分别占各自风电场收入的10%~15%和20%~35%[2].在风电机组故障统计中,风电机组中发生电气和控制系统故障较为频繁,但是平均故障修复时间(mean time to repair, MTTR)较短,传动系统中的主轴承、齿轮箱、发电机等设备MTTR较长[3-4].因此,笔者通过风电机组主轴承温度预警来了解设备健康情况,这对合理安排检修具有重要的实践意义.
文献[5-8]分别采用频域分析法和时域分析法对轴承或齿轮箱进行故障诊断分析,但没有考虑故障劣化的渐变过程.文献[9]基于主成分分析法建立了正常运行状态下轴承的温度预测模型,并通过滑动窗口残差统计方法对故障进行有效预测,该方法中阈值的设定增加了人为参与度.文献[10]利用改进的集合经验模态分解方法构建轴承健康劣化度模型,但模型未考虑时序数据故障劣化渐变过程对故障预警模型的影响.文献[11]利用非线性状态估计(nonlinear state estimate technology, NSET)方法建立齿轮箱正常工作状态下的温度模型并用其进行温度预测,采用滑动窗口方法计算残差的统计分布特性,当残差的均值或标准差的置信区间超出预先设定的阈值时,认为齿轮箱工作状态异常,该方法同样需要人为设定阈值判断故障情况.文献[12] 通过采集风电机组主轴转动频率、滚动体频率和保持架频率等参数,利用深度置信网络模型对风电机组进行主轴承故障诊断,输入训练样本,逐层无监督训练达到局部参数最优,反向微调使整体性能最优,并用测试集数据进行验证,该方法未考虑风电机组运行过程中数据会随季节发生长周期变化,造成模型精度不高.
以上这些研究方法虽然对风电机组主轴承故障预警研究起到了促进作用,但仍存在研究盲点:
第一,算法模型多基于某段时间的采集与监视控制系统 (supervisory control and data acquisition, SCADA)数据,但风电机组运行过程中数据通常会随季节发生长周期变化,这些变化有可能将故障早期形成过程中产生的数据变化淹没,无法在真正意义上实现故障预警.
第二,在建立时序数据模型过程中,通常只考虑模型输入输出的非线性关系,很少考虑时序数据故障劣化的渐变过程对故障预警模型的影响.
第三,算法多采用人为设定阈值来评价风电机组故障状态,阈值设定不合理会导致模型预测精度不高、泛化性差的问题.
因此,笔者将GMM、Bi-RNN神经网络算法、随机森林算法相结合,提出一种风电机组主轴承温度预警方法,使用SCADA 数据和设备更换台账就能准确预警主轴承故障.
笔者以风电机组主轴承为研究对象,将GMM、Bi-RNN神经网络算法、随机森林算法有机结合,开展主轴承温度预警研究.
考虑到风电机组运行的工况不同,利用GMM对机组工况进行辨识,克服了气候周期性变化及气象条件瞬时变化对预警结果的影响,扩大了算法的时间尺度和适用范围.
考虑到机组设备故障劣化的渐变过程对模型精度的影响,利用Bi-RNN神经网络算法建立主轴承温度模型,使之能够更加精准地预测以长时间序列数据为特征的故障劣化问题.
采用随机森林算法建立主轴承故障预警决策模型,降低人为设定阈值引起的复杂性和不确定性,使得该预警方法更加有利于工程实际应用,具体方法框图如图1所示.
图1 风电机组主轴承温度预警建模方法结构图(2台风电机组示例)Fig.1 Structure diagram of temperature prediction model for main bearing of wind turbine (Examples of 2 wind turbines)
首先,将多台风电机组SCADA数据预处理,从中选取有效数据,确定Bi-RNN神经网络算法的输入数据和输出数据;再采用GMM对机组运行工况进行辨识,根据机组运行建立3个子工况空间;然后在每个子工况空间内建立基于Bi-RNN神经网络的主轴承温度模型,并计算模型输出与SCADA数据之间的残差;最后将计算的残差按天提取残差特征向量,根据残差分布建立基于随机森林的主轴承故障预警决策模型.将测试机组数据同样按照以上步骤进行计算,根据随机森林算法输出结果判断风电机组主轴承异常情况.
GMM是一种聚类算法,该算法利用高斯概率密度函数(正态分布曲线)精确量化事物,是将一个事物分解为若干基于高斯概率密度的函数模型.某一高斯模型的概率密度函数为:
(1)
其中,x为D维向量;μ为D维均值;∑为D×D维协方差矩阵.
GMM的概率密度函数为:
(2)
应用GMM对风电机组运行工况进行辨识,建立3个子工况空间,将生成的每个高斯模型中的数据期望值作为多维特征点,代表隶属于本高斯模型全部有效数据点的数据特征.
深度学习模型是一种拥有多个非线性映射层级的深度神经网络模型,能够对输入信号逐层抽象并提取特征,挖掘出更深层次的潜在规律[13].在众多深度学习模型中,循环神经网络(recurrent neural network,RNN)将历史数据的时序特征引入到网络结构设计中,具有较强的适应性,如图2所示.
令第t时刻的输入为xt∈Rxdim,隐层节点的输出为ht∈Rhdim,输出层ot∈Rodim,输入到隐层的权重矩阵U∈Rxdim×hdim,隐层自循环的权重矩阵W∈Rhdim×hdim,隐层到输出层的权重V∈Rhdim×odim,对应偏执向量分别为bh∈Rhdim,bo∈Rodim,那么正向计算:
ht=f(netht),
(3)
netht=xtU+ht-1W+bh,
(4)
oth=g(netot),
(5)
netot=htV+bo,
(6)
其中,netst,netot分别表示激活前对应的加权和;f(·)、g(·)表示激活函数.
图2 RNN神经网络前向传播展开图Fig.2 Expansion diagram of RNN neural network forward propagation
Bi-RNN神经网络如图3所示.输出由两个RNN的状态共同决定,算法既考虑时序数据的过去也考虑时序数据的将来,因此具有较强的时间特征.Bi-RNN神经网络在语言建模、视频行为分析、医学分析、图像识别等方面具有良好的应用[14-18],在设备可靠性领域,劣化渐变过程对建立故障预警模型更为重要,因此,笔者将 Bi-RNN神经网络算法引入到主轴承温度预警建模过程中.
图3 Bi- RNN神经网络前向传播图Fig.3 Diagram of Bi- RNN neural network forward propagation
Bi-RNN可以看作两个RNN的连接:一个是前向传播RNN,另一个是反向传播RNN.反向传播RNN的计算公式为(7)~(10). Bi-RNN输出由两个RNN的状态求和共同决定.
qt=f(netqt),
(7)
netqt=xtU+qt+1W+bh,
(8)
otq=g(netot),
(9)
netot=qtV+bo.
(10)
根据公式(5)得出Bi-RNN的前向输出为两个RNN的状态和:
ot=otq+oth.
(11)
Bi-RNN神经网络输入参变量选择与主轴承温度密切相关的7个参数.
①风速:传动系统的转速与风速正相关,相应的主轴承温度会发生变化.
②发电机转速:与主轴承转速正相关.
③有功功率:与主轴承温度正相关.
④风向角:风向角影响风电机组机舱对风的准确性,影响机组有功功率.
⑤环境温度:由于风电机组所处的环境温度差异,即使机组功率和风速相同时,环境温度的不同也会导致主轴温度有很大差异.
⑥发电机绕组温度:主轴承转速越高,发电机转速越高,发电机绕组温度相对较高.
⑦齿轮箱油温:主轴承转速越高,齿轮箱传动系统转速越高,齿轮箱油温和主轴承温度相对越高.
输入和输出数据将做归一化处理,归一化计算公式为:
(12)
模型输入的参变量为数据的10分钟最大值、最小值、均值,输出数据选取10分钟均值.
模型参数选取时,设定输入层21个神经元,隐层设置4层记忆细胞,其中第一层100个神经元、第二层60个神经元、第三层35个神经元、第四层15个神经元,每一层的激活函数选择为线性整流函数(rectified linear unit, ReLU),输出层共1个神经元,激活函数为线性激活函数.
随机森林是一个包含多个决策树的分类器,并且输出的类别是由决策树的投票决定.随机森林算法框图如图4所示.将要分类的样本输入多个决策树,以少数服从多数的原则表决出这个样本的最终分类类型.
图4 随机森林算法框图Fig.4 Block diagram of random forest
将风电机组主轴承温度模型输出与SCADA数据残差按天计算,得到残差向量的6个特征,分别是:模型残差向量最小值、模型残差向量最大值、模型残差向量平均值、模型残差向量中位数、模型残差向量标准差、模型残差向量欧氏距离.将该特征向量作为随机森林算法的输入,以是否为异常时间段标记值为随机森林算法的输出(1代表正常,0代表异常),样本设置为等权重,训练主轴承故障预警决策模型.
主轴承故障预警决策判定标准为:将故障警戒线设置为0.6,如果在一个月内随机森林算法输出有大量的数据点位于故障警戒线下且呈现出无反弹的特征,可以认为主轴承已发生磨损或已发生和主轴承温度相关的其他一些类似异常,反之判断主轴承正常.
笔者选用内蒙古某风电场33台1.5 MW 双馈风力发电机组,切入风速为3.5 m/s,切出风速为25 m/s,在风速为13 m/s 时进入恒功率阶段.选取25台主轴承正常运行的机组数据作为模型训练数据,每1台机组选取1个月数据,覆盖时间为全年,机组工况覆盖为切入风速到切出风速的全工况.
为保证算法模型精度,将参与训练和测试的风电机组SCADA数据预处理,包括:剔除错位数据、噪声数据、停机数据,保留正常工况下的有效数据点,选取训练数据30 103条.
选取数据过程中,将风电机组升功率阶段中发电机恒转速阶段的SCADA数据去除,保留变速最大功率追踪阶段数据,其优点在于:①最大程度保留了风电机组动态参数丰富阶段的有效数据;②能避免因风力资源时间分布不均衡,尤其在风电机组长周期运行时,恒转速阶段风速差别较大的问题.
测试数据共选取8台风电机组数据,其中4台风电机组主轴承异常,4台风电机组主轴承正常.A002号机组和A005号机组由于主轴承磨损严重分别在2017年12月3号和12月15号更换;A007号机组由于主轴开裂于2017年1月13号更换主轴承;A018号机组由于主轴滚子表面剥落于2017年5月1日更换,选取每台机组更换主轴承前1个月的运行数据为测试数据.
应用GMM对风电机组运行工况划分为3个子工况:工况1是风速较低、有功功率相对较低的工况;工况3是风速较大、有功功率相对较高的工况;工况2介于两种工况之间. GMM建模结果如图5所示,每个工况的多维特征点如表1所示.
图5 GMM建模结果Fig.5 GMM modeling results
多维特征点工况风速/(m·s-1)发电机转速/(r·min-1)有功功率/(kW)工况14.531 060.4134.9工况26.951 443.0458.3工况39.741 723.01 135.7
在3个子工况下,分别使用RNN和Bi-RNN神经网络建立风电机组主轴承温度模型. RNN与Bi-RNN训练误差对比见表2,误差计算采用均方误差(mean-square error, MSE).
在模型训练过程中,尽管RNN神经网络在前几次训练中误差和收敛速率高于Bi-RNN,但是很快Bi-RNN神经网络的收敛速率和训练误差均好于RNN,这表明在同等条件下,Bi-RNN神经网络算法训练精度优于RNN模型.
模型训练和测试结果如图6所示.图中红色虚线为机组主轴承温度模型输出,蓝色实线为训练数据的输出. 绿色曲线为机组主轴承正常测试样本数据与模型输出之间的残差,蓝色曲线为机组主轴承异常测试样本数据与模型输出之间的残差.从图6中可以看出,当主轴异常时,以主轴承温度为表征的模型输出和数据之间的残差增大,尤其是在工况3的时间序列后期这种残差更大.
表2 3种工况下RNN和Bi-RNN训练误差Tab.2 Training errors of RNN and Bi-RNN of three conditions
图6 基于Bi-RNN神经网络的风电机组主轴承温度模型训练和测试Fig.6 Temperature model training and testing of wind turbine main bearing based on Bi-RNN
将测试机组SCADA数据输入风电机组主轴承温度模型并计算与SCADA数据之间的残差.按照2.3中提出的特征向量提取方法,将特征向量输入主轴承故障预警决策模型获取随机森林算法的输出结果.测试的8台机组的故障预警情况如图7所示.
图7 风电机组主轴承运行状态预测情况Fig.7 Prediction of main bearing operation state of wind turbine
从图7(a)中可以看出,30#机组、32#机组、33#机组一个月每天的正常率都在警戒线以上,按照主轴承故障预警决策判定标准,这3台机组判定为主轴承正常.31#机组有两个时刻机组主轴承的正常率在警戒线以下,但又快速反弹至警戒线以上,按照决策标准同样可判断该机组主轴承正常,后续可重点关注该台机组主轴状态. 4台主轴承正常的机组预测全部正确.
从图7(b)中可以看出,5#机组、7#机组、18#机组一个月每天的正常率都在警戒线以下并且无反弹的趋势,根据主轴承故障预警决策判定标准,这3台机组判定为主轴承异常. 2#机组在时间序列前期正常率在警戒线震荡,在后期正常率又上升至警戒线以上,后续应持续关注.4台主轴承异常的机组中有3台机组预测正确.
提出了一种风电机组主轴承温度预警方法,将GMM、Bi-RNN神经网络算法、随机森林算法有机结合预警潜在的故障.
相比于传统的故障预警方法,所用的算法对原始数据无特定要求,基本参数调校快.在方法设计中利用GMM对机组工况进行辨识,克服了气候周期性变化及气象条件瞬时变化对后续建模的影响,扩大了算法的时间尺度适用范围;同时,基于Bi-RNN神经网络的风电机组主轴承温度模型,增加了故障劣化渐变过程的时序特征,使得故障预警模型更接近于实际状态;此外,基于随机森林的主轴承故障预警决策减低了人为设定阈值的复杂性和不确定性,提升了故障预测精度.文章最后通过实例验证了该方法的有效性与实用性.