基于自编码压缩与多尺度特征提取的抽水蓄能机组劣化趋势评估与预测

2022-08-01 10:08吴一凡张海库李超顺
水利学报 2022年6期
关键词:劣化特征提取趋势

陈 鹏,吴一凡,蔡 爽,杨 彬,张海库,李超顺

(1.华中科技大学 土木与水利工程学院,湖北 武汉 430074;2.大唐西藏能源开发有限公司,四川 成都 610072;3.大唐水电科学技术研究院有限公司,四川 成都 610074)

1 研究背景

抽水蓄能机组在谷荷期间抽水蓄能、峰荷期间放水发电[1],随着越来越多的可再生能源并网,其对电网调峰调频的作用日益显著[2]。然而,复杂多变的工况、频繁启停以及水力-机械-电磁耦合等因素为抽水蓄能机组安全稳定运行带来严峻挑战[3]。通过劣化趋势评估与预测技术,及时掌握机组运行状态并预测未来发展趋势,及时采取相应措施,对保障机组安全意义重大。

当前抽水蓄能机组劣化趋势评估与预测研究仍处于起步阶段[4-6]。振摆信号中蕴含着丰富的机组运行状态信息,随着监测系统的成熟,基于数据驱动的机组劣化趋势评估与预测受到越来越多研究者的青睐[7-9]。通过建立健康模型,拟合健康状态下工况参数与振摆值间的关系,再比较待评估阶段健康模型的振摆参考值与实测振摆值,生成劣化度,能够有效评价机组劣化趋势。文献[10]构建了基于最小二乘曲面的健康模型;文献[7]采用最小二乘支持向量机作为健康模型,建立工况与振动时域特征之间的函数关系;文献[11]将粒子群算法用于优化人工神经网络以提升健康模型精度。健康模型的精度越高,生成的劣化趋势序列越可靠。然而,机组工况参数中存在大量冗余或干扰信息且难以直接剔除,这些无效信息严重影响到了健康模型的拟合精度。

降维压缩[12]方法能够有效提取海量数据中的重要信息,广为应用的有主成分分析(principal component analysis,PCA)[13]、独 立成分 分析(independent component analysis,ICA)[14]、核主成 分分析(kernel principal component analysis,KPCA)[15]等。文献[16]采用KPCA去除输入数据中的冗余信息,将压缩后得到的主成分输入至预测网络以提升海底油管腐蚀劣化预测的精度;文献[17]结合改进的ICA与马氏距离将多维劣化特征压缩为高灵敏度劣化指标。与传统降维方法相比,深度自编码器[18](deep auto-encoder,DAE)具有极强的非线性表征能力,能够尽可能多保留有效信息。因此,本文提出了基于自编码压缩的健康模型DAE-MLP,首先采用DAE压缩工况参数,保留关键信息,再将压缩后的信息送入多层感知机[19](multilayer perceptron,MLP)与振摆信号建立高精度拟合关系。抽水蓄能机组实际运行情况极其复杂,生成的劣化趋势中往往存在大量非线性与局部波动成分,这些因素严重影响劣化趋势预测的准确性,支持向量机[20](support vector regression,SVR)等传统机器学习模型难以胜任。由于劣化趋势序列的时序性,能够学习时间序列中长期依赖的门控循环单元(gated recurrent unit,GRU)[21]受到广泛关注。文献[1]将劣化趋势序列通过变分模态分解分解为一系列简单模态,再送入GRU网络中以准确预测未来劣化度;文献[22]将注意力机制与GRU融合实现高精度剩余寿命预测。相比于GRU,双向门控循环单元[23](bi-directional gated recurrent unit,BiGRU)能够从正序反序双向提取长期依赖,预测精度更高。然而,劣化趋势序列中的局部波动依然难以被BiGRU所学习。受一维卷积神经网络(one-dimensional convolutional neural network,1DCNN)[24]能够有效关注局部特征的启发,结合BiGRU对双向长期依赖的学习能力,本文提出了多尺度特征提取网络以预测劣化趋势。首先用BIGRU层与1DCNN层分别提取劣化序列中的双向全局时序特征与局部空间特征,再将特征聚合经过全连接网络获得未来劣化趋势。以某抽水蓄能电站为例验证了所提机组劣化趋势评估与预测模型的优越性。相比于其他模型,所提自编码压缩模型DAE-MLP的拟合能力更强,能够生成可靠的劣化趋势序列;多尺度特征提取网络的预测误差最小,能够关注劣化序列的全局趋势与局部波动。

2 基于自编码压缩与多尺度特征提取的机组劣化趋势预测模型

2.1 整体流程所提模型的运行流程如图1中所示,主要包括以下三个步骤:(1)构建并训练DAEMLP健康模型;(2)对某待评估过程,获取对应工况参数健康状态下振摆参考值,结合实测振摆值计算机组劣化度;(3)构建多尺度特征提取网络,预测机组未来劣化度。

图1 模型的运行流程

2.2 基于深度自编码压缩的DAE-MLP健康模型选定机组运行历史良好的阶段为健康状态,通过DAE-MLP建立健康状态下m个工况参数{wh1,wh2,…,whm}与振摆值vh之间的映射关系。如图2所示,DAE-MLP健康模型的建立包括DAE自编码压缩和MLP建立拟合关系两个阶段,具体流程如下:

图2 健康模型结构

(1)DAE自编码压缩:DAE由编码器与解码器两部分组成,编码部分与解码部分对称,编码器将m个工况参数压缩为n个通道的信息

式中f()为编码器建立的映射关系,Rm→Rn。

式中f-1()为解码器的映射关系,Rn→Rm。

还原后的信息与原始工况参数越相近,DAE的训练越充分,压缩效果越好。因此,训练DAE直至式(3)中所示的损失函数L最小:

(2)MLP建立拟合关系:MLP主要由输入层、隐含层及输出层三部分组成,本文采用多个隐含层以增强MLP学习能力。将DAE得到的压缩信息{ch1,ch2,…,chn}送入MLP中,建立其与振摆值vh间的映射关系如下:

式中:K为隐含层数目;relu()为ReLU激活函数;Wfk、bfk为各隐含层的权重矩阵与偏置;Fk为各隐含层输出;Wo、bo为输出层的权重矩阵与偏置;O为MLP的输出。

O与vh越接近,MLP的拟合效果越好,以MSE为损失函数,通过反向传播调整MLP的权重与偏置,直至MSE达到最小。

2.3 劣化度生成随着运行时间增加,机组逐渐劣化。此时实测振摆值往往会偏离同工况参数下的健康振摆值。因此,本文通过比较实测振摆值与健康振摆值的差异构建机组劣化趋势指标。由于抽水蓄能机组的振摆值越小,机组运行状况越好,当实际振摆值小于健康摆度值时,认为此时机组运行状况良好,劣化度为0。抽水态与发电态是机组最重要的两种工况,磨损老化也主要发生在这些工况中。因此,通过这两种工况将机组监测数据分割为一系列抽水过程与发电过程,并以这些过程为描述机组劣化情况的基本单元。对第k次抽水或发电过程,其劣化度D(k)定义如下:

式中:N为该过程中的样本数;hf()为DAE-MLP健康模型;vk(i)与{wk1(i),wk2(i),…,wkm(i)}分别为第k次过程的实测振摆值与实测工况参数;Pk(i)为实测工况参数对应的健康振摆值。

2.4 基于多尺度特征提取的劣化趋势预测模型生成劣化趋势序列后,需要预测未来劣化度,为机组预防性维护提供支持。如图3所示,本文所提多尺度特征提取网络主要由BiGRU与1DCNN构成的特征提取部分和全连接层组成。首先,通过1DCNN层提取历史劣化趋势序列中的局部波动成分,结合BiGRU层挖掘序列中的双向长期依赖;再将提取出的局部空间特征与双向全局时序特征合并,送入全连接层中,预测未来劣化度。

图3 所提多尺度特征提取网络结构

若以T个历史劣化度{D(k-T),D(k-T+1),…,D(k-1)}预测第k个过程的劣化度D′(k),网络的前向传播过程如下:

(1)1DCNN层获取局部空间特征:第l层卷积层的输出Sl为

式中:relu()为ReLU激活函数;conv()为卷积操作;wli和bl分别为第l层卷积核与偏置;n为卷积核数目。

(2)BiGRU提取的双向全局时序特征:采用BiGRU以学习双向的长期依赖,BiGRU层t时刻对应的输出Ht为

(3)将1DCNN的最后一层输出SL与BiGRU的输出Ht,t=1,…,T相拼接,经过全连接层,生成未来劣化度D′(k):

式中:K为全连接层数目;relu()为ReLU激活函数;Wfk、bfk为各全连接层的权重矩阵与偏置;Fk为各全连接层输出;Wo、bo为输出层的权重矩阵与偏置。

3 案例分析

3.1 数据来源实验数据来源于国内某抽水蓄能电站三号机组,机组类型为混流可逆式水轮发电机组,单机容量为375 MW,额定水头为447 m。机组监测系统记录了有功功率、无功功率、励磁电流、励磁电压、水头、导叶开度等工况参数与导轴承振摆值,传感器采样间隔为1 min,本文以上导轴承X向摆度数据反映机组健康状况。根据电站运行报告,三号机组在2018年1月15日至2018年2月15日间运行状况良好,该阶段被代表机组健康状态,在此期间与摆度的关系如图4所示,可见各工况参数与摆度间为非线性非函数关系,工况参数中的有效信息被淹没其中;由图4(a)可见,机组运行数据按有功功率分为两类:左侧有功功率小于0,处于抽水态;右侧有功功率大于0,处于发电态。抽水态摆度下分布于58.9~67.2μm,而在发电态下摆度分布在55.4~64.0μm,可见两种工况下机组运行特性并不相同。为消除工况差异带来的影响,对两种工况分别开展劣化趋势评估与预测。此外,机组在2019年3月1日至2019年10月1日间运行状况不佳,以此阶段验证所提模型的有效性。文中所有实验在python 3.6环境下完成,为避免随机误差,所有结果均为10次重复实验的均值。

图4 健康状态下各工况参数与摆度的关系

3.2 健康模型建立在2018年1月15日至2018年2月15日间,数据库中有5009条抽水态监测数据,3175条发电态监测数据,随机选取90%数据用于训练,剩余用于验证。将3.1节中工况参数作为DAE-MLP健康模型输入,上导轴承X向摆度为模型输出。

对工况参数不做任何处理的MLP健康模型被建立以说明工况参数压缩的必要性;此外,为证明DAE的有效性,建立基于PCA、ICA、KPCA与等距特征映射方法[25](Isometric Mapping,ISOMAP)压缩的健康模型作为对照,记作PCA-MLP、KPCA-MLP、ICA-MLP、ISOMAP-MLP。通过试错法确定各健康模型最优参数,如表1所示。

表1 各健康模型参数设置

均方根误差(Root Mean Square Error,RMSE)[26]能衡量拟合误差的绝对大小,对离群数据更加敏感,可以突出影响较大的误差值,而平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)[26]考虑误差对真实值的比例,衡量拟合误差的相对大小。以RMSE和MAPE衡量各健康模型在验证集上的效果,如表2所示,表中加粗的为最优指标。

由表2可知,两种工况下,DAE-MLP均有最优的表现,其RMSE与MAPE平均比MLP降低了8.71%和8.70%。这说明通过DAE将工况参数压缩能够去除干扰因素,提高健康模型拟合精度;相比于其他降维方法建立的健康模型,DAE-MLP的RMSE与MAPE在抽水态下平均降低了12.16%和11.34%,而在发电态下平均降低12.75%、11.71%,这揭示了DAE相比于传统降维方法保留的信息更加有效。值得注意的是,ICA-MLP与ISOMAP-MLP健康模型的精度低于MLP模型,这表明这两种方法在压缩时损失了工况参数中的关键信息,并不适用于工况参数降维,也说明选择有效降维方法的必要性。

表2 各健康模型在测试集上的表现

图5中直观展示了各健康模型在验证集上的效果。可见MLP、ICA-MLP、ISO-MLP等健康模型的拟合范围较集中,在抽水态下尤为明显;而DAE-MLP、PCA-MLP、KPCA-MLP等方法能够有效拟合更大范围的摆度,可以拟合部分 “离群”摆度值。为进一步说明DAE-MLP健康模型效力,各模型在验证集上误差的箱线图如图6中所示,在两种工况下,DAE-MLP的误差分布最集中,误差的中位数最接近于0,这说明DAE-MLP健康模型的表现较稳定,拟合误差中没有系统误差成分。

图5 验证集上各健康模型效果

图6 各健康模型拟合误差箱线图

3.3 劣化趋势序列生成2019年3月至10月共有207个抽水过程、307个发电过程。将各待评估过程的工况参数送入训练好的DAE-MLP健康模型中,获得对应的健康振摆值。将健康振摆值与实测振摆值代入式(7)中,生成劣化趋势序列,如图7所示。可见随着运行时间增加,机组劣化总体呈上升趋势,这与实际情况相一致,说明DAE-MLP模型可以生成可靠的劣化趋势序列。然而,劣化趋势序列呈非线性,且存在着大量局部波动,这些现象在发电过程的劣化趋势序列中尤其明显。劣化趋势序列中的复杂成分为准确预测带来严峻挑战。

图7 两工况下机组劣化趋势序列

3.4 劣化趋势预测为验证所提多尺度特征提取网络的有效性,将前60%的劣化度用于训练,剩余40%用于验证模型。选取SVR、高斯过程回归[27](Gaussian Process Regression,GPR)等经典机器学习模型与GRU、BiGRU、1DCNN等深度学习模型作为对照。通过试错法确定各预测模型参数,各模型的最优参数如表3所示。

表3 各预测模型参数设置

确定系数(R-square,R2)[28]能够描述预测序列与实际序列的关联程度,R2越大,相关性越高。本文以RMSE、MAPE与R2评价各预测模型表现,如表4所示,表中加粗的为最优指标,各模型的预测表现如图8中所示。

由表4可知,GPR在两种工况下MAPE与RMSE均远远大于其他模型,这表明其预测存在较大偏差,R2均小于0,这体现其完全没有学习劣化序列的趋势;SVR预测模型也有相似的结论,以上说明复杂的劣化趋势序列为准确预测带来严峻挑战,传统预测模型难以胜任。GRU在抽水态下的预测误差偏小,RMSE与MAPE比上述两种模型平均降低了59.00%和60.14%,但预测表现不稳定,仍不能在发电态下取得较高的预测精度。

相比之下,BiGRU与1DCNN预测模型在两种工况下RMSE与MAPE较小且较接近,说明它们预测能力相仿且预测表现良好。值得注意的是,BiGRU的R2在两种工况下均高于1DCNN,这说明BiGRU学习了更多劣化序列中的时序信息。由图8可知,BiGRU预测值与实际劣化趋势序列的总体趋势相一致,而对劣化趋势序列的局部波动不能很好掌握;1DCNN更加侧重于局部波动,而未关注全局趋势,整体预测值在实际劣化趋势序列下方,导致其RMSE与MAPE比BiGRU更差;此外,与GRU相比,BiGRU在各评价指标上表现均有所提升,这说明提取双向时序特征更加有效。

由表4可知,结合1DCNN与BiGRU优势的多尺度特征提取网络在两工况下均取得了最优表现,RMSE、MAPE两种工况下平均比BiGRU低9.10%、9.29%,比1DCNN低13.12%、13.52%,R2与BiGRU相比也略有提升。这表明多尺度特征提取网络将1DCNN提取局部空间特征与BiGRU提取双向全局时序特征的优势相融合,弥补了单尺度特征的缺陷,既能关注劣化序列中的全局趋势,又能学习局部波动,其预测效果如图8中所示。

表4 各模型预测结果对比

图8 各模型的预测效果

各预测模型的误差分布的箱线图如图9所示,可见所提多尺度特征提取网络的误差中位数最接近于0,误差分布较集中,说明其预测精度高且预测表现稳定。相比之下,SVR、GPR的预测误差分布较宽,且不在0附近均匀分布;而GRU、BiGRU、1DCNN等模型误差分布略差于所提模型。

图9 各模型预测误差箱线图

4 结论

本文提出一种基于自编码压缩与多尺度特征提取的抽水蓄能机组劣化趋势评估预测方法。通过DAE去除工况参数中的干扰成分,建立高精度的健康模型,以期实现可靠的劣化趋势评估;考虑到传统机器学习模型难以对复杂的劣化趋势序列实现精确预测,将1DCNN与BiGRU的优势相结合,提出了多尺度特征提取网络,充分挖掘劣化趋势序列中局部空间特征与双向全局时序特征。以某抽水蓄能电站三号机验证模型,得出以下结论:

(1)DAE-MLP健康模型能更精确地拟合工况参数与振摆间映射关系,且表现更为稳定。相比于传统降维方法,DAE能去除工况参数中的干扰因素,有效保留关键信息。值得注意的是,不适当的降维方法反而会降低健康模型的表现。

(2)所提多尺度特征提取网络能够学习劣化趋势序列中的长期趋势与局部波动,实现高精度的劣化趋势预测,且具有稳定的预测表现。

所提模型对准确评估抽水蓄能机组运行状态,预前制定检修决策具有重要意义。

猜你喜欢
劣化特征提取趋势
高含盐08系统劣化原因分析及恢复过程
趋势
空间目标的ISAR成像及轮廓特征提取
场地环境变化引起的水泥土劣化深度及预测*
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
基于Daubechies(dbN)的飞行器音频特征提取
十里泉发电厂330MW机组高压抗燃油酸值异常的分析与处理
初秋唇妆趋势
MOV压敏电阻电气参数与冲击劣化关系初探