基于L-DCGAN的风机齿轮箱时序温度数据生成模型

2023-03-04 09:56李登峰黄细霞吴恩洁
可再生能源 2023年2期
关键词:原始数据时序风机

李登峰,黄细霞,吴恩洁,阮 慧

(上海海事大学 航运技术与控制工程交通行业重点实验室,上海 201306)

0 引言

由于很多风机建立在山区或丘陵,维护起来较为麻烦,因此对风机进行故障预测显得尤为重要。目前,有关风机故障预测的研究多是基于机器学习和深度学习算法,但风机长时间处于正常运行状态,得到的故障数据比较少,不平衡的数据无法训练出好的预测模型,于是数据增强的研究越来越多。

生成对抗网络(GAN)是基于少量可用数据生成新数据集[1]。文献[2]展示了GAN在不同身体疾病医学图像生成和分类中的应用。文献[3]设计了一种基于图像金字塔网络(FPN)的生成对抗网络,以端到端的形式从模糊图像生成清晰图像。文献[4]提出了一种基于生成对抗网络输出样本区分度的方法,以满足对风机的不同健康等级进行量化评估的需求。文献[5]利用电流信号并应用生成对抗网络获取合成数据,从而抵消数据集不平衡的问题。考虑到风机故障演变是一个时序的过程,其数据具有自相关特性,于是有研究将长短期记忆网络(LSTM)引入到故障预测。文献[6]提出了基于极端梯度提升树与LSTM加权融合的模型,并将其用于进行风机定子绕组温度预测。文献[7]提出了基于LSTM和自编码器神经网络的风电机组时序状态监测数据评估方法。文献[8]利用GAN对锂电池数据进行扩充,利用CNN-LSTM建立健康状态预测模型。文献[9]提出GAN/LSTM架构,根据云负荷时间序列每个子带负载的复杂和波动性,预测每个子带负载的时间序列。

以上介绍中有两个问题需要考虑,其一是LSTM的研究更多的是从故障本身出发基于已有数据进行建模,而在数据生成方面基于LSTM的研究还相对较少;其次,GAN和LSTM的结合更多的是一种串联关系,即GAN/LSTM的输出作为LSTM/GAN的输入。

综合前人的研究,本文从网络结构出发,在DCGAN网络的基础上,加入处理长期数据有着较好表现的LSTM网络,得到改进后的L-DCGAN网络。依靠CNN和LSTM的特征提取能力,能够准确地提取数据的分布特征和时序特征,并交由FC层计算。以风机实际运行数据为例进行模型验证,并与DCGAN网络使用均方根误差(RMSE)和平均绝对误差(MAE)评价指标进行生成数据真实性的比较,同时使用结构相似性指数(SSIM)和峰值信噪比(PSNR)评价指标进行生成数据拟合原始数据趋势的比较。

1 相关理论

1.1 GAN

GAN是一种生成模型,包括生成器和判别器两个模块。判别器执行的是1个二分类任务,使用交叉熵损失函数进行计算,其目标函数为

式 中:x为 真 实 数 据;z为 噪 声;G(z)为 来 自 于 生 成器 的 数 据;D(x),D(G)均 为 判 别 器 判 断 结 果。

生成器与判别器进行对抗训练,开始生成的数据无法骗过判别器,误差梯度下降缓慢,生成器的 目 标 函 数 不 再 简 单 的 定 义 为J(G)=-J(D),而 是改用神经网络来训练生成器。即使判别器能够准确地将来自生成器的数据判别为假数据,生成器依然可以根据神经网络的反向传播算法继续自适应更新参数,直至生成足可以骗过判别器的数据。

结 合 式(1),(2)可 得 到 生 成 对 抗 网 络 的 目 标优化函数。

1.2 LSTM的时序特征提取

LSTM在传统RNN结构上引入了“门”的概念,通过控制门的方式实现对相关信息的长期记忆,从而达到提取时序特征的作用[10],其结构如图1所示。

图1 LSTM网络结构Fig.1 LSTM network structure

图中上方类似于传送带的便是细胞状态,保证了信息的不变性,具体结构如下。

①丢 弃 门:读 取ht-1和xt,输 出1个(0,1)之 间的数值ft给前时刻细胞状态Ct-1,确认旧的细胞状态丢弃多少。

式 中:{Wf,ht-1,bf}为 丢 弃 门 相 关 网 络 参 数;ft为 决定丢弃的值。

②记忆门:丢弃门确定丢弃的信息后,记忆门需要确定存放在细胞状态中的新信息,将ht-1和xt拼接并乘以记忆门权重加上偏置,通过sigmoid函数输出(0,1)确认当前输入和历史记忆保存多少,通过tanh层创造一个新的细胞状态作为候选值。

式 中:{Wi,ht-1,bi}为 记 忆 门 相 关 参 数;it为 决 定 更新的值;为创建的更新向量。

③更新门:更新操作中,旧的状态乘以丢弃门的输出丢弃掉要遗忘的信息;记忆门的输出乘以构造的细胞状态得到要保存的信息;将二者相加更新旧细胞状态为Ct。

式中:Ct为新细胞状态;Ct-1为旧细胞状态。

④输出门:输出值由sigmoid和tanh层完成,通过sigmoid层确认输出的细胞状态,通过tanh层 输 出(0,1)的 值,乘 以sigmoid层 的 输 出,确 认输出的部分。

式 中:{Wo,ht-1,bo}为 输 出 门 相 关 网 络 参 数;ht为 最终决定输出的值。

2 基于L-DCGAN的齿轮箱时序温度数据生成模型

2.1 数据生成模型结构

DCGAN网络依靠CNN强大的特征提取能力,保证了生成数据的真实性。本文延续DCGAN主体网络结构,在生成和判别模块融入LSTM网络得到L-DCGAN,具体结构如下。

①构建生成模块

使用CNN层、LSTM层搭配全连接层构建生成模块。其中,CNN层通过卷积池化操作进行特征的选择与计算;LSTM将CNN抽取到的特征通过固定步长T进行拆分,计算并学习得到数据的时序分布特征hz;FC层将学习到的特征映射为符合分布的数据Xfake;生成模块的输入为服从高斯分布的随机向量z,具体计算步骤为

式 中 :θG1={WG,bG},θG2={WGi,WGf,WGo,bGi,bGf,bGo},θG3={WG,bG}分 别 为CNN,LSTM和FC的 网 络 参数;hc1为CNN的输出;hz为LSTM的输出。

②构建判别模块

判别模块的组成与生成模块相同,其中CNN层对生成数据和原始数据分别进行特征提取,LSTM对CNN层抽取的数据特征进行拆分并计算得到时序特征,FC将特征映射为0或1,其中0为假,1为真。具体计算步骤为

式 中:Xd∈{Xfake,Xtrue}为 判 别 器 输 入;θD1={WD,bD},θD1={WDi,WDf,WDo,bDi,bDf,bDo}分 别 为CNN,LSTM的 网 络 参 数;θD2={WD,bD}为FC的 参 数。

③损失函数设计

网络的训练过程中损失函数起着反馈调节的作用,本模型中判别模块主要用来区分输入数据的真实性,对来自生成器的数据判别为0,对原始数据判别为1,于是设计成:

式中:Xtrue为判别器对真实值的判别值;Xfake为判别器对生成值的判别值。

生成模块的主要作用是欺骗判别模块,期望能够最小化其生成数据与真实数据之间的差距,使得判别器将其生成数据判别为1,于是设计成:

基于L-DCGAN的生成模型的结构见图2。

图2 基于L-DCGAN的生成模型结构图Fig.2 The structure diagram of the generative model based on L-DCGAN

2.2 数据生成模型参数设置

整体预测模型的参数设置主要是针对CNN和LSTM模块的设置,其中LSTM是隐含层层数和神经元个数的设置。表1为CNN-LSTM参数设置。通过实验,调整确定隐含层层数为2,神经元个数设置为32,CNN使用两层卷积和池化,激活函数采用Relu。

表1 CNN-LSTM参数设置Table1 CNN-LSTM parameter settings

2.3 数据生成模型训练

模型训练过程,当交叉训练和优化达到纳什平衡时,认为生成的数据足够符合时序分布特征,具体流程如下。

①训练判别模块

判 别 模 块 的 输 入 为Xd∈{Xfake,Xtrue},分 别 计 算判别结果,结合式 (12)的损失函数,利用动量Adam优化算法进行判别网络参数的优化,得到第s次迭代后优化的判别器。

式中:netD(s-1)为第s-1次迭代后的判别器模型;θD1(s-1),θD2(s-1)均 为 第s-1次 迭 代 的 网 络 参 数;Ld(s)为 第s次 迭 代 的 损 失 值。

②训练生成模块

生 成 模 块 的 输 入 为Z(s),经 过 计 算 得 到Xfake(s),作 为 判 别 器 的 输 入 得 到dXfake(s),根 据 式(13)计 算得到损失值,利用动量Adam优化算法进行生成网络参数的优化,得到第s次迭代后优化的生成器。

式中:netG(s-1)为第s-1次迭代后的判别器模型;θG1(s-1),θG2(s-1)均 为 第s-1次 迭 代 的 网 络 参 数;LG(s)为 第s次 迭 代 的 损 失 值。

基于L-DCGAN生成模型训练流程见图3。

图3 基于L-DCGAN的生成模型训练流程图Fig.3 Flow chart of generative model training based on L-DCGAN

2.4 数据生成模型评价指标

本文采用评价指标RMSE,MAE和决定系数R2对生成数据与原始数据之间的真实性进行评价。

式中:N为样本个数;yi为生成数据;y1i为真实数据;真实值的平均值。

针对生成数据是否具有随时间演变的自相关特性,采用SSIM和PSNR进行评价[11]。

SSIM是通过亮度、对比度以及结构3个方面对相似性进行评估,从而量化图像的属性,SSIM的值为0~1,值越大代表图像越相似。

式 中:μxμy为xy的 均 值;σx,σy均 为xy的 方 差;σxy为x和y的 协 方 差;c1=(k1L)2,c2=(k2L)2均 为 用 于维稳的常数。

PSNR是衡量最大值信号和噪声之间的图像质量参考值。一般来说,若PSNR>40dB,说明图像几乎与原图一样好;若PSNR为30~40dB,说明失真在可接受范围内;若PSNR为20~30dB,说明图像比较差;若PSNR<20dB,说明图像失真严重。

式中:MAXI为图片可能的最大像素值。

3 实例验证

3.1 实例概述

为了验证所建立模型,选取上海东海大桥海上风电场风机SCADA系统采集的齿轮箱数据集(20200601-20210630),本文选择15号 风机20200801-20210201的19000组数据作为训练集,选取20201001-20201031的8000组数据作为测试集,每组数据包含油温、电机温度和轴承温度3类典型特征。

3.2 模型训练与测试结果

由于数据是真实风电场数据,可能存在错误信息,因此,首先进行数据预处理,之后采用Zscore对数据进行归一化,将预处理后的数据作为真实样本传入所建模型,采用动量Adam算法进行网络优化更新,设置Adam学习率为0.001,η=0.1,β1=0.9,β2=0.999。

模型训练后,输入测试样本,对油温、电机温度、轴承温度3个变量进行分析。图4为油温、电机温度、轴承温度生成数据与原始数据对比曲线。

图4 油温、电机温度、轴承温度生成数据与原始数据对比图Fig.4 Comparison chart of oil temperature,motor temperature,bearing temperature generated data and original data

由图4可知,变量的生成数据和原始数据的差别不大且趋势接近。计算评价指标(表2,3)进一步验证了生成数据与原始数据之间的差异较小,同时R2超过0.95,可以认为二者相似度已达到较高程度;生成数据与原始数据构造的特征图之间的SSIM达到98%,同时PSNR接近40,在误差允许的范围内认为二者的时序趋势有着较高的相似度。

表2 数据生成模型评价指标结果一Table2 Data generation model evaluation index result one

表3 数据生成模型评价指标结果二Table3 Data generation model evaluation index result two

3.3 对比实验

为了进一步验证本文所提模型的有效性,与DCGAN模型进行对比实验,分别采取60,90d和120d的温度数据进行训练和测试,相关评价指标的计算结果如表4,5所示。

由表4,5可知:当训练样本为60d和90d时,由于网络结构较为相似,虽然L-DCGAN模型的评价指标值中RMSE和MAE的值更小,R2更接近与1,却并未拉开大的差距,由于LSTM的引入,SSIM和PSNR两项指标远好过DCGAN模型,表明所生成数据更加接近原数据的分布趋势;当训练样本进一步加大到120d时,在电机温度部分,由于数据量的增加,独立同分布数据的占比相对有所提高,此时,DCGAN生成模型相关指标的值要略优于L-DCGAN,但是,结合60d和90d的结果综合来看,想要达到较高指标值,L-DCGAN只需更少的数据量。

表4 不同数据生成模型评价指标对比结果一Table4 Comparison results of evaluation indicators of different data generation models result one

表5 不同数据生成模型评价指标对比结果二Table5 Comparison results of evaluation indicators of different data generation models result two

综上所述,在生成数据的真实性方面,两个模型皆有较好的表现,L-DCGAN略胜一筹,但是在数据分布趋势上,本文所提模型的精确度更高。

4 结论

针对传统的生成对抗网络无法很好地生成随时间演变具有时序相关特性数据的问题,本文提出了融合LSTM网络的新生成对抗网络LDCGAN,通过LSTM学习得到时序数据的分布特征,从而生成时序数据。

①本文基于CNN结构融入LSTM网络,创建了基于CNN-LSTM-FC3层结构的生成和判别网络模型,通过LSTM对时序相关性的挖掘,以及FC的映射计算,保证了生成数据的准确性。

②与DCGAN模型相比,本文所提模型在保证数据准确性的前提下,进一步拟合了数据的时序分布。

猜你喜欢
原始数据时序风机
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
清明
受特定变化趋势限制的传感器数据处理方法研究
基于不同建设时序的地铁互联互通方案分析
风机折翼“倒春寒”
基于FPGA 的时序信号光纤传输系统
风机倒塔事故为何频发?
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
节能技术EPU在AV71风机上的应用
基于模体演化的时序链路预测方法