李洪军 ,汪大春 ,杨哲昊 ,韩 莹
(1.国能黄骅港务有限责任公司,河北 沧州 061110;2.西南交通大学电气工程学院,四川 成都 611756)
质子交换膜燃料电池(PEMFC)功率密度高、能量转换效率高、负载响应快且环保无污染,受到广泛关注。燃料电池系统结构复杂,容易出现多种故障,发展应用受限[1]。进行燃料电池故障诊断研究,不仅可以保证发电系统的安全可靠运行,还能为燃料电池大规模发展提供有利条件。
燃料电池故障诊断方法主要包括基于实验模型和基于数据驱动两类方法。文献[2]对燃料电池故障特征指标进行研究,提出基于深度学习的PEMFC 水淹故障诊断方法,可自动提取原始数据的故障特征来诊断水淹故障。文献[3]提出一种基于气体压力降的燃料电池水故障诊断方法,搭建了PEMFC 水故障诊断测试平台。文献[4]提出一种基于球形多类支持向量机(SVM)和Shapelet 变换的PEMFC 故障诊断方法,可识别膜干、低高压、低空气过量系数故障和正常状态等健康状态,整体准确率为96.13%。基于数据驱动的诊断方法使用监测的历史信息来了解系统特性并完成故障诊断,无需搭建燃料电池模型,运算效率高且可快速实现,在燃料电池系统故障诊断领域得到广泛应用。
本文作者提出基于深度卷积生成对抗网络(DCGAN)的PEMFC 水管理故障诊断方法。首先利用主成分分析(PCA)对原始实验数据进行消除量纲和维度缩减操作,以提取故障特征向量并降低运算复杂度;再使用DCGAN 对PEMFC 数据样本实现故障诊断,以提高故障诊断准确率,并缩短诊断时间。对比BP 神经网络(BPNN)和SVM 算法的诊断结果,采用1 800 组PEMFC 故障样本数据集,对所提方法的可行性进行验证。
PEMFC 系统故障类别如图1 所示。
图1 PEMFC 系统故障类别Fig.1 Category of the failure of proton exchange membrane fuel cell(PEMFC) system
PEMFC 系统由电堆模块和辅机设备(如氢气/空气供给系统、气体加湿系统、热管理系统和数据采集及控制系统等)组成,系统故障可分为电堆故障和辅机设备故障。电堆故障包括电堆水淹、膜干和催化剂中毒等可逆故障,以及质子交换膜破损、电极穿孔等不可逆故障[5]。以上故障中,最常见的是电堆水淹和膜干故障,都属于水管理故障。水淹故障是由于电堆内部电化学反应产生的水无法排出或排出不畅,导致液态水累积;膜干故障则是由于电堆内部水含量过低,膜干燥导致电化学反应无法正常进行。实验主要针对PEMFC的水管理故障展开诊断方法研究。
2.1.1 生成对抗网络(GAN)
GAN 是一种基于对抗思想进行训练的网络结构,核心思想源于博弈论中的纳什均衡。GAN 由生成器和判别器两部分组成,其中,生成器对输入的真实数据样本进行分析,生成与真实数据特征相近的新数据样本。这些样本与真实样本一并输入判别器,再由判别器对输入数据进行判别,将真实数据和生成器生成的数据样本进行分类。
生成器的输入包含真实数据样本,还有随机生成的噪声z。在捕捉真实数据的潜在分布特征后,可以生成与真实样本相近的数据Xgen=G(z)。判别器的输入由两部分构成,包括生成的虚假数据Xgen和真实输入数据Xreal,通过输出概率值D(X),判别输入数据是真实的还是生成的。生成器与判别器不断对抗,前者生成更真实的数据,后者判别输入的数据真实与否。通过二者的迭代对抗训练,同时改善性能,最终达到纳什平衡[6]。目标函数如式(1)所示:
由于GAN 具有无监督学习特性,将导致Xgen可能会与Xreal差异较大。此外,不同输入数据集的特征分布存在差异,将导致GAN 训练过程不稳定。
2.1.2 DCGAN
为解决GAN 存在的缺陷,引入卷积神经网络(CNN),并与GAN 结合,形成DCGAN。DCGAN 利用转置卷积层替换所有池化层,并在更深的卷积网络中去除全连接层,将步幅卷积应用于生成对抗网络中,保证生成数据的质量及多样性。DCGAN 将转置卷积层所提取的特征作为判别器的输入项,经优化生成的对抗网络判别层选择Sigmoid 作为激励函数,而输出层则选择Relu 作为激活函数。DCGAN 的结构见图2,其中C为输出节点数,即分类的类别数。
图2 DCGAN 的结构Fig.2 Architecture of deep convolutional generative adversarial net(DCGAN)
输入的随机噪声数据为z;生成器生成的与输入数据相关的输出数据为z′。在生成器模型中训练过的z′与z合并,叠加后作为判别器的输入项。这些故障数据并不都是真实数据,其中包含一部分真值为0 的负样本y和真值为1 的正样本y′。经过Sigmoid 函数激励,判别器可以区分生成的和真实的故障数据,且无需反复确定模型的参数。卷积层的加入,不仅提升了模型应对大规模数据集的能力,还能调整神经元的数量,降低计算复杂度。生成器在训练过程中通过对抗调整和优化参数,使输出结果更真实,因此,生成器损失函数的设计是提升模型对故障数据监测与诊断的关键。对进入判别器的正样本进行y′训练,设LGAN(D)为判别器输入结果与真实值的交叉熵[7]:
式(2)中:W为能量函数;D(z,z′)表示输入判别器的数据为随机数据和生成数据的概率。
利用y和y′的L1范数作为生成器的损失函数,衡量真实值与生成值之间的差距:
利用以上损失函数,模型训练初期转置卷积层提取的故障数据特征会更稳定。在局部特征训练时,采用迁移学习策略对数据集进行调整,可缩短训练时长,提升处理效率。
PCA 是一种减少变量维度的多元统计方法,核心思想是通过正交变换,将一组可能存在相关性的变量数据,转换为一组线性不相关的变量,转换后的变量被称为主成分。这些主成分变量可反映原变量的大部分信息,利用主成分变量进行后续运算,可简化问题的复杂性[8]。PCA 计算步骤如下。
①将原始数据组成n行m列矩阵X=[X1,X2,…,Xm]。
②将原始数据X标准化,如式(4)-(5)所示:
③求出协方差矩阵P:
式(6)中:X*为矩阵X标准化后得到的矩阵;(X*)′为X*的转置;pii=1,pij=pji。
④求出协方差矩阵P的特征值及对应的特征向量。P的m个特征值为λj,特征向量为Uj=[U1j,U2j,…,Umj],j=1,2,…,m,提取的主成分yj如式(7)所示:
式(7)中:k=1,2,…,n;j=1,2,…,m;U为特征向量Uj中的各项元素;x*为标准化矩阵X*中的元素。
基于DCGAN 的PEMFC 水故障诊断流程如图3 所示。
图3 基于DCGAN 的PEMFC 水故障诊断流程Fig.3 Water fault diagnosis process of PEMFC based on DCGAN
具体流程如下:
①原始数据采集。通过PEMFC 系统采集1 800 组原始实验数据,正常状态、水淹故障和膜干故障各600 组。
②数据预处理。对原始数据样本进行归一化处理,降低不同参数间的量纲差异对诊断结果的不利影响;利用PCA对数据进行降维处理,提取主成分故障特征变量。
③故障样本划分。将样本数据按3 ∶1的比例,随机分为训练集和测试集。
④训练样本集初始化。随机输入噪声z;激励函数设置为Sigmoid 函数;设置隐含层神经元个数为N;设计生成器损失函数。将训练集样本输入到模型中,训练判别器参数。
⑤对模型进行训练。利用博弈机制优化判别器参数,当模型达到纳什平衡时,训练结束,保存模型参数。
⑥诊断结果输出。将测试样本输入到判别器模型中,并输出故障诊断结果。
实验所采用的数据为PEMFC 实测数据,总样本为1 800组,其中正常状态、水淹故障和膜干故障各为600 组。根据DCGAN 的诊断流程,需将数据样本划分为训练集和测试集两部分。训练集数据样本用于帮助训练DCGAN 中的模型参数;测试集数据样本用于测试已经训练好的模型精确度。考虑训练集和测试集的划分要保持数据分布的一致性,同时需要保证诊断方法的有效性及适应性,在3 种健康状态样本数据中,各随机选取240 组数据,共720 组数据作为总数据样本。利用留出法,将以上数据按3 ∶1的比例划分为训练样本集和测试样本集。各健康状态类别及样本数量如表1 所示。
表1 健康状态类别及样本数量Table 1 Health status category and sample number
燃料电池系统实际运行时会产生较多的监测数据,其中可以直接反映燃料电池运行状态的主要数据如表2 所示。
表2 PEMFC 系统各特征变量Table 2 Various characteristic variables of PEMFC system
连接在PEMFC 系统上的传感器能实时监测这12 个特征变量,将多个特征变量共同作为评判指标完成的故障诊断,具有更高的可靠性。
为提高PEMFC 系统故障识别效率,利用PCA 对原始故障特征数据进行主特征提取。在保证降维数据各维度相关性尽量最小的同时,将高维数据合理展开至低维空间,可大幅简化模型复杂度。利用最大似然估计,对原始12 维故障特征变量进行内在维度估计,发现将原始数据降低至3 维,具有最佳效果,因此,通过PCA 将原始的12 维数据简化为3维的数据集。特征提取过程如下:
①确定原始故障特征向量,选取表2 中的12 个变量组成12 维原始故障特征变量X=[x1,x2,…,x12];
②原始故障特征变量标准化,对特征变量X进行去均值处理,得到X*=
③计算协方差矩阵P,以及P的特征值λ和特征向量U;
④对特征值λ由大至小排序,选择前3 个特征值和相对应的特征向量,并将原始特征投影到选取的特征向量上,得到降维后的新3 维特征Y=[y1,y2,y3]。
PCA 三维特征可视化图如图4 所示。
图4 PCA 三维特征可视化图Fig.4 Principal components analysis(PCA) 3D feature visualization diagram
从图4 可知,经过PCA 降维处理后的故障特征数据是互相分离的,多数数据分布在不同区域,仅少量数据有重合,因此,将数据投影到3 维的特征空间,更易区分各健康状态。
将数据样本输入到DCGAN 中,使用训练样本进行模型训练,得到已完成训练的网络模型,再将测试集输入到判别器模型中,得到测试结果并与真实值对比。得到的诊断准确率为98.33%,DCGAN 模型诊断时间为2.79 s。测试集的诊断结果如图5 所示。
从图5 可知,有2 组属于水淹状态的数据被错误地诊断为正常状态和膜干故障;有1 组正常状态的数据被诊断为水淹故障。燃料电池发生水淹故障的初期所表现出的数据特征与正常状态类似,且水淹故障和膜干故障均导致PEMFC电堆电压下降、输出功率降低,表现出的故障特征较类似,因此发生误判。
图5 DCGAN 测试集诊断结果Fig.5 DCGAN test set diagnostic results
为验证DCGAN 方法的性能与可行性,分别采用DCGAN、BPNN[9]和SVM 算法[10]进行故障识别,并对故障诊断结果进行对比。为对算法做出公平合理的对比,使用PCA降维后的数据作为BPNN 和SVM 的训练样本和测试样本。
3 种诊断方法的诊断精度和诊断时间如表3 所示,其中诊断精度分为各健康状态和整体的诊断精度。
表3 3 种方法的诊断精度及诊断时间Table 3 The diagnostic accuracy and diagnostic time of three methods
从表3 可知:相比于BPNN 和SVM 法,DCGAN 法的诊断准确率最高;在运算时间方面,BPNN 法具有最短的运算时间,但诊断准确率较低;SVM 法同样具有良好的诊断效果,但运算速度较慢。综上所述,基于DCGAN 的故障诊断方法具有良好的故障诊断效果,更适用于PEMFC 水管理故障诊断。
本文作者针对PEMFC 系统水管理故障问题展开研究,提出一种基于DCGAN 的PEMFC 水管理故障诊断方法,实现了PEMFC 的3 种健康状态的故障识别,结论如下:利用720组故障样本数据进行实例分析,所提方法能正确识别电堆水淹、膜干和正常状态,故障分类精度达到98.33%,诊断时长为2.79 s。该方法利用PCA 对故障原始数据作降维处理,将原始的12 维特征降到3 维,提高模型诊断准确率并缩短模型运算时间。所提方法的预测精度分别比BPNN 和SVM 法高出7.22%和3.33%,计算时间比SVM 法节省2.56 s。
由此可见,所提方法在诊断精度和计算时间两方面都具有较大优势,适用于PEMFC 水管理故障诊断。该方法无需了解燃料电池内部运行机理,仅通过数据即可完成故障诊断,因此,同样适用于其他工程应用中。