谢宏远,刘 逸,候 权,徐心海
(1.哈尔滨工业大学(深圳)机电工程与自动化学院,广东 深圳 518055;2.哈尔滨商业大学能源与建筑工程学院,黑龙江 哈尔滨 150028)
为实现能源的低碳转型,质子交换膜燃料电池(PEMFC)由于其无污染、效率高与噪声低等特点,成为21世纪最有发展前景的发电技术之一,广泛应用于汽车动力、分布式发电与便携式电源等领域[1].然而,PEMFC的运行寿命、长期性能和维护成本成为制约其进一步商业化发展的主要因素[2].除实现材料突破与改进堆栈设计外,预测与健康管理是保障PEMFC长时间安全稳定运行的方法之一.其中,对剩余使用寿命(Remaining Useful Life,RUL)进行准确预测可以保证电堆得到及时维修进而延长使用寿命,因此RUL的预测方法成为燃料电池领域的主要研究热点之一.
目前,评估PEMFC剩余使用寿命的方法主要分为模型驱动和数据驱动两种类型.Jouin等[3]对于PEMFC堆栈提出了基于粒子滤波的RUL预测模型,并对三种电压衰退经验模型进行了测试.相对线性模型和指数模型而言,对数线性模型的效果最好.Kimotho等[4]进一步提出了一种自适应粒子滤波算法来预测PEMFC的RUL,该算法在每次电堆启停后引入自愈因子,对电压衰减模型的参数进行调整,以适应不断变化的衰减趋势.Bressel等[5]将极化曲线半经验模型中的参数时间化,利用扩展卡尔曼滤波估计模型的时变参数,实现了电堆的RUL预测.而在基于数据的预测方法中,Ma等[6]提出了基于网格长短期记忆循环神经网络的PEMFC性能退化预测方法.对比一般的RNN算法,该方法将网络储存单元并联组合,提高了训练网络的广度和深度,能有效避免预测过程中的梯度爆炸或消失问题,更适合长时间的RUL预测.Liu等[7]提出基于核超限学习机的RUL预测方法,将通过局部加权回归散点平滑法处理后的电压衰减数据进行训练,实现了对测试集的快速准确预测.Cheng等[8]考虑了基于模型和数据方法的优缺点,提出了一种基于最小二乘支持向量机和正则化粒子滤波的混合预测方法.在该预测框架中,将LSSVM初步预测的电压值作为RPF方法新的系统观测值,并以RUL概率分布的形式实现预测结果的不确定性表达.Chen等[9]将灰色神经网络模型与粒子群算法和移动窗口方法相结合,建立了PEMFC电压衰减模型,采用三份不同的PEMFC实验数据实现了不同运行条件下的电堆性能退化预测.
根据上述研究,对氢燃料电池的RUL预测可分为短期预测和长期预测.其中短期预测主要针对实时采集系统,具有较高的预测精度和拟合度,但是由于依赖实时数据的输入,增加了额外的成本.而长期预测利用预测起始点前的数据直接预测未来数百小时的趋势变化,可以实现对电池能量的合理分配和维修策略的可靠制定.但由于长期预测只利用训练集对模型进行训练,预测结果相对短期预测而言较为分散,整体的波动范围也更大,因此该预测方式具有更大的提升空间.
对此本文提出基于粒子滤波和遗传算法的PEMFC剩余使用寿命预测方法,能够在实现长期预测精确度的基础上提高计算效率.本文首先介绍了原始电压数据的采集及处理方法,以及电堆启停时的电压恢复效应处理模型.之后开发了基于遗传算法对参数进行优化的粒子滤波模型,用于对电堆输出电压的长期衰减趋势进行预测并估计其RUL.最后利用法国燃料电池实验室(FCLAB)公开的1kW质子交换膜燃料电池堆的电压衰减实验数据对本文提出方法的计算结果进行了讨论.
本文采用FCLAB在IEEE PHM 2014数据挑战赛中公开的PEMFC电堆实验数据集[10].数据来自于5片活化面积为100 cm2的单电池组成的电堆.该电堆在恒定电流70 A的稳定状态下运行1 154 h,运行条件基本保持不变,而其中最大电流密度为1 A/cm2.运行期间采集各种状态监测数据(如电压、温度、气体流速、湿度等24维参数).其中部分PEMFC的监测参数随时间的变化情况如图1所示.
为确定氢燃料电池的性能退化指标,对各监测参数进行相关性分析,设监测参数为X,其相关系数rij,见公式(1),同时建立相关矩阵R,见公式(2).根据相关矩阵绘制的相关矩阵图,如图2所示.
(1)
(2)
由相关矩阵图可知,单电池和电堆的电压与时间呈明显的负相关,其他参数则没有表现出明显的相关性,而观察部分监测参数图(见图1)可以得到相同结论.因此,本文选用电堆电压作为氢燃料电池的性能退化指标.
根据相关性分析确定了PEMFC的性能退化指标,降低了整体的数据复杂度,但总计143 862个原始电压数据含有大量噪声和部分尖峰,这些异常值的偏差会影响模型对真实值的捕捉,对计算结果产生较大误差.同时,间隔30 s的电压数据波动相对整体衰减而言太小,对模型的影响低而计算时间长.因此需要对原始电压数据进行预处理.
为保证最大程度上保留原始数据的信息,本文采用基于核的平滑器进行滤波,加权的平均值权重取决于核函数.为消除大多数平滑方法所表现出的端点偏差,选择高斯核函数[11],如公式(3)所示.
将采样点数据设为u(tj),其中j=1,2…n,n为采样数据点个数.而滤波后数据的估计值设为f(tj),如公式(4)所示.
(3)
(4)
公式中:si=K[(tj-ti)/h],h为带宽,控制函数径向作用范围.
滤波后,为进一步减少计算负担,利用三次样条法对数据进行插值,得到均匀时间间隔为1小时的样本.预处理结果,如图3所示.
图2 监测参数间的相关矩阵图图3 电压衰减数据的预处理结果
实验测试过程中每隔一段时间对电堆进行一次启停堆操作,期间进行极化曲线与电化学阻抗谱的测量.启停的时间点分别为Tc=48;185;348;515;658;823;991 h,如图3所示,每次启停后输出电压均会出现短暂的恢复现象.而恢复效应的发生会对预测造成一定程度的偏差,为实现基于电堆实验数据的RUL预测,必须考虑启停操作导致的电压恢复效应.
为实现捕捉启停阶段电压恢复效应导致的不同恢复程度,Kimotho等[4]利用任意两个启停区间的平均梯度差得到的自愈因子实现了恢复程度的增幅.Zhang等[12]考虑了堆栈内部阻抗,利用阻抗谱所提供的信息来更新恢复效应的模型参数.两者都在一定程度上实现了对恢复效应的捕捉,但前者每次根据平均梯度差更新下一阶段的恢复幅度,导致后续恢复幅度趋于某一固定值,与实际情况不符;而后者由于每次恢复幅度的预测依赖阻抗谱的测量,实际长期预测过程中是无法得到后续启停阶段的阻抗,因此该预测无法运用于电堆的实际长期预测中.
虽然无法预知未来恢复效应的影响,但是由于启停堆的时间可以根据预设的实验计划确定,因此可以建立对应的恢复模型,预测当时间到达预设的启停时间点的电压恢复程度.根据氢燃料电池寿命实验中的启停测试结果,本文的恢复模型同样根据电堆的实际运行数据选择双指数经验模型[13],如公式(5)所示.该模型在启停时间点的恢复幅度与实际结果对比如图4所示,其结果拟合效果良好.后续实际预测过程中的恢复模型只考虑训练数据,实现对电堆的长期预测.
xc=xk+r1·exp(r2·tk)+r3·exp(r4·tk)
(5)
图4 恢复幅度拟合
公式中:c为表征时间点;r为模型参数.
为了实现对PEMFC的长期剩余使用寿命预测,进一步提高基于模型方法的运算效率和预测精度,本文以氢燃料电池的电压衰减为基础,提出了一种基于遗传算法优化粒子滤波的PEMFC长期剩余使用寿命的预测方法整体框架,如图5所示.
图5 基于GA优化PF下的PEMFC预测方法框架
该预测框架中将电压作为健康指标,首先对PEMFC的原始电压数据进行预处理,然后将平滑重整后的数据划分为训练集和测试集,预测起始点设为Tp.
训练过程中,将实际电压测量值作为系统观测值跟踪系统状态,不断更新模型参数.当时间到达Tp时,粒子滤波模型将停止系统状态的跟踪.但是由于电压波动的随机性,导致模型参数的波动,使得结果发散.根据经验电压衰减模型,PEMFC的电压衰减趋势整体不变,因此利用PF估计的参数范围和训练集拟合优度R2来表示的适应度,通过遗传算法实现最佳模型参数的优化计算,其结果用于后续预测过程.
预测过程中,根据系统的状态空间模型随时间传递相应状态,预测未来电压变化,直至达到电堆预设的失效阈值,得到估计的RUL.最后通过重复性测试实现RUL的不确定性表达,减小预测的偶然性,提高模型的泛化能力.
2.2.1 粒子滤波模型
粒子滤波(Particle Filtering,PF)方法的基础是建立系统的动态空间模型,模型一般形式如下:
状态方程:xk=f(xk-1,Θk-1,nk)
(6)
观测方程:zk=h(xk,νk)
(7)
公式中:正整数k为离散时间变量;x、z分别为状态序列和观测序列;f、h分别为状态转移函数和观测函数;Q=[q1,q2…]为模型参数向量.
在PF框架中,退化状态概率分布的近似和退化状态本身的估计都是基于生成的粒子及其相关的权值.系统的未知状态和模型参数通过含有概率信息的粒子进行传播,该方法主要包括以下步骤[14]:
(3)计算权重:假设测量误差为方差R的高斯分布,为每个粒子生成重要权值,如下式所示:
(8)
(4)归一化权重:将权重归一化,形成一个概率分布,如下式所示:
(9)
(5)重采样:保留权值大的粒子,剔除权值小的粒子,不断进行递推,改善粒子退化现象.
利用PF进行预测的过程中,通过现有数据进行学习,对状态方程中的未知参数进行更新.到达给定时间后,不再进行重采样,而通过外推估计的退化演化,直至达到停止条件,得到对应状态粒子的概率分布.
2.2.2 电压衰退模型
根据PF模型,状态空间模型是预测的基础.根据相关文献[8,13],本文采用对数线性模型作为电压衰减的状态空间方程.其中,线性部分表示退化过程中恒流、恒工况下的电压降,对数部分用于拟合PEMFC长期寿命测试过程中开始和结束时电压衰减的快慢变化.具体状态方程和观测方程为
xk=-θ1·ln(tk/tk-1)-θ2·ln(tk-tk-1)+xk-1
(10)
zk=xk+νk,νk~(0,σk)
(11)
公式中:θ1、θ2为系统模型参数;vk为观测噪声,是服从零均值,σ标准分布的白噪声.
2.2.3 参数初始化
初始参数的设置对PF模型的预测具有重要作用,合适的模型参数可以快速捕捉系统状态,提高跟踪效率.其中主要的初始化参数包括x0,θ1,θ2和σ0.
本文设定粒子数N为500,假设系统初始状态x0服从以初始电压为中心的均匀分布,根据波动程度设置范围为±0.05 V.其他参数也以均匀分布进行初始化.通过对数线性模型拟合初始电压观测值,可以得到θ1和θ2的初始分布范围分别为[-0.008,-0.007]和[0.000 5,0.000 6],测量噪声的标准差范围为[0.001,0.002].
初始化模型参数后,在训练过程中的每一步利用实际电压测量值对系统状态进行更新,估计Tp范围内的模型参数.而预测过程中选用最佳模型参数预测后续电压状态,同时在预设的启停时间点添加恢复模型,直至到达PEMFC的失效阈值点,完成对电堆RUL的估计.
2.3.1 遗传算法
遗传算法(Genetic Algorithm,GA)是以待优化问题的目标函数为依据,将其转化为适应度函数来评估问题中各种参数编码形成的初始种群,通过自然演化机制下的迭代循环,找到最适应的个体作为问题的最优解.算法的主要流程如下[15]:
(1)编码策略:编码过程是将待优化问题的解作为染色体,利用基因表示具体解;
(2)初始化:在编码的问题空间中随机生成N个个体的初始种群,个体的多少决定种群的规模;
(3)适应度函数设计:选择合适的适应度函数评价种群个体的优劣程度;
(4)选择操作:利用适应度函数作为标准,通过”优胜劣汰”的方式淘汰不良个体,保留优秀个体;
(5)交叉操作:通过交叉组合父代种群染色体内的等位基因信息产生新的个体,不断累积优良基因;
(6)变异操作:每个子代选取少量个体改变其基因,保证种群的多样性,提高整体算法的全面性.
2.3.2 优化过程
GA对PF模型的优化主要是求取对数线性模型参数的最优解.根据PF估计的模型参数创建种群,经实际测试,将种群数设为100.编码方式选择二进制编码,模型参数范围根据估计值范围设为[a,b],离散精度为m,码长L如下所示:
(12)
本文中,将模型拟合优度R2作为适应度函数,如下所示:
(13)
确定目标函数后,对种群进行如下遗传操作:
(14)
公式中:fi为个体适应度.
每次轮转时,随机产生0-1之间的随机数r,当Pi-1≤r (2)交叉操作和变异操作:交叉和变异类似,前者根据交叉概率,通过交换两个父代染色体基因得到新的个体;后者根据变异概率,反转子代某处基因得到新的个体.经测试,本文设定交叉概率和变异概率分别为0.8和0.05. 最后,将通过GA得到的最优模型参数带入PF模型中进行预测.相对迭代训练估计模型参数的方式,基于GA的优化提高了整体模型的计算高效性和预测稳定性. 由于电堆老化实验测试的时间有限,本文将失效阈值设定为初始总电压的96.5%,即电压3.23 V,相应的失效时间为805h处.将预测起始点设为Tp=550 h,即[0,550 h]间的551组数据为训练集,[551,1 154 h]间604组数据为测试集,而该预测起始点下的RUL为255 h. 将训练集数据送入PF模型作为系统观测值跟踪系统状态,根据每组数据估计的模型参数范围利用GA进行优化,优化过程如图6所示,随机分布的初始种群经过以适应度为目标的”优胜劣汰”,逐渐向最优解靠近且趋于稳定,最终得到对数线性模型的最优解Θ. 图6 遗传算法参数优化过程 将最优解Θ代入PF预测模型中,预测结果如图7所示.其中,基于GA-PF的RUL预测准确度和电压衰减趋势的拟合度均劣于添加恢复模型下的预测结果.因此,PEMFC启停阶段的恢复模型可以有效提高电堆RUL预测的精确度,有利于未来电压衰减趋势的捕捉,因此后续测试只考虑添加恢复模型下的预测结果. 图7 基于GA-PF的PEMFC剩余使用寿命预测结果 预测结果的不确定性表征是决策过程中的一个重要方面,它比单一的估计结果能提供更好的指导.由于PF结果存在偶然性,本文对该模型的预测重复100次,以评估结果的分散性.因此,对参数估计过程和预测过程添加显著性水平为90%的置信区间,如图8(a)所示,观察预测结果的分布程度.为防止数据极端值的影响,预测的RUL取100次试验的中值,结果如图8(b)所示.其中[100 h,114 h]区间处的少量异常值是因为658 h处的预测电压接近失效阈值,部分预测由于偏差将此处作为失效时间点,但实际失效时间点由于启停操作导致的恢复效应而延后,这也是进行该重复性测试的主要原因. 图8 预测的不确定性表达 为评估模型预测结果的可靠性和有效性,本文选择均方根误差(Root Mean SquareError,RMSE)和精度两个常用的模型性能评估指标,如公式(15)、公式(16)所示.前者主要反映预测值与真值之间的整体偏差,后者为RUL的预测精度. (15) (16) 基于GA-PF方法的预测结果,如表1所示.当预测起始点设为550 h时,预测RUL中值和实际RUL分别为233 h和255 h,预测值小于实际值两天之内.通过GA优化后的PF算法大幅缩短了运行时间,有利于PEMFC长期运行中的快速预测. 表1 算法间的预测性能评估 为了评估GA-PF方法预测效果的提升,测试两种未经过GA优化的算法,具体结果如表1所示,其中运行时间均为100次测试结果.由于电压的不确定性波动,PF单独预测得到的参数由于拟合性差使模型出现较大偏差.为缩小预测的整体偏差,对滤波阶段进行多次迭代,提高模型参数的拟合度.迭代PF的预测精度有一定程度提高,但运行时间也大幅增加,难以实现快速预测. PEMFC的长期剩余使用寿命预测除准确性的评估外,模型性能的泛化能力也是重要的参考指标之一.本文设置多预测起始点观察预测结果,而双指数模型至少需要四个数据点进行拟合,同时考虑启停时间点对恢复模型的影响,本文选取Tp=550;600;650;700;750;800 h六个不同的时间点.为直观表现各预测起始点的不确定性预测结果,绘制各预测起始点绝对误差的箱型图,如图9所示.其中,绝对误差公式 (17) 图9 各预测起始点下对应RUL的绝对误差 由于实际运行中PEMFC性能受多物理场耦合的影响而异常复杂,尽管将电堆的运行条件设为恒工况,但监测到的各项物理参数总是随时间而变化,包括作为电堆健康指标的输出电压也在随机波动,这导致预测PEMFC的RUL变得异常困难.通过基于高斯核的平滑处理,可以最大程度还原电压的整体衰减趋势,但是由于电压的不确定性波动,在利用PF训练的过程中,尽管估计参数下每一步的模型预测结果在该时间点与实际数据高度拟合,但是对于整段电压衰减曲线而言仍有较大偏差.利用拟合优度R2对训练集进行评估,可以选择相对合适的模型参数,但是单次滤波范围内得到的模型参数有限,而通过对训练集反复训练得到的估计参数的拟合优度会提高,但是该重复的滤波过程会占用大量计算资源.而通过GA可以根据单次滤波结果得到的参数范围,通过随机优化快速求取全局的近似最优解.因此,与单独的PF算法相比,基于GA-PF的方法可以实现更高的预测精度和更快的计算效率. 由表1的实验对比可知,基于GA-PF方法的RMSE、准确率、置信区间长度和运行时间都远优于单独的PF算法,更适合PEMFC的长期剩余使用寿命预测.而根据图8所示,模型的预测精度整体随训练数据的增加而提高,符合实际情况.其中650 h处的预测结果出现突降,主要原因是658 h处发生一次启停导致的恢复效应,从而影响了预测结果. 整体而言,预测的RUL多数小于实际值,有利于提前确定失效时间而采取相应措施,保证氢燃料电池安全稳定的长期运行.基于GA-PF的PEMFC长期剩余使用寿命预测方法具有预测精确度高、运算复杂度低和泛化能力好的特点. 本文研究了恒工况条件下PEMFC的长期剩余使用寿命预测问题,提出了一种基于遗传算法优化粒子滤波的预测方法.在该预测框架中,通过基于高斯核的平滑器和三次样条插值法将数据进行预处理.利用PF对训练集数据进行滤波确定对数线性模型合适的参数范围,采用GA对模型参数进行优化,将得到的最优参数用于模型预测.预测过程中,添加双指数模型捕捉电堆启停阶段的电压恢复幅度,提高了预测结果的拟合度. 本文相对一般的PF模型,采用基于GA-PF的优化模型,将氢燃料电池的剩余使用寿命预测结果提高了22.63%的准确度,缩小了23.92倍的置信区间;近似预测精度下,提高了10.06倍的运算效率.新方法可以对PEMFC的RUL进行快速准确的长期预测,具有极大的实用价值.3 结果与讨论
3.1 剩余使用寿命的预测
3.2 预测的不确定性表达
3.3 结果分析
3.4 讨论
4 结 论