张浩,胡昌华,杜党波,裴洪,张建勋
锂电池以其充电速率快与使用寿命长等优越性能被广泛应用于新能源汽车、通信设备与航空航天电子设备领域[1]. 然而,随着锂电池循环使用次数的累积,电池性能不可避免地发生衰退,最终导致系统无法正常工作甚至可能造成安全事故[2]. 因此,高效准确的预测锂电池的剩余寿命(Remaining Useful Life,RUL)具有重要的实际意义[3].
通过预测锂电池运行过程中容量、阻抗等状态的动态变化可实现电池RUL 的预测[4],现有锂电池的RUL 预测方法主要包括基于模型的方法与数据驱动方法两类[5]. 数据驱动方法无需根据系统内部复杂的退化机理而建立特定的预测模型,直接利用锂电池循环充放电过程中的监测数据来拟合电池性能的退化规律,进而实现锂电池的RUL 预测[6,7],相对基于模型的方法来说更具有普适性.
深度学习方法作为数据驱动方法的分支,以其强大的数据处理能力被广泛应用于锂电池RUL 预测领域.Zhao 等[8]结合深度置信网络与支持向量机(Support Vector Machine,SVM)实现了锂电池容量退化的预测,并通过容量外推得到了电池RUL. 文献[9]则进一步考虑锂电池循环使用过程中的放电电流与环境温度对容量退化的影响,建立考虑外部状态影响下的锂电池容量与RUL 预测模型. Zhou 等[10]利用人工神经网络与SVM 实现了电池温度至RUL 的预测. 文献[11]同样以电池温度为基础,但建立的模型为多通道神经网络容量预测模型,并综合考虑充放电端电压与电流在电池性能退化中的作用. 而Xu等[12]在文献[10]的基础上将电压纳入堆叠去噪自动编码器直接预测锂电池的RUL. 然而上述文献仅以一种内部状态(即容量或电池温度)搭建锂电池的RUL 预测模型,忽略了电池运行过程中各内部状态的相互作用,因此难以充分利用各状态所包含的寿命信息,一定程度上影响着预测结果的准确性. 此外,在利用深度学习方法实现锂电池的RUL预测时,多数文献未对预测结果进行不确定性量化或量化的计算过于复杂.
综上,针对现有RUL 预测方法中的问题与不足,本文充分考虑锂电池循环使用过程中的容量、阻抗与温度信息,以三种状态数据为Bi‑LSTM 网络的输入,其循环寿命为网络输出搭建锂电池的RUL 预测模型. 同时,借鉴文献[13]中Bayesian 变分推断技术与dropout技术间的等价性,实现RUL 预测结果的不确定性量化;最后,通过Severson教授课题组的锂电池数据集对比验证了该模型的有效性.
LSTM 网络主要包含遗忘门、输入门与输出门三部分,分别表示为ft、it、ot. 网络传递的途径如式(1)所示.
式中,xt表示t时刻神经元的输入,ht表示t时刻的输出,ct表示当前神经元状态,W,U为权重矩阵,b为偏置,σ为Sigmoid函数,⊙表示按元素乘积.
但LSTM 仅学习了过去状态对当前状态的影响,忽略了未来状态的作用,没有充分利用时间序列的前后依赖性关系,对数据的学习能力有限. 而Bi‑LSTM 网络能同时学习过去与未来状态对当前状态的作用,极大提高了模型对具有前后依赖关系的长序数据的学习能力.Bi‑LSTM网络通过前向层与后向层可独立地对时序数据进行处理,并将两层处理结果同时前馈到输出层,能够充分利用过去与未来时刻数据所蕴含的寿命信息. 鉴于此,本文采用Bi‑LSTM 网络进行建模,完整的Bi‑LSTM 网络前向与后向过程的输出结果为式(2)所示.
Ht=h→t+h←t(2)
式中,h→t为最后一个前向层的输出,h←t为最后一个后向层的输出,Ht为网络最终输出.
本文的预测结构如图1 所示,首先采用独立的Bi‑LSTM‑1 网络提取三个内部状态的时序特征信息,再利用特征融合技术将三部分特征信息进行拼接,最后将拼接的特征输入到Bi‑LSTM‑2 网络以实现考虑特征相关性的同时提取具有时间关系的深度特征.
图1 基于Bi‑LSTM网络的锂电池RUL预测模型
所提模型通过堆叠多个Bi‑LSTM 网络实现模型对数据间的相关性与时序依赖关系的学习,并通过一个全连接层与回归层得到电池的RUL. 此外,本文选用均方根误差(Root Mean Square Error,RMSE)与平均绝对误差(Mean Absolute Error,MAE)两个指标对模型的性能进行评估,其公式如下.
其中,m为数据总数,yi表示锂电池第i个时刻真实的RUL表示模型在第i个时刻的RUL预测值.
尽管基于Bi‑LSTM 网络的RUL 预测模型对时序数据具有强大的学习能力,能取得更高的预测精度,但该模型的预测结果仅为点估计而非区间估计,无法反映预测结果的不确定性. 为描述预测结果的不确定性,在模型中引入Bayesian神经网络[14],将Bi‑LSTM 网络的参数视为服从某种分布的随机变量.X表示训练数据集,Y表示相应的真实RUL标签.
令随机变量θ={W,b}表示模型的参数,其中W与b分别表示网络的权重与偏置向量.p(θ)表示参数θ的先验分布,q(θ)表示p(θ)的近似变分分布,通过最小化两个分布间的Kullback‑Leibler(KL)散度可得到最优的近似分布. 考虑到神经元数目较多时,求KL 散度较为复杂,利用dropout 技术与Bayesian 变分推断间的等价性,在L2正则化条件下,将目标函数优化为:
式(4)中,S为训练样本的子集,p为子集的数目,H表示模型参数的总数,Y︵表示利用dropout 技术所获得的模型输出,λ表示正则化技术的衰减系数.
通常采用Adam 优化方法对目标函数式(4)进行优化,当获得模型参数后验分布的最优近似分布后,对新获得的输入样本X*,模型RUL预测结果的分布为:
本文采用美国Severson 教授课题组的商用磷酸铁锂电池“2017‑05‑12”批次数据集[15]对模型的性能进行验证. 数据集中部分电池由于仪器测量误差等原因导致所获取的状态数据存在较大波动. 为建立预测性能更好的RUL 预测模型,本文在实验中剔除状态异常的电池数据,保留变化趋势符合实际的电池,以此数据搭建锂电池的RUL 预测模型. 以剩余10 个电池中前9 个锂电池的容量、阻抗与温度为模型输入,锂电池的剩余使用周期数为输出对模型进行训练. 首先利用Min‑Max 方法对电池容量、阻抗与温度数据进行归一化处理后,采用滑动时间窗技术生成固定长度的训练样本,其中滑动时间窗长度设为10,步长设为1,将经过上述预处理操作后的电池数据输入至模型中进行训练.
设置不同网络结构时预测效果存在差异,为选择合适模型进行预测,需对不同超参数下的模型性能进行对比. 利用滑动时间窗技术处理原始数据后得到9216 个数据段,每个数据段具有10个充放电循环的数据. 通过对比发现将模型的学习率设为0.01,Bi‑LSTM‑1 设为每层具有64个神经元的双隐藏层,Bi‑LSTM‑2则为具有64个神经元的单隐藏层,最后的全连接层包含100个神经元,训练epoch 为10000,每个epoch 包含90 个随机的数据段,此时模型的RMSE最低,RUL预测精度最高.
图2 固定参数与随机参数模型的RUL预测结果及误差
为了验证本文基于等价Bayesian 深度学习算法与Bi‑LSTM网络的锂电池RUL预测方法的有效性,我们将固定Bi‑LSTM 网络参数模型在第10 号电池的预测效果同本文方法进行对比,其中开始预测时的真实RUL 为802 个循环周期. 当锂电池已运行某个周期后,分别采用固定模型参数法与随机参数法预测该电池还能有效工作的循环周期. 由于本文模型参数的随机性与预测结果的唯一性,通过1000 次循环预测可得到1000 组锂电池的RUL 预测值,每组包含802个预测循环. 将模型权重与偏置分别视为服从高斯混合分布与高斯分布时,最终RUL 预测结果亦服从高斯分布[14],根据802×1000 个RUL预测结果可得到802个点处的预测结果的均值μ与标准差σ,利用式(6)即可得到预测结果的95%置信区间,不同dropout 率下RUL 预测结果的95%置信区间如图3所示.
图3 不同dropout率下RUL预测结果的95%置信区间
式中,n为样本数,M为样本均值.
从图2(a)中可以直观看出,随机参数模型的预测均值与真实RUL 值更接近,拟合效果更好;图2(b)展示了dropout率为0.1时两种模型的预测误差对比情况.随机参数模型与固定参数模型的RMSE 均值分别为10.497 与12.383,二者的MAE 分别为6.262 与11.022,因此具有参数随机性的模型预测精度更高. 此外,利用dropout技术等价地实现RUL预测结果的不确定性量化时,不同dropout 率对RUL 预测结果的不确定性影响不同. 为探究不同dropout 率下RUL 预测的差异性表现,此处 以dropout 率分 别等 于0.1、0.2、0.3 时为 例进 行展示.
从图3 可以直观发现,随着dropout 率的增大,RUL预测结果95%置信区间的宽度逐渐增大,与预测结果的不确定性呈正相关,即dropout 率的增大将提高模型训练过程中随机丢失信息的比例,因而增加了预测结果的不确定性. 此外,不确定性的增加将使初始阶段的置信区间宽度增加,从而使预测区间更容易包含真实的RUL,即一定程度上提高了预测初始时刻RUL 的准确性. 表1为第10个电池运行了600个、700个与800个循环后RUL 预测结果95%置信区间的宽度,可以明显发现,随着dropout 率的增大,置信区间的宽度随之增大,进一步验证了RUL 预测结果的不确定性与dropout率间的正相关关系.
表1 不同dropout率下置信区间宽度
基于1000 组RUL 预测值在MATLAB 中利用核密度估计函数可得到预测结果的概率密度分布(Probabil‑ity Density Function,PDF),图4 为不同dropout 率下第600个循环RUL预测结果的PDF.
图4 不同dropout率下第600个循环RUL的PDF
如图4 所示,当dropout 率增大时,第600 个循环RUL 预测结果PDF 的高度随之减小,宽度相反随之增大,即随着dropout率的增加,RUL预测结果的不确定性增加.RUL 预测结果的不确定性直接影响着设备健康管理活动的合理性与科学性,较小不确定性有助于精准制定设备的维修策略. 但过度追求较小不确定性可能会造成预测结果无法较好反映实际工程中测量误差与个体差异性等各类不确定因素的问题. 为保证RUL预测精度的同时考虑RUL 预测结果的不确定性,本文从集合{0,0.05,0.1,0.2,0.3}中选择dropout 率进行分析,不同dropout 率下RUL 预测结果的RMSE 如表2所示.
表2 不同dropout率下RUL预测结果的RMSE
从表2 中可以看出dropout 率设为0.1 时,RUL 预测结果的RMSE 最小. 此外,图3 进一步验证了dropout 率为0.1 的合理性与优越性,能够充分反映实际中各类不确定因素的影响.
为验证本文考虑电池阻抗与温度后建立的Bi-LSTM 模型的优越性,引入七种方法与本文方法进行对比分析,其中主要包含GRU、Bi‑GRU、LSTM、Bi‑LSTM四种针对时序数据具有强大学习能力的网络结构,再分别考虑每种网络是否融入电池阻抗、温度实现锂电池的RUL 预测,共八种RUL 预测方法分别记为方法1~8,方法1~4 为四种网络仅根据电池退化容量对锂电池RUL 进行预测,方法5~8 为四种网络考虑电池容量、阻抗与温度后进行RUL 预测,需要说明的是方法8 即为本文方法. 此外,方法1~7同样采用dropout深度学习技术对RUL 预测结果的不确定性进行量化,并选择RMSE、MAE 与循环1000 次预测时间三种指标对RUL预测结果进行评估,对比结果如表3所示.
表3 八种方法的RUL预测结果性能指标对比
从表3 的对比结果可以发现,在所有模型中,本文方法即考虑电池退化过程中的容量、阻抗与温度三种状态对电池RUL 的影响,并基于等价Bayesian 变分推断技术与Bi‑LSTM 网络进行建模时,RUL 预测的RMSE与MAE 均为最小. 但本文方法的预测时间并非最短,主要由网络结构复杂程度与输入变量的个数两方面因素造成,结构越复杂且考虑内部状态的因素越多,模型预测时间越长. 此外,相对于方法1、3、5、7,方法2、4、6、8 在预测时对数据两个方向上的时间相关性进行了学习,因此其RMSE 与MAE 更小. 方法1~4 的RMSE 与MAE均大于对应的方法5~8,进一步论证在进行锂电池的RUL 预测时,融入电池阻抗、温度等多种状态后得到的RUL 预测结果精度更高. 综上,本文方法预测性能更优,且能考虑各种随机因素的影响,对RUL 预测的不确定性进行度量,并可提供RUL 预测结果的PDF,为设备开展维修活动提供理论支撑.
高效准确地预测锂电池的RUL 在电池的健康管理系统中发挥着越来越重要的作用. 本文提出了一种融合多个内部状态的锂电池RUL 预测方法,以电池容量、阻抗与温度为核心,直接实现三种电池状态至RUL 的预测,最后基于Bayesian 变分理论与dropout 技术间的等价性对RUL 预测结果的不确定性进行量化. 并将本文的RUL 预测结果同四种引入深度学习模型的预测结果进行对比,验证了本文方法的有效性与优越性.