张慧颖,王军华,丁 汀,朱永茂
(武汉大学电气与自动化学院,湖北武汉 430072)
锂电池健康状态(SOH)作为电池能量管理系统(BMS)的重要组成部分,对电池的维护与管理以及系统的安全稳定运行至关重要。目前,常用的SOH估计方法主要包括传统估计方法、模型驱动方法和数据驱动方法。
传统估计方法包括容量法、内阻法[1]和电化学阻抗谱法[2],该类方法虽然精度高,但测试困难、设备高昂,无法用于在线估计。模型驱动方法包括电化学模型[3]、等效电路模型[4]和经验退化模型,但需要关注电池内部机理过程,综合考虑电池材料属性和内外部物理化学反应,通常模型复杂、参数众多,描述电池动态特性的能力较弱。相比之下,数据驱动方法可以不考虑电池内部机理,从电池外部可测量历史数据中,提取出与电池容量密切相关的健康指标进行训练,从而输出SOH估计结果,是当下SOH估计中的热门方法。如Sahar 等基于部分电池充电电压曲线提取出健康指标,从而建立非线性自回归神经网络模型估计电池SOH,但仅基于充电电压提取指标,难以充分描述电池退化特征[5]。周等基于日常片段充电数据,提出了扩展卡尔曼滤波和高斯过程回归的全充时间算法估计SOH,具有实时性,但计算量较大[6]。Feng 等从电池循环充电电流中提取了五个与电池容量高度相关的指标,提出了一种基于高斯过程回归的SOH估计模型,精度较高,但指标提取相对复杂[7]。Choi 等基于多通道充电数据,应用长短时记忆神经网络(LSTM)估计电池容量,该方法能够很好地描述电池的退化特征,但模型精度有待提高[8]。
对于上述研究中出现的问题,本文将基于锂电池充电数据,从电压、电流和温度三个维度出发,提取多个与锂电池容量衰减密切相关的健康指标,充分描述锂电池的退化特征,并将卷积神经网络(CNN)捕获信息特征能力强、权值数量少与LSTM 善于挖掘数据间长期依赖关系的优势结合起来,提出CNN-LSTM 融合模型,实现锂电池SOH的在线估计。
SOH表示旧电池相比于新电池的电能存储能力,通常主要有基于容量和内阻两种定义方式。
基于容量:定义为标称容量与额定容量的百分比,如式(1)所示:
式中:C0表示电池初始额定容量,为恒定值;Ck为循环测量容量。
基于内阻:随着电池的老化,内阻相应增加,因此,内阻的大小可反映出电池的SOH情况,如式(2)所示:
式中:Rk为当前循环测量内阻;Re为电池退役时内阻;R0表示电池初始内阻,为恒定值。
考虑到基于内阻法定义电池SOH对实验设备有很高的精度要求,本文采用基于容量法定义SOH,如图1 所示。
图1 SOH定义
本文采用美国宇航局NASA 研究中心公布锂电池数据集中实验条件相似的B5、B6、B7 和B18 号四组锂电池数据集进行验证,测试对象为18650 市售锂电池,额定容量为2 Ah。NASA 对每组锂电池反复进行充放电循环实验以加速其老化过程,并将容量衰减至额定容量的70%视为失效阈值,即容量由2 Ah 衰减至1.4 Ah 时,认为电池已经失效,具体实验信息如表1 所示。
表1 实验信息表
电池容量退化曲线如图2 所示,1 次循环代表着电池经历了一次老化实验,黑色虚线代表失效阈值。其中,B5、B6、B7号锂电池均达到168 次充放电循环,B18 号锂电池达到132 次充放电循环,B5、B7 号电池的容量衰减较为同步,前期较为缓慢,中后期衰减速度加快;B6 号电池容量衰减速度始终较快;B18 号电池的容量衰减速度居中。此外,从图2 中可以看出,电池的容量衰减并非是线性递减的,而是存在很多“尖峰毛刺”,容量出现一定幅度的回升,研究学者将这种情况视为“容量的自恢复效应”,即电池在搁置一段时间后,容量出现局部再生现象。
图2 电池容量衰退曲线图
由于电池在放电时可能引入其他因素的干扰,如用户使用习惯、环境温度等导致采集到的电池放电数据并不客观,难以用于锂电池SOH估计。而电池在充电过程中,一般暂停使用并不向外输出能量,干扰因素较少,数据相对客观,所以本文选取锂电池的充电数据进行研究。以B5 号电池为例,如图3 所示,依次为1、48、88、128、168 共五个循环次数下电池的充电电压、电流、温度变化曲线。
图3 部分充电数据变化曲线图
研究表明,电池在不断老化的过程中,其内部锂离子浓度逐渐降低,活性物质不断减少。对于同一块电池,当充电阶段输入同样的电量时,充电电压的表现也并不相同。因此,本文基于锂电池充电电压数据,提取出健康指标H1、H2来描述电池老化特征。
H1表示电池充电阶段充电电压从达到4.2 V 至充电结束过程中的时间,如式(3)所示:
式中:tall表示充电阶段总时长;tmin表示充电电压达到4.2 V 的初始时刻;Δv表示电压裕量,取值很小。
H2表示电压变化率,即取电池充电电压在3.9~4.1 V 间的数据点做一次拟合,计算过程如式(4)所示:
式中:n表示数据点总数表示充电时间的均值。
电荷的积累主要依靠恒流充电阶段的情况,恒流充电阶段时间的减少,将伴随着电流充电容量下降,电池极化程度加深和正极锂离子电荷量减少,其SOH也会受到影响。因此,本文基于锂电池充电电流数据,提取出健康指标H3、H4来描述电池老化特征。
H3表示充电电流保持在1.5 A 的时间总长,如式(5)所示:
式中:tall表示充电阶段总时长;tmax表示充电电流保持为1.5 A的总时长;Δi表示电流裕量,取值很小。
结合充电电流变化曲线分析,为量化充电电流波动情况对电池容量的影响,本文引入标准差,计算过程如式(6)所示:
式中:σi表示电流标准差;n表示电流序列的长度;ij表示电流序列为电流序列平均值。
锂电池性能对温度的变化十分敏感。当温度较低时,电池会析锂,造成放电容量的降低;当温度较高时,电化学反应的加剧会促进锂离子的消耗,从而导致电池内阻增大。高温还会使电池内部电解液受热分解发生过热损害。因此,本文基于锂电池充电温度数据,提取出健康指标H5、H6来描述电池老化特征。
H5表示恒流充电阶段温度曲线在时间上的积分,如式(7)~(8)所示:
式中:Tmax表示温度峰值;ΔT表示温度裕量,取值很小。
H6表示充电阶段电池温度达到峰值时对应的时间,如式(9)所示:
式中:Tmax表示温度峰值;n表示数据点个数。
卷积神经网络[9]凭借其特定的连接方式,不仅能减少权值的数量便于网络优化,又能避免数据过拟合,结构如图4 所示。
图4 CNN结构
其中,卷积层是最重要的一层,相当于滤镜,先将图片进行分块,再对每一块进行特征处理进而提取。卷积计算过程如式(10)所示:
池化层对数据和参数的量进行压缩,避免数据过拟合,计算过程如式(11)所示:
式中:yl+1i(j)为池化后第l+1 层的第i个特征矩阵中的元素;xli(k)为第l层的第i个特征矩阵中的元素;Dj为第j个池化覆盖区域。
长短时记忆神经网络[8]具有记忆功能,主要通过输入门、遗忘门和输出门来控制保留的信息量大小,结构如图5 所示。
图5 中,σ为sigmoid 激活函数,取值为0~1;tanh 取值为-1~1,处理过程如式(12)~(17)所示:
式中:ft为遗忘门输出;Wf为遗忘门权重矩阵;ht-1为前一时刻输出状态;xt为当前时刻输入状态;bf为遗忘门偏置值;it为输入门输出;bi为输入门偏置值;WC为细胞状态权重矩阵;bc为细胞状态偏置值为候选细胞状态;Ct为当前时刻细胞状态;Ct-1为前一时刻细胞状态;ot为输出门输出值;Wo为输出门权重矩阵;bo为输出门偏置值;ht为神经元细胞输出值。
考虑到NASA 数据集为时间序列数据,具有高挥发性和不确定性,本文提出CNN-LSTM 融合模型,将CNN 捕获信息特征能力强、权值数量少与LSTM 善于挖掘数据间长期依赖关系的优势相结合,设计出基于CNN-LSTM 融合的锂电池SOH估计模型,模型架构如图6 所示。
图6 CNN-LSTM模型架构图
如图6,在CNN-LSTM 模型架构中,首先,由输入层和折叠层将输入的健康指标数据折叠起来供给CNN 使用;然后,通过CNN 的卷积层对数据进行卷积训练,卷积核大小为6×1,深度为n;接着,由序列展开层和平滑层将CNN 输出的卷积结果展开成一排输入到LSTM 中,隐藏神经元个数为m;同时,引入随机丢弃层降低复杂度,丢弃部分信息,提高对噪声的抗干扰能力;最后,通过全连接层和回归层输出模型估计。
CNN-LSTM 模型流程图如图7 所示。首先,将提取出电池容量和H1~H6六个健康指标数据进行标准化处理,使数据变化范围均为0~1;接着,引入Spearman 相关系数法分析指标与容量间的线性关联程度;最后,以健康指标数据作为模型输入,容量数据作为模型输出,适当训练CNN-LSTM 神经网络输出估计结果。
图7 CNN-LSTM流程图
本文以平均绝对误差(MAE)和均方根误差(RMSE)为评价标准量化模型的评估效果和评估性能指标,计算过程如式(18)~(19)所示:
式中:N为样本总数为估计值;yi为实际值。
其中,MAE表示估计误差的平均大小,数值越接近于0,说明估计的准确度越高;RMSE可描述估计值与真实值的接近程度,数值越接近于0,表示估计误差的离散度和收敛性能越好。
由于电池单体具有不一致性,所提取健康指标的变化范围并不相同,为了消除因数据量纲不同产生的差异性,提高模型估计精度。本文在剔除原始数据异常值的基础上,对所提取的健康指标及电池容量数据进行了归一化处理,使数据变化范围均为[0,1]。
正向指标及电池容量处理步骤如式(20)所示:
逆向指标处理步骤如式(21)所示:
Spearman 相关系数法可描述两个变量间的关联程度,对数据条件的要求不高,应用更广。因此,本文通过引入Spearman 相关系数法对所提取指标与电池容量间的线性关联程度作定量评估,计算过程如式(22)所示,结果见表2。
表2 健康指标与电池容量的关系
式中:ρ为相关系数;xi、yi为两个变量中的对应元素分别为xi、yi的平均值。
从评估结果来看,H1~H6指标与电池容量间的相关系数大多在0.9 以上,满足经验解释下的极强相关条件,能够有效用于锂电池SOH估计。
在数据标准化处理的基础上,以H1~H6共六组健康指标数据作为模型输入,电池容量数据作为模型输出,分别取B5、B6、B7 和B18 四组电池的前100 次循环的数据作为训练集,其余数据作为测试集,对CNN-LSTM 模型进行训练,具体参数见表3,B5、B6、B7 和B18 电池的估计结果分别如图8~图11所示,误差情况见表4。
表3 模型参数
表4 误差情况
图8 B5号电池估计结果
图9 B6号电池估计结果
图11 B18号电池估计结果
由图8~11 可知,尽管三种模型输出的估计结果整体上与电池容量真实值的衰退趋势大体相似,但模型误差效果、稳定性情况差异较大。CNN、LSTM 单一模型的估计曲线与真实曲线偏离较大,尤其体现在电池发生“容量自恢复效应”现象时,模型不能很好地描述电池容量的衰退,估计曲线一旦发生偏离,误差将会积攒,导致模型稳定性和精确度下降。相比之下,CNN-LSTM 融合模型结合了CNN 与LSTM 的优势,其估计曲线与真实曲线更接近,能够更加有效地模拟出锂电池的容量衰减情况,稳定性也更好。
由表4 可知,受电池单体不一致性的影响,CNN、LSTM单一模型在四组电池中的估计表现并不稳定,鲁棒性较差,而CNN-LSTM 融合模型在四组电池中均有着很好的估计表现,其MAE最大不超过0.009 4,说明模型估计的准确度很高;RMSE最大不超过0.013 4,说明模型估计误差的离散度和收敛性能也很好。相比于其他方法,如文献[8]中,LSTM 模型MAE为0.021 0,RMSE为0.028 8,以及文献中提到的其他方法,如前馈神经网络(FNN)、CNN,其MAE至少为0.055 7,RMSE至少为0.063 3,本文所提方法平均MAE不超过0.007 8,平均RMSE不超过0.010 3,具有很高的精确度和很好的鲁棒性。
针对锂电池SOH估计精度不高、健康指标单一难以描述电池退化特征的问题,本文提出一种基于多指标的CNNLSTM 锂电池SOH估计模型,从锂电池充电电压、电流和温度数据中,提取H1~H6共六个与锂电池容量衰减密切相关的健康指标,搭配CNN-LSTM 融合模型,实现锂电池SOH在线估计。经过NASA 数据检验,相比于CNN、LSTM 和FNN 等方法,本文所提方法在B5、B6、B7 和B18 号四组电池中均有着很好的估计效果,达到了更高的精确度和更好的鲁棒性,平均MAE不超过0.007 8,平均RMSE不超过0.010 3,能够有效地描述电池容量的退化情况。