陈 锐,丁 凯,祖连兴,许青松,王宗标,罗大思,苏敬江,胡 圣,毛冀龙
(1长园深瑞能源技术有限公司,广东 珠海 519000;2强电磁工程与新技术国家重点实验室(华中科技大学),湖北 武汉 430074)
在双碳目标的背景下,国家大力扶持新能源,电池储能因其能量密度高、污染低、使用寿命长的特性而得到了迅速发展[1]。在基于电池的能源系统中,电池系统的健康状态(state of health,SOH)是一个非常重要的监控值[2]。电池的SOH预测指的是依照电池的历史运行数据预测接下来一段时间内的电池健康状态并给出寿命终点(end of life,EOL)预警[3]。EOL 指的是电池到达一个濒临不稳定的状态,一般来说,当电池达到EOL 时,电池容量会迅速退化,影响设备的工作效率[4]。因此,准确预测SOH 有助于优化设备的使用,甚至避免事故发生。
然而,锂电池复杂的内部化学结构和不同的工作环境导致锂电池的降解过程相当复杂。因此,很难准确预测锂电池的SOH。目前,SOH 预测研究按照预测模型的不同可以分为以下两类;①基于物理模型的方法。基于物理模型的方法基于电池的物理化学现象并进行建模[5]。该方法在熟悉电池内部反应的基础上能够提供电池退化的物理解释。其主要方法主要包括等效电路模型,电化学模型和经验退化模型[6],但是由于电池内部的化学相互作用较多,很难从单一的反应推断全局,考虑所有的化学反应又不切实际。同时,模型的建立依赖于电池的内部参数,而内部参数在外部很难观测到,这也进一步影响到了该方法的实用性。②数据驱动的方法。与基于模型的方法相比,数据驱动的方法既不考虑电池的内部反应,也不分析电池失效的原因,而是将电池系统视作黑盒,从电池的历史数据中发现并学习电池的退化规律进行预测。因此,数据驱动方法被广泛应用于锂离子电池SOH 预测中,包括神经网络[7]、支持向量机(SVM)[8]、高斯过程回归(GPR)[9]、相关向量机(RVM)[10]等。其中基于神经网络方法的电池寿命预测是当前的学术热点问题。为了实现更稳健的SOH预测,文献[11]使用深度神经网络来估计电池的充电曲线并由此计算电池的SOH。文献[12]结合卷积神经网络与双向长短期记忆网络用于电池的RUL预测。文献[13]使用长短期记忆网络与自回归嵌套序列模型聚合信道和周期信息来对健康状态预测。文献[14]综合残差神经网络和双向长短期记忆网络的并加入注意力机制来对电池进行预测。通常,这些方法基于电池在较长时间内退化的信息来预测SOH,但是基于RNN 结构的神经网络不可避免地会陷入长期依赖性问题,较长时间段内的退化信息会影响其预测的性能。基于注意力结构的Transformer 模型[15]则最近被提出用于序列建模,并正在逐步探索其他用途,包括机器翻译、音乐生成等。Transformer 网络模型通过使用自注意机制完全抛弃了传统的水平方向的RNN 传播,通过连续叠加自注意层仅在垂直方向传播。这样,每一层的计算都可以并行执行,并且可以通过GPU来加速。
电池容量再生是估计SOH 需要考虑的一个因素[16]。容量再生表现为电池下一次循环可用容量的突然增加,其特点是短暂且迅速。容量再生增加了容量预测的不确定性。因此,在预测电池寿命时,需要考虑到电池容量再生对于预测的精度影响[17],针对此种现象,文献[18]利用EMD 分解进而建立基于高斯过程回归的锂离子电池SOH 预测模型。文献[19]使用EMD分解之后得到的各个子序列建立自回归移动平均(ARMA)模型。而基于EMD改进的互补集合经验模态分解(complementary ensemble empirical mode decomposition,CEEMD)在电池健康状态预测中也有应用[20],相较于EMD 能实现更为准确的预测精度。
本文设计了一种基于AED-CEEMD-Transformer的网络模型。首先,平均欧几里得距离(average euclidean distance,AED)被用于从历史测试数据库中挖掘与目标电池最相似的测试数据,然后补充待预测电池的短期测试数据来作为训练集。最后,通过应用互补集合经验模态分解(CEEMD)技术,将原始SOH 数据序列分解成具有不同频率的几个分量和一个残差。前者包含关于容量再生的信息,后者包含关于寿命退化趋势的信息。为了解决长期依赖的问题,采用Transformer 模型分别对寿命退化部分和容量恢复部分进行预测。最后,将这两个预测组合起来,以获得最终的容量预测输出。为了验证所提出方法的有效性,我们将所提网络模型所获得的结果与常用的几种神经网络模型得到的结果进行了比较以验证方法的有效性。
为了减少输入数据分布变化对神经网络的影响,必须对数据进行归一化。设x={x1,x2…xn}表示长度为n的容量输入序列,使其映射为(0,1]:
其中C0表示额定容量。
给定电池平台中具有相同阴极材料系统的电池,它们的容量数据存在一定的相似性。迁移性测量用于测量目标电池和电池平台中的其他电池之间的容量退化曲线的相似性。选择作为参考电池的电池与目标待预测电池相较于其他电池应该最相似,并且具有最高的可转移性,这意味着目标电池和参考电池的曲线不仅应该彼此接近,而且应该具有相似的趋势。选取更好的参考电池的容量数据可以减少训练集数量并减少训练时间。
通常,迁移性测量是基于相似性测量方法设计的,该方法可以从许多电池中迅速找到最适合目标电池的参考电池,已经有学者提出了各种相似性测量方法,包括马氏距离(Mahalanobis distance)以及欧几里得距离(Euclidean distance)等。本文使用平均欧几里得距离(Average Euclidean distance,AED)测量方法来评估电池平台下多种电池之间的曲线距离和趋势相似性。
欧几里得距离是一种几何距离测量,由欧几里得空间中两点之间的距离导出。作为计算距离的自然度量,它有多种应用。通过欧几里得距离测量的两个电池SOH变化趋势的相似性可以定义如下:
式中,EDobj,k是目标电池与电池平台中第t个电池之间的欧几里得距离,Cobj是包含目标电池的容量数据{cobj,1,cobj,2…cobj,n}的容量向量,Ct是包含第i个电池{ct,1,ct,2…ct,n}的容量向量,n代表容量曲线包含从1到n个循环的数据。
为了消除容量向量的长度(n)变化引起的可转移性测量结果EDobj,k的波动,在欧几里得距离中引入平均运算,得到基于AED 的迁移性测量方法。在电池数据库中,任意两组电池的n维容量向量之间的AED由式(3)给出
在模型训练之前,使用公式(3)计算目标电池和电池平台的历史数据库中的每个电池之间的所有AED,并按升序排列,以选择距离最小的电池作为参考电池。由于结合了欧几里得距离和平均计算操作过程,通过曲线接近度和趋势一致性可以容易地选择与目标电池具有更好曲线接近度和趋势一致性的参考电池。通过使用所选取的参考电池来训练模型,避免了用整个电池数据库来训练模型,减少了模型的训练量,同时也减少了训练时间,提高运算效率。
互补集合经验模态分解(complementary ensemble empirical mode decomposition,CEEMD)是在经验模态分解(empirical mode decomposition,EMD)的基础上改进而来。EMD 是一种经典的具有处理非线性和非平稳数据的方法[21]。该方法基于瞬时频率和本征函数(intrinsic mode function,IMF)的概念,假设一个时间序列中同时存在许多不同的模态,通过筛选过程将模态提取并逐步分解为有限个独立的固有模态函数分量和平滑趋势分量。由于EMD 的实现依赖于信号自身的时域特征而没有预定义的基函数,因此它的实现简单且具有自适应性。
然而,EMD 方法的局部特性可能在一个模态中产生尺度非常不同的震荡,或者在不同模态中产生尺度相似的震荡,具有“模式混合”的缺点,为了解决这个问题,有学者提出了一种名为集合经验模式分解(ensemble empirical mode decomposition,EEMD)的噪声辅助数据分析方法,其中真实分量是集合试验的平均值,每个试验都是添加白噪声数据的EMD 结果。然而,随着平均次数的增加,EEMD 方法的实现变得耗时,此外,添加白噪声的幅值和迭代次数依靠人为的经验设置,而不是自适应添加,设置不当时,平均次数一般在几百次,非常耗时。文献[22]提出了CEEMD 方法,该方法在每个分解阶段的残差中加入正负成对的自适应辅助白噪声,克服了重构误差大、分解完备性差的问题,同时减少了平均次数到几十次,可以以较低的计算成本提供更好的分解结果[23]。
在RNN 结构中,受链式结构影响,每一个隐状态都依赖于前一步的隐状态,必须从前向后必须逐个计算,每次只增加单个步长,这带来了长期依赖性问题,为了避免这一问题,伴随着深度学习方法的发展,使用基于Transformer 网络模型来进行序列的预测逐渐受到了学者们的关注,Transformer 网络模型首次被提出是应用于自然语言的处理[15],随后拓展到了计算机视觉等相关的领域。与传统的RNN 网络模型不同,Transformer模型没有必须从前向后逐个计算这样的约束,输入序列可以被并行处理,由此获得了更快的训练速度。同时,Transformer 模型也具备了更强的长期依赖建模能力,更适用于处理长序列相关任务,能解决类RNN 模型面对长序列时无法完全消除梯度消失和梯度爆炸的问题。在时间序列上下文依赖方面,Transformer 可以同时建模长期依赖和短期依赖。
1.4.1 注意力机制
注意力机制通过学习输入元素的相关性,使得神经网络架构能够自动权衡任意输入的局部相关性,并在执行序列处理计算时考虑这种权重。其核心思想是计算输入序列的权重分布,为更相关的元素分配更大的权值。简而言之,注意力机制是将一组键(Key)、值(Value)向量对和查询(Query)向量经过计算后得到相应的输出(Output)。
在计算过程中,首先需要将查询和每个键进行相似度计算得到对应的权重,如公式(4)所示,用来计算相似度的函数选择包括点积、拼接、感知机等。其中Q表示查询,K表示键。
接着使用softmax 函数对上述权重做归一化处理:
最后,将归一化后的权重和相应的值进行加权求和得到最后的注意力计算结果:
通过注意力机制的加入,模型能更好地提取对当前任务更关键的信息并忽略不重要的信息以更好地匹配当前的计算任务。
1.4.2 自注意力机制
相较上文提到的注意力机制,Transformer模型使用中的自注意力(self-attention)机制更好地解决了长距离依赖的问题。在Transformer中,对于给定的查询Q ∈RN×Dk、键K ∈RM×Dv、值V∈RM×Dv,有缩放点击注意力定义:
其中N和M表示查询和键(或值)的长度,Dk、Dv表示键(或查询)和值的维度。缩放因子1/用于归一化,使得训练过程中梯度保持稳定,从而避免梯度消失问题的出现。
不同于其他模型只使用单个注意力模块,Transformer 使用多头注意力模块并行运算,其中Dm维的原始查询、键和值矩阵分别用学习到的H个不同的向量投影到Dq、Dk和Dv维空间。根据公式(8)对每个投影查询、键和值计算,分别输出注意力权重。然后,模型将所有输出连接起来并将它们投影回Dm维表示。
1.4.3 位置编码
Transformer 模型依靠其精巧的自注意力并行结构,可以进行并行计算并解决了长期依赖性问题,获得了远超同规模LSTM模型的训练速度,但是由于并行计算结构,也带来了上下文关系注入问题。对于Transformer 模型而言,序列的顺序关系无法进行直接获取,自注意力模块在计算注意力分布时只能给出输出向量和输入向量之间的权重关系,而不能给出位置信息,因此,需要引入位置编码矩阵P。
如公式(9)所示,PE为二维矩阵,维度跟输入矩阵的维度一样,2i表示偶数位置,2i+1表示奇数位置,pos表示数据点在整个序列中的位置,其特征维度为dm。
1.4.4 损失函数
在神经网络中的训练阶段,数据集的某个批次输入模型之后得到输出,即当前模型的预测值,为了提高模型的预测精度,需要利用损失函数的反向传播来更新调整模型的参数,其中,损失函数用来计算得到预测值与真实值之间的损失值。经过模型的更新迭代,损失值会越来越小,小于给定的值或者训练的代数达到终点之后,停止训练。本文采用的损失函数如公式(10)所示。
为了具现模型进行SOH 估计的科学性和精确性,使用均方根误差和平均绝对百分比误差指标组合进行比较。
均方根误差(root mean squared error,RMSE)作为模型对电池SOH估计的评价指标,如公式(11)所示。
平均绝对百分比误差(mean absolute percent error,MAPE):在标准操作条件下,锂离子电池实际容量的预测值与实际容量的真实值之间的误差的绝对值,作为真实值的百分比。
本文所提出的SOH 预测的流程如图1 所示,其主要步骤如下:
图1 整体预测方法框架Fig.1 The overall forecasting methodology framework
(1)准备阶段:根据待预预测电池前n个循环的容量数据,对比电池数据库中其他电池前n个循环的历史容量数据,使用AED 方法遍历数据库寻得AED 得分最高的电池组,他们具有和待预测电池相近的容量变化趋势。将电池组的容量数据和待预测电池的容量数据依图2 划分为训练集以及测试集。
图2 数据划分流程Fig.2 Data Segmentation Process
(2)训练阶段:将训练集标准化之后,进行CEEMD 分解,成N个IMF 分量以及一个残值,然后将每条分量分别进行Transformer 网络建模,得到每个分量所对应的神经网络模型。
(3)预测阶段:将测试集标准化之后输入模型,得到所预测的第n个循环的SOH 值,并更新输入量,继续预测第n+1 个循环的SOH 值,依次循环直到达到电池的寿命终点。
(4)评价阶段:将预测的SOH 值和真实的SOH 值之间进行评价指标的计算,作为所提出模型的性能的评价指标。
本文的数据划分流程如图2所示,其中,待预测电池的数据按照图示划分为训练集以及测试集,电池组的数据全部划分为训练集。输入层单次输入数据量由滑动窗口L控制,L取为64。
结合上文所提模型结构,本文提出基于AEDCEEMD-Transformer 的网络模型:首先将待预测电池的容量数据按照一定的比例分为训练集和测试集,根据测试集的容量数据,利用AED 方法找出电池平台中具有相似容量退化趋势的电池数据与待预测电池的循环测试数据一起组成完整的训练集,然后利用CEEMD方法将初始容量数据分解成容量再生部分以及退化趋势部分,对这两部分分别打包成训练集并分别使用Transformer 模型进行训练,最后为了验证模型的有效性,将测试集用于误差验证。
本文选取的电池数据库来自于斯坦福大学[24],共选取由124个在快速充电条件下循环失效的商用锂离子电池。这些锂离子磷酸盐(LFP)/石墨电池由A123 Systems(APR18650M1A)制造,在设置为48 ℃的恒温室中循环。电池的标称容量为1.1 Ah,标称电压为3.3 V。
电池集使用不同的充电策略:一步或两步快速充电策略进行充电。之后电池以1C 的速度进行恒流(CC)-恒压(CV)充电,上限和下限截止电压分别为3.6 V和2.0 V。充电阶段结束之后所有电池以相同的4C的速率进行放电。
电池共有三个批次,本文分为A、B、C三组,三组电池循环实验的时间不同。图3(a)展示的是随着循环次数的增加,电池的容量随之下降的曲线图,可以看出,在电池的循环寿命方面,有部分电池的容量迅速下降,有些下降则没有那么明显,不同电池之间的容量退化趋势有很大的差异性,但是也可以看出,循环寿命相似的曲线之间往往趋势也是相似的,这说明如果在预测目标电池的SOH时,找到一个退化趋势与之相近的电池能起到很好的参考作用;在单一容量曲线方面,虽然容量总体呈下降趋势,但是在小范围内有容量的恢复波动,这也是上文所说的容量再生现象。
图3 电池容量退化曲线Fig.3 Battery capacity degradation curve
图3(b)给出的是三组电池的循环寿命的箱线图,图中,橙色的线是中位数,其余分别指上下四分位数,极值,圆圈表示的是异常值。三组电池之间表现了很明显的寿命差异,尤其是B组电池的寿命明显小于其他两组,寿命分布于[300,600]区间,不及其余组别电池的一半,但是其电池之间有最强的相似性,分布区间很小。其余两组电池寿命的分布差异则很大。
为了剥离出电池容量曲线中的容量再生部分以及退化趋势,使用CEEMD方法对电池容量曲线进行分解得到多段本征函数以及残值。为证明其有效性,图4 展示的是某一电池经过CEEMD 分解之后所得到的各个分量图。经过分解之后,有4个IMFs和一个残值。IMF1、2、3 都具有高频率的波动,其相应地反映了高频容量再生,IMF4 的频率波动相对较低。通常来说,多个IMF值一起显示电池的容量再生现象,我们可以用IMFs 来描述容量再生现象。残值则与原始SOH 值一起绘制在图的最下方。为了定量分析原始的SOH 值与残值之间的相关性,本文使用皮尔逊相关性分析两条曲线,其相关系数为0.9949,这意味着残值足以准确描述电池的退化趋势[25]。
图4 CEEMD分解图Fig.4 CEEMD decomposition diagram
抽取电池数据库中A、B、C 三组,每组别的前2 个电池共6 个电池进行验证,并分别使用每个电池的前30%、50%、70%数据作为训练集,为了验证本文所提模型的预测能力,分配相同的训练集,使用LSTM、RNN、GRU 等网络模型进行相同的寿命预测并对比分析,为了对比的严谨性,所有模型统一以MAE 作为损失函数进行编译,并采用Adam 优化器,学习率设置为0.001,epoch设置为500。输入模型的容量向量均为64个循环长度。对比结果如图5 所示。图中,每行为不同电池的预测结果,数据的比例按列区分,红色的竖直虚线是预测的开始点。从图中可以看出,本文所设计模型所预测的容量曲线与真实的容量曲线较为接近,并且所预测电池的循环寿命次数范围分布从400 到1000 不等,证明在较大的寿命区间内,我们所提方法均有效,有较强的适应性。而其他方法与真实值相比有较大的波动。
图5 电池估计结果Fig.5 Battery estimation results
为了具体展示多种方法之间的预测性能差异,我们还使用两个预定义的指标来评估所提出的方法的预测性能,评估公式如式(10)、(11)所示,具体误差值如表1 所示。以电池A0 为例,在30%训练集时,RMSE、MAPE 的误差分别为4.59%和3.33%,小于LSTM、RNN、GRU 三种方法的RMSE 误差:4.98%,5.13%以及5.33%。表中已经把最小的值加粗显示,可以看出,在不同的训练集比例以及不同的电池下,我们所提方式均有较小的误差数值,这证明,我们所提方法有较强的预测性能,并且不受训练集比例以及电池种类的影响,在不同情况下均能实现寿命预测。也可以看出LSTM作为常用的预测模型的优势:比剩余的两种方法的精度更高,但是LSTM 是在基于RNN 模型的基础上进一步发展而导致其也具有长期依赖性的缺点,实际预测效果也表明了长期依赖性的负面影响。
表1 多种方法估计误差指标对比Table 1 Comparison of multiple methods for estimating error metrics
2.1 节的电池数据库中电池之间的差异来自于充电策略的不同,为了验证本文所提方法应用在其他循环策略的电池数据库上的有效性,使用马里兰大学先进生命周期工程中心(center for advanced life cycle engineering,CALCE)电池数据集中CS2_33、 CS2_34、 CS2_35、 CS2_36、 CS2_37、CS2_38(分 别 用CS1、CS2、CS3、CS4、CS5、CS6表示)共6个电池的充放电实验数据[14]作为模型的输入数据。电池在放电策略上存在差异,并使用0.5 C恒定电流充电。
同上文一样分别选取电池前30%、50%、70%数据作为训练集进行预测,预测结果如图6 所示,由图6 可知,本文所提AED-CEEMD-Transformer网络模型对来自CALCE 电池数据库的6 种型号电池的SOH 估计均有很好的预测效果。表2 所示为本文模型在CALCE 数据集测试的评价指标。可以看出,除了CS1 电池的RMSE 较大,大于0.03 之外,其余5种电池的RMSE和MAPE均较低,通过本文所提模型在CALCE 电池数据集上的预测结果分析可知,在不同放电策略的数据集下,本文所提网络模型有良好的预测精度,能实现多种放电策略之下的电池SOH估计预测。
表2 CALCE电池估计误差Table 2 CALCE cell estimation error
图6 CALCE电池估计结果Fig.6 Estimated results for CALCE cells
在本工作中,我们提出了一种基于AEDCEEMD-Transformer 网络模型的锂离子电池SOH预测方法。该方法由三部分组成,其中AED 用于从电池平台中寻找与目标电池最为相似的参考电池,该步骤可以减少训练集来加快预测效率;CEEMD 用于将电池的容量曲线分解成容量再生曲线以及退化趋势部分,增加预测精度;相较于常见的RNN、LSTM 等神经网络模型,Transformer网络模型摆脱了链式结构,避免了长期依赖性等弊端,并且可以进行并行计算加快模型训练进度。为了验证所提出方法的有效性,我们使用了来自斯坦福大学的大型锂离子电池数据集,其电池以不同的充电速率降解,以及斯里兰卡大学的数据集,其电池以不同的放电速率降解。结果表明,与其他机器学习方法相比,该方法显著提高了预测性能。