基于SVD-SAE-GPR的锂离子电池RUL预测

2023-05-15 12:13董渊昌庞晓琼贾建芳史元浩
储能科学与技术 2023年4期
关键词:特征提取锂离子容量

董渊昌,庞晓琼,贾建芳,史元浩,温 杰,李 笑,张 鑫

(1中北大学计算机科学与技术学院;2中北大学电气与控制工程学院,山西 太原 030051)

锂离子电池因其工作电压高、功率密度大、寿命长等优点,已经成为电动汽车、智能电网和储能系统等众多应用领域的主流能源存储器件[1-2]。然而,随着充放电次数的增加,电池会通过不同的机制退化甚至失效。如果在其达到失效阈值前不及时采取有效措施,可能会导致设备性能退化甚至灾难性事件[3]的发生。因此,研究电池的退化并建立可靠的退化模型以准确预测其剩余使用寿命(remaining useful life,RUL)是非常重要的。

近年来,数据驱动的方法因可以利用历史监测数据直接预测电池的退化趋势而不依赖于复杂的物理模型,在锂离子电池RUL 预测领域受到了广泛关注[4]。目前大多研究定义容量[5]或内阻[6]作为健康因子(health indicator,HI)。然而,容量或内阻的检测对实验条件和仪器设备要求较高,难以实现在线采集[7]。因此,提取易于计算且能量化电池退化状态的HI具有重要的实用价值。Khaleghi等[8]设置电压上下边界并指定固定的采样率从部分充电电压曲线中提取HIs 并用来估计电池健康状态。此外,短放电时间间隔内的电流变化[9]、固定电压间隔的时间差[10]等也可以作为反映锂离子电池健康状态的特征。虽然这些方法[8-10]在提取HI 方面展现了优异的性能,但需要设定固定的时间或电压等参数,这不仅依赖于人为经验,还有可能使特征提取变得复杂。Liu 等[11]分别在NASA 和CALCE 的电池数据集上设置了不同的参数提取相同HI并进行RUL预测,结果表明不同锂电池特征提取参数需求可能不同。Pang 等[12]提取了更敏感的IC 曲线的峰值和峰下的区域面积作为HIs,并对NASA 提供的锂离子电池数据集进行RUL 预测;而Pan 等[13]在CALCE 提供的电池数据集上提取的IC曲线有两个可识别的峰,此特征提取方法显然不适用于不同的锂离子电池数据集。文献[11-13]的特征提取方法虽然可以用于提取HI,但由于电池参数或实验环境的差异,可能不适用于其他锂离子电池数据集。如上所述,传统的特征提取方法通常需要设定参数且适应性较差,因此,本工作的第一个动机是寻找一种能减少或避免参数设定,且对于不同的锂离子电池数据集适应性强的特征提取方法。

基于以上的分析,本工作对电池的原始测量数据重新进行分析,尝试从中获取隐藏的特征信息。根据电池数据的特点,同时考虑到特征值是矩阵的重要信息,本工作将电池数据看作矩阵,从矩阵中计算特征值,然后判断该特征值是否可以作为重要信息来表征电池的退化状态。但电池数据不是方阵,无法获得其特征值,而奇异值分解[14](singular value decomposition,SVD)可以从非方阵中提取奇异值来表示矩阵的重要信息。因此,本文选择SVD从电池数据中计算奇异值作为HIs。同时,考虑到提取的HIs会有一定的冗余性,当作为训练数据时,其维度过高和不足会使模型训练变得复杂且不利于RUL 预测的准确性。因此,本工作的第二个动机是消除HIs不相关信息的负面影响和降低数据维数。在数据去噪和降维方面,主成分分析[15](principal component analysis,PCA)表现出了较好的性能,但它适合于服从高斯分布的数据且只能执行线性变换,缺乏一定的灵活性。堆叠自编码器[16](stacked autoencoder,SAE)可以自动从无标注数据中提取学习特征,给出比原始数据更好的特征描述。因此,选择SAE用于HIs的在线融合。

此外,模型和数据的不确定性可能导致预测可靠性差,因此,在研究锂离子电池的RUL 预测时考虑预测结果的不确定性是非常有必要的。高斯过程回归[17](gaussian process regression,GPR)能够实现任意线性或者非线性系统动态行为特征的建模预测,并能以概率的形式解释预测结果的不确定性。考虑到锂离子电池的退化过程是一个复杂的、动态的、非线性的电化学过程,GPR 方法适合于建立锂离子电池RUL预测模型。

综上所述,本文提出了一种不需要参数设定且对于不同锂离子电池数据集有良好适应性的特征提取策略,从电池数据中提取潜在HIs并进行相关性分析,选择了极强相关性的HIs 进行SAE 数据降维,并将融合的HI结合GPR进行RUL预测。通过两组实验验证了本文所提方法的优越性,一是通过不同的锂离子电池数据集验证了SVD 特征提取方法具有良好的适应性;二是将本文所提的HI、经过PCA融合的HI与其他HI分别训练GPR模型并进行对比,验证了本文所提的HI具有更好的预测性能。

1 特征提取与分析

1.1 实验数据

本工作中选择的电池退化数据集来自NASA PCoE 研究中心[18]。该数据集包含在相同实验环境中收集退化状态数据的4 个18650 型锂离子电池。4 个电池的标称容量为2.2 Ah,标称电压为3.7 V。在充电阶段,以1.5 A 恒流(CC)模式充电,直到电池电压达到4.2 V,然后继续以恒压(CV)模式充电,直到充电电流降至20 mA。在放电阶段,以2 A 的CC 进行放电,直到B0005、B0006、B0007 和B0018 电池的电压分别降至2.7 V、2.5 V、2.2 V和2.5 V。图1为电池实际容量衰减曲线。

图1 4个电池的容量退化曲线Fig.1 Capacity degradation curves of four batteries

1.2 基于SVD的特征提取

在本小节中,首先介绍奇异值分解[19]方法,该方法在本工作中用于特征提取。SVD是一种矩阵分解方法,它可以将复杂矩阵表示为更小更简单的子矩阵的乘法,如图2所示。

图2 矩阵的SVDFig.2 SVD of matrix

假设矩阵A是一个大小为p×q的矩阵,则定义矩阵A的SVD如式(1)所示:

矩阵U的秩为r,U是大小为p×p的正交矩阵,U的列向量称为左奇异向量。∑是一个大小为p×q的矩阵,除了主对角线外,所有元素都为0,它是一个对角矩阵。∑主对角线上的每个元素称为A的奇异值,记为σi(i= 1, …,r)。V是一个大小为q×q的正交矩阵,V的列向量是右奇异向量。将A乘以其转置矩阵AΤ,得到式(2),同理可得与AAΤ相关的式(3)。

可以看出,AΤA和AAΤ的特征向量分别组成了SVD中的矩阵V和U。由于AΤA和AAΤ的特征值均为λ1, …,λr,如式(4)所示。因此,将矩阵A的奇异值记为σi=(i= 1, …,r)。

矩阵奇异值的大小与矩阵中隐藏的重要信息密切相关,信息的重要性与奇异值的大小正相关。可以发现,SVD 在矩阵分解过程中不涉及参数设置,可以实现简单的计算过程,降低特征提取的复杂性,同时避免了对人为经验的依赖。因此,选择SVD用来提取能表征电池退化状态的HIs。

通常情况下,锂离子电池的电压、电流和温度等参数都是可测的,因此首先从12 组测量数据中通过SVD 提取各自的奇异值作为12 个HIs(详细描述见表1)。同时考虑到特征提取对象包含的退化信息对提取出来的HI 量化电池退化状态的能力有重要影响,额外计算了三组特征提取对象,分别为dQ/dV,dV/dQ和dT/dV矩阵。锂离子电池的退化是一个动态非线性过程,降解模式多种多样,如电极材料的机械降解、锂库存损失、活性材料损失等。所有这些退化模式也可以相互影响。dQ/dV、dV/dQ和dT/dV常被用来分析上述相关的退化模式[20-22],因此可以作为反应电池退化状态的特征提取对象,从其中分别提取了HI13、HI14 和HI15。dQ/dV、dV/dQ和dT/dV的计算公式如下。

表1 四个电池15个潜在HIs与容量的Spearman相关分析Table 1 Spearman correlation analysis of 15 potential HIs and capacity of four batteries

其中I,V,t和T分别为放电的电流、电压、时间和温度。

以从B0005 电池的放电电压中提取HI1 为例,使用SVD 从电池数据中提取HI 的过程为:首先,需要将所有放电周期的电压数据看作矩阵并构建成矩阵集,其中c为总放电周期。其次,将所有循环周期的电压数据即矩阵A(i)依次进行SVD。由于每次SVD 的处理对象均为单个周期,所以根据矩阵SVD 原理,所有放电周期都可以得到一个代表其特征信息的奇异值σi。最后,从所有放电周期提取出来的奇异值σi则可以构成HI1,表示为。其他特征提取对象的SVD与之同理。

1.3 特征评估与特征选择

特征融合是HI 构建的关键一步,为了得到与容量相关性更强的HI,在融合之前需要对提取出来的潜在HIs进行定量评估和特征选择。考虑到本工作使用的数据不符合正态分布,选择Spearman相关系数来衡量HIs 的相关性。15 个潜在HIs 与容量之间的相关性分析表为表1。根据表1 中的相关系数绝对值,选择相关性极强(1~0.9)的HIs 进行之后的特征融合。B0005、B0006 和B0007 选择HI1、HI2、HI4、HI5、HI6、HI8、HI11、HI13 和HI15这9个HIs进行融合。B0018选择除了HI14之外的14个HIs进行融合。

1.4 基于SAE的特征融合

SAE也叫深度自动编码器,是可以用于降维和特征提取的无监督神经网络。SAE是多个自动编码器(autoencoder,AE)的叠加,它克服了单层编码器不能有效提取复杂特征的缺点。使用SAE对1.3节中选择的相关性极强的HIs进行处理,以降低维数和噪声。SAE 的具体结构如图3(a)所示。将两个SAE 堆叠成一个栈式自编码器进行二阶参数融合,结构如图3(b)所示。具体的融合过程为:首先让初始参数作为图3(a)SAE结构的输入和输出,进行网络编码与解码,得到输入层到h(1)层的网络参数,训练完后留图3(b)所示的输入层至h(1)层,隐藏层输出为一阶融合结果。将其结果作为图3(a)所示结构的输入与输出,隐藏层节点数设定为1,使融合结果为一个序列。融合过程与一阶相似,去除解码层后的隐藏层输出即为二阶融合HI。

图3 堆栈式SAE:(a)SAE结构;(b)栈式自编码结构Fig.3 Stacked SAE: (a)SAE structure; (b) Stack autoencoder structure

其中m表示融合特征的个数;n表示输入输出的节点个数;f(·)表示节点激励函数;b1和b2均为权值。编码阶段主要是将n维输入样本xi通过编码激励函数映射成m维的hj,解码阶段是将hj重新映射为n维的x̂k。

为了进一步分析融合HI 量化电池退化状态的能力,对融合HI 进行了定量与定性分析。定量分析结果在表2 给出,同时为了检验结果的显著性,使用p 值法进行了显著性检验。从表中可以看出,四个电池融合HI 的Spearman 相关系数均大于0.99,且p值也远小于0.01,表明融合HI与容量之间显著相关。定性分析的结果在图4中给出。通过分析图4可以得知四个电池融合HI的曲线与原始容量曲线的退化趋势基本一致。结合定量与定性分析结果,可以得出结论,融合HI 可以很好地表征电池的退化状态。

图4 融合HI定性分析:(a)B0005; (b)B0006; (c)B0007; (d)B0018Fig.4 Fusion HI qualitative analysis: (a)B0005; (b)B0006; (c)B0007; (d)B0018

表2 四个电池融合的HI与容量的Spearman相关分析Table 2 Spearman correlation analysis of fused HI and capacity of four batteries

2 方法论

2.1 GPR

GPR 模型是一种非参数模型,可通过先验知识实现贝叶斯框架下的状态预测,估计后验分布,输出预测均值和方差,并通过95%(或其他值)的置信区间来表示预测的不确定性。高斯过程记作如下形式:

其中m(x)为均值函数、k(xi,xj)为协方差函数。具体如下所示:

协方差函数用于捕获不同输入之间的相似性。超参数通常通过边概率的最大似然估计来优化。根据训练数据和测试数据构造先验分布,利用贝叶斯理论得到预测的后验分布:

其中x,y为训练样本的输入和输出,x*,y*为测试样本的输入和预测输出,ŷ*为预测均值,σ2(y*)为预测方差。

通过95%的置信区间(CI)用于预测结果不确定度的评估:

2.2 基于SVD-SAE-GPR的建模过程

本节将SVD、SAE 和GPR 相结合,提出了一种新的SVD-SAE-GPR锂离子电池RUL预测方法。具体流程如图5所示,可分为四个步骤。

图5 基于SVD-SAE-GPR的锂离子电池RUL预测流程图Fig.5 Flow chart of RUL prediction of Li-ion battery based on SVD-SAE-GPR

步骤1:SVD特征提取。首先对电池的测量数据进行SVD,将各自的奇异值作为12 个潜在HIs;其次根据电流,时间,电压和温度等参数,计算dQ/dV,dV/dQ和dT/dV矩阵,并使用SVD从中提取HI13,HI14和HI15。

步骤2:特征选择和特征融合。通过Spearman 相关分析从步骤1 中的15 潜在HIs 中选择相关性极强的HIs进行特征融合。通过SAE处理选择的HIs融合成一个HI。

步骤4:计算RUL 预测值。剩余寿命(NRUL)为电池实际容量下降到阈值时的总充放电循环次数(NEOL)与电池当前充放电循环次数(NECL)之差。计算公式如式(15)。

2.3 预测性能评价指标

为了评价本文所提方法的预测性能,分别采用均方根误差(root mean square error,RMSE)、决定系数(R2)、绝对误差(absolute error,AE)三种评价指标。

3 结果与讨论

3.1 锂离子电池RUL预测结果

为了分析该模型的RUL 预测性能,设计了不同预测起始点的实验。实验设置:选取前59 个周期和前79 个周期的数据作为训练集,即预测起点分别为60 和80。电池的故障阈值为额定容量的70%~80%。本工作中,电池B0005、B0006 和B0018的容量故障阈值为1.38 Ah。由于B0007 电池未达到故障阈值,因此未给出故障阈值线。

图6 分别给出了四个电池在预测起始点60 和80 处的预测结果及其不确定性表达。从整体上可以看出,预测曲线与真实的容量退化曲线较为接近,预测结果受预测起始点的影响较小,且四个电池在预测起始点80 时的预测曲线比在预测起始点60时更接近真实容量退化曲线。

图6 四个电池在不同预测起点的预测结果及不确定性表达Fig.6 Prediction results and uncertainty expression of four batteries at different prediction starting points

此外,表3给出了四个电池的不同预测起始点的预测性能评价结果,从表中可以看出,预测起始点为80的预测误差均比预测起始点为60的预测误差小,且四个电池的RMSE 均小于0.0301,说明所提模型的预测性能较好;四个电池的R2均大于0.93,说明预测曲线与实际曲线的拟合程度较高;随着预测起始点的后移,B0005、B0006和B0018三个电池的AE 值逐渐减小。在预测起始点为60 时,三个电池的AE 值均小于6,误差值较小;而且随着预测起始点的后退,在起始点为80 时,AE值逐渐减小,均不超过2。

表3 四个电池在不同预测起始点的预测性能Table 3 Prediction performance of four batteries at different prediction starting points

3.2 SVD对不同电池数据集的适应性

为了验证SVD 特征提取方法对不同锂离子电池数据集的适应性,本小节的实验额外选择了麻省理工学院[23](Massachusetts Institute of Technology,MIT)提供的电池数据集,其中电池参数和实验环境与NASA提供的电池数据集不同。首先详细描述了用于测试的电池数据集。然后,仍然使用SVD 提取HIs。最后,利用GPR进行容量预测。

3.2.1 MIT数据集

测试电池是由A123 Systems 公司(APR18650 M1A)制造的磷酸锂离子(LFP)/石墨电池[24-25],放置在30 ℃的强制对流温度室中,在充电阶段以不同倍率的恒流快充组合形成 72 种充电模式,放电过程统一采用4 C倍率。电池标称容量1.1 Ah,标称电压3.3 V。选取“2017-06-30”第二批数据中的两组数据Channel 2 (CH2)和Channel 5 (CH5)进行实验。CH2 和CH5 的原始容量退化轨迹如图7所示。

图7 CH2和CH5的容量退化曲线Fig.7 Capacity degradation curves of CH2 and CH5

3.2.2 特征提取、选择与融合

对于CH2 和CH5,使用相同的SVD 分别从测量数据、dQ/dV、dV/dQ和dT/dV中提取各自的奇异值作为HIs。dQ/dV在数据集中已经给出,dV/dQ和dT/dV需要计算才能得到。在计算dT/dV时,由于同一周期内某些相邻时间点采集的相同电压值会导致dT/dV的值无效,因此将重复的电压数据和其相应测量时间对应的温度数据去除。对提取出来的潜在HIs 进行Spearman 相关分析,分析结果如表4 所示。可以看出除了HI8 之外,其余7 个潜在HIs与容量之间的相关系数绝对值均大于0.9,属于极强相关。因此,根据相关系数选择除HI8之外的7个HIs使用SAE融合成一个HI。为了分析融合HI表征电池退化状态的能力,计算了它的Spearman相关系数和p值,具体结果在表5 中给出。从表5中可以看出,融合HI与容量之间的Spearman相关系数均大于0.99,p值接近于0,表明融合HI 与容量显著相关。

表4 CH2和CH5容量与潜在HIs的Spearman相关分析Table 4 Spearman correlation analysis between capacity and potential HIs of CH2 and CH5

表5 CH2和CH5容量与融合HI的Spearman相关分析Table 5 Spearman correlation analysis of capacity and fused HI of CH2 and CH5

3.2.3 容量预测

预测部分选用GPR 进行建模。以融合HI 作为训练数据,以容量作为输出数据,构建基于GPR的容量预测模型。根据CH2 和CH5 的数据大小,分别选择前500和100个周期的数据进行训练。预测结果如图8所示,可以发现预测曲线能够相对准确地接近真实容量退化曲线。预测性能评价结果如表6所示。从表中可以看出,CH2和CH5的RMSE均小于0.008,R2均大于0.94,说明本工作模型具有较好的预测性能,预测曲线与实际曲线吻合较好。

表6 CH2和CH5的预测性能Table 6 Predicted performance of CH2 and CH5

图8 CH2和CH5的容量预测结果及不确定性表达Fig.8 Capacity prediction results and uncertainty expression of CH2 and CH5

综上所述,通过在NASA和MIT提供的电池数据集实验,可以得出SVD可以用于提取HIs,并且在避免人为设置参数的情况下,对不同电池数据集具有良好的适应性。此外,融合的HI 具有较强的相关性和较好的预测性能和准确性。

3.3 不同HI的对比试验分析

为了更充分地说明利用SVD方法从测量数据、dQ/dV、dV/dQ和dT/dV中提取潜在HIs,选择极强相关的HIs 使用SAE 进行特征融合并结合GPR预测模型(命名为M1)的有效性和优越性,设计了比较模型M2和M3。其中模型M2通过PCA融合模型M1中选择的极强相关的HIs。模型M3使用的HI为放电阶段电压从3.8 V 降到3.5 V 的等压降放电时间。在预测阶段,模型M1、M2 和M3 均采用GPR,具体模型描述如表7所示。

表7 对比实验中使用的预测模型(M1、M2和M3)Table 7 Prediction models used in comparison experiments (M1, M2 and M3)

模型M1、M2 和M3 对B0005、B0006、B0007和B0018电池的预测性能如表8所示。可以看出,对于模型M1,电池B0005、B0006、B0007和B0018的RMSE分别为0.0062、0.0267、0.0070和0.0066,四个电池的RMSE 均小于模型M2 和M3,且模型M2 的RMSE 也均小于模型M3。在模型M1 下,除B0007 外的三个电池的AE 值分别为0、2 和1,也均小于模型M2 和模型M3 的AE 值。而且,模型M2 除了B0018 的AE 值比模型M3 大1之外,模型M2 也比模型M3 具有优势。从RMSE和AE 可以看出,模型M1 比模型M2、M3 具有更好的预测精度,且本文提取的HIs经过PCA融合后的预测性能也优于其他HI。模型M1的四个电池的R2分别为0.9946、0.9400、0.9893 和0.9572,明显大于模型M2 和M3 电池的R2,这充分说明模型M1 的预测结果比模型M2、M3 能更好拟合原始退化曲线。此外,除了B0018之外,模型M2的其余三个电池的R2也均明显大于模型M3,表明经过PCA 融合后的HI 的预测结果与原始曲线的拟合程度优于模型M3的HI。对比实验结果表明,同样的HIs 经过SAE 融合之后比经过PCA 融合的HI 预测性能更好,说明SAE 用于特征融合的效果优于PCA。此外,本工作提取的潜在HIs经过融合之后的HI 预测性能优于其他HI,说明了本工作提取的HIs的有效性与优越性。

表8 不同模型(M1、M2和M3)的预测性能Table 8 Predicted performance of different models(M1, M2 and M3)

4 结论

本文提出了一种基于SVD-SAE-GPR的锂离子电池RUL 预测方法。主要贡献如下。首先,为了解决传统特征提取方法依赖于参数设定且对于不同锂离子电池数据集适应性差的缺点,将SVD 用于特征提取解决上述问题。然后,从原始测量数据和计算出的包含更多退化信息的特征提取对象中提取了15 个潜在HIs。考虑到HIs 的冗余和不足会影响RUL 预测,将Spearman 相关分析和SAE 用于处理潜在HIs 得到一个融合HI。最后,将融合HI 与GPR 相结合进行RUL 预测,并给出结果的不确定性表达。在验证阶段,在NASA和MIT提供的电池数据集上的实验结果说明了该特征提取策略的有效性和适应性。通过与PCA融合HI和其他HI进行比较,验证了所提HI 的优越性。综上所述,SVD 特征提取方法具有良好的适应性,提取出的潜在HIs使用Spearman 相关分析和SAE 得到的融合HI 具有较好的预测性能,所提出的RUL 预测框架具有较高的精度且输出概率等优点。本文的方法也具有一定的局限性。比如,锂离子电池的实验室数据根据实验条件和测量仪器的不同,测量出来的数据可能会存在差异,而这些差异是否影响SVD 特征提取,是否需要对数据做进一步的处理,是需要通过具体的测量数据进一步研究的。此外,在电池出厂之后,无法获得实验室数据的情况和在使用阶段比较复杂的工况下,测量数据可能有一定的难度,因此该方法适用性需进一步探究。

猜你喜欢
特征提取锂离子容量
高能锂离子电池的“前世”与“今生”
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
2015年上半年我国风电新增并网容量916万千瓦
2015年一季度我国风电新增并网容量470万千瓦
基于MED和循环域解调的多故障特征提取
改进等效容量法在含风电配网线损计算中的应用
锂离子电池组不一致性及其弥补措施
锂离子的萃取和反萃研究
锂离子电池基础科学问题(X)——全固态锂离子电池