陆 楠,孙 越,彭 鹏,2,熊 瑞(中国电源学会会员),孙逢春
(1.北京理工大学机械与车辆学院,北京 100081;2.南方电网调峰调频发电有限公司储能科研院,广州 510630)
锂离子电池被广泛应用于电动化交通、电池储能和便携式电子设备,然而锂作为一种稀有金属元素,储量有限,难以满足锂电池技术带来的日益增长的能源需求[1]。钠盐储备丰富和工作原理相似促使钠离子电池成为大规模储能领域的重要备选技术。相较于锂离子电池,钠离子电池在资源和安全方面具有明显优势。钠储量丰富,占地壳元素总含量的2.83%,远高于锂的丰度(0.01%)[3]。然而,作为复杂电化学系统,钠离子电池工作过程中存在各类副反应,使其随时间推移和循环工作产生不可避免的性能衰退,从而使储能设备、电动汽车等用电器的性能大打折扣,甚至危及安全[4]。因此,探究如何精准高效估计钠离子电池健康状态SOH(state of health)是确保其安全高效应用的基础。
电池健康状态,描述电池当前性能与初始性能之比,是评估电池老化程度的量化指标[5]。现有SOH估计方法主要分为三大类:测量分析法、自适应算法和数据驱动法。测量分析法通过对电流、电压和阻抗等参数的分析辨识电池SOH;自适应算法基于模型构建状态空间方程,将容量或内阻视为待估计参数,结合观测器或滤波器实时更新SOH[6];数据驱动法则运用机器学习算法挖掘电池老化敏感参数并映射到SOH,常用算法包括高斯过程回归GPR(Gaussian process regression)、神经网络、支持向量机SVM(support vector machine)等[7]。Feng 等[8]基于小波分析的GRP 模型预测钠离子电池SOH,其单步SOH 预测均方根误差为0.8%,展示了数据驱动法在电池SOH 估计方面的潜力和有效性。
目前,钠离子电池老化研究处于起步阶段,鉴于钠离子具有更大半径,其对电池相变行为和副反应的影响可能更为显著。例如,合金类负极材料在钠嵌入/脱嵌时产生的巨大体积变化会导致电极粉末化[9],硬碳负极材料会导致电解质分离和较差的离子扩散动力学等严重的副反应[10]。因此,建立准确描述钠离子电池老化过程的机理模型极具挑战性。数据驱动方法无需精确的数学模型或者先验知识[11],为钠离子电池SOH 估计提供解决方案。Wei 等[12]以18650 型钠离子电池为研究对象,通过增量容量分析解释老化机制并提取老化特征预测电池老化。数据驱动方法的性能通常受到输入特征的影响,老化特征的适用性与可用性有待探究。钠离子电池体系众多,机理研究较少且老化数据可用性有限,缺少一种通用且有效的钠离子电池特征提取以及评价方法。
综上所述,本文以电池老化数据分析为出发点,提取电池老化特征并结合机器学习算法,提出钠离子电池健康状态估计方法。首先,从全电压范围和部分电压范围数据中提取特征,结合方差筛选、灰色关联分析GRA(grey relational analysis)和递归特征消除RFE(recursive feature elimination)等方法筛选高效特征;其次,分别采用多元线性回归、支持向量机、高斯过程回归以及误差反向传播BP(back propagation)神经网络构建SOH 估计模型,并基于2.5 Ah 软包钠离子电池的老化测试数据验证不同模型的性能。
通常按照容量的衰减程度定义电池的健康状态,即SOH 为电池当前容量与初始容量的比值,则有
式中:Qact为当前老化状态下的实际容量;Qnom为标称容量。
健康状态估计方法的总体架构流程如图1 所示,主要包括4 部分。
图1 SOH 估计框架Fig.1 Framework of SOH estimation
(1)数据分析:利用实验采集的电池充电数据,分析获取相关测量或计算参数与容量衰退的映射关系。
(2)特征提取:基于部分充电数据和增量容量曲线提取电压统计值、区间容量、增量容量曲线峰值等参数。
(3)特征选择:结合方差筛选、灰色关联分析和递归特征消除等特征选择算法,从计算和测量参数中选取最富信息量的特征,用于表征电池的健康状态。
(4)SOH 估计:在选定的老化特征基础上,采用多元线性回归、SVM、GPR 和BP 神经网络等4 种主流机器学习方法对电池SOH 进行估计,并在2.5 Ah软包钠离子电池的老化测试数据下进行算法验证。
重点讨论特征提取、特征选择和SOH 估计。特征选择和SOH 估计具体算法流程如图2 所示。
老化特征作为数据驱动法的核心要素,其可靠性和有效性是准确估计SOH 的基础。高质量的衰退特征应易于提取且能有效表征电池老化过程[13]。电池老化常用评价指标容量和内阻在线测量困难,因此有必要研究衰退特征的过程性表征。文献[14]总结了可用于SOH 估计的主要特征,包括基于电压、阻抗、时间、温度、超声波和力等特性参数。实际工作条件下电池放电行为随机不可控,但充电过程一般遵循固定的充电倍率模式,充电电流由充电器稳定调节[15],因此可以基于充电电压数据提取老化特征指示电池SOH。在充电过程中,电池容量是电压的函数,即
式中,Vlower为电池下截止电压。充电过程中某电压区间段的容量可通过电压阶跃dV 离散为
式中,V1和V2分别为电压段的起点和终点。
值得注意的是,电池参数的均值、标准差、最小值和最大值等统计数据均可作为电池老化特征。电池利用过程中,较容易获得部分电压区间数据,所以在特征提取过程中,可以通过等宽分组和等充入电量分组[14]将电压区间进行划分,再依据分电压区间提取特征。
首先,等宽分组法将已知电压区间[UL,UH]均等划分为new段,new为分组数,电压段宽度可表示为
其次,等充入电量分组法通过等分电池充电容量区间划分电压范围,其中充电容量由式(2)计算,积分上、下限是充电过程的下截止电压Vlower和上截止电压Vupper,通常使用的电池容量是电池初始容量。可以依据分电压区间提取分段容量和电压统计量作为老化特征。
最后,还可以通过特征曲线提取老化特征,例如IC 曲线的峰值特征。研究表明,电池容量衰减与终端电压的变化密切相关[21],IC 曲线可以将电池内部电化学反应引起的电压平台转换成IC 峰[18],IC峰与嵌入/脱嵌过程中引起的钠离子电池活性材料的相变有关[12]。
电池SOH 估计模型依赖于老化特征与SOH的映射关系,但是有效的映射关系有限,使用过多无关健康因子容易导致过拟合风险,而且显著增加计算成本。本文利用常见的过滤式和包裹式特征选择方法进行特征选择[19]。灰色关联分析是一类常用的过滤式办法,“灰色” 描述已知信息的比例;“白色”和“黑色”分别表示信息量为0 和100%[20]。其基本思想是研究曲线间的几何接近度以评估其关系,接近度越高表明相关性越强。因此其可以描述电池老化特征变化曲线与容量衰退曲线之间的几何接近度。基于支持向量机的递归特征消除是一类包裹式特征选择方法,使用SVM 的权重作为排序标准,权重向量w 包含数据集各特征的权重[21]。每次迭代,移除权重向量中的最小值,即最不重要的特征。在特征集合上重复递归操作直至特征集合为空,即可输出特征的重要性排序。
多元线性回归模型描述因变量与多个自变量之间的线性关系,输入电池d 维老化特征X=[x1,x2,…,xd],输出电池SOH 值Y。通过训练辨识偏回归系数[α1,α2,…,αd]T和待拟合常数β,可得到钠离子电池SOH 估计模型。
支持向量机可通过核函数将输入数据映射到更高维的特征空间来处理非线性可分的数据,因此适用于电池容量衰退的非线性轨迹,同时SVM 对于处理钠电小数据样本和高维数据很有优势。其中高斯核函数适用于求解非线性问题且参数较少,可提高模型精度。SVM 通过选择支持向量来定义超平面和计算边际,并通过寻找参数优化超平面,这些参数在最小化分类误差的同时最大化边际,因此优化模型参数ω 和b 可显著提升模型泛化能力及精度。
高斯过程回归利用概率方法训练样本数据,无需特定函数形式构建模型,适用于高维、小样本、非线性的回归问题[22]。高斯过程回归由均值函数和协方差函数确定,并利用贝叶斯学习过程根据训练数据和先验分布估计后验分布[18],其目的是建立输入与输出的映射关系,输出估计结果及其不确定性,GPR 模型精度依赖于其函数和参数选择。
BP 神经网络是一类典型的前馈网络,其核心思想是信号前向传播和误差反向传播[23]。BP 神经网络包括输入层、隐含层和输出层,各层之间采用全连接方式。通过梯度下降法,网络能够调整权重使得实际输出值的平方误差之和最小化,三层BP神经网络能以任意精度逼近任意非线性函数[24]。BP神经网络的训练循环进行信息正向传播和误差反向传播修正权值,最终停在预设的误差最小值或训练步骤,得到表征电池SOH 估计模型。修正权值时采用梯度下降法求解无约束最优化方程,导致学习收敛速度慢且易收敛到局部极小值[24]。首先,学习率影响BP 神经网络的收敛性,并控制算法迭代的更新步长,学习率小、收敛速度慢,过大则易引起振荡[19]。其次,模型精度依赖于隐含层数和神经元数目,合适的神经元数目能显著优化模型训练时间和学习能力。
本文搭建的电池测试平台如图3 所示,主要包括Arbin-BT2000-5V-30A 电池充放电设备、DGBELL可控温箱、上位机、钠离子电池单体以及电池夹具等。其中,充放电设备通过夹具与电池连接,用于对被测电池施加电流激励,并通过传感器采集被测钠离子电池的电流电压信号;温度箱用于放置电池并为其提供恒定在实验所需温度的工作环境;上位机实现对充放电设备的控制并接收测试数据。本文实验使用额定容量2.5 Ah 的4 只软包钠离子电池进行测试,其正极材料为层状氧化物(镍铁锰酸钠)、负极材料为硬碳,具体参数如表1 所示。
表1 实验电池具体参数Tab.1 Specific parameters of battery used in experiment
图3 钠离子电池加速寿命实验平台Fig.3 Platform of accelerated life experiment for sodium-ion battery
本次实验分为特性测试和加速寿命测试两部分,特性测试包含容量标定、开路电压测试。实验环境温度为25 ℃,按照1 C 倍率恒流充电至上截止电压3.95 V-静置10 min-0.5/1 C 倍率恒流放电至下截止电压1.5 V-静置10 min 循环测试至电池容量衰减到SOH 失效阈值80%,采样频率为1 Hz。考虑不同放电倍率条件下动力电池性能衰退特性,不同放电倍率下实验样本各为2 只电池。测试电池的容量和SOH 趋势如图4 所示,电池的寿命均接近50 个循环,容量和SOH 随着充放电循环进行呈现退化趋势,但伴随着无规律的局部波动。
图4 钠离子电池退化曲线Fig.4 Degradation curves of sodium-ion batteries
电池的容量衰减与终端电压的变化密切相关[20]。由图5(a)可见,随电池充放电循环进行,相同充电电压对应更小的容量,因此充电电压相关参数能够表征电池老化;IC 曲线将电池内部电化学反应引起的电压平台转换成IC 峰[18],同时IC 峰与插层/去插层过程引起的钠离子电池活性材料的相变有关[25]。Wei 等[12]研究发现IC 峰的高度和面积与反应钠离子的量有关,峰的位置和斜率与氧化还原反应密切相关,因此IC 曲线峰值特征参数亦映射电池老化;其中峰值面积代表峰值所覆盖的特定电压范围的累计充/放电容量,表明在电池不同老化条件下,使电池端电压发生相同变化所需的容量变化不同。图5(b)表明不同分电压区间的累计容量变化同样可以指示电池SOH。
图5 电池衰退特征曲线Fig.5 Curves of battery degradation features
本文实验所用软包钠离子电池的上截止电压为3.95 V,下截止电压为1.50 V。实际应用场景中,充电过程开始于各种状态,且通常不会以完全充电状态结束,完整的充电曲线难以获取[26]。因此,本文基于充电数据提取的老化特征只覆盖3.20~3.95 V电池实际工作常用的电压范围。基于部分电压区间提取的老化特征质量与电压区间宽度有关,随电压区间宽度减小,所提取特征的噪声增大,SOH 估计精度较差,故应限制电压区间的最小宽度[14]。电压范围的增大在提高精度的同时需要从更大的电压范围内获取数据,增大实际应用中的数据获取难度。本文基于不同的宽度划分电压区间进行特征提取,参考Xiong 等[14]的方法,确定最小电压区间宽度为0.15 V,依据论文提出的等宽分组和等充入电量分组法对电压区间进行划分。电压区间划分与特征提取结果如表2 所示,其中等宽分组法中的EW10~EW14 的提出是为了验证是否可以无需计算IC 曲线直接得到能够指示SOH 的分电压区间的累计容量变化值。
表2 电压区间划分与特征提取结果Tab.2 Results of voltage interval division and feature selection
初步提取50 个钠离子电池备选老化特征,机器学习模型可通过训练学习建立所提取老化特征与SOH 的映射关系,但特征的质量影响模型的精度,且数量过多的特征输入会增加计算成本和过拟合的风险[27],因此本节结合方差选择法、灰色关联分析与递归特征消除方法逐层筛选出对电池容量衰减最富信息的老化特征。
首先,对所提取的50 个特征做初步方差筛选,方差过小说明提取的特征不随电池老化而对应改变,滤去方差小于10-4的特征;其次,对初步筛选后的特征进行灰色关联分析,选择与电池衰退轨迹几何接近度更好的特征,定义阈值为0.65;最后,对关联度大于0.65 的15 个特征进行递归特征消除计算。递归特征消除用于训练的基模型选择SVM,第1 次训练选择现有所有特征,每次迭代按照权重降序排列并去除排在末尾的特征,直至特征集合为空,得到特征集合的排序集。本文选择排名前4 的特征用作钠离子电池SOH 估计模型的输入,依次为:EQ3 容量区间下的电压标准差、EQ2 容量区间下的电压最小值、EQ1 容量区间下的电压最大值和EW9电压区间下的充入容量值。
本文采用多元线性回归、SVM、GPR 和BP 神经网络等4 种机器学习方法分别构建钠离子电池SOH 估计模型。SOH 估计结果与误差如图6 所示。在多元线性回归模型中,通过对训练集数据的拟合得到偏回归系数和常数项。支持向量机和高斯过程回归的核函数分别选择高斯核函数与平方指数核函数,采用基于k 折交叉验证的网格搜索算法优化主要超参数,以提高模型的泛化能力和防止过拟合。BP 神经网络采用了一层隐含层,神经元节点数为3,学习率设置为0.1,迭代次数限制为100 次。训练集与测试集的比例通常为7∶3 或8∶2,钠离子电池样本共4 只电池,随机选取3 只电池数据作为训练集,剩余为测试集。为消除原始数据的不同维度对模型训练的影响,归一化处理数据。图6 展示了49号电池为测试集时4 种算法的SOH 估计结果,均接近真实值,图6(b)、(d)、(f)和(h)所示SOH 估计误差基本在1%以内,最大误差值小于3%。
图6 SOH 估计结果与误差Fig.6 SOH estimation results and the corresponding errors
引入模型性能评估指标均方根误差RMSE、拟合优度R2,用作分析所构建模型的性能,计算方法可表示为
式中:yi为真实值;y¯i为真实值的平均值;f(xi)为估计值;n 为样本个数。RMSE 表示估计值与真实值之间的偏差,对数据中的异常点较为敏感,RMSE 越接近0,模型性能越优秀;拟合优度R2表示因变量的波动能被自变量的波动所描述的程度,展示了SOH 估计值与真实值之间的相关性,因此可以评估模型准确度。R2越接近1,表示模型精度越高。4 个SOH 估计模型的性能评价指标如表3 所示。
表3 SOH 估计性能指标结果Tab.3 Results of performance indicators for SOH estimation
SOH 估计性能指标表明,基于所选的4 个老化特征,多元线性回归、SVM、GPR、BP 神经网络均能实现钠离子电池SOH 的精准估计,其均方根误差依次为1.2%、1.5%、0.8%和1.4%。GPR 方法精度最高,图6(e)和(f)展示GPR 估计的SOH 曲线接近真实曲线,分布区间窄,估计误差均在1%以内。其次是多元线性回归模型,本文钠离子电池的衰退轨迹曲线形状近似线性,多元线性回归模型估计曲线与真实SOH 曲线基本一致。BP 神经网络模型和SVM 模型在电池寿命后期SOH 估计值小幅度上飘,估计误差增大。钠离子电池数据具有小样本的特点,BP 神经网络无法得到大量的训练数据而导致更易过拟合。同时,最终选定的特征均为基于充电电压直接或者间接得到,实验直接采集的电压数据样本噪声较大以及参数的选择导致模型对噪声较为敏感等原因,导致SVM 预测模型性能下降。
本文提出一种融合特征选择与机器学习算法的钠离子电池SOH 估计方法。首先,结合方差选择法、灰色关联分析与递归特征消除选择与钠离子电池SOH 最相关的特征;其次,基于所选特征,分别利用多元线性回归、支持向量机、高斯过程回归、BP神经网络构建钠离子电池的SOH 估计模型,并利用2.5 Ah 软包钠离子电池加速寿命老化实验数据对4 个模型进行验证与性能分析。结果表明,对于老化特征选择结果,4 种机器学习算法均能实现对钠离子电池SOH 的精准估计,SOH 估计均方根误差均小于2%。其中,GPR 模型精度最高,置信区间为95%时的SOH 估计均方根误差仅为0.8%,这为钠离子电池的管理与状态估计提供了有力支撑。