赵显赫,耿光超,林 达,李志浩,张 杨
(1.浙江大学 电气工程学院,杭州 310027;2.国网浙江省电力有限公司电力科学研究院,杭州 310014;3.国网浙江省电力有限公司,杭州 310007)
锂离子电池具有能量密度高、输出电压高、允许使用温度范围大、循环寿命长、自放电现象不明显、污染较小等优点[1],因而被广泛应用于电网储能、电动汽车、通信基站、商用储能等众多民用领域及航天、航空、航海等军工领域[2-3]。
在使用过程中,锂离子电池的性能会随其内部电化学成分的不可逆退化而下降,这被称为电池老化。电池老化带了电池的安全性与可靠性问题,导致用电设备性能下降或系统故障,甚至引发起火或爆炸的问题。为确保电池的安全性与可靠性,锂离子电池的健康管理技术开始不断发展。电池的SOH(健康状态)与电池的RUL(剩余使用寿命)是电池健康管理的两个重要评价指标,二者均可反映电池在使用过程中的健康状况。已有大量学者对锂离子电池的SOH 估计与RUL 预测进行研究,目前的主流方法分为基于物理模型的电池健康状态评估和基于数据驱动的电池健康状态评估两类[4]。
随着大数据及机器学习技术的蓬勃发展,数据驱动技术已成为当前电池健康分析的主要研究方向,数据驱动预测技术的一般流程如图1 所示。首先采集大量电池使用数据,利用特征工程方法提取电池退化相关特征,借助数据驱动算法,训练出与电池老化特性一致的模型,对电池进行离线或在线的退化分析及健康管理。相比于传统基于物理模型的分析方法,数据驱动不需要对电池内部复杂的电化学机理进行精确建模,无需进行电池自身参数辨识,具有较高的可迁移性、鲁棒性与自适应性。基于数据驱动的锂离子电池健康状态评估过程如图2 所示。
图1 数据驱动预测技术的一般流程
图2 基于数据驱动的锂离子电池健康状态评估过程
目前,国内外已有部分学者对锂离子电池健康状态评估方法进行综述[6-10],文献[6-8]综述了基于物理模型及数据驱动模型的电池健康管理问题研究方法,但在数据驱动技术方法介绍较为简略,文献[9]对锂离子电池的数据驱动方法进行对比综述,但只讨论了三种典型建模方法,对方法的总结不够全面。文献[10]介绍了电池SOH 与SOC(荷电状态)预测的机器学习方法,但缺少电池退化特征提取过程的介绍。总体来看,目前国内单独对数据驱动的电池健康状态评估技术详细归纳的文献较少,且较多文献对数据驱动的全过程把握不足。因此,有必要从数据驱动的角度出发,对电池健康状态评估技术进行系统的综述。
本文首先通过分析锂离子电池的退化机理列举了电池老化的影响因素,并概述了电池健康状态的定义。其次归纳了数据驱动过程中电池退化特征的提取方法。然后综述了基于数据驱动的电池SOH 估计及电池RUL 预测方法,对各类方法进行了比较。最后分析了现有数据驱动的锂离子电池健康状态分析方法存在的挑战,并提出了未来趋势及展望。
目前,国内外已有大量学者对锂离子电池的退化机理进行研究。目前主流的观点认为锂离子沉淀、SEI(固体电解质界面)膜厚度变化和电解液降解等是造成电池老化和容量衰减的主要原因[5]。在锂离子电池使用过程中,其使用时间、电压、充放电电流强度、温度、充放电深度等条件是影响锂离子电池使用寿命的主要外部因素[11],图3 总结了锂离子电池外部因素、衰减机制及电池性能退化间的关系。研究锂离子电池退化机理对于电池健康状态评估具有重要意义。
图3 锂离子电池外部因素、衰减机制及电池性能退化情况间的相互关系
电池的SOH 是表征电池当前性能及退化程度的重要指标。随着电池的使用次数增加,其最大可用容量降低,内阻不断提高,因此行业内一般使用容量与内阻对电池的SOH 进行定义。
从电池容量角度对电池SOH 的定义如式(1)所示,目前,该定义在电池行业中认可度最高[12]。
式中:Qcurr为电池当前最大可用容量;Qnew为电池出厂最大可用容量。
此外,也可从电池内阻角度对电池SOH 进行定义[13],表达式如式(2)所示:
式中:REOL为电池寿命结束时的内阻;Rcurr为电池当前内阻;Rnew为电池出厂时的内阻。
电池RUL 指在当前使用条件下电池工作至报废所需要的循环次数,通常作为表征电池的健康状态的另一个重要指标。一般认为,当锂离子电池当前容量小于出厂容量的80%时,则判定电池报废[14]。
特征生成是电池健康状态数据驱动建模过程中的重要一环,通过从电池数据中提取反映电池老化信息的特征参数作为模型训练的输入,参与模型的训练。根据锂离子电池SOH 的定义,电池的最大容量、内阻等参数可直接作为表征锂离子电池退化情况的特征参与模型训练。但通常情况下,这些参数在电池使用过程中无法直接测得,因此,往往还需要以下退化特征的生成方法。
ICA(容量增量分析)和DVA(电压差分分析)是最常用的两种电池退化特征生成方法[15]。ICA通过分析电池在不同循环周期中电压与电池增量容量之间关系的变化趋势,提取出电池的退化特征参数[16]。DVA 则通过电压对容量的导数与电池循环退化过程中的峰谷变化,分析电池容量随使用时间增长的衰减趋势[17]。此外,DTV(差分热伏安法)是一种改进的基于ICA 的电池退化特征生成方法,它将ICA 手段与温度测量相结合,对电极材料的热力学信息进行推断[18-19],进而提取出电池的退化特征。基于ICA/DVA 生成的退化特征能够反映电池内部的物理状态,且数据容易获得,具有较高的实用性。但ICA/DVA 仅限在较低充放电倍率条件进行,同时,该方法对于噪声及测量误差较为敏感,需要借助合理的滤波手段对曲线平滑处理才能提取更稳定的退化特征。
通过各种统计学方法对采集的电池电压、电流、温度等数据进行分析计算可作为一种电池退化特征的生成手段,其优点在于可利用有限的电池数据生成大量电池退化相关特征。文献[20]通过分析电池第100 次循环与第10 次循环差值曲线的最大值、平均值、散度值、偏度值、峰态系数等统计学指标,以及温度、充放电量等曲线,生成了20 个表征电池退化特征的统计学参数,仅利用电池前100 个周期的测试数据回归预测了电池的RUL,误差小于9.1%。文献[21]通过灰色关联度和主成分分析的统计方法,提取出5 个电池HI(健康因子)作为反映电池健康状态的特征,最终利用神经网络得到了误差小于2%的SOH 预测精度。
使用统计学手段进行特征生成的缺点在于,该方法过于依赖先验经验,且部分所提取的特征可能与预测目标相关性很小甚至无明显相关性,导致模型训练后预测效果变差。为避免这一问题,需通过一定的正则化方法削弱无关特征对模型的影响,如文献[20]采用弹性网络弱化了与预测相关性较小的特征对模型的影响,提高了预测的准确度与可信度。但正则化过程也增加了模型训练的难度,增加了训练时间。
对于一部分机器学习模型而言,其模型本身具有从输入数据中提取隐含退化信息的能力,可直接使用电池的电压、电流、温度等外部参数作为特征进行模型训练,无需额外进行电池退化特征生成。文献[22]使用DCNN(深度卷积神经网络)将在线监测的电池电压、电流、温度等外部参数直接作为模型训练的输入,实现了锂离子电池容量的实时在线预测;文献[23]利用不同的数据驱动模型,使用BMS(电池管理系统)直接测量的电流、电压、温度训练机器学习模型,在动态运行条件下进行电池健康评估。直接外部参数输入作为特征的缺点在于过分依赖模型的分析能力,模型计算复杂程度高。
不同锂离子电池数据退化特征生成方式比较如表1 所示。
表1 3 种锂离子电池数据退化特征生成方式优缺点比较
数据驱动的电池健康状态评估一般通过回归分析方法或机器学习的算法,建立电池退化特征或HI 与电池健康状态的关联模型。以电池数据中提取出的退化状态特征作为模型输入,电池的最大容量或内阻作为模型输出,得到关联二者耦合关系及演变规律的模型,从而实现对电池未来SOH 的估计。通过判断电池容量循环曲线到达容量退化阈值的循环次数,可进而对电池RUL 进行预测。
数据驱动方法不需要考虑电池内部的复杂电化学反应与非线性退化机理,避免了不同锂离子电池内部结构、化学成分、制造工艺、使用条件、个体差异等困难参的数辨识过程,仅依靠电池在线监测或离线积累的数据即可建立电池的数学模型,并对电池健康状态进行分析预测,具有极强的鲁棒性与自适应性。本节将详细介绍目前对电池SOH 估计及RUL 预测的数据驱动建模方法并进行对比分析。
AR(自回归)是一类对时间序列预测问题建模的方法,通过对过去系统状态作为输入进行回归分析,得模型参数与系统阶数,建立含多个电池健康特征的时序模型,并对当前时刻系统状态进行预测。常用的AR 类模型有ARMA(自回归滑动平均)、ARIMA(差分整合移动平均自回归)等[24]。
在电池SOH 评估及RUL 预测方面,文献[25]介绍了一种基于AR 的多元时间序列模型用于电池SOH 的预测,并达到了90%以上的置信精度;文献[26]通过提取等幅压升时间,等幅流降时间等特征建立电动汽车电池SOH 的多元AR 模型,使得模型预测的MAE(平均绝对值误差)小于3%,RMSE(均方根误差)小于4%。一些研究在传统的AR 模型基础上进行改进与优化,提高了模型的预测效果。文献[27]提出了一种结合EMD(经验模态分解)的ARIMA 模型的来预测RUL,对电池的容量恢复过程实现了高精度预测,先比与传统ARIMA 方法,平均误差下降了83.08%。
AR 类模型具有模型参数少、计算复杂度低、训练时间短等优点,一般用于电池样本数据量较小的应用场景中。但自回归模型无法分析多个输入特征间的隐含关系,结果置信程度与预测精度较低,甚至可能出现预测结果违背实际物理规律的问题。
ANN(人工神经网络)是以数学形式模拟人类大脑思考过程,将神经元以一定方式相互连接形成的网络通过大量数据对神经元间的阈值及权重进行训练得到预测模型,ANN 的基本结构如图4所示,包含输入层、输出层、隐藏层三层。ANN适用于多相关特征复杂非线性建模问题,具有自主学习能力强、预测精度高的优点。在电池健康状态评估领域中,ANN 目前已成为一种主流的数据驱动技术,且具有优异的预测性能。常见的ANN 模型有FNN(前馈神经网络)、RNN(循环神经网络)、CNN(卷积神经网络)以及其他改进神经网络模型。
图4 ANN 基本结构示意
大量文献应用神经网络对电池健康状态进行估计及预测。文献[28]使用ANN 模型建立了电池最大可用容量与温度、电池循环充放电量、放电深度等因素之间的模型,进而对电动汽车动力电池的SOH 进行准确估计。文献[29]使用模拟退火算法改进的FNN,分析了微分电压、循环次数等健康因子对电池SOH 的影响,改善了传统FNN在训练过程中容易陷入局部最优的问题,降低了预测误差。相比于FNN,RNN 通过网络参数循环反馈机制,能在一定时间内保留网络的重要信息并更新,在电池退化这类时间序列问题建模中更具优势。文献[30]利用GRU-RNN(门控循环神经网络)建立电压时序特征与电池SOH 的映射规律,实现了MAE 小于1.25%的预测精度。文献[31]使用RNN 类中的LSTM(长短期记忆神经网络)神经网络对磷酸铁锂离子电池进行SOH 估计和RUL预测,该方法能分析出电池测试数据与寿命的长期依赖关系,相比传统RNN 方法,LSTM 方法的预测效果提高了20%~50%。
ANN 的方法在电池健康状态预测过程中具有出色的表现,但仍存在以下不足:首先,由于ANN 网络参数复杂,所需训练时间与计算资源随数据量增长急剧增加,对于小样本数据的预测能力差;其次,ANN 在训练过程中,容易陷入参数局部最优,导致过拟合问题;同时ANN 的表现效果与选取的模型网络结构高度相关,而目前缺乏选取网络结构的明确方法,通常需借助一定先验经验或多模型比较确定最终网络结构。
SVM(支持向量机)是一种目前常用数据分析算法,其通过核函数将低维空间的非线性问题映射至高维空间中的线性问题,从而对复杂的非线性系统建模,其原理示意如图5 所示。
图5 SVM 方法的原理示意
与ANN 相比,SVM 具有更严格的数学证明,计算复杂度较低,收敛速度较快。同时,SVM 克服了ANN 易陷入局部参数最优的问题,对小样本数据的训练能力强[32],预测精度高,因此在电池健康状态评估领域受到广泛关注。
文献[33]使用了等充电电压差时间间隔和等放电电压差时间间隔两个实时可测的HI,通过SVM 对健康指标与在线容量之间的关系进行建模,从而实现了RMSE 小于1.97%的预测RUL。
SVM 方法也存在很多不足,如核参数复杂难以选取、对交叉训练及正则化方法的依赖程度高等。另外,SVM 对训练过程中的缺失数据敏感,在实际应用中对原始电池数据质量及数据预处理方法要求较高。
RVM(相关向量机)与SVM 的基本原理相同,但采用稀疏贝叶斯理论框架得到网络权重,因此其输出形式为概率密度估计而非点估计。RVM 具有SVM 相似的计算精度高、运算复杂度低等优点,且由于其概率预测的输出形式,受到锂离子电池预测领域的广泛关注。文献[34]提取电池放电表面温度特征的HI,使用RVM 模型对电池RUL 实现了预测,RMSE 小于2.84%。文献[35]提出了一种RVM 增量在线学习策略,通过在线电压、电流、温度数据的实时输入对模型进行更新,以实现RMSE 小于1.95%的RUL 在线精确预测,并较少了50%的训练时间。
总的来说,RVM 算法模型精度高,运算复杂性低,并能输出概率形式的预测,在电池健康状态建模中具有出色的表现。但由于RVM 模型矩阵过于稀疏,其对训练数据量的需求相对较高,预测结果稳定性较差。
GPR(高斯过程回归)是一种基于贝叶斯框架与先验知识对系统行为过程进行回归分析的概率估计模型。与RVM 模型相似,GPR 的输出也为概率密度估计形式,可用作电池老化健康状态估计的一种方法。文献[36]针对容量再生现象影响锂离子电池健康状态建模精度的问题,提出一种基于EMD(经验模态分解)的能量加权的GPR 方法,利用EMD 分解获得样本的能量分布情况,建立基于能量加权GPR 的锂离子电池SOH 预测模型。文献[37]从恒流恒压充电过程中提取3 个健康因子,用通过统计学相关系数分析健康因子与电池容量之间的相关性,以健康因子和容量数据建立GPR 模型以预测容量,获得电池RUL 预测结果。
总的来说,GPR 具有模型预测精度高,预测结果为概率密度形式等优点。但由于其模型固有结构导致在分析电池数据量较大的问题时,计算复杂度较高。同时,该模型超参数较多,训练时超参数调整过程繁琐。
综上所述,基于数据驱动的锂离子健康状态评估技术目前已比较成熟,不同数据驱动方法具备各自优点与适用场景。从图6 对各种模型的预测精度进行对比可知,AR 类模型的预测精度相对最低,其他四类方法在情况合适的条件下均有较出色的预测效果。ANN 类模型虽然预测平均精度最高、但预测的稳定性较差,其预测效果与所选取的网络结构相关性很大。各类模型性能比较如表2 所示。
图6 不同数据驱动的电池健康状态建模方法的精确度比较
表2 锂离子健康状态评估数学驱动模型性能比较
总的来说,目前对于基于数据驱动的锂离子电池SOH 估计与RUL 预测技术目前已比较成熟,各类方法的验证也较为充分。但仍面临以下挑战:
首先,数据驱动的锂离子电池SOH 一般属于“黑盒模型”,对模型的物理可解释性较差。目前,已有部分研究使用数据驱动与物理模型相结合的方式进行锂离子电池健康或电荷状态进行分析[38-39],但仍无法准确描绘电池的电化学特性,且两种模型结合方式的合理性有待验证。随着电池老化机理研究的日益完备与人工智能算法的不断更新,物理模型与数据驱动相结合的方法将是未来电池SOH 评估的主流发展趋势。
其次,数据驱动估计对数据有效性要求较很高,在预测过程中,当出现训练数据中不包含的电池工作模式时,往往模型预测效果很差。目前数据驱动的电池SOH 评估的研究一般都使用数据相对完整、电池循环次数较多、充放电模式规范的电池公共数据集或实验室测试的数据进行方法验证,而很少有研究直接采用实际储能应用场景的随机性高、波动性强、缺乏部分工况、测量误差较大、完整性差的真实数据。因此,对于电池的SOH 研究仍多局限于实验室测试条件下的理想情况。未来主流的发展趋势是借助工业大数据、云边协同计算、数字孪生等先进技术,通过对海量实际应用场景电池数据进行分析,得到具有普适性的电池退化规律模型,进而提升电池SOH 分析评估水平。
最后,目前的电池数据驱动建模大多只使用电池的电压、电流、温度、内阻等测量参数进行分析。但由于电池多种老化因素的复杂非线性耦合方式,这些测量参数中隐含的电池退化信息难以被充分提取出来。X 射线、红外成像、核磁检测、声纹识别等非侵入式检测技术可直接检测电池内部结构改变、温度分布、电解质降解程度、电池噪声等直接反映电池健康情况的信息,可应用于新一代BMS 中作为电池SOH 监测的手段。
本文针对基于数据驱动的锂离子电池SOH评估方法开展综述性研究,可得出以下结论:
(1)锂离子电池退化机理主要为锂离子沉淀、SEI 膜厚度变化和电解液降解等,这与电池使用的时间、电压、电流、温度等外部因素有关。
(2)电池退化特征生成的主要方法有ICA/DVA法、统计学方法、直接外部参数输入等方法,其中前两种方法使用较为广泛,能提取多个有效的电池退化特征;后者对模型复杂度要求较高,一般用于ANN 等复杂模型。
(3)目前锂离子电池健康状态评估的数据驱动建模方法主要包括AR,ANN,SVM,RVM,GPR 等方法,不同模型具备各自的优缺点与应用场景,目前ANN,SVM,GPR 是目前最主流的3种数据驱动的锂离子健康状态评估模型。
(4)数据驱动的电池健康状态评估领域仍存在模型可解释性差、数据质量要求高、电池测试方法有限等挑战,随着科技的不断进步,数据驱动的电池健康状态评估将具有更广阔的应用前景。