赵 珍, 庞晓琼, 董渊昌
(中北大学 计算机科学与技术学院, 山西 太原 030051)
近年来, 随着储能技术的发展, 锂离子电池(Lithium-Ion Batteries, LIBs)已经成为可再生能源存储的主流方案之一。从便携式设备到电动汽车再到航空航天系统, 设备的正常运行都离不开LIBs稳定的能源供应[1-3]。然而, 随着使用周期的增加, LIBs性能会逐渐下降, 直到达到失效阈值。在此之后, 电池的性能将会大幅下降, 进而可能威胁到电力系统能源供应的稳定性, 甚至导致灾难性的后果[4-7]。近年来, 由LIBs性能故障引起的电动汽车驾驶事故案例日趋增加, 这虽然和电动汽车普及率的提高有关, 但同时也说明, LIBs的性能安全问题仍然是一个亟需关注的问题。因此, 构建锂离子电池退化状态监测系统具有重要的现实意义[8-10]。
到目前为止, 已有不少文献从不同角度提出了各种策略来实现LIBs健康状态和剩余使用寿命(Remaining Useful Life, RUL)的预测。这些策略根据研究侧重点的不同可以分为两大类: 基于模型的方法和数据驱动的方法[11-14]。基于模型的方法从电池内部的电化学反应入手来研究LIBs的退化特性, 然而由于LIBs的内部机理比较复杂, 很难用物理模型定量描述其结构。因此, 基于模型的方法很难直接准确地进行锂离子电池RUL的预测。基于观测数据的数据驱动方法直接从电池状态监测数据中挖掘电池退化信息, 避开了对锂离子电池复杂内部机理和电化学反应过程的研究, 成为了当前电池寿命研究的热点方向。
然而, 在目前关于LIBs的RUL预测研究工作中, 更多的是从数值水平上取得更高精度的预测结果, 即获得一个精确的预测数值。但是, 由于实际使用情况的不确定性, 一个精确的数值结果可能无法直接应用于实际工况[15-16]。在一些实际应用中, 为LIBs的RUL提供一个可供选择的预测区间比提供一个精确的预测结果更有意义。在这种情况下, 根据使用对象的安全性要求和使用场景紧迫程度的不同, 用户可以在潜在故障出现前得到充分的预警, 并做出合理的决策。在安全性或紧迫程度较高的情况下, 可以在达到失效阈值处的预测区间下限附近尽早终止对电池的使用, 以避免由于能量供应不足而发生事故; 否则, 可以适当增加LIBs的工作周期, 以减少频繁更换电池所带来的不必要的开销。因此, 一个令人满意的锂离子电池RUL预测模型, 不仅应该提供准确的LIBs未来性能退化趋势, 还应该给出可信的RUL预测区间。
目前, 锂离子电池RUL区间预测的研究工作还较少。Pang等[17]利用模糊信息粒化方法直接对电池容量退化数据进行处理, 并与数据驱动方法结合来实现电池RUL区间的预测。在使用过程中, 还引入了语言描述来解决模糊信息粒化在处理容量退化序列过程中对波动数据平滑的问题, 尽可能地保留了原始容量退化数据的形态, 从而较好地实现了锂离子电池RUL区间预测。然而, 在锂离子电池RUL预测中, 用容量作为健康指标并不是最好的选择。一是由于容量的测量常常需要精密且昂贵的仪器, 但是, 在大多数使用环境下, 容量并非直接测得, 而是由电流、电压、放电时间等特征间接计算得来[18-19]。二是由于容量直接表征了电池的性能, 直接对其进行处理, 很容易损失关于电池性能退化情况的信息, 进而影响后续的预测效果。从特征选择的角度看, 模型预测结果的准确性往往受模型训练准确性的影响, 而模型训练的准确性在一定程度上依赖于训练输入的特征数据与输出数据之间的相关性。也就是说, 模型特征数据与输出目标数据之间的相关性越大, 模型的稳定性和预测结果的准确性就越高。因此, 选择更易测量的且与容量相关度较高的健康指标对锂离子电池RUL区间预测更有效。
基于上述分析, 本文将实际应用中更容易获取的表征电池健康状态的特征量作为实现锂离子电池RUL区间预测的健康指标, 提出了一种新的区间预测方案。首先, 从电池退化数据集中提取多种表征电池退化状态的健康指标; 其次, 将容量作为参照对象, 进行灰色关联分析, 选择相关性最高的两组健康指标作为模糊信息粒化的输入序列; 然后, 对两组特征序列分别进行模糊信息粒化, 生成模糊颗粒, 进而获得各自特征序列的上下限, 并以此作为区间预测的基础; 最后, 将所选两组健康指标粒化后的上下限作为输入, 容量作为输出, 利用最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)进行训练并预测最后的RUL区间。
信息粒化是指一个完整的对象被处理(分割和粒化)为若干连续的部分, 每个部分生成一个颗粒的过程。在信息粒化的概念下, 进一步利用模糊理论来生成模糊信息颗粒, 称为模糊信息粒化[20]。
模糊信息粒化的处理主要包括时间序列的分割和时间窗口的模糊化两个步骤。
在时间序列分割部分, 将原始时间序列划分为若干个同质且不重叠的子序列, 这些子序列被定义为时间窗。合理的时间窗口分割策略是更好地理解和分析原始时间序列的关键前提。一般来说, 常用的分割方法是定宽分割, 即选择一个固定的宽度来生成所有的时间窗。
设X={x1,x2,…,xn}为时间序列, 窗口尺度为w, 且1≤w≤n。时间窗的大小与其保留原始时间序列本质信息的能力有关。如果w=n, 说明一个时间窗口等于整个时间序列, 这样生成的颗粒尺度过大, 失去了粒化的本意。如果w=1, 说明每个xi都是一个颗粒, 这样的粒化是无效的。因此, 选择合适的时间窗口至关重要。
分割后, 利用模糊粒化对生成的时间窗口进行处理, 产生模糊颗粒, 每个时间窗口对应一个颗粒。模糊颗粒由一组参数组成, 这组参数可以在一定程度上表征对应时间窗口的信息。令U作为一个论域, 模糊信息粒化的定义为
g(xisG)isλ,x∈X,
(1)
式中:x为变量;G为U的凸模糊子集。模糊信息粒化的一个重要核心是确定G的隶属度函数。本文选取三角隶属度函数A(x), 表示为
(2)
式中:m为时间窗口中子集的中位数;a和b分别为生成模糊颗粒的支持度的下界和上界。构造三角隶属度函数的颗粒表达式, 即确定上述参数[21]。模糊颗粒的构建需要满足两个条件: 1)模糊颗粒能够完整表达原始信息, 2)模糊颗粒应具有一定的特异性。为满足上述条件, 构造函数QA, 表示为
(3)
(4)
确定m的值后, 原始子序列X′可以被划分为两个子序列, 然后分别计算A(x)的左边(小于m部分)和右边(大于m部分)。根据A(x)和式(3), 可以得出关于a和b的函数, 即
(5)
(6)
分别计算式(5)和式(6)的导数, 可得
(7)
(8)
当Q(a)和Q(b)达到最大值时, 分别得到a和b的值, 即
(9)
(10)
支持向量机(Support Vector Machine, SVM)是一种解决分类和回归问题的强大工具[22]。SVM建立在统计学基础上, 属于机器学习范畴, 其基本思想是将低维线性不可分问题映射到高维线性可分超平面。SVM基于结构风险最小化原则, 而非经验风险最小化原则, 这一特点也使得支持向量机具有比神经网络更好的泛化性能。SVM通过在模型复杂度和学习能力之间找到合适的平衡点来抑制过拟合和欠拟合。当处理有限的训练样本时, 支持向量机表现出良好的性能。然而, 当训练数据量增大时, 优化的复杂度会随着训练样本的增加而成比例增加, 大大增加了优化需要的时间。此外, SVM的性能很大程度上依赖于参数的优化结果。为了克服传统支持向量机的不足, Suykens等[23]提出了LSSVM, 将支持向量机的优化问题转化为求解线性方程组, 在保留SVM特点的基础上, 降低了计算的复杂度, 提高了计算效率[24-25]。
令{(x1,y1),(x2,y2),…,(xl,yl)},yi∈R为一个训练集, 其中,xi是第i个样本的输入向量,yi是输出。构建的模型为
f(x)=ωTφ(x)+b,
(11)
式中:ω是权值向量;b是偏差;φ(x)是将x映射到更高维特征空间的非线性映射函数。LSSVM的最小目标函数可以表示为
s.t.yi=ωTφ(xi)+b+ei,i=1~l,
(12)
式中:λ为关于误差惩罚的正则化参数;ei为误差变量, 且e=[e1,e2,…,el]T。采用拉格朗日乘子法解决上述优化问题, 即
(13)
式中:LLSSVM有参数ω,b,e和α;αi是拉格朗日乘子, 且α=[α1,α2,…,αl]T。令式(13)中ω,b,e和α的偏导数为0, 即
(14)
消去式(14)中的ω和e, 则式(13)仅与b和α有关, 可得
(15)
式中:E=[1,1,…,1]T;Ω是l×l的方阵, 且Ωij=φ(xi)Tφ(xj)。令K(xi,xj)=φ(xi)T·φ(xj),K(xi,xj)是LSSVM的核函数。考虑到LIBs退化数据具有严重的非线性特征, 本文选择径向基函数作为核函数, 表达式为
(16)
式中:σ是核宽度。通过求解式(15), 可以得到α和b, 最终建立的回归模型为
(17)
实验中使用的锂离子电池退化数据集来自NASA Prognostics Center of Excellence(PCoE)中心的公开数据集, 该数据集是由4组同类型电池(cell 5, cell 6, cell 7和cell 18)在相同的实验环境下测得的[26]。4个电池组的容量退化数据如图1 所示, 其退化循环都在168个周期以内。当电池容量达到额定容量的70%时, 则认为该电池已达到失效阈值。
图1 4组电池容量的退化曲线(cell 5, cell 6, cell 7和cell 18)
健康指标的提取对于表征锂电池退化状态非常重要。常见的健康指标主要从电池的充放电电压变化率、充放电时间变化长度以及温度变化等方面进行描述。本文实验从充放电电压、时间以及温度3个方面提取了6种健康指标, 包括电池平台期放电时长、平台期电压变化率、等时间间隔放电电压差、等压升充电时间间隔、平均电压衰减以及放电期平均温度。以cell 5为例, 具体介绍如下:
1)电池平台期放电时长。
电池在不同循环周期下的放电电压曲线如图2 所示。由图2 可以看出, 放电初始阶段的瞬时压降值随着放电循环周期的增加而逐渐增大, 然后电压进入一个平稳变化期, 称为平台期。随着电池放电循环的增加, 平台期的持续时间缩短, 电压下降速度变快, 因此, 电池平台期放电时长和平台期电压变化率都与电池的性能有关。
图2 不同放电循环周期的电压曲线
电压下降结束后, 电池电压进入缓慢变化的放电平台期。这一平台期通常出现在锂离子电池的标称电压附近。由于本文所用电池的标称电压为3.6 V~3.7 V, 因此, 选择电压达到3.5 V所作为最终的平台期结束电压, 也就是说, 电压达到3.5 V所对应的时刻为平台期结束时刻。
第i个放电循环的平台期放电时长的计算公式为
td_plat(i)=tend(i)-tstart(i),
(18)
式中:td_plat(i)为第i个放电循环的平台期放电时长;tend(i)为该放电循环的平台期结束时刻;tstart(i)为起始时刻, 也就是电压骤降结束点。
2)平台期电压变化率。
第i个放电循环的平台期电压变化率的计算公式为
Rv=Vd(i)/td_plat(i),
(19)
式中:Rv为第i个放电循环的平台期电压变化率;Vd(i)为该放电循环下的平台期电压降量。
3)等时间间隔放电电压差。
在持续使用过程中, 电池电量放空所用的时间会随着放电循环次数的增加而逐渐减小, 相同时间间隔下的电压差也可以作为一组健康指标。
4)放电期平均温度。
电池放电过程中的温度平均值会随着电池内阻的增大而升高。
5)等压升充电时间间隔。
充电过程中电池达到相同电压间隔所需要的时间即为等压升充电时间间隔。
6)平均电压衰减。
在一个放电循环中, 将500 s~1 500 s的时间间隔作为研究范围, 在该范围内平均取100个电压点, 每个取样时间定义为j=1,2,…,100。第i个放电循环的平均电压衰减的计算公式为
(20)
式中:FMV(i)为平均电压衰减值;Vj为放电循环第j个电压点;Vn为标称电压。
模型预测结果的准确性往往受模型训练准确性的影响, 而模型训练的准确性在一定程度上依赖于训练输入的特征数据与输出的标签数据之间的相关性。也就是说, 模型特征数据与输出目标数据之间的相关性越大, 模型的稳定性和预测结果的准确性就越高。
灰色关联分析(Grey Relation Analysis, GRA)是一种定量描述和比较系统发展变化情况的方法, 其基本思想是通过比较数据中几何形状的相似度来判断其联系是否紧密。GRA的结果越高, 两个数据之间的相关性越高。
(|y(k)-xi(k)|+
(21)
(22)
式中:ξi(k)为第k个指标的灰色关联系数;y(k)为参考序列, 在这里是原始容量序列;xi(k)为对比序列, 即健康指标序列;ρ为分辨系数, 取值为0.5;γi为最终计算所得的灰色关联度。
图3 给出了对cell 5的6组健康指标的提取结果, 从整体趋势上可以看出, 除去放电期平均温度外, 其他5组序列的变化趋势与图1中对应电池的容量退化趋势呈明显的正相关或负相关。将其容量序列进行灰色关联分析, 结果如图4 所示。由图4 可知, 与电池容量相关度最高的是电池平台期放电时长和等压升充电时间间隔, 相关度均达到了0.9以上, 与容量具有较好的相关性。在后续的实验中将上述两种指标作为输入, 容量作为输出进行建模。
图3 cell 5的6组健康指标提取结果
图4 灰度关联分析结果
在获得健康指标之后, 需要对其进行模糊信息粒化, 得到模糊信息颗粒。在模糊信息粒化中, 第一步是生成时间窗口, 而生成时间窗口最重要的是确定分割窗口的尺度。考虑到实验所选用的退化数据集规模不大, 为使达到要求的训练数据规模不过分小, 同时为了尽可能利用粒化的优势, 分割尺度设置为3。
以cell 5为例, 图5 给出了所选健康指标电池平台期放电时长和等压升充电时间间隔经过模糊信息粒化的结果, 其中Low和Up分别表示颗粒的下界和上界, R表示颗粒的平均水平。为了便于预测, 在建模前对Low和Up进行归一化处理。将两组健康指标的前23个颗粒的上下限作为LSSVM模型的输入, 容量作为输出, 对模型进行训练。
(a)电压平台期放电时长
4组电池的RUL区间预测结果如图6 所示, 将结果从颗粒扩展到循环周期, 预测起始点设置为70。位于真实值右侧的曲线表示预测上限, 左侧曲线表示预测下限。从图6 中可以看出, 4组电池的预测区间, 即上下限范围差, 在大部分情况下覆盖了真实值, 这说明本文所提模型可以实现对锂离子电池RUL的区间预测。
图6 4组电池的区间预测结果(cell 5, cell 6, cell 7和cell 18)
由图6 可知, cell 7在测量周期内没有达到失效阈值, 因此, 在表1 中给出了cell 5, cell 6和cell 18的RUL区间预测结果。由表1 可知, 3组电池的RUL区间预测结果均包含了真实RUL值, 且预测区间宽度在30个循环内, 说明预测效果良好。
表1 3组电池的RUL区间预测结果(cell 5, cell 6和cell 18)
综上所述, 利用电池平台期放电时长和等压升充电时间间隔作为表征电池退化状态的指标来建模可以实现效果良好的锂离子电池RUL区间预测。
为进一步评价本文所提区间预测模型的性能, 引入一类可评价区间预测模型的指标, 一个是特异性准则(记为V), 用来计算预测区间的宽度, 另一个是覆盖准则(记为Q), 用来衡量预测区间的数量。讨论第i个时间窗的数据, 令其为Xi={x1,x2,…,xw};[ai,bi]为预测区间。两组指标定义为
Vi=bi-ai,
(23)
(24)
(25)
式中:w表示窗宽。当Qi值相等时,Vi值越小, 表示模型预测结果的精确度越好。同样, 当Vi值相等时,Qi值越大, 说明预测结果越准确。另外, 令p为时间窗的个数, 可以得到源于Vi和Qi的综合指标P。
(26)
4组电池的区间预测评价结果如表2 所示。
表2 4组电池的区间预测评价结果(cell 5, cell 6, cell 7和cell 18)
本文提出了一种新的区间预测策略, 实现了对离子电池RUL的区间预测。用更易于测量的健康指标而不是容量来表征电池退化状态, 更适用于实际情况。在利用数据驱动方法训练模型时, 模型效果受输入特征与输出数据之间相关性的影响较大, 因此, 本文利用灰色关联分析计算与容量(输出)相关度最高的指标可以最大程度地保证训练效果。本文利用了区间预测中常用的数据处理方法模糊信息粒化, 将特征序列处理为带有上下限的颗粒, 方便了后续处理。另外, 建模选择了泛化性能强且小样本友好的LSSVM。实验结果表明, 4组电池都实现了RUL区间预测, 且预测区间在30个循环周期内, 说明所提模型的区间预测效果较好。在4组电池的区间预测过程中, 区间预测覆盖率均在90%以上, 预测宽度在0.056内, 说明所提模型区间预测的准确度和精确度良好。下一步的研究工作可利用实际工况下的数据集而非实验室数据对所提模型性能进行测试和优化, 使其更适用于实况环境。