廖子豪,于丽娅,李少波,周 鹏,2,张安思,李传江
(1.贵州大学 a.现代制造技术教育部重点实验室;b.机械工程学院,贵阳 550025;2.清华大学机械工程学院,北京 100062)
锂离子电池依靠内部锂离子的流动产生电流,具有功率密度大、工作温度范围宽、使用寿命长等优点。虽然历经了多年的改良和优化,锂离子电池的长期使用仍然会造成其性能衰退,从而影响其使用寿命和使用安全性,甚至进而造成严重的财产、人员等的损失[1-2],所以非常有必要对锂离子电池的剩余使用寿命(remaining useful life,RUL)进行预测,从而实现健康管理,以规避多种损伤电池寿命的操作并安全有效地对锂离子电池进行合理管理及使用[3]。
锂离子电池内部系统是一个随时间变化的动态系统,HU等[4]分析了电池寿命衰减的外部影响因素以及内部物理、化学因素,并从基于模型、基于数据驱动、基于融合的三类算法对电池RUL发展现状进行了系统总结。基于模型的电池RUL预测方法是利用专业相关的知识和经验建立电池寿命退化数学模型,例如电池内部结构的物理模型或是电化学方程,从电池内部结构出发,深入探讨其中的数学机理和退化规律,具有性能稳定、预测精度高等优点,但缺点是其需要知道准确的电化学、电池物理作用方程,且不适合于离线检测[5-7]。基于数据的电池RUL预测方法通过采集电池寿命退化的相关失效数据,利用算法挖掘数据隐含信息和数据之间的潜在联系,在统计分析等技术的支持下建立电池寿命退化的逼近模型,再将模型外推从而实现电池RUL的预测。基于融合的电池RUL预测方法通过融合和集成模型与算法、算法与算法,充分发挥各种方法的优点并扬长辟短,更好的提取和使用数据中的信息与数据特征,以获得更优异的网络模型鲁棒性和预测精度[8-10],但基于融合的方法存在的高消耗、数据需求大等问题又限制了其应用范围和泛化能力。
数据驱动的预测算法最大的优点就是不需要知道电池的准确模型,只需要一定量的退化数据即可完成,因此,数据驱动的电池RUL预测方法更加流行,应用也更加广泛,慢慢成为了电池寿命预测的主流方法[11-13]。数据驱动的电池RUL预测方法主要有人工神经网络、支持向量机、支持向量回归、粒子滤波等,其中人工神经网络旨在模拟人类脑部神经系统运作,因其强大的非线性处理能力、自适应性和自学习能力等优点在电池寿命预测问题中大放异彩[14],但是人工神经网络带来的训练缓慢、资源消耗过大、泛化性较弱等问题也在使用过程中慢慢地显现出来,成为了阻碍其在锂离子电池寿命预测方向发展的难点,好在增量学习的出现逐步解决了这些问题。
随机配置网络(stochastic configuration networks,SCN)是一种采用增量学习方式的神经网络,具有网络泛化性强、结构简单、实时性强、训练快速等优点。因此,本文使用SCN进行锂离子电池的寿命预测实验,旨在解决锂离子电池寿命预测中存在的精度低、训练数据需求大等问题,并使用FNN、CNN、LSTM等多种神经网络与所提方法进行对比验证,证明本文所提方法的可用性与优越性,为随机配置算法在电池寿命预测中的准确应用及推广提供科学依据,也为锂离子电池在航空航天、电子设备、汽车等多个领域的安全应用提供科学保障。
神经网络由于其对非线性映射良好的逼近能力和数据学习能力,被广泛应用于数据建模。但神经网络的构建存在一个现实性问题,即无法事先确定合适的网络架构以使模型达到良好的学习效率和泛化性能,而且计算参数(输入权重,偏差和输出权重)的过程既费时又费力,很难用于大规模数据分析。针对这些问题,人们开始了对增量式神经网络的研究,从小规模的网络开始,逐渐生成隐藏层节点和输出权重,直到满足预先设定的终止条件[15]。随机学习算法不仅在网络模型的建立上具有巨大的潜力,而且大大降低了网络的计算成本[16-19]。还有一种增量学习式神经网络-随机配置网络,不仅可以用于分类研究,还可以用于回归预测[20-23]。
对于给定的目标函数f:Rd→Rm,假设已建立一个拥有L-1个隐藏节点的单层前向反馈网络,如式(1)所示。
(1)
将误差表示为式(2)。
eL-1=f-fL-1=[eL-1,1,…,eL-1,m]
(2)
若误差eL-1未能达到预定误差限,算法目的就是以增量学习的方法添加βL,gL(其中gL的权重为ωL,偏置为bL),更新fL=fL-1+βLgL,直到误差eL-1达到给定误差限。
(3)
如果生成的随机基函数gL满足式(4)。
(4)
且输出权重由式(5)
(5)
式中,
(6)
从而推导得出一种具有强泛化性的逼近器。
不同于其他最大化目标函数的方法,式(4)中的监督机制通过计算最佳的权重ωL和偏置bL得到合适的新增节点,从而进一步达到满足式(7)的数理条件。
(7)
显然式(8)
βL=[βL,1,…,βL,m]T
(8)
通过
(9)
式(9)分析求值得到,并在网络中保持固定不变以进行进一步节点的添加。但是,这种方法可能会导致构造过程的收敛速度缓慢。因此,作者重新考虑了输出权重的计算方案,即根据式(4)计算得到gj(j=1,2,…,L),通过最小化全局残差来计算得到β1,β2,…,βL的值。
SCN涉及两个关键参数:隐藏节点的数量和随机参数的范围。节点的数量尽可能大量设置,第二个参数与随机基函数的逼近能力有关。SCN的建立分为两个步骤:①隐藏节点参数的配置:随机分配输入权重和偏差以满足式(4)。然后生成一个新的隐藏节点并将其添加到当前学习者模型中。②计算输出权重:通过使用最小二乘法或其正则化版本来求解线性方程系统来降低输出权重。
SCN采用Sigmoid函数作为隐藏节点激活函数,其中参数Y={λ1:Δλ:λmax}对自适应确定随机参数w和b的范围设置起着重要作用,虽然随机性有利于新添加的隐藏节点的快速配置,但参数的搜索范围可能对输入数据有关。由式(4)可得,权重ωL和偏置bL的随机分配应该具有一定的约束性且与输入数据相关。也就是说,隐藏参数的配置需要与给定的训练样本相关联,而不是完全依赖于随机权重和偏差的预设定,不应严格固定。事实上,在添加新的隐藏节点的过程中,λ∈Y是变化的。除了期望的误差容限e,也可以通过预先设置的最大隐藏节点个数Lmax来终止算法,以防止出现过拟合现象。
随着节点的增加,当残留误差变得足够小时,w和b的随机配置也会变得越来越困难。为了克服这个问题,SCN取r的时变值,这种情况下的r需要设置得非常接近1,以使式(10)趋近于0,从而尽可能地使得ξL≥0。
(10)
(11)
本文采用NASA电池数据集PCoE Datasets中的B0005、B0006、B0007三块电池的数据作为SCN的输入数据进行交叉验证实验,利用一块电池的放电电压数据序列和电池容量数据序列对SCN进行训练,分别再利用其余两块电池的放电电压数据对自身容量进行预测,从而实现锂离子电池的剩余有效寿命预测。PCoE数据集在不同温度下对电池进行充放电处理,记录了电池的充放电电压、电流、温度、阻抗等数据,是很好的数据驱动算法可用数据集[24],表1列出了NASA电池数据的具体信息。
表1 NASA电池数据
2.2.1 健康因子
本文选取电池放电电压作为间接健康子,电池容量作为健康因子[26],利用电池放电电压作为网络输入数据,建立数据驱动的电池容量预测模型,进而预测电池容量并对锂离子电池的健康状态进行评估。并使用灰色关联度分析(grey relation analysis,GRA)证明健康因子选取的可靠性。灰色关联度分析用于计算系统中其他元素对某元素的影响程度。假设在一个灰色系统中有n个影响元素,有一个重要元素X,已知其他n-1个元素对X均有不同程度的影响力,可以使用多元素统计分析计算其他n-1个元素对X的影响程度强弱。可利用下式计算两个数据元素之间的GRA值,两个元素的紧密程度越高,则得到的GRA值越高。
(12)
式中,ξi(k)为计算出的第k个影响元素序列的灰色关联系数;y(k)为参考元素序列即上文中提到的受关注元素序列X,在本文中为电池容量序列;xi(k)为比较元素序列即上文中提到的n-1个其他元素序列,在本文中为放电电压序列;ρ为自定义的分辨系数(一般取0.6)。最后根据式(13)求出放电电压序列的平均值,得到放电电压对电池容量的灰色关联度值。表2是电池B0005各放电数据对容量的灰色关联度值。
表2 各放电数据对容量的灰色关联度值
图1是经过预处理后的电池B0007的电压vol与容量cap衰减对比图像。根据放电电压以及电池容量的衰减图像可以更为直观地观察到两个系统元素的关联度。
图1 电池电压与容量衰减图像对比
2.2.2 训练数据
(13)
考虑到锂离子电池在充放电的开始和结束阶段因为化学反应造成的电压不稳定情况,相比较电池的168次循环数据我们去掉数据的开始30次循环和结尾38次循环,采用中间的100次循环数据对SCN进行训练。以下是我们得到的网络训练RMSE、训练集拟合图像和测试集拟合图像对比,其中网络实验采用B0005电池作训练集B0007电池作测试集的组合。图2和图3分别是100次循环数据做训练集和168次循环数据做训练集的算法拟合图像,图4是100次循环数据做训练集和168次循环数据做训练集的算法拟合对比图像。
图2 100次循环数据做训练集的拟合图像 图3 168次循环数据做训练集的拟合图像
图4 100次与168次循环数据做训练集的网路测试拟合图像对比
对比100次循环数据与168次循环数据分别做网络训练数据集的测试拟合图像,以及表3中RMSE均值可以看出,去掉电压数据的开始30次循环和结尾38次循环可以有效减少不稳定电压数据对网络训练的影响,从而加强网络训练效果,因此我们最终采用去除开始30次循环和结尾38次循环的电池放电电压100次循环据作为SCN的训练输入数据。
表3 网络RMSE值
2.2.3 训练参数
在确定了训练集数据量后,接下来我们以电池B0005做训练集电池B0007做测试集,利用单一变量实验找出最佳的Lmax,即隐藏层最大节点个数。从表4中不难看出,随着隐藏层最大节点数的增加,网络训练效果得到增强,在最大节点数Lmax为100时网络训练RMSE为0.019 2,此时网络拟合效果最好。文章也将节点数设置为200、500、1000分别做了对比实验,实验结果是网络训练均在Lmax≤100的情况下就会自动截止训练,说明隐藏层最大节点个数Lmax的值选定为100时网络训练效果最佳。
表4 网络Lmax个数与相应的RMSE
在SCN中,r是一个重要的参数。r是一系列正标量,用来随机配置网络权重ω和偏置b。我们从0.5开始设置r的大小直至10 000,同样采用电池B0005做训练集电池B0007做测试集的组合进行单一变量实验,发现r设置过大同样会出现训练集表现良好测试集表现差强人意的过拟合情况,如图5所示。综合多次实验结果考虑,最终将r设置为最大值200,最小值0.5。
图5 r的单一变量对比实验
经过多次对比实验,最终SCN的参数设置如表5所示。
表5 SCN参数设置
图6是SCN的电池寿命预测拟合图像。其中深色曲线为B0007电池数据集寿命真实衰减值,浅色曲线为SCN网络使用B0005数据集进行训练后得到的预测值。可以明显看出,SCN拟合曲线仅在网络初期有些许波动,是因为网络构建开始时节点较少造成的,随着网络节点的增加,曲线拟合情况渐渐变得良好。
图6 基于SCN的电池寿命预测拟合图像
图7是B0005、B0006、B0007的电池数据分别作为训练数据集的电池训练RMSE衰减图像。
图7 训练RMSE衰减图像
图8是三块电池数据的训练拟合图像,其中实线是电池的真实容量衰减图像,虚线是模型预测的衰减图像。
图8 训练拟合图像
文章取多种常用的电池RUL预测算法与基于SCN的电池RUL预测算法进行对比实验以验证随机配置网络对于电池剩余寿命预测的可用性及有效性。两种网络结构不同的前馈神经网络(FNN)、两种网络结构不同的卷积神经网络(CNN)和一种长短时记忆网络LSTM做出对比实验;数据集使用B0005数据做训练集B0007数据做测试集的组合。其中FNN1第一个全连接层采用输出维度10、正态分布初始化权重,激活层采用Leaky ReLU激活函数,第二个全连接层采用输出维度1、激活函数采用线性激活函数,网络优化器选用Adam优化器,不设置Dropout层;FNN2第一个全连接层采用输出维度40、正态分布初始化权重,激活层采用Leaky ReLU激活函数,第二个全连接层采用输出维度1、激活函数采用线性激活函数,网络优化器选用Adam优化器,并在两个全连接层之间设置Dropout层;CNN1采用小卷积核、Leaky ReLU激活函数,CNN2采用大卷积核、Leaky ReLU激活函数,并在第一层卷积与第二层卷积、第二层卷积与全连接层之间分别添加Dropout层。LSTM网络同样采用Leaky ReLU激活函数并添加Dropout层。
根据表6对比SCN算法和其他算法的RMSE均值可以看出,SCN的训练均方根误差最小。测试集在SCN上的拟合最为优秀。相比较其他人工神经网络,SCN的训练RMSE值最小,其值为0.0192,分别是FNN1的43%、FNN2的41%、CNN1的42%、CNN2的34%。
表6 网络RMSE值对比表
图9是SCN与多种神经网络的对照实验拟合图像,其中黑色加粗线条为真实值,红色加粗线条为SCN拟合值。可以明显看出,SCN的整体拟合情况优于其他网络,在预测初期由于隐藏节点较少,网络稳定性其拟合效果略差于LSTM网络,与CNN1较相似;在50次循环后,SCN的拟合效果明显优于其余网络,几乎与真实寿命衰减图像重叠。由此可以得出结论,本文提出的基于随机配置网络的锂离子电池寿命预测方法具有实用性,且准确性优于多种现有的神经网络方法。
图9 SCN与多种人工神经网络的对照实验
本文提出了一种基于随机配置网络的锂离子电池RUL预测方法。利用一种增量式随机神经网络SCN对电池RUL进行预测实验,首先对SCN的训练集数据进行确定,数据集采用NASA PCoE电池数据集,首先截取数据较稳定的中间100次循环作为SCN的训练数据,其次进行对比实验对网络参数值进行逐次确定,最后使用两种FNN网络、两种CNN网络、一种LSTM网络与SCN进行对照实验,实验结果表明随机配置网SCN在电池寿命预测的网络训练与拟合中均具有更好的表现,是一种稳定、高效、实用的锂离子电池RUL预测算法。