基于离群点检测的动力电池一致性快速辨识方法

2023-10-19 00:31黄彧王占国张言茹王瑞张维戈
电测与仪表 2023年10期
关键词:整组离群电池组

黄彧,王占国,张言茹 ,王瑞,张维戈

(1.北京交通大学 电气工程学院,北京 100044; 2.国家能源主动配电网技术研发中心,北京 100044)

0 引 言

产生动力电池不一致性的主要原因有两方面[1-3],首先是在生产过程中,由于生产条件和工艺等因素,通过配料、涂膜、装配、化成等步骤,成批次生产的单体电池本身在尺寸、微孔率等方面具有不一致性;其次在单体电池成组后,由于其在成组中位置分布不同导致散热率等环境因素不同,会在运行使用过程中对单体电池的性能变化产生不同的影响,从而进一步加速成组电池不一致性的发展[4]。

电池不一致性受多方面因素影响,包括容量、内阻、自放电率等。电池包的容量变化服从木桶效应,由容量最低的单体决定,容量不一致性越大对成组影响越严重。在车辆行驶过程中,需定时对车辆一致性进行检测,便于发现危险单体及早排除,改善一致性以实现机动车使用价值最大化[5-7]。

关于电池组一致性的衡量和辨识方式,现有研究较为丰富。按照研究内容分类,主要分为对内特性参数和外特性参数的研究。其中内特性参数包括内阻、容量、电化学阻抗谱、极化电压;外特性参数包括充放电电压分布、充放电电压序列、SOC(State of Charge;电池可用容量和额定容量的百分比)、OCV(Open-circuit Voltage)曲线等。在基于不同参数的一致性辨识方法中,使用内特性参数的方法涉及测量过程一般较复杂,耗时与计算量相对较多,更能代表电池内部特性;使用外特性参数的方法,一般参数测量较简单,可在一定程度上描述电池组一致性状态[8-13]。

按照研究方法分类,对一致性的评估辨识方法包括测量分析方法、统计分析方法、数据聚类分簇方法、神经网络法等等。基于测量、统计的一致性辨识方法结果与参数测量精度、参与辨识参数类型、分类标准与阈值紧密相关,评选标准确定后,辨识结果是固定的;在使用聚类、神经网络的辨识方法中,选用模型与训练参数输入会对辨识结果造成较大影响,辨识能力会随着训练数据的变化和学习模型的自我修正而不断变化[14-20]。

1 异常单体表现

1.1 容量异常

容量偏低单体在放电过程中比其他单体电压降低更快,在充电过程中电压上升更快,即电量更易耗尽和更易充满。容量偏低单体电压在充电过程的表现为:充电前期在整组中偏低,在充电过程中其电压快速提升,在充电后期其电压在整组中偏高。充电过程中容量偏低单体相较整组的变化趋势可参考图1,其中黑色粗曲线为容量偏低单体。

图1 容量异常单体在电池组表现

1.2 内阻异常

电池的极化电阻在充电过程中不易直接得出,但其欧姆电阻可通过电池上电过程中的电压差值近似计算得到。在电池组上电的短时间内电压差变化较大的单体,其对应内阻较大。内阻偏大单体在上电期间电压的变化趋势如图2所示,其中黑色粗曲线为内阻偏大单体。

图2 内阻异常单体在上电区间表现

1.3 SOC异常

锂电池放电曲线为非线性,SOC会受驾驶习惯,环境温度等多种复杂条件影响,其测量也必须经过一些其他物理量的测量,基于相关电路模型或数学工具借助复杂算法得到。但SOC偏移单体在整组电池中的表现是可直观观察到的,如图3,其中黑色粗曲线为SOC偏高单体。

图3 SOC异常单体在电池组表现

2 离群点检测算法相关介绍

2.1 离群点算法原理简介

离群点检测发展至今,已广泛运用于多个社会领域,例如:数据库异常分析、生产监测、故障诊断等;其算法理论研究也相当丰富,较为主流的检测方法包括:基于统计的离群点检测、基于距离的离群点检测、基于聚类的离群点检测、基于分类的离群点检测、基于密度的离群点检测[21-22]。

(1)基于统计的离群点检测

离群点检测最早出现在统计领域。基于分布的方法是由已知数据特性假设给定的数据集符合某种概率分布模型,或从已知的数据集中寻找其符合的概率分布模型, 然后使用这个模型来对数据进行匹配,与分布模型不匹配的数据点被识别成为离群点。

其经典检测方法为基于正态分布的离群点检测方法。

(2)基于距离的离群点检测

E.Knorr和R.Ng在众多研究成果的基础上最先给出了基于距离的离群点检测的定义:如果对象O在数据集N中有大于P部分的对象与它的距离都大于D,那么就将对象O称为数据集N上的DB(P,D)离群点。该定义中参数P代表的是与数据点O的距离大于D的所有数据点占数据集总数的比例的最小值。

基于k邻居距离来判断是否离群还有几种经典算法:

Top-n-Outlier:如果一个数据集具有N个对象,给定对象离群程度的计算公式,计算每个对象的离群得分,离群得分最高的n个对象就是所求离群点。

Top-n Dk-Outlier:数据集O中那些到其第k个最近邻居的距离Dk最大的n个对象就是离群点。

Top-n wk-Outlier: 数据集O中那些与其k个最近邻居的距离之和wk最大的n个对象就是离群点。

这些基于距离的离群点方法比较简单,但对参数选取比较敏感,算法时间复杂度较高。由于高维空间数据的高度稀疏性使得数据点之间几乎是等距离的,其不适用于高维数据集。

(3)基于聚类的离群点检测

其核心思想为:如果一个对象不属于任何簇,则该对象是基于聚类的离群点。

基于聚类离群点挖掘的主要优点是:

1)由于对聚类的研究成果比对离群点的研究成果更多,而且有些聚类技术(如k均值)的时间和空间复杂度是线性或接近线性的,因而基于这种算法的离群点检测技术是可行和高度有效的;

2)簇的定义通常是离群点的补集,因此可同时发现簇和离群点。

其主要缺点是:

1)聚类算法的主要目标是发现簇,而不是发现离群点,因此对离群点的挖掘效率较低;

2)在聚类过程中,为了避免离群点对聚类的影响,不同算法采用了适合特定数据类型的方法,因此算法的针对性很强,必须小心地选择聚类算法;

3)基于聚类的离群点挖掘算法依赖于所有簇的个数和数据中离群点的存在性。

2.2 离群检测在动力电池的应用

现有的动力电池故障预警研究中已使用了离群点相关的概念,在搭建的动力电池状态参数检测系统中,借由容量增量分析法中得到的代表电池特性的特征参数进行离群点检测,筛选有异常离群现象的单体电池[23-24]。

在动力电池性能研究中,容量增量分析法(Incremental Capacity Analysis,ICA)为现行使用较为广泛的一种研究方法。其借助电池容量增量曲线(IC曲线),如图4所示,将电池平台区内的细微变化反映出来。在图4(a)中可观察到,锂电池平台期变化缓慢且占据容量增加过程的主要区间,该过程是富锂相和贫锂相两相共存状态的反映,是锂电池内部特性的主要体现;具体地,在三元锂离子电池的整个充电过程中,正极的反应过程主要为镍离子(Ni+)由二价离子(Ni2+)转化为三价离子(Ni3+),和三价离子(Ni3+)转化为四价离子(Ni4+)这两个反应;而负极反应过程为石墨(碳)的五个状态(C6、C12、C18、C36、C72)之间的四次相变。

图4 锂离子电池电压曲线和容量增量曲线

从图4(b)可得到,在平台期对应的电压区间,通过容量增量处理,可明显观察到两个IC峰的形成,IC峰的峰值、位置、宽度、包含面积等都与锂电池内部特性相关联,可对应相关锂电池的容量、内阻等重要性能参数。

现有的电池故障预警模型在已知IC曲线中的特征参数中选取相关系数不大的主峰峰值、主峰位置作为特征信息,基于正常电池衰退过程的特征信息分布轨迹散点图,划定锂电池带状安全区域,在动力电池特征信息位置超出安全区域时提出故障预警。其中电池安全区域位置的确定和区域面积的划分,使用的便是基于正态分布的离群点检测原理。此方法可在一定程度上有效预警电池故障,但其需要大量的电池充电实验得到电池的安全运行区间带,在检测时为得到电池的IC曲线需要经过大量滤波工作,会耗费大量计算资源及一定的计算等待时间。

3 动力电池一致性快速辨识方法

3.1 现有电池一致性辨识局限性

现有电池一致性辨识多为单项性能参数测量,需要实验室或电池厂测试条件,且测试时间较长。

例如电池容量以安时数衡量,目前较为准确的电池容量测试需要采用小倍率充放电测试,一辆70 A·h的电动汽车以5 A的小电流充电要耗时14 h才能完成一次测试,耗时较长。

锂电池电阻主要包括欧姆电阻和极化电阻,欧姆内阻对于具体某个电池来讲,是个相对固定值,而极化内阻与正负极材料和电解液的浓度、电池充放电电流大小和环境温度等有关。其准确值需要通过HPPC测试实验,实验需对电池进行多次大电流放电,其中需要数小时的静置时间。

评价一组电池的SOC偏移情况,可在首支单体充电达到电压上限后(即100%SOC),计算其余单体所在的SOC状态。涉及单体容量和已充电量,一般借助复杂数学工具计算完成,同样需要大量测试时间与较高的仪器测量精度。

故上述方式不适用于在役车辆电池组,不能满足日常一致性辨识需求,下文提出的动力电池一致性快速辨识方法,基于动力电池1 C充电倍率下的的充电数据,仅需一小时左右的时间,对电池组进行充电操作,即可完成对数项电池参数一致性的辨识,测试流程简单,计算量小,测试时间与计算时间都相对较少。

3.2 单体电压服从正态分布验证

基于上文对离群点检测算法的研究,本文选用基于统计分析的离群点检测算法,在使用算法前,对动力电池电压数据分布的正态性进行验证。

动力电池成组采用同一批次的电池,生产条件统一,电池性能表现近似正态分布,推测电池组在某一时刻的单体电压服从正态分布。其正态性可从电压分布图大致观察得出,图5为某组电池在充电过程中某时刻对应的单体电压分布图,从图中观察各时间点的单体电压分布近似于正态分布的钟型,数据分布对称性较好。为了更加科学地确定电池组单体电压分布的正态性,文中选用经典的偏度-峰度检验法对其进行检验。

图5 瞬时单体电压分布

峰度(kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。随机变量的峰度计算方法为:随机变量的四阶中心矩与方差平方的比值,如式(1)所示:

(1)

峰度包括正态分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)。

偏度(Skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。定义上偏度是样本的三阶标准化矩,见式(2):

(2)

偏度定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0)和左偏分布(也叫负偏分布,其偏度<0)。

一般峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。

文中使用SPSSAU在线数据分析软件实现偏度-峰度检验。将某组电池充电时长五等分,将均分后对应的5个时间点所在的85支单体的电压数据进行计算,计算结果如表1所示。从表中数据可得,充电过程中某一时刻对应的单体电压分布可近似服从正态分布。

表1 正态性检验结果

3.3 基于正态分布的动力电池一致性快速辨识方法

动力电池组一致性快速辨识方法主要分为两步,第一步:基于统计分布的离群点检测方法,分辨出电池组内存在离群现象的电池单体;第二步:结合上文对各类问题单体在整组中电压表现的分析,对离群单体存在性能极端表现的原因进行识别。

(1)基于正态分布的电池极端情况标记

由于在车辆充电过程中,整组电池单体电压的分布情况是一个动态变化的过程,故经对电压变化快慢和计算量的综合考虑,选定时间间隔5 s,对整组单体的电压分布情况进行周期性正态拟合。

对于拟合结果中处于整体两端的单体,根据分布概率将其极端程度量化。如图6所示,当单体的电压值处于整体的80%区间内时,认为该单体此时刻处于较为正常的状态内,赋予其极端值为0;当某单体处于正态分布概率小于10%的区间时,赋予其极端值m1;当某单体处于正态分布概率小于5%的区间时,赋予其极端值m2。

图6 正态分布统计

为了给下文具体性能辨识做准备,从时间(充电前、充电中、充电后)和正态分布(高端、低端)两个维度划分6个区间,如图7所示,分区间记录单体极端偏移情况,其中上电时刻为t1,下电时刻为t2。

图7 二维区间划分

随着充电过程中每次拟合,每个单体由拟合得到的极端值也被随之累加。对于每支单体而言,其极端程度的分区间积分过程可联系式(3)理解。

(3)

式中T1为充电前时间序列[1,1,…,1],设充电开始前共进行了n1次拟合(n1=t1/5),其为1×n1的全1矩阵;T2为充电中时间序 [1,1,…,1],设充电开始至充电结束共进行了n2次拟合(n2=(t2-t1)/5),其为1×n2的全1矩阵;T3为充电后时间序列[1,1,…,1],设充电结束后共进行了n3次拟合,其为1×n3的全1矩阵;L为低端极端值序列[l1,l2,…,ln]T,n为n1、n2、n3之和,l的取值为0,m1或m2;H为高端极端值序列[h1,h2,…,hn]T,n为n1、n2、n3之和,h的取值为0,m1或m2。

每次拟合并更新其区间累积分值矩阵后,都会对每区间分值是否超过阈值进行判断,若超过则对该单体进行相应的区间标记。用“A+”、“A-”、“B+”、“B-”、“C+”、“C-”符号,按照时间发生顺序,对单体在全充电过程中存在的电压分布极端情况进行标记。各区间阈值范设定如表2所示。由于容量偏低单体在充电前期电压偏低时间较短,故此情况下可适当降低阈值要求。

将极端分布情况赋值、累计、并设阈值,可排除单体的电压出现偶然分布极端情况,将电压长期处于极端位置的单体筛选出来。

(2)单体性能识别

结合第1节讨论的单体电压在充电过程中分布情况对应的性能表现得到表3。根据单体电池的标记对照该表,即可得到每支单体当前的性能情况。

表3 单体电压表现辨识表

例如被标记为“A-B-B+C+”的单体,即存在单体容量较小的情况,需将其筛出后期针对性关注其容量发展变化。若一支单体无任何标记,则说明其在充电过程中单体电压一直处于中等水平,是电池组中性能参数较均衡的单体。

筛选出不利于电池一致性发展的单体,以供测试者重点关注,例如容量小、内阻大的单体,容量大或内阻小的单体无需筛出。

(3)单体极端程度评价

整组电池的标记辨识完成,对选出的单体进行极端程度评价,提出极端值计算方法如式(4)所示:

(4)

(4)电池组一致性评价

上文已对电池组全充电过程进行了周期性正态拟合,可从中得到其若干次拟合标准差σ的平均值,该数值可在一定程度上表现电池组一致性情况。

经分析数据发现,一致性较好与较差的电池组的标准差平均值数值范围在百分位至千分位间波动,两者之间一般差距一个数量级。故将其电池组一致性参数定义如式(5)所示,以更简易直观地表达一致性差别。

(5)

将同型号多种不同状态的动力电池组一致性参数进行比较,可得到一致性较好、一致性中等、一致性较差的电池组对应参数范围如表4所示。

表4 一致性参数划分范围

由此可划定一致性初步评价标准,对电池组一致性进行评价。

4 算例分析

利用3.3节所研究的一致性快速辨识方法,对实际车辆电池组性能进行评估,本文选用长安新能源汽车进行性能测试,选取测试算例中具有代表性的三个算例,对其计算结果进行分析研究。

4.1 算例一

测试车型为长安逸动160,整组共85支单体,额定容量为80 A·h。对车辆电池组进行快充测试,将测试数据进行一致性快速辨识计算。针对计算结果,将被辨识出的单体按照极端值进行排序,并对照这些单体实际性能参数在整组的排序位置,验证辨识结果的参考价值,如表5所示。

表5 算例一测试结果

该车辆为性能较差的返厂问题车辆,未能测得单体容量数据,但根据车厂反馈#69、#9、#76、#83均为问题单体,存在容量偏低问题。根据测试结果可看出,车辆电池组一致性参数确实较低,辨识出的内阻偏大单体的欧姆阻值在整组中处于顶端的位置,且极端值排序与阻值排序对应关系较好,证明极端值有描述单体在整组极端程度的参考作用,辨识结果具有参考价值。一致性较差的电池组,辨识出的极端单体危险程度较高,在车辆检修或维修时需要引起重视重点关注。

4.2 算例二

测试车型是长安奔奔,整组共86支单体,额定容量为80 A·h。对车辆电池组进行快充测试,将测试数据进行一致性快速辨识计算。针对计算结果,将被辨识出的单体按照极端值进行排序,并对照这些单体实际性能参数在整组的排序位置,验证辨识结果的参考价值,如表6所示。

表6 算例二测试结果

测试结果中,内阻偏大的单体对应的欧姆内阻在整组范围内排名第一,说明辨识出的这两只单体内阻在内阻一致性中属于较极端的单体;辨识出的SOC偏低的单体,在整组中的状态排序也处于较低的水平。实验结果表明一致性辨识算法选出的性能极端单体与实际情况基本吻合,具有一定的性能描述作用。

4.3 算例三

测试车型是长安逸动200,整组85支单体,额定容量为100 A·h。对车辆电池组进行快充测试,将测试数据进行一致性快速辨识计算。针对计算结果,将被辨识出的单体按照极端值进行排序,并对照这些单体实际性能参数在整组的排序位置,验证辨识结果的参考价值,如表7所示。

由计算结果可得,该组车辆电池的一致性状态较好,不存在容量偏低或内阻偏大的内部性能问题单体,仅部分单体电池的SOC存在偏置状况。其中辨识出的SOC偏高和偏低的单体,其性能偏置情况在整组中的SOC排名结果中得到了验证。基于整组一致性较好的情况,可认为此类电池组被辨识出的单体偏离群体的情况较轻微,可在后续车辆运行中继续保持关注。

5 结束语

文章发现并总结了性能问题单体在整组中存在的离群现象,提出基于离群点检测进行一致性快速辨识的研究方向。学习各类离群点检测原理后,从中选择使用基于统计分布的离群检测方法。基于正态分布离群点检测和性能异常单体的差异化表现,确定动力电池组一致性快速辨识的核心算法,对单体的极端程度和电池组一致性状态进行评估。方法测试流程简单计算量小,较传统方法具有明显速度优势。

最终通过算例分析验证,算法可辨识出具有离群现象的单体,有效描述电池组一致性情况。算法辨识出的单体在日后车辆运行和检修时可重点关注;车辆使用者可根据多次得到的辨识结果对车辆状态变化进行持续性地了解。

猜你喜欢
整组离群电池组
基于单元整组 用好习作支架 落实语文要素
论前置作业的目标性和实践性——以单元整组阅读教学和习作教学为例
2017年7月原电池及原电池组产量同比增长2.53%
青海某陆军预备役步兵旅严密组织整组工作检查验收
离群数据挖掘在发现房产销售潜在客户中的应用
基于LTC6802的电池组均衡电路设计
一种优化的基于ARM Cortex-M3电池组均衡控制算法应用
离群的小鸡
应用相似度测量的图离群点检测方法
一种基于核空间局部离群因子的离群点挖掘方法