方形卷绕式锂电池电极褶皱检测方法研究

2021-06-03 03:55周佳禾宫临凡王盛瑶
仪表技术与传感器 2021年5期
关键词:子图锂电池卷积

周佳禾,宫临凡,王盛瑶

(1.国网天津信通公司,天津 300010;2.长庚大学资讯工程学系,台湾桃园 333323;3.浙江大学数学院,浙江杭州 310027)

0 引言

广泛应用于数码相机、移动电话等便携电子设备的方形卷绕式锂电池是锂电池3种重要构型中的一种,集成了圆柱卷绕式与方形层叠式两种构型各自的优点。方形卷绕式锂电池安全性好、体积小、容量大、空间利用率高。在方形卷绕式锂电池的生产工艺流程中,卷绕及组装等环节容易产生隔膜褶皱与电极错位等现象,严重影响电池的安全性与使用寿命。为保证锂电池产品质量,生产过程中的缺陷检测必不可少。使用数字化X射线摄影(digital radiography,DR)技术生成锂电池电极结构影像,利用机器视觉技术处理、分析获得的DR影像,实现锂电池电极缺陷检测[1-4],是业界的主流技术路线。

传统机器视觉基本思想包括图像采集和特征检测2部分。特征提取算法主要包括HOG[5]、LBP和SIFT[6]等,此类算法均依赖于人工定义特征,其灵活性与适应性有很大的局限性。随着机器学习技术迅速发展,在物体识别方面能够达到商业化的要求。早期的锂电池缺陷检测研究中,缺陷识别多使用传统的图像处理方法,如灰色关联算法[7]和Otsu算法[8]等,但其发展趋势逐渐步入机器学习领域。文献[9]提出一种锂电池膨胀缺陷的检测算法,使用双峰直方图对图像进行预处理,并使用支持向量机SVM实现特征提取与分类。文献[10]使用基于Tucker张量分解的方法对锂电池的单元缺陷进行研究,利用支持Tucker机对缺陷样本进行训练并实现分类。文献[11]选择机器学习中的决策树分类器建立模型,对锂电池的电极隔膜缺陷进行检测分类。

自2012年以来,以卷积神经网络(convolutional neural network,CNN)为代表的深度学习技术发展迅猛。CNN在模式分类、目标检测、图像分割等任务上性能全面超越了传统的机器视觉技术,成为科学研究和工程实践的热点之一。

历史上第一个成功的CNN模型是应用于识别手写数字的LeNet-5[12],它的出现推动了深度学习领域的发展,随后又陆续出现了AlexNet[13]、VGG[14]、GoogLeNet[15]、ResNet[16]和MobileNet[17]等经典的网络模型,均取得了标志性的成就。如今CNN已成为机器视觉问题中最受欢迎的研究方法,并在解决基于图像的识别与分类问题上倍受青睐。文献[18]使用改进的LeNet-5模型对太阳能电池板进行缺陷识别与分类。文献[19]以VGG的网络结构为基础进行了电池片缺陷识别的研究。2019年,文献[20]选取了VGG19等几种经典的深度学习模型对锂电池的缺陷检测进行研究,在取得较好的实验结果的同时,也存在着参数较多、运算时间较长的问题。

针对方形卷绕式锂电池电极褶皱缺陷,本文提出了一种卷积神经网络CNN与支持向量机SVM结合的检测方法,使用CNN模型提取图像特征,再使用SVM完成最终的检测分类预测,在精确度与实时性两方面均满足实际生产要求。

1 数据集的制作

1.1 电池电极DR影像预处理

图1为非晶硅平板探测器拍摄的锂电池局部的DR影像,图像尺寸为1 600×1 200。图中高亮圆形部分是X射线覆盖区域,右下角处为锂电池电极有效区域的影像,其中左侧亮度偏高的灰色部分为锂电池的阳极区域,右侧亮度偏低的部分为阳极与阴极混合区域,影像中能够清晰看见极片的横截面情况。从图1可以看出该区域电极分布均匀、排列整齐、无错位或褶皱现象发生。检测系统需依次检测电池的四角,方能综合确定电池的质量。

锂电池DR影像的预处理包括电极位置调整、倾斜校正和电极图像分割。位置调整的目的在于将锂电池DR影像中电极有效区域调整为同一位置(右下角),便于后续处理,倾斜校正力图减小电池姿态对成像的影响。锂电池DR影像经过位置调整和倾斜校正,通过简单的图像分割即可获得电池电极有效区域的图像。图2(a)为锂电池DR影像经预处理后得到的电池电极有效区域图像,图中显示电池外层阳极边缘出现了明显的褶皱。

1.2 数据集生成与标注

为了扩大数据集的规模,对每幅原始电池电极图像,以其中心为圆心分别进行2次-2°~-1°和1°~2°的随机旋转,从而将每幅电极图像数量扩展至5幅,以补偿CNN在旋转不变性上的不足。每幅电极图像以重叠分割的方式裁剪出100张99×99的小尺寸子图,在水平与垂直方向的裁剪间隔均为在10像素基础上附加0~5个像素的随机扰动。每幅原始电池电极图像可生成500张候选子图。图2(b)为从图2(a)中裁剪出的部分候选子图。

面对数以十万计的候选子图,如果采用直接人工标注分类,一方面对操作者的体力和心理是一个巨大的挑战,另一方面候选子图感受域的有限会影响分类判断,错误标注不可避免。为此,本文采用人工标注与自动分类结合的数据集标注方法。针对数量较少的用于生成候选子图的电极图像,使用标注工具labelme对其存在的电极褶皱进行人工标注。根据电极褶皱形态的不同,分别使用了线段、折线、多边形、三角形和矩形等方式予以标注。对于每张候选子图,在其中心位置划分出尺寸为79×79的正方形核心区域,使该核心区域与子图边界的间隔均为10像素。自动分类时,对于每张候选子图,若其完整区域与其原始生成电极图像褶皱标记区域交集像素小于正例分类阈值,标注为正例样例。如果候选子图核心区域与其原始生成电极图像褶皱标记区域存在交集,则标注为负例样例。除此以外的其他情况,候选子图虽然与标记区域存在交集,但不满足正例和负例的判定条件,该子图被归类为灰色样例。

本文共选取1 300幅锂电池电极图像进行子图裁剪,生成65万张候选子图用于数据集的制作,正例分类阈值设置为5。训练集、验证集与测试集中的样例分别源自不同的原始电池电极图像,以保持各数据集的相对独立。在剔除灰色样例后,训练集、验证集与测试集的样例数量分别为460 918、51 599和55 364。

2 基于CNN的特征提取

本文使用卷积神经网络提取图像特征,具体结构如表1所示。网络的第一层是预处理层,完成对输入数据的归一化预处理。conv1使用步长为2×2的7×7卷积核,结合max-pool层进行下采样,缩小特征图的尺寸。conv3_0和conv4_0使用步长为2×2的1×1的卷积替代池化层。conv5_1、conv5_2和fc层均使用卷积运算实现全连接层的功能。该模型训练阶段输入图像的尺寸为99×99,输出为1×1×2的张量。在推理阶段受益于卷积运算的自适应性,模型可以输入任意尺寸大于99×99的图像,利用输出的张量实现电池电极图像特征提取。网络中除linear以外的所有卷积层均使用ReLU激活函数,除conv5_2和linear以外的所有卷积层都加入了批归一化(batch normalization,BN)[21]操作。

表1 卷积神经网络架构

归一化是深度学习中常见的数据预处理手段,统计训练集的均值与方差,并使用该均值与方差在训练与推理阶段对训练数据和测试数据做归一化处理。受批归一化的启发,将归一化处理加入到CNN的第一层,利用训练阶段minibatch的均值与方差估计训练集的均值与方差,这两个参数在网络训练结束后被集成在网络模型中,供推理时使用。预处理层具体计算方法如下:

μE=EB[μB]

(1)

(2)

(3)

式(1)和式(2)与标准BN算法完全相同,式(3)与标准BN算法稍有差别。式(3)利用均值与方差的估计值对输入数据x做归一化处理,省略了BN中的平移及缩放运算。预处理层中部分运算源自BN,但无待学习的参数。为此,将该层命名为“类批归一化”(BN-like,BNL)。

选择交叉熵函数作为网络训练阶段使用的代价函数主体,并加入了正则项,提高网络的泛化能力。

(4)

式中:m取值为128;yi为当前minibatch中第i个样例的分类置信度;αi为其归一化样本均衡因子,正比于yi归属类别样本数量的倒数;正则项中的w表示网络各层中的突触权值,正则项系数λ=1.0×10-2,用于惩罚较大的突触权值,旨在提升网络的泛化能力。

此外,网络的conv5_2层和linear层中还引入了dropout机制,也能够实现过拟合抑制,dropout的概率取值为0.5。

网络在随机梯度下降的训练过程中,加入了动量项和学习率衰减的策略,用于加速网络的收敛,减少梯度下降过程中的频繁震荡。训练阶段网络参数的更新规则为

(5)

θj+1∶=θj+vj+1

(6)

η=max(0.981p·η0,5.0×10-4)

(7)

式中:v为动量项;μ为动量项系数,μ取值0.6;θ为网络中包括突触权值在内的待学习参数;j为迭代次数;η为学习率,学习率初值η0=0.01;p为回合次数,学习率每回合更新一次,呈指数级衰减,至第120回合时衰减为1.0×10-3;max(·)为取最大值运算,确保学习率不低于5.0×10-4。

3 基于SVM的图像分类预测

利用小尺寸子图训练得到的CNN模型,将用于电池电极有效区域图像的特征提取,该特征供SVM完成最后电池电极褶皱的结果预测。

与训练阶段不同的是,CNN模型在推理阶段使用了较大尺寸的图像,目的在于覆盖电池电极完整的有效区域。针对电池电极有效区域图像尺寸的不同,通过裁剪或补零将其尺寸统一处理至275×275。在输入图像尺寸为275×275时,CNN模型推理输出的维度扩展为12×12×2,可分解为2幅尺寸为12×12的分类置信度结果图。选择负例对应的置信度结果图,经阈值降噪处理后作为电池电极特征(见图3),SVM使用该特征完成迁移学习,并给出电池电极褶皱的检测结果预测。阈值降噪处理的计算为

f(x)=xu(x-th)

(8)

式中:x为负例对应的置信度结果输出;u(x)为阶跃函数;th为阈值,本文取0.25。

4 实验结果与分析

4.1 模型检测精度

图4为CNN训练120回合的训练误差与测试误差曲线,训练误差最低达到0.05%,测试误差最优为0.38%。

我们使用17 160幅电池电极图像进行特征提取与迁移学习。选择测试误差最优回合的CNN模型提取电极图像特征,并借助sklearn的SVM实现SVM迁移学习。在参数配置上,核函数选择高斯核函数,惩罚因子设为2.0,并加入了自动样本均衡设置。使用10折叠交叉验证方法,交叉验证结果如图5所示,平均验证误差为0.96%。

为了对比SVM迁移学习的性能,设计了另一种迁移学习方案。在训练得到的CNN模型中,保留conv5_1之前的结构并冻结其参数,在此基础上添加4个3×3卷积层、1个全局平均池化层、2个全连接层和一个softmax层。使用相同的数据集进行相同的10折叠交叉验证实验,每次验证训练120回合。从图5的数据对比可以看出,SVM迁移学习性能略优于基于CNN迁移学习,这印证了在SVM较小数据集上的性能优势和CNN对数据集规模的依赖。

实验使用的硬件平台为i5-4570CPU+GTX1050GPU。CNN模型对尺寸为275×275的电极图像提取特征的平均耗时为7.6 ms,SVM推理的平均耗时为0.27 ms。

4.2 模型性能对比

锂电池的缺陷检测通常应用于实际生产中,因此对检测的精确度与实时性要求较高。本文共选取了VGG19、MobileNetV2、InceptionResNetV2[22](表2中简写为IncResNetV2)和ResNet50等4种基于深度学习的CNN模型,从准确性与实时性两方面进行对比实验。实验结果表明,本文提出的方法在检测精度与检测速度方面略占优势。实验从迁移学习的角度出发,对比模型均使用了keras中提供的预训练模型参数,且这些模型同样只用于提取特征,后续的分类预测仍然由SVM完成。表2为不同模型结合SVM的10折叠交叉验证性能对比。可以看出,本文提出的方法在检测精度与检测速度方面略占优势。

表2 模型性能对比

在使用模型进行特征提取方面,针对不同模型的特点,在输入图像尺寸上采用了相应的设置。由表2可知,InceptionResNetV2的特征提取耗时最长,原因是该模型结构较深,深度达572层,因此计算的复杂度也会相对较高;MobileNetV2模型是针对移动设备设计的轻量型网络,参数量较小,计算速度较快,因此MobileNetV2的总耗时在4种对比模型中最少。但MobileNetV2由于模型规模较小、参数较少,性能相比规模较大的网络会稍差一些。从表2可以看出ResNet50、VGG19和InceptionResNetV2结合SVM的分类预测误差较低,使用MobileNetV2的分类预测误差偏高。

5 结束语

本文利用卷积神经网络提取特征结合支持向量机实现分类的方法对卷绕式锂电池电极褶皱检测进行了研究,实验证明该方法具有较高的检测精度与检测速度,能够满足基本生产要求。在进一步提升检测性能方面来看,研究中还存在一些待改善的问题:一是在制作数据集前的图像预处理中,提前分析成像环境等因素是否对图像造成了影响,加强电池图像的质量;二是平衡不同褶皱特征的样本数量,改善样本的均衡度。

猜你喜欢
子图锂电池卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
临界完全图Ramsey数
基于傅里叶域卷积表示的目标跟踪算法
基于频繁子图挖掘的数据服务Mashup推荐
充电电池到底该怎么带?——话说锂电池
一种多采样率EKF的锂电池SOC估计
不含2K1+K2和C4作为导出子图的图的色数
一种基于卷积神经网络的性别识别方法
锂电池百篇论文点评(2014.6.1—2014.7.31)