改进YOLOX的药品泡罩铝箔表面缺陷检测方法

2022-11-03 02:57:12胡海涛杜昊晨王素琴朱登明
图学学报 2022年5期
关键词:铝箔精度表面

胡海涛,杜昊晨,王素琴,石 敏,朱登明

改进YOLOX的药品泡罩铝箔表面缺陷检测方法

胡海涛1,杜昊晨1,王素琴1,石 敏1,朱登明2,3

(1. 华北电力大学控制与计算机工程学院,北京 102206;2. 中国科学院计算技术研究所,北京 100190;3. 太仓中科信息技术研究院,江苏 太仓 215400)

药品泡罩包装中铝箔表面包含各种字体和图案信息,而且铝箔表面凹凸不平,拍摄中会出现明暗分布不均的情况,可导致缺陷特征和铝箔表面特征相似度较高。针对YOLOX模型无法更加准确区分缺陷特征和铝箔表面特征的问题,提出一种改进YOLOX模型的表面缺陷检测方法。首先,为了使输入到Prediction网络的信息更具全局性,需要对Neck网络中特征图的全局特征进行分析,于是将Neck网络的CSP模块替换成transformer encoder模块。同时YOLOX模型具有较深的深度,为了有效地提高分类精度,使用Mish激活函数替换Swish激活函数。然后针对缺陷特征和铝箔表面特征相似导致缺陷区域和背景区域分类困难的问题,在损失函数中引入focal loss。实验结果表明,改进的模型对铝箔表面缺陷检测的mAP为90.17%,比原始的YOLOX模型提高了4.95%,并且改进的模型能够降低和铝箔表面特征相似度较高的缺陷误检和漏检的概率。

铝箔表面;缺陷检测;YOLOX;transformer编码器;Mish;focal损失函数

在药品泡罩包装过程中,铝箔表面会出现一些缺陷,比如密封不良、长破损、褶皱、气泡破损等。铝箔和塑膜贴合部分会出现点状的网纹,密封不良的原因是铝箔和塑膜贴合的过程中发生了密封偏移,即在药粒位置的铝箔上出现了和铝箔表面贴合部分相同的点状网纹区域,如图1(a)所示;长破损为铝箔上细长状的破损,铝箔表面较暗的区域和长破损特征很相似,如图1(b)所示;褶皱为铝箔和塑膜贴合部分在点状网纹区域出现的皱起,该类缺陷和铝箔中间凹陷区域具有相似的特征,如图1(c)所示;气泡破损为药粒位置的铝箔出现的大范围破损,该缺陷区域较大,如图1(d)所示。缺陷特征和背景特征相似度较高的问题给检测带来了很大地挑战。

一些研究者将传统的机器学习方法应用于药品泡罩包装的铝箔表面缺陷检测之中,且取得了不错的效果[1-2],但使用的数据集未见复杂的字体和图案信息,且缺陷区域与背景区域特征差异较小,缺陷识别难度较小。当被检测产品的表面出现各种字体或图案信息、缺陷区域特征和背景特征相似等问题时,传统的机器学习方法很难适应这类产品的表面缺陷检测需求。

随着深度学习的迅速发展,基于深度学习的目标检测技术被广泛应用于工业产品的表面缺陷检测研究[3-4]。基于深度学习的目标检测技术在具有复杂纹理结构的图像上取得了较高地检测精度,能够准确地识别和定位缺陷,但是很少有研究者将基于深度学习的目标检测技术应用在药品包装中铝箔表面缺陷检测领域。

基于深度学习的目标检测网络根据是否生成候选框分为一阶段和二阶段2种方法。一阶段方法直接从图像中预测物体类别,如FCOS[5],EfficientDet[6]和YOLO系列等,具有检测速度较快的优势;二阶段方法将目标检测分为生成候选框和目标类别识别2部分,如fast R-CNN[7],SPP-Net[8]和faster R-CNN[9]等,具有检测精度较高的优势。GE等[10]将YOLOv3-SPP[11]作为基准网络并进行改进,提出了YOLOX网络。YOLOX是典型的一阶段目标检测网络,具有速度快、精度高的特点,但是在铝箔表面上和背景特征相似度较高的缺陷检测中精度较低,不能满足工业上高精度的要求。因此本文选取了YOLOX网络,并进行了如下改进:

(1) 在Neck网络中引入transformer encoder模块[12],模块中的自注意力机制可以将感受野提升为整个特征图,在更大范围内学习特征图的特征。Transformer encoder模块可以使Prediction网络获得更有全局性视野的特征图,提高了和背景相似度较高的缺陷的检测效果。

(a) (b) (c) (d)

(2) 引入Mish激活函数[13]。YOLOX网络中使用了Swish激活函数[14],与Mish激活函数相比,其能提高模型检测的准确性。

(3) 在损失函数中引入focal loss[15],针对样本中缺陷区域和背景区域分类困难的问题,focal loss可以增加难分类样本的权重,减少易分类样本的权重,使得模型在训练时更专注于难分类的样本,并能精确地区分检测区域是否包含缺陷。

1 相关工作

在药品泡罩包装缺陷检测领域,一些研究者采用了传统的机器学习方法并取得很好的效果。文献[1]提出了基于四光源光度立体法的铝箔缺陷检测方法,提高了药品泡罩包装中铝箔缺陷检测效率。文献[2]采用模板匹配方法进行铝箔印刷品质量检测,其使用的数据集较本文数据集背景简单。当检测图像背景包含各种字体和图案信息较为复杂时,传统的机器学习方法不再适用。

近年来,基于深度学习的目标检测技术在工业产品的表面缺陷检测研究上得到了广泛应用。文献[3]提出了一种改进YOLOv3的金属缺陷检测算法,解决了目标尺寸小和特征不清晰导致漏检的问题。文献[4]研究了一种基于ResNeXT-SSD模型的多目标检测算法,该算法既保证了不额外增加参数复杂度也保证了特征提取网络的稳定性。在药品包装之铝箔表面缺陷检测领域中,采用基于深度学习的目标检测技术进行检测的工作较少。

在YOLO系列的相关研究中,文献[10]在YOLOv3-SPP网络的基础上进行了大量改进,提出了YOLOX网络。该网络共分为3部分:Backbone,Neck和Prediction。Backbone网络用于提取图像特征,Neck网络用于多尺度特征融合,Prediction网络进行识别和定位。

Backbone部分采用了CBS,Focus,CSP和SPP结构,其中CBS由Conv+BN+Swish 3部分组成,Focus结构采用了切片操作,CSP结构借鉴了CSPNet[16]的网络结构,由卷积层和个残差组件拼接组成。SPP结构采用3个不同尺度的最大池化进行处理,实现了多尺度融合。Neck部分使用了FPN[17]和PAN[18]结构,将语义特征和定位特征进行高效融合,进一步提高了特征提取能力。Prediction网络采用了Decoupled Head,anchor free,Multi positives和SimOTA的方式,Decoupled Head采用多路卷积操作实现对目标的分类和定位,将多路的输出结果进行拼接得到最终的输出结果。Anchor free[10]相较anchor based[11]方式大大减少了参数量,且该方式设计的锚框巧妙地将主干网络中下采样的信息引入进来。Multi positives方式以目标中心点所在网格的3×3邻域作为正样本,该方法可缓解训练期正负样本极端不平衡的问题。SimOTA为标签分配策略,首先设置候选框的数量,然后通过计算真实框和预测框得到的成本函数挑选候选框,最后过滤掉共用的候选框。该策略不仅减少了训练时间,也提高了模型的检测精度。

2 本文模型

本文针对铝箔表面的缺陷特征设计了一种改进YOLOX的缺陷检测模型,模型总体结构如图2所示。

2.1 Transformer encoder模块

CSP模块虽然增强了CNN的学习能力,但是感受野仍然局限于卷积核的大小,不能兼顾卷积核以外的像素信息。Transformer encoder中的自注意力机制可以将感受野提升为整个特征图,在更大范围内分析特征图的全局特征,因此本文将Neck中的CSP模块替换为transformer encoder,transformer encoder模块结构如图3所示,为了提高计算效率,本文将transformer encoder的数量设为1,Multi-Head Attention中的heads数量为4。

本文采用了Vision transformer的Embedding和encoder部分,首先将特征图在维度上进行变换,生成维度缩小的embedding序列,将得到的序列输入到encoder里得到三维的张量,然后将张量扩增至四维并对第一维和第四维进行转置,最后根据输出通道数改变转置后张量的维度。输入的特征图维度是[,,,],其中为样本数量,为通道数,和分别为特征图的宽和高。特征图的维度变化如图4所示。

Encoder中包括Layernorm[19],Multi-Head Attention和MLP 3部分,首先将得到的Embedding序列输入到Layernorm层,得到Q,K,V,将这些值输入到Multi-Head Attention得到的结果和Embedding序列进行残差连接,将其结果作为输入,然后将该输入经过Layernorm层和MLP模块得到的结果和输入进行残差连接作为最后的输出结果。其中MLP模块包含两层高斯误差线性单元[20](Gaussian error linear units,GELU)。

图2 模型结构

图3 transformer encoder结构

图4特征图维度变化

2.2 Mish激活函数

本文模型将CBS模块中的Swish激活函数替换为Mish激活函数,根据文献[11]实验结论,在分类准确率上,Mish激活函数优于Swish激活函数,而且随着网络加深,使用Mish激活函数仍然能保持较高的分类准确率,而使用Swish激活函数分类准确率则明显下降。因此本文将Swish替换为Mish激活函数,即

Mish激活函数如图5所示。与Swish激活函数相同,Mish激活函数有下界,无上界,避免了网络训练时因梯度为零导致的收敛缓慢,同时有利于网络参数的正则化。

2.3 Focal loss

损失函数可通过计算目标框和正样本预测框两者的误差得到,主要包含:①iou_loss:目标框和真实框的位置信息误差;②obj_loss:判断目标框中的对象是缺陷还是背景;③cls_loss:目标框中对象所属类别的误差。损失函数即为三部分之和,即

其中,采用的是传统的iou loss;采用的是focal loss;采用的是BCEWithLogitsLoss。

Focal loss在训练过程中通过(权重因子)为正负样本附上权重值,其中正样本检测缺陷区域的样本,负样本检测背景区域的样本。Focal loss还加入调制系数(1-p)以控制难分类和易分类样本的权重,即

其中,=1为正确预测的样本;为样本属于正确类别的概率。

3 实验结果与分析

本文实验运行环境为:处理器是Intel(R) Core(TM) i9-10900K CPU,64 G内存,显卡是NVIDIA RTX3090 24 G, Ubuntu 20.04 LST 64位操作系统,深度神经网络在pytorch深度学习框架上搭建,编译器为pycharm。

3.1 数据集构建

本文所用数据集采集于苏州某公司生产的泡罩包装产品,共包含4类缺陷,分别为密封不良(poor_sealing)、长破损(long_damage)、褶皱(fold)和气泡破损(broken_blister),共计1 007张,缺陷数量如图6所示。按照4∶1的比例划分数据集,其中训练集有805张,测试集有202张。

图6 缺陷数量

首先对图像进行预处理,为了保持原模型的输入大小,将图像尺寸从1920×720缩放为640×640。此外对训练集采用了Mosaic和Mixup[21]2种数据增强方法,增强后的训练集有2 007张,解决了缺陷样本数量有限的问题。

Mosaic数据增强方法是随机选取4张图像,然后在一个1280×1280大小的画布中随机选取一个点,选取比例为[0.5,1.5],之后按照左上、右上、左下、右下4个顺序一次对4张图像进行拼接。最后将画布大小裁剪成640×640,该方法大大丰富了训练数据集,增强效果如图7所示。

图7 Mosaic数据增强

Mixup在Mosaic的基础上增加了一种额外的增强策略,随机选取2张图像,然后设置一个融合系数,将缩放后的2张图像进行随机加权融合,最终得到融合后的图像。如图8所示,图像的标签与加权融合之后的结果相对应。计算方法为

其中,l∈[0,1],xi,xj为原始图像;yi,yj为图像标签编码;,分别为融合后的图像及标签编码。

3.2 模型训练

模型使用随机梯度下降(stochastic gradient descent,SGD)进行训练,初始学习率设置为0,使用cosine学习机制,权重衰减设置为0.000 5。训练的batchsize设置为2,训练迭代400次。

本文采用准确率(precision,P)和召回率(recall,R)计算出的平均精度均值(mean average precision,mAP)作为模型性能的评估指标。mAP是所有缺陷类别平均精度的均值,用来评估检测模型的整体性能。此外,Accuracy表示模型分类准确率,即

其中,TP(true positive)为被正确预测的正例;TN(true negative)为被正确预测的负例;FP(false positive)为被错误预测的正例;FN(false negative)为被错误预测的正例。+为所有样本,为检测类别数;()为第类缺陷的AP值,即

3.3 实验对比分析

3.3.1 不同模型结果对比

为了验证模型的综合检测性能,将本文模型与SSD,Efficientdet,Centernet,YOLOv5,Faster R-CNN和YOLOX进行对比,评价指标为4类缺陷的AP值、mAP值和FPS,实验结果见表1。此外,本文实验评价指标中的AP,mAP为AP0.50和mAP0.50,即当IoU=0.50时AP和mAP的值。

表1 不同检测模型的比较

注:加粗数据为最优值

由表1可知,在poor_sealing,long_damage和fold 3类缺陷的检测精度和所有缺陷的mAP中,本文模型优于其他模型,但对第四类broken_blister缺陷的精度比YOLOv5低0.49%,但相差不大。本文模型的检测速度虽不及YOLOv5和YOLOX,但优于SSD,Efficientdet,Centernet和Faster R-CNN模型,在实际工业生产中,这种时间差仍在允许范围内。从实验结果可知,改进Neck网络、引入Mish激活函数和focal loss,能够有效提高铝箔表面缺陷的检测精度。对于poor_sealing类,本文模型检测该类缺陷的AP值比YOLOX提升了3.63%,而long_damage,fold和broken_blister类的AP值分别比YOLOX提升了5.50%,8.57%和2.09%。实验结果表明本文算法在铝箔表面缺陷检测上表现良好,能够有效提高和背景特征相似度较高的缺陷的检测精度。图9为本文模型检测各类缺陷的P-R曲线,其中阴影部分面积为该类缺陷的检测精度(AP)。

使用YOLOX模型和本文模型分别对铝箔表面缺陷进行检测,如图10所示。对比图中原始和改进的YOLOX,可以看出本文模型能够检测出所有的缺陷,同时减少了poor_sealing,long_damage,fold,broken_blister误检和poor_sealing漏检情况的发生,表明改进后的模型能有效降低和背景特征相似度较高的缺陷误、漏检的概率。

3.3.2 引入transformer encoder模块

YOLOX模型的Neck网络部分改进前、后结果见表2。从实验结果可知,使用transformer encoder模块之后,4类缺陷的AP值分别提升了0.30%,2.40%,4.98%和2.56%,所有缺陷的mAP值提升了2.56%,说明改进的Neck网络能够学习到更全面的特征图信息,在检测速度小幅度降低的情况下提高了缺陷的检测精度。

图9 不同缺陷类型的P-R曲线((a)密封不良;(b)长破损;(c)褶皱;(d)气泡破损)

图10 检测效果对比((a) Groud truth;(b) YOLOX;(c)改进YOLOX)

表2 Neck网络改进效果

注:加粗数据为最优值

3.3.3 引入Mish激活函数

表3为改进激活函数前后的实验结果对比,并增加了分类准确率的对比,即铝箔表面是否含有缺陷,来评估模型的准确性。从实验结果可知,改进后所有缺陷的mAP值相比之前提升了3.77%,后三类缺陷分别提升了4.93%,8.60%和2.56%,第一类缺陷的AP值降低了1.02%,分类准确率提升了0.85%,说明改进激活函数在poor_sealing缺陷精度和检测速度小幅降低的情况下提升了缺陷的检测精度和分类准确率。

3.3.4 引入focal loss

Focal loss函数中有和2个参数,通过取不同参数值进行对比试验,实验结果见表4。从实验结果可知,当为0.25,为1时,四类缺陷的mAP值最高,因此本文选择=0.25,=1进行后续实验。

表3 激活函数改进效果

注:加粗数据为最优值

表4 不同αt,γ取值mAP对比

注:加粗数据为最优值

图11为和2个参数取不同值时的总体损失曲线图,可以发现损失值的变化趋势接近,其中当=0.25,=1时,对应的损失曲线下降幅度介于其他取值时的下降幅度之间,但缺陷的mAP值最高。

表5为改进损失函数前、后的实验结果对比,从实验结果可知,使用focal loss之后,后三类缺陷的AP值分别提升了6.17%,8.38%和2.37%,第一类缺陷的AP值降低了0.20%,所有缺陷的mAP值提升了4.18%,说明改进损失函数能够在poor_sealing缺陷精度和检测速度小幅度降低的情况下提升缺陷的检测精度。图12为obj_loss分别使用BCEWithLogitsLoss和focal loss进行训练的总损失曲线,可以看出使用focal loss之后损失值明显减小,而且模型训练更加稳定,收敛速度更快。

3.3.5 不同策略组合实验

Transformer encoder模块、focal loss和Mish激活函数的不同组合也可以提高铝箔表面缺陷的检测精度,本文做了多组对比实验来说明transformer encoder模块、focal loss和Mish激活函数的多种组合可以在不同程度提高检测精度,对比结果见表6。

图11 at,g不同取值下的损失曲线

图12 训练总损失曲线

表5 损失函数改进效果

注:加粗数据为最优值

由N1和N4可知,引入focal loss使得前三类缺陷的AP值分别提升了2.99%,0.69%和0.06%,第四类降低了0.47%,所有缺陷的mAP值提升了0.82%,说明该损失函数能够更加准确地区分缺陷区域和铝箔表面区域。由N2和N4可知,引入Mish激活函数使得前三类缺陷的AP值分别提升了3.87%,1.52%和2.43%,第四类缺陷的AP值降低了0.20%,所有缺陷的mAP值提升了1.90%,说明该激活函数能够在一定程度上提高分类精度。由N3和N4可以得知,引入transformer encoder模块使得前三类缺陷的AP值分别提升了2.98%,3.62%和0.50%,第四类缺陷的AP值降低了0.57%,所有缺陷的mAP值提升了1.63%,说明该模块通过分析特征图的全局特征能够有效区分缺陷特征和铝箔表面特征。

由以上分析可知,引入transformer encoder和Mish激活函数和focal loss可以在broken_blister缺陷精度小幅度降低的情况下有效提升和背景特征相似度较高的缺陷检测精度。

3.3.6 泛化性验证

为了验证本文模型的泛化性,采用了从江苏某公司生产的药品泡罩包装产品中采集的数据进行实验。

数据集中的缺陷包括铝箔压坏(crush)、破损(damage)、圆点(dot)、脏污(dirty),铝箔压坏和破损是在铝箔热封过程中由于设备振动挤压药片导致的,圆点和脏污是在铝箔生产过程中出现的。铝箔压坏出现在药粒区域,具有和点状网纹区域相似的特征,如图13(a)所示;破损多出现在印字区域,具有和该区域相似的特征,如图13(b)所示;圆点为药粒区域上的小凹坑,具有和该区域相似的特征,如图13(c)所示;脏污为深褐色印迹,多出现在铝箔表面的字体、网纹和药粒区域上,具有和这些区域相似的特征,如图13(d)所示。由此可知,该数据集同样存在缺陷特征和铝箔表面特征相似度较高的问题。

表6 不同策略组合实验

注:N1~N4为加入不同改进策略的检测模型

图13 铝箔表面缺陷((a)铝箔压坏;(b)破损;(c)圆点;(d)脏污)

该数据集共计有905张图片,缺陷数量如图14所示。按照4∶1的比例划分数据集,其中训练集有724张,测试集有181张。图像分辨率为3000×3000像素,首先将图像缩放至640×640大小,然后对训练集进行了Mosaic和Mixup[21]数据增强,增强后的训练集有1 810张。

在实验环境和模型参数设置不变的情况下,将本文模型与SSD,Efficientdet,Centernet,YOLOv5,Faster R-CNN和YOLOX进行对比,实验结果见表7。从表中可知,针对四类缺陷的AP值和所有缺陷的mAP值,本文模型均高于其他模型,检测速度略慢于YOLOv5和YOLOX,但仍可满足工业生产实时性的要求。实验结果显示本文模型在吴中医药数据集上表现良好,说明本文模型具有较好的泛化性。

使用YOLOX模型和本文模型分别对吴中医药的数据进行检测,结果如图15所示。从图中可以看出,本文模型能够减少crush,damage,dot和dirty误检情况的发生,说明本文模型能够更加准确地检测出缺陷。

图14 缺陷数量

表7 不同检测模型的比较

注:加粗数据为最优值

图15 检测效果对比

4 结 论

为了解决药品泡罩包装中铝箔表面缺陷特征和铝箔表面特征相似度较高,本文提出了一种改进YOLOX模型的铝箔表面缺陷检测模型。首先将Neck网络的CSP模块替换成transformer encoder模块,以此提高感受野的范围,使得Prediction网络可以获得更全面的信息。其次使用Mish激活函数替换Swish激活函数,可以有效地防止过拟合,提高网络的鲁棒性。此外在损失函数中引入focal loss能够使模型更加精确地区分检测区域是否为缺陷区域。实验结果表明,改进的模型提高了检测精度,而且改进的模型能够降低和铝箔表面特征相似度较高的缺陷的误检和漏检的概率。虽然检测速度相比改进前有所增加,但是仍然能够满足工业生产上实时检测的需求。本文算法的不足是针对面积特别小的缺陷检测精度仍然较低,后续可进一步改进网络,增强对面积特别小的缺陷的特征提取能力。

[1] 黄秀玲, 陆宏建, 任超, 等. 基于四光源光度立体法的药品泡罩包装中铝箔缺陷检测方法[J]. 包装学报, 2018, 10(3): 47-51.

HUANG X L, LU H J, REN C, et al. The method of aluminum foil defect detection in medicine packaging based on four-light photometric stereo method[J]. Packaging Journal, 2018, 10(3): 47-51 (in Chinese).

[2] 姚爽, 韩震宇, 马鹏, 等. 基于机器视觉的药用铝箔印刷品质检测系统[J]. 计测技术, 2016, 36(4): 17-21.

YAO S, HAN Z Y, MA P, et al. Print quality detection system for medicinal aluminum foil based on machine vision[J]. Metrology & Measurement Technology, 2016, 36(4): 17-21 (in Chinese).

[3] 程婧怡, 段先华, 朱伟. 改进YOLOv3的金属表面缺陷检测研究[J]. 计算机工程与应用, 2021, 57(19): 252-258.

CHENG J Y, DUAN X H, ZHU W. Research on metal surface defect detection by improved YOLOv3[J]. Computer Engineering and Applications, 2021, 57(19): 252-258 (in Chinese).

[4] 陈婉琴, 唐清善. 基于ResNeXt-SSD的多目标缺陷检测算法[J]. 信息技术与信息化, 2021(6): 72-74.

CHEN W Q, TANG Q S. Multi-target defect detection algorithm based on ResNeXt-SSD[J]. Information Technology and Informatization, 2021(6): 72-74 (in Chinese).

[5] TIAN Z, SHEN C H, CHEN H, et al. FCOS: fully convolutional one-stage object detection[C]//2019 IEEE/CVF International Conference on Computer Vision. New York: IEEE Press, 2019: 9626-9635.

[6] TAN M X, PANG R M, LE Q V. EfficientDet: scalable and efficient object detection[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE Press, 2020: 10778-10787.

[7] GIRSHICK R. Fast R-CNN[EB/OL]. (2015-9-27) [2021-12- 12]. https://arxiv.org/abs/1504.08083v2.

[8] HE K, ZHANG X, REN S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9): 1904-1916.

[9] REN S, HE K, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.

[10] GE Z, LIU S T, WANG F, et al. YOLOX: exceeding YOLO series in 2021 [EB/OL]. (2021-08-06) [2021-12-12]. https://arxiv. org/abs/2107.08430.

[11] REDMON J, FARHADI A. YOLOv3: an incremental improvement[EB/OL]. (2018-04-08) [2021-12-15]. https:// arxiv.org/abs/1804.02767.

[12] DOSOVITSKIY A, BEYER L, KOLESNIKOV A, et al. An image is worth 16x16 words: transformers for image recognition at scale [EB/OL]. (2021-06-03) [2021-12-20]. https://arxiv.org/abs/2010.11929.

[13] MISRA D.Mish: a self regularized non-monotonic neural activation function[EB/OL]. (2019-08-23) [2021-12-20]. https://arxiv.org/abs/1908.08681.

[14] RAMACHANDRAN P, ZOPH B, LE Q V. Searching for activationfunctions[EB/OL]. (2017-10-16) [2021-12-20]. https://arxiv.org/abs/1710.05941.

[15] LIN T Y, GOYAL P, GIRSHICK R, et al. Focal Loss for Dense Object Detection[EB/OL]. (2018-02-07) [2021-12-20]. https://arxiv.org/abs/1708.02002.

[16] WANG C Y, MARK LIAO H Y, WU Y H, et al. CSPNet: a new backbone that can enhance learning capability of CNN[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. New York: IEEE Press, 2020: 1571-1580.

[17] LIN T Y, DOLLÁR P, GIRSHICK R, et al. Feature pyramid networks for object detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition. New York: IEEE Press, 2017: 936-944.

[18] LIU S, QI L, QIN H F, et al. Path aggregation network for instance segmentation[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE Press, 2018: 8759-8768.

[19] BA J L, KIROS J R, HINTON G E. Layer normalization[EB/OL]. (2016-07-21) [2022-01-10]. https://arxiv.org/abs/1607.06450.

[20] HENDRYCKS D, GIMPEL K. Gaussian error linear units (gelus)[EB/OL]. (2016-06-27) [2022-01-10]. https://arxiv.org/ abs/1606.08415.

[21] ZHANG H Y, CISSE M, DAUPHIN Y N, et al. Mixup: beyond empirical risk minimization[EB/OL]. (2018-04-27) [2022-01-15].https://arxiv.org/abs/1710.09412.

Improved YOLOX method for detecting surface defects of drug blister aluminum foil

HU Hai-tao1, DU Hao-chen1, WANG Su-qin1, SHI Min1, ZHU Deng-ming2,3

(1. College of Control and Computer Engineering, North China Electric Power University, Beijing 102206, China; 2. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China; 3. Taicang Institute of Information Technology, Taicang Jiangsu 215400, China)

The surface of aluminum foil in drug blister packaging contains various information on fonts and patterns, and the surface of aluminum foil is uneven, leading to the uneven distribution of light and dark. To address the problem that the YOLOX model cannot more accurately distinguish the defect features from the surface features of aluminum foil, a surface defect detection method based on the improved YOLOX model was proposed. Firstly, in order to enhance the globality of the information input to the Prediction, it was necessary to analyze the global features of the feature map in the Neck network,so the CSP module of the Neck network was replaced with the transformer encoder module. At the same time, the YOLOX model has a deep depth, and to effectively improve the classification accuracy, the Mish activation function was utilized to replace the Swish activation function. Then, focal loss was introduced into the loss function to solve the problem of difficulty in classifying defect regions and background regions due to the similarity of defect features and aluminum foil surface features. The experimental results show that the mAP of the improved model for the detection of aluminum foil surface defects was 90.17%, which was 4.95% higher than the original YOLOX model,and that the improved model can reduce the probability of false detection and missed detection of defects with high similarity to the surface features of aluminum foil.

aluminum foil surface; defect detection; YOLOX; transformer encoder; Mish; focal loss

TP 391

10.11996/JG.j.2095-302X.2022050803

A

2095-302X(2022)05-0803-12

2022-02-13;

2022-07-05

13 February,2022;

5 July,2022

国家自然科学基金项目(61972379);国家重点研发计划课题(2020YFB1710400)

National Natural Science Foundation of China (61972379); National Key Research and Development Plan Subject (2020YFB1710400)

胡海涛(1973-),男,副教授,博士。主要研究方向为大数据分析、软件架构技术等。E-mail:huhaitao@ncepu.edu.cn

HU Hai-tao (1973-), associate professor, Ph.D. His main research interests cover big data analysis, software architecture technology, etc. E-mail:huhaitao@ncepu.edu.cn

石 敏(1975-),女,副教授,博士。主要研究方向为计算机视觉、虚拟现实等。E-mail:shi_min@ncepu.edu.cn

SHI Min (1975-), associate professor, Ph.D. Her main research interests cover computer vision, virtual reality, etc. E-mail:shi_min@ncepu.edu.cn

猜你喜欢
铝箔精度表面
2022年中国铝加工材总产量及构成(万t)
俄铝开发生产8 μm 厚的铝箔,以提高电池容量
铝加工(2023年3期)2023-08-31 08:06:46
分开的铝箔片
太阳表面平静吗
基于DSPIC33F微处理器的采集精度的提高
电子制作(2018年11期)2018-08-04 03:25:38
GPS/GLONASS/BDS组合PPP精度分析
3.《黑洞表面》(英/美)等
新青年(2015年2期)2015-05-26 00:08:47
改进的Goldschmidt双精度浮点除法器
神回复
意林(2014年17期)2014-09-23 17:02:14
铝箔填料在直接蒸发冷却机组中的性能分析