张 毅,范玉刚
〈无损检测〉
基于深度学习与域自适应的工件涡流热成像的缺陷检测
张 毅1,2,范玉刚1,2
(1. 昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2.云南省人工智能重点实验室,云南 昆明 650500)
机械设备运行过程中,标记的故障样本量小,导致建立的模型故障诊断准确率低,为此本文提出一种结合深度学习与域自适应的工件涡流热成像的缺陷检测方法。首先将注意力机制引入深度残差网络ResNet50中,加强模型的特征提取能力;然后将源域和目标域数据送入改进的ResNet50网络中提取深度特征,并且在网络的全连接层中引入局部最大均值差异,用于缩小两域特征间的分布差异,以此实现相关子域的分布对齐;最后在网络的Softmax分类器中实现对工件金属材料的缺陷检测。在公开的磁瓦数据集和本文实验采集的金属板涡流红外图像数据集上进行实验,结果表明,本文方法对涡流红外图像的裂纹缺陷检测识别准确率较高,通过t分布随机邻居嵌入方法对分析结果可视化,验证了本文方法的优越性。
涡流热成像;深度残差网络;注意力机制;域自适应;局部最大均值差异
工业生产中的金属材料在使用过程中可能会产生划痕、裂纹等损伤缺陷,从而影响设备的正常运行,甚至危及人身安全,因而对金属材料中的损伤缺陷进行检测具有重要意义。涡流脉冲热成像检测作为新兴的无损检测技术,具有非接触性、检测速度快等优点[1],因而被广大研究者应用于工业中金属材料的探伤检测。如Peng等[2]采用快速傅里叶变换和主成分分析消除非均匀加热影响来增强红外图像的裂纹特征,成功检测出铜棒裂纹位置和形状。Yi等[3]通过涡流热成像检测技术,提出用核主成分分析和低秩稀疏建模方法,增强缺陷区域特征,实现了金属表面裂纹深度的检测。
因此基于图像分析的检测方法能够有效识别设备的金属裂纹,但上述文献无法实现自适应地提取缺陷图像的特征信息。近年来深度学习方法在图像识别、缺陷检测等方向取得了较好的效果,它能够自动地学习输入数据的深度特征。但深度学习方法的训练需要足量的数据,且训练的数据和测试的数据要具有相同的分布[4],实际的工业生产中,工况多变,训练和测试样本数据同分布的要求难以得到满足。
为解决以上问题,多种深度迁移学习方法被提出,例如基于特征迁移的深度学习方法。特征迁移的核心思路是通过适当的特征变换将源域和目标域的数据映射到一个公共的特征空间,并通过特征对齐来减小领域间的分布差异,然后利用源域的标签数据训练目标域的分类器[5]。特征迁移学习方法在许多领域得到发展和应用,例如Long等[6]提出的DAN深度适配网络同时适配3个全连接层,且提出了多核MMD(Maximum mean discrepancy)来度量两域之间的分布差异。Ganin等[7]引入生成对抗网络(Generative adversarial networks, GAN)[8]思想提出领域对抗神经网络(Domain adversarial neural network, DANN),将生成对抗网络的生成器视为特征提取器,将生成对抗网络的判别器视为域适应器,因而提取出源域和目标域的共同特征实现迁移。王等[9]联合生成对抗网络和多核MMD最小化域间距离,提出了基于生成对抗网络和距离度量的联合分类模型。
以上文献聚焦于源域和目标域进行全局特征对齐研究,缺乏对源域和目标域相同类别间关系的深入研究,故本文在特征提取网络ResNet50的基础上引入CBAM注意力机制,使得网络更加关注图像的重点区域,以此来提高网络的特征提取能力,并引用局部最大均值差异(Local maximum mean discrepancy, LMMD)[10]作为子领域自适应对齐算法,用来度量源域和目标域特征的分布差异,通过最小化该差异损失优化训练模型,并将得到的特征迁移深度学习模型应用于金属板材料缺陷的检测问题。
领域自适应实质就是把提取的源域和目标域数据特征映射到可再生核希尔伯特空间(Reproducing kernel Hilbert space, RKHS)中来减小两领域间的分布差异。实行全局域自适应后,源域和目标域的全局特征得到对齐,但两域间不同类别的特征样本并没有明显地分开,影响了分类的准确性。而经过子领域自适应后,源域和目标域不仅全局特征得到对齐,而且两域中不同类别的特征很好地得以分开,且同类别间的特征分布更为紧密,因此子领域自适应可以改善全局域自适应分类精度较差的情况。两种领域自适应的思想如图1所示。
图1 领域自适应示意图
卷积注意力模块(Convolutional block attention module, CBAM)[12]是一种结合了通道注意力和空间注意力的综合注意力模块,CBAM结构如图2所示[13]。输入特征图∈R××,先经过通道注意力模块得到其权值C(),再经过空间注意力模块得到其权值S(¢),整个过程计算公式如(3)、(4)所示。
¢=C()Ä(3)
²=S(¢)Ä¢(4)
图2 CBAM模块结构图
由于随着网络模型的加深,会相继出现梯度消失和网络退化的问题,因此本文选择了采用残差块的ResNet50[14]网络模型,残差块的存在使得网络层之间能够进行短连接,缓解了梯度爆炸和梯度消失问题,提高了模型的稳定性。
ResNet50网络在提取特征中没有重点的关注喜好,本文希望网络模型在对工件进行检测训练时能更多地关注缺陷的部位,而忽略不重要的背景信息,从而提高模型检测识别的正确率。因此本文将CBAM注意力模块引入ResNet50网络中,实验采用在ImageNet上预训练的ResNet50网络,在引入CBAM模块时不改变ResNet50的残差结构,所以分别在第一层卷积和最后一层卷积后面加入CBAM模块,融合CBAM机制的ResNet50网络结构参数如表1所示。
本文使用局部最大均值差异来测量两领域间相关子领域的分布差异,其公式为:
式中:是两域的类别数;w,jt和分别是样本xs和xt属于类别的权重,其计算公式为:
表1 添加CBAM的ResNet50网络结构
本文使用真实标签ys的one-hot得出源域中类样本的权重w,is。目标域中样本由于没有标签,故无法使用yt来计算目标域中对应的权重,但卷积神经网络的输出是概率分布,它可以表示样本x属于某个类别的概率大小,故而使用卷积神经网络的Softmax分类器来预测目标域中的标签,从而得出样本xt是类的权重w,jt。
对于输入的源域和目标域数据,经过本文改进的ResNet50网络的全连接层中提取得到对应特征zs和zt,于是将其映射到可再生核希尔伯特空间进行特征对齐,因此可将公式(5)重新计算得到:
本文通过融合CBAM注意力的ResNet50特征提取网络模块和子领域自适应模块,搭建了工件的缺陷检测模型,其结构如图3所示,首先将注意力机制CBAM模块添加到ResNet50中,提取源域和目标域数据的深度特征,并将网络的参数共享,同时将子领域自适应层设在网络的全连接层[10],以便在此层中使用局部最大均值差异来实现两域中相关子领域的特征对齐,最后用网络模型中的Softmax分类器对金属板材料的红外热图像进行缺陷的检测识别。
式中:J(,)是交叉熵损失函数;dlmmd(,)是子领域自适应的分布距离函数;l>0,是权衡超参数。
涡流热成像实验平台由涡流加热装置和红外热像仪组成,图4为实验的涡流加热设备和有缺陷的金属板材料。实验时给装置通电,给被测金属材料涡流加热,然后用红外热像仪拍摄金属板材料的红外图像,从而得到实验的红外图像数据。
图4 涡流加热设备(左)和缺陷金属板(右)
Fig.4 Eddy current heating equipment (left) and defective metal plate (right)
本文实验模拟工业生产设备的金属材料工件,选用并加工了有裂纹缺陷的金属板和无缺陷的完好的金属板作为实验中的两大类别,以此来验证本文提出网络模型的性能优劣。对工件材料加工时分别设置了有缺陷的裂纹长度为4mm、8mm、10mm、20mm,以满足不同长度裂纹缺陷的检测实验,提高实验的丰富性和可靠性,裂纹的宽度均为1.5mm,考虑到加工误差,裂纹缺陷的尺寸会和标注数据有0.2mm的误差,本实验加工的裂纹缺陷均在金属材料的表面。通过涡流设备对金属材料的加热和红外热像仪采集图像数据,本实验采集得到的红外图像分辨率为320×240,红外图像集分别有裂纹缺陷和无裂纹缺陷两种类型。在实际的机械设备运行过程中,工况多变,标记的故障样本量小,为此本文提出一种结合深度学习与域自适应的工件涡流热成像的缺陷检测方法,所以还需要选择一个相似的领域数据集来进行实验,于是选择了中科院自动化所收集的磁瓦数据集[16]作为其相似领域来进行迁移学习的实验。因本实验采集的数据集有无裂纹缺陷和有裂纹缺陷两种类别,所以从磁瓦数据集中也选用了对应的类别进行实验。同时由于实验采集的图像是彩色的RGB图像,因此需要先对磁瓦数据集的两种类型的黑白图像进行处理转化为RGB图像后再进行本文模型方法的相关实验,根据源域数据集相关资料,尽量还原了真实的RGB色彩,以便和本文的红外图像进行领域适应的迁移学习。如图5为实验数据集示例。
图5 实验数据集示例
本文中实验的两个领域的样本存在数目不均衡的问题,为了更好地训练模型,验证实验方法的性能,因此使用翻转、缩放、裁剪,旋转等一些数据增强的方式得到了相对均衡的数据样本。故最后得到磁瓦数据集的裂纹缺陷图像460张,无裂纹缺陷图像434张,本实验得到的金属板红外图像数据集的裂纹缺陷图像380张,无裂纹缺陷图像320张。将两域的数据集根据有无裂纹缺陷各自按照8:1:1的比例划分训练集,验证集和测试集。实验包含两种域迁移:磁瓦数据集→金属板数据集,金属板数据集→磁瓦数据集,因本文主要应用网上公开的缺陷数据集来实现对我所实验的金属材料红外图像的缺陷检测识别,所以更多关注的是从磁瓦数据集到金属板数据集的迁移任务的准确率。
本文实验都使用基于Python 3.7的Pytorch深度学习框架,CPU为i5-11400H,GPU为GeForce RTX 3060,RAM为16GB。模型训练的迭代轮数保持一致,使用随机梯度下降法(Stochastic gradient descent,SGD),动量设置为0.9,学习率的调整公式为=0/(1+),其中训练时服从0到1的线性变化,0=0.01,=10,=0.75。
为对比证明本文方法的优越性,于是设置了几组不同方法的模型来进行对比实验。一是经过网络数据集预训练后的微调ResNet50网络模型,二是度量距离为多核最大均值差异(Multipe Kernel Maximum Mean Discrepancy,MK-MMD)的DAN模型,三是未添加注意力机制,采用局部最大均值差异(Local Maximum Mean Discrepancy,LMMD)度量距离的ResNet50_LMMD模型,四是本文的添加CBAM注意力模块的改进ResNet50网络,用局部最大均值差异度量距离的模型。几种模型实验的环境条件和配置相同,实验设定100轮次,本文方法训练集和测试集的检测精度如图6所示。可以看出,训练集和测试集在30轮左右达到稳定,且精度相差不大,说明模型是稳定可靠的。
图6 训练集和测试集精度对比图
各个不同模型的检测精度对比如表2所示,可以明显看出本文提出的方法平均精度为88.52%,好于对比的其他模型,表明本文提出的模型通过对齐同类子领域,能得到领域间更细节的信息,使得不同领域间同类别联系更为紧密,不同类别间的类间距分得更开,同时和方法3相比可知添加注意力机制后检测精度得到大约1.3%的提升,验证了模型的优越性。同时图7展示了磁瓦数据集到金属板数据集训练得到的准确率的对比效果,相同轮次下,可以看到其余方法在20个epoch左右达到收敛,随后细微振荡,而本文提出的方法收敛速度较慢,原因是在ResNet50网络基础上加入了CBAM注意力模块,增加了网络的复杂度,所以检测消耗的时间较不添加CBAM模块的时间增加了大约2.5s,但是检测缺陷的准确率得到了提升。
表2 不同模型的检测精度
Magnetic tile data set→sheet metal data set
为了更加直观地体现出本文方法的优点,实验选择了源域为磁瓦数据集,目标域为本文采集的金属板的红外图像数据集作为可视化对比,利用t-SNE(t-distributed stochastic neighbor embedding)算法[17]将源域和目标域部分数据的特征值映射为二维空间,然后在二维空间里将其特征可视化。几种对比方法的特征可视化效果如图8所示,其中S代表源域,T代表目标域,S-0表示源域中无缺陷的样本,S-1表示源域中裂纹缺陷的样本。由图可知,仅采用经过预训练微调的ResNet50模型提取通用特征能力强,一个域内的同类别间的聚类效果好,但不同领域相同类别就没有很好地聚类。采用多核MMD(MK-MMD)的DAN模型展现出一定的特征对齐能力,但未考虑两域子领域的分布对齐,不同领域的同类别间聚类效果不是很好。而采用子领域自适应模型的ResNet50_LMMD和本文方法在对齐全局域分布的同时还实现了对齐同类子领域的分布,另外本文方法融入注意力机制,提升了特征提取能力,可以看出两域间相同类别密切地聚集在一起,得到了不错的聚类效果,充分证实了本文方法的有效性和优越性。
图8 不同方法的t-SNE特征可视化
通过引入特征迁移学习思想,建立局部最大均值差异衡量指标,缩小了源域和目标域数据特征间的分布差异,实现了相关子域的分布对齐。基于特征迁移学习思想建立的金属板材料裂纹的缺陷识别模型,解决了数据集中裂纹缺陷样本量少,训练和测试样本难以同分布的问题。提出的基于深度学习与子领域自适应的工件涡流热成像的缺陷检测模型,在ResNet50网络添加CBAM注意力机制,提高了模型对于缺陷区域特征的关注度,可以聚焦于缺陷特征的提取,提升模型缺陷检测能力。通过相关实验对比,并使用t-SNE算法对几种对比实验提取的特征进行可视化,验证了所提模型的有效性,提升了金属板材料裂纹缺陷的检测精度。
[1] 李宝芸, 范玉刚, 高阳. 基于OTSU和Canny算子的红外图像特征提取[J]. 陕西理工大学学报: 自然科学版, 2019, 35(6): 33-40. LI Baoyun, FAN Yugang, GAO Yang. Infrared image feature extraction based on OTSU and Canny operator[J].:, 2019, 35(6): 33-40.
[2] PENG Y, HUANG S, HE Y, et al. Eddy current pulsed thermography for noncontact nondestructive inspection of motor winding defects[J]., 2020, 20(5): 2625-2634.
[3] YI Q, Malekmohammadi H, TIAN G Y, et al. Quantitative evaluation of crack depths on thin aluminum plate using eddy current pulse-compression thermography[J]., 2021, 16(6): 3963-3973.
[4] 董绍江, 朱朋, 裴雪武, 等. 基于子领域自适应的变工况下滚动轴承故障诊断[J]. 吉林大学学报: 工学版, 2022, 52(2): 288-295. DONG Shaojiang, ZHU Peng, PEI Xuewu, et al. Fault diagnosis of rolling bearing under variable operating conditions based on subdomain adaptation[J].:, 2022, 52(2): 288-295.
[5] 姜万录, 岳毅, 张淑清, 等. 基于特征迁移学习的变工况下轴向柱塞泵故障诊断[J]. 农业工程学报, 2022, 38(5): 45-55. JIANG Wanlu, Yue Yi, ZHANG Shuqing, et al. Axial piston pump fault diagnosis under variable working conditions based on feature transfer learning[J]., 2022, 38(5): 45-55.
[6] LONG M S, CAO Y, WANG J, et al. Learning transferable features with deep adaptation networks[C]//, 2015: 97-105.
[7] Ganin Y, Ustinova E, Ajakan H, et al. Domain-adversarial training of neural networks[J]., 2016, 17(1): 2096-2030.
[8] 陈佛计, 朱枫, 吴清潇, 等. 生成对抗网络及其在图像生成中的应用研究综述[J].计算机学报, 2021, 44(2): 347-369. CHEN Foji, ZHU Feng, WU Qingxiao, et al. A survey about image generation with generative adversarial nets[J]., 2021, 44(2): 347-369.
[9] 王格格, 郭涛, 余游, 等. 基于生成对抗网络的无监督域适应分类模型[J]. 电子学报, 2020, 48(6): 1190-1197. WANG Gege, GUO Tao, YU You, et al. Unsupervised domain adaptation classification model based on generative adversarial network[J].2020, 48(6): 1190-1197.
[10] ZHU Y C, ZHUANG F Z, WANG J D, et al. Deep subdomain adaptation network for image classification[J]., 2020(99): 1-10.
[11] Gretton A, Borgwardt K M, Rasch M J, et al. A kernel two-sample test[J]., 2012, 13: 723-773.
[12] Woo S, Park J, Lee J Y, et al. CBAM: Convolutional block attention module[C]//, 2018: 3-19.
[13] 郝帅, 张旭, 马旭, 等. 基于CBAM-YOLOv5的煤矿输送带异物检测[J].煤炭学报, 2021, 1644: 1-11. HAO Shuai, ZHANG Xu, MA Xu, et al. Foreign object detection in coal mine conveyor belt based on CBAM-YOLOv5[J].2021, 1644: 1-11.
[14] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]//, 2016: 770-778.
[15] 吴静然, 刘建华, 崔冉. 子域适应无监督轴承故障诊断[J]. 振动与冲击, 2021, 40(15): 34-40. WU Jingran, LIU Jianhua, CUI Ran. Sub-domain adaptive unsupervised bearing fault diagnosis[J]., 2021, 40(15): 34-40.
[16] HUANG Y B, QIU C Y, YUAN K. Surface defect saliency of magnetic tile[J]., 2020, 36(1): 85-96.
[17] Laurens V D M, Hinton G. Visualizing data using t-SNE[J]., 2008, 9(2605): 2579-2605.
Defect Detection of Eddy Current Thermal Imaging of Workpiece Based on Deep Learning and Domain Adaptation
ZHANG Yi1,2,FAN Yugang1,2
(1. Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, China; 2. Key Laboratory of Artificial Intelligence in Yunnan Province, Kunming 650500, China)
When operating mechanical equipment, the number of fault samples marked is small, which leads to low accuracy of the fault diagnosis of the established model. Therefore, this study proposes a defect detection method for eddy current thermal imaging of a workpiece that combines depth learning and domain adaptation. First, the attention mechanism is introduced into the deep residual network ResNet50 to enhance the feature extraction capability of the model. Then, the source and target domain data are sent into the improved ResNet50 network to extract the depth features. The local maximum mean difference is introduced into the full connection layer of the network to reduce the distribution difference between the two domain features to achieve the distribution alignment of related sub-domains. Finally, workpiece metal material defects were detected in the Softmax classifier of the network. The experiment was conducted on the open magnetic tile dataset and eddy current infrared image dataset of the metal plate collected during the experiment. The results show that the method proposed in this paper is highly accurate in detecting and recognizing crack defects in eddy current infrared images. The advantages of the method in this study were verified by visualizing the analysis results using the t-distribution random neighbor embedding method.
eddy current thermal imaging, deep residual network, attention mechanism, domain adaptation, local maximum mean discrepancy
TP391
A
1001-8891(2024)03-0347-07
2022-11-15;
2023-01-31.
张毅(1997-),男,四川眉山人,硕士研究生,主要从事涡流热成像缺陷检测、图像处理。E-mail:1946552068@qq.com。
范玉刚(1973-),男,山东省威海市人,副教授,主要从事涡流热成像检测技术、图像处理。E-mail:km72905566372@qq.com。
云南省科技厅项目(KKPT202203010)。