基于改进SSD模型的给水管道内缺陷识别

2024-12-27 00:00:00高源原
中国新技术新产品 2024年18期
关键词:迁移学习

摘 要:监测给水管道内部的缺陷以防潜在风险是水质安全监控的重要组成部分。为了准确识别并定位管道内的缺陷,本文开发了一种基于SSD目标检测模型的改进模型,该模型结合了CBAM(Convolutional Block Attention Module)和迁移学习技术,可用于管道缺陷的自动检测。在SSD网络中加入CBAM可加强模型的特征识别能力,迁移学习则利用预训练模型加速学习过程并提高特定任务的表现。试验结果表明,与传统SSD模型相比,本文改进模型在缺陷检测的AP和mAP分数上都有显著提升,证明了其在给水管道内缺陷识别中的应用潜力。

关键词:给水管道;缺陷识别;SSD模型;迁移学习

中图分类号:TU 992" " " " 文献标志码:A

给水管道系统是城市基础设施的重要组成部分,其安全与效率对公共健康和环境持续性具有深远的影响[1-3]。随着时间推移,管道系统可能因腐蚀、结垢和裂纹等多种原因而出现缺陷,这些缺陷如果没有得到及时发现和处理,就可能造成严重的水质问题甚至管道破裂。传统的给水管道检测方法主要采用机器视觉[4-5]和图像处理[6-7]等,这些方法耗时、耗力,难以满足城市快速发展需求。

目前,计算机视觉技术的发展为自动化和智能化管道检测提供了新的可能。尤其是单阶多框检测器(Single Shot MultiBox Detector,SSD)模型具有高效的检测速度和良好性能,应用广泛。然而,当直接应用于给水管道缺陷识别时,SSD模型面临识别小型和模糊缺陷、适应光照变化和复杂背景干扰的挑战。

为了解决这些问题,本文提出了基于SSD模型的改进模型,引入卷积块注意力模块(Convolutional Block Attention Module,CBAM)以增强模型对关键特征的关注能力,并采用迁移学习方法,利用大规模预训练数据集来提升模型在特定给水管道环境下的表现。通过这种方式,模型能够有效提高给水管道内缺陷检测精度。下文将详细介绍模型的架构、试验设置以及在实际管道缺陷数据集中的表现评估。

1 SSD模型结构

SSD目标检测模型可在单次前向传播中进行高效率的目标检测,这种一步到位的检测方式在保证较高准确率的同时显著提高了处理速度,其模型结构如图1所示。

SSD模型的核心优势是使用多尺度特征图,使模型能够有效识别不同大小的对象。此外,SSD还引入了锚框机制,即在每个特征图单元中预设多个锚框(默认框)。这些锚框具有不同的尺寸和长宽比,每个锚框都用来预测对应的真实框的偏移及其所属类别的概率。这种方法使SSD能够在图像中的任何位置检测到目标。

SSD模型的损失函数结合了定位损失和置信度损失。定位损失用于衡量预测框与真实框间的位置偏差,通常采用Smooth L1损失;置信度损失用于评估预测的类别与真实类别间的误差,通常采用Softmax损失。利用这2种损失的合理加权,SSD能够在训练过程中优化目标的位置和类别预测,提高检测性能。SSD模型的高效性还体现在能够利用非极大值抑制处理多个重叠预测框,筛选出最佳预测结果。这种整合了特征提取、目标检测和后处理的综合性设计,使SSD在实时视频分析和图像处理领域表现优异。

2 基于改进SSD和迁移学习的模型构建

2.1 改进SSD模型

为了提升SSD模型在给水管道内缺陷识别中的性能,本文进行了改进,即在SSD模型的基础上,在Conv4×3和Conv7这2层引入CBAM模块,以增强模型对特征的感知能力,如图2所示。

CBAM是一种注意力机制模块,利用聚焦于输入特征的重要部分来提高网络的表达能力,从而提高对小型和模糊缺陷的识别准确性。在给水管道内缺陷识别中,CBAM可以帮助模型更好地聚焦于裂纹、沉积物等细节,以提高检测效果。具体来说,CBAM模块依次进行空间注意力(Spatial Attention)和通道注意力(Channel Attention)计算。首先,进行通道注意力计算。通过全局平均池化和全局最大池化来获取特征图的统计信息。其次,利用这些信息并通过共享网络学习不同通道的重要性权重。这一步骤增强了模型对重要通道特征的关注,从而提高了对特征的提取能力。在通道注意力的基础上,对聚焦的通道特征图进行空间维度注意力学习。基于空间注意力机制,模型能够更关注图像中的关键位置,可提高模型对空间位置的敏感度,从而提升对复杂背景下缺陷的检测能力。例如,当处理给水管道内壁上由光照变化导致的阴影和反光区域时,CBAM模块能够有效区分实际缺陷和环境噪声,从而提高检测的准确性和鲁棒性。

2.2 迁移学习

本文使用了迁移学习策略,以提高模型对新领域数据的适应性和泛化能力。迁移学习允许模型将一个任务中学到的知识应用到另一个相关但不同的任务中。本模型将VGG-16网络作为基础架构,并预加载ImageNet数据集中训练的权重,这样做的目的是将已有的丰富特征学习能力作为起点。

在给水管道内缺陷识别任务中,迁移学习能够加速模型的训练过程,提高模型在特定任务中的表现。通过预加载VGG-16的权重,模型初始化时已经具备了较强的特征提取能力,只需要在较小的给水管道数据集上进行微调即可适应新任务。微调过程包括调整模型参数,使其能够更好地识别和分类处理给水管道中的各种缺陷。具体来说,通过迁移学习,模型利用预训练权重在初期阶段快速学习到管道缺陷的基本特征,例如裂纹、沉积物等。进而在后续训练中,针对特定的缺陷类型进行精细调整,使模型在处理这些特定类型的缺陷过程中能够表现得更精准、高效。这种方法不仅减少了模型的训练时间,还提高了模型的泛化能力和适应性,使其能够在复杂和多变的实际环境中保持较高的检测精度。

3 试验与分析

3.1 数据集构建

本文针对水下管道内缺陷识别问题,在实际工程视频中采集了大量图像,并构建了一个专门的水下管道内缺陷识别数据集。为了提升数据集的质量和多样性,本文采用了多种图像增强技术,包括对比度调整、亮度调整和旋转等方法。这些增强措施可使最终数据集的规模达到8 660张图像。数据集覆盖了6种不同的管道状态,包括泄露、沉积泥沙、沉积石块、气囊、其他异物和无缺陷管道。为了有效训练和评估模型,按照7∶2∶1的比例将数据集划分为训练集、验证集和测试集,并进行手动标注。此外,为了保证数据的均衡性,需要保证各类缺陷的训练样本均为1 000张左右。

3.2 模型训练

水下管道内缺陷识别数据集构建完成后,使用改进的SSD模型在数据集中进行训练。具体的训练参数如下:输入图像尺寸为300×300,权重衰减参数为2×10-4,批量大小为32,最大学习率设为0.001,最小学习率设为0.000 01,模型使用Adam优化器进行优化。

3.3 损失函数

在训练过程中,损失函数用于衡量模型预测与真实值间的差异。本文采用的损失函数包括2个主要部分:定位损失(localization loss)和置信度损失(confidence loss),两者结合可用于优化模型在给水管道内缺陷识别中的性能。

定位损失用于测量预测边界框(bounding box)与真实边界框间的偏差。在SSD中,通常将Smooth L1 Loss作为定位损失,这是一种比标准L1损失鲁棒性更强的版本,对异常点(outliers)不敏感。当Smooth L1损失值小于一定阈值(例如1)时表现为平方损失,大于该阈值时表现为L1损失,从而能够平滑地减少大误差对总损失的影响。使用l和g分别表示预测框和真实框的位置,定位损失Lloc(x,l,g)可以表示为公式(1)。

(1)

式中:xkij=1为第i个预测框对应的第j个真实框,并且正确的类别是k;smothL1为Smooth L1损失函数; cx、cy分别为中心点的坐标;w、h分别为宽度和高度;m为坐标维度的索引;i为预测框的索引;N为总的预测框数量;Pos为正样本集合;lim为第i个预测框在第m维度上的位置;gjm为第j个真实框在第m维度上的位置。

置信度损失衡量预测类别与真实类别间的误差,在SSD中通常由Softmax损失实现。这种损失函数能够比较预测的类别概率分布与实际的类别概率分布,以此评估分类的准确性,如公式(2)所示。

(2)

式中:为模型预测第i个框为类别k的概率;xkij=1为第i个预测框对应的真实类别是k;Neg为被选择为负样本(非目标类)的框;Lconf(x,c)为置信度损失函数,计算模型在预测类别上的误差,其中x为真实的类别标签信息,c 为模型的预测结果。

SSD的总损失函数是定位损失和置信度损失的加权和,如公式(3)所示。

(3)

式中:α为一个平衡定位损失与置信度损失的权重系数;N为匹配到真实框的预测框数量,用于规范化损失。

多次迭代训练可最小化总损失函数,使模型能够逐渐提高对给水管道内缺陷(如裂纹、沉积物等)的检测精度。在优化过程中,定位损失能帮助模型更准确地定位缺陷区域,置信度损失则保证模型能够对各类缺陷进行正确分类。

3.4 评估指标

在给水管道内缺陷识别中,本文将平均精度(Average Precision,AP)和平均精度均值(mean Average Precision,mAP)作为主要评估指标,量化模型对各种缺陷类型的检测性能。AP计算了召回率-精确率曲线(Precision-Recall Curve,PR Curve)下的面积。下文将具体解释精确率与召回率。

精确率(Precision)是模型正确识别为正类的样本数与所有被识别为正类的样本数的比率。精确率高说明模型在其判断样本为正类时更准确。在给水管道内缺陷识别任务中,精确率反映了模型检测出缺陷的可靠性。例如,当模型识别出某个区域存在裂纹时,精确率高表明该识别结果更可能是正确的。召回率(Recall)也称为真正率,是模型正确识别为正类的样本数与所有实际正类样本数的比率。召回率高表示模型能够捕捉到更多的正类样本。在给水管道内缺陷识别中,召回率反映了模型发现所有实际缺陷的能力。高召回率表示模型能够检测到更多的实际缺陷,例如裂纹、沉积物等,从而降低漏报率。

召回率-精确率曲线受模型预测正类的阈值的影响。随着阈值发生变化,召回率和精确率会发生变化。一般来说,当召回率增加时,精确率会下降,反之亦然。该曲线有助于了解模型在不同阈值下的表现。平均精度(AP)是召回率-精确率曲线下的面积,如公式(4)所示。

AP=∫0p(r)dr " " " " " (4)

式中:p(r)为给定召回率r时的精确率。

在实际操作中,召回率和精确率通常是离散计算的,因此AP可以利用公式(5)进行近似计算。

(5)

式中:Rk和Pk分别为第k个阈值对应的召回率和精确率;n为阈值的数量。

mAP是所有类别的平均检测性能指标。对每个缺陷类别分别计算AP值后,将所有类别的AP值取平均,即可得到mAP。

3.5 结果分析

为验证模型的性能,本文将原始的SSD模型、加入CBAM模块的模型、进行迁移学习的SSD模型与本文提出的完整的模型进行对比试验,即在构建的给水管道内缺陷数据集的训练集中按照第3.2节的试验配置进行训练,并在测试集上进行测试,试验结果见表1。

由表1结果可知,所有模型在每种缺陷类型中的表现均随技术增强而提高,尤其是在结合CBAM和迁移学习的情况下,模型性能有显著提升。CBAM增强了模型的特征表达能力,使其在进行特征学习过程中更关注于图像中的关键部分,表明模型可以更有效地从图像中提取出有助于识别各种缺陷的信息。迁移学习提供了一组已经在复杂环境下学习过的权重,这些权重可以使模型在特定任务上更快达到优化状态,并降低过拟合风险(模型已经学习了多样化数据中的通用特征)。二者结合使模型不仅能够捕捉到缺陷类型的详细特征,还能在复杂背景下保持较高的性能和稳定性。

4 结语

本文研究了一种改进的SSD模型,结合CBAM(卷积块注意力模块)和迁移学习技术,提高了给水管道内部缺陷的识别精度。试验结果验证了这种方法的有效性,显示出其在水质安全监控领域的应用潜力。尽管改进的SSD模型在性能上有显著提升,但是仍然具有一定局限性。模型的计算复杂度因引入CBAM而增加,可能会影响模型在实时应用中的部署效率。针对现有模型缺点,未来可以研究更高效的算法或简化CBAM结构,以减少模型的计算需求,使其更适合实时监测应用。此外,优化模型的架构可能还包括引入轻量级的神经网络层和采用更高效的训练技术,在保持模型性能的同时减少其对硬件资源的依赖。

参考文献

[1]张伟,余健,李葳,等.广州市排水管道沉积现状研究分析[J].给水排水,2012,38(7):147-150.

[2]户莹.基于深度学习的地下排水管道缺陷智能检测技术研究[D].西安:西安理工大学,2019.

[3]王俊岭,邓玉莲,李英,等.排水管道检测与缺陷识别技术综述[J].科学技术与工程,2020,20(33):13520-13528.

[4]李华,刘阳,孟祥鹏,等.基于机器视觉的管道通径内检测技术[J].油气储运,2019,38(10):1165-1169.

[5]李忠虎,张琳,闫俊红,等.基于机器视觉的管道内表面三维重建研究[J].内蒙古科技大学学报,2017,36(2):167-171.

[6]A HAWARI ,MALAMIN M,F ALKADOUR ,et al.Automated defect detection tool for closed circuit television (cctv) inspected sewer pipelines[J].Automation in construction,2018(89):99-109.

[7]MOTAMEDI M,FARAMARZI F,DURAN O.New concept"for corrosion inspection of urban pipeline networks by digital image processing[J].The journal of urology,2016,195(4):1079-1080.

猜你喜欢
迁移学习
《宋史·曾公亮传》传主形象论析
文学教育(2018年7期)2018-07-17 18:50:52
基于深度神经网络的人体动作识别研究
威斯顿相互作用法在社会保险学课程教学中的实践
基于卷积神经网络的图像分类技术
科技视界(2017年32期)2018-01-24 17:54:40
迁移学习在专业课程教学中的实践研究
迁移学习研究综述
从认知角度探讨大学英语网络教学模式
现代交际(2017年18期)2017-09-11 20:34:02
基于多特征融合的跨域情感分类模型研究
奇异值分解与移移学习在电机故障诊断中的应用
一种基于迁移极速学习机的人体行为识别模型
物联网技术(2015年9期)2015-09-22 09:23:43