基于机器学习的公路桥梁裂缝检测技术分析

2024-05-29 23:51包丽霞
交通科技与管理 2024年9期
关键词:机器学习公路桥梁

收稿日期:2024-01-09

作者简介:包丽霞(1982—),女,本科,工程师,研究方向:道路与桥梁。

摘要 裂缝是桥梁结构中常见的破损形式,需要对其进行及时检测和评估。机器学习为桥梁裂缝检测提供了一种新的解决方案,文章聚焦于机器学习在桥梁裂缝检测中的应用,分别分析了VGGNet、AlexNet和ResNet三种深度学习模型在图像分类方面的应用,以及FasterRCNN、YOLOv3和YOLOv4三种模型在目标检测方面的性能。研究结果表明,VGG16精确度表现出色,YOLOv4则能够在维持高速度检测的同时提升检测精确性。

关键词 机器学习;公路桥梁;裂缝检测技术

中图分类号 U446文献标识码 A文章编号 2096-8949(2024)09-0110-03

0 引言

桥梁结构随运营时间增长出现各种裂缝损伤,传统裂缝检测方法难以保证检测的准确性和及时性。随着机器学习技术的发展,公路桥梁可利用先进图像识别和目标检测算法提高裂缝检测效率。该文旨在探索和分析基于机器学习的公路桥梁裂缝检测方法,为桥梁健康监测和维护提供技术支持。

1 基于机器学习的图像识别算法模型

1.1 VGGNet模型

VGGNet模型深度和参数量大、运算成本较高,需要较大的存储空间和计算资源,其使用多达19层的网络提取图像特征,采用多个小型卷积核(通常为3×3)连续卷积,使得网络在保持感受野的同时能够更深入地学习图像特征。VGGNet模型的一般结构可以表示为连续卷积层(Convolutional Layers),后接最大池化层(Max Pooling Layers)[1-2]。卷积层主要用于提取图像中的局部特征,最大池化层则用于降低特征空间维度、增强模型泛化能力。网络的末端由几个全连接层(Fully Connected Layers)组成,用于最终的任务分类。VGGNet卷积层计算方法可表示为:

f(x)=max(0,W×x+b) (1)

式中,f(x)——ReLU激活函数,表示卷积层的输出;W——卷积核的权重矩阵;x——输入图像或上一层的输出图像;b——偏置项,用于引入非线性。

1.2 AlexNet模型

AlexNet模型标志着深度学习时代在图像识别领域的开始,其结构包含5个卷积层和3个全连接层。AlexNet第一个卷积层使用较大的卷积核(11×11),步长为4,能够在较大尺寸的图像上捕捉更多的细节。随后的卷积层使用较小的卷积核(5×5和3×3),以提高特征提取的精度。其ReLU激活函数公式如下:

g(x)=max(0,x) (2)

式中,g(x)——激活函数的输出;x——输入。Dropout技术则通过随机丢弃一部分神经元、减少模型对特定节点的依赖,从而有效防止过拟合。

1.3 ResNet模型

ResNet(Residual Network)模型引入残差学习(Residual Learning)的概念,构建了深达152层的网络,其核心思想是在网络中引入“跳跃连接”(或称为“快捷连接”),直接将输入添加到输出[3-4]。若将网络的输入表示为x,残差函数表示为F(x),则输出可以表示为F(x)+x,其基本公式为:

y=F(x,{Wi})+x (3)

式中,y——网络的输出;F(x,{Wi})——残差映射;{Wi}——残差映射中学习的权重集合;x——输入。

2 基于机器学习的目标检测

2.1 FasterRCNN

FasterRCNN(Faster Region-based Convolutional Neural Network)在R-CNN和Fast R-CNN的基礎上发展而来,其引入了区域建议网络(Region Proposal Network, RPN)。FasterRCNN的架构主要分为四个部分:特征提取网络、RPN、RoI(Region of Interest)池化层和全连接层(如图1所示)。特征提取网络通常使用预训练的VGG16或ResNet-50卷积神经网络,从输入图像中提取特征,流程图如图1所示。

FasterRCNN利用RPN滑动窗口在特征图上运行,为每个位置生成多个固定大小的锚框(anchor boxes),以不同尺寸和纵横比覆盖图像中可能的对象位置,并进行二元分类(对象或非对象)和边界框回归优化锚框[5]。RoI池化层则从每个建议区域中提取固定大小的特征映射,随后在全连接层中进行最终的对象分类和边界框的精确调整。这一过程中,RPN和检测网络可以共享卷积特征并同时进行优化。

图1 FasterRCNN流程图

2.2 Y0L0v3

YOLOv3(You Only Look Once version 3)能够在单次前向传播中同时进行对象检测和分类,其架构基于Darknet-53。YOLOv3能够在三个不同的尺度上进行目标检测,从而有效地检测到不同大小的对象。在检测过程中,网络将输入图像划分为S×S网格,每个网格单元负责预测B个边界框和每个边界框的C个类别概率。边界框预测包括四个坐标值(中心x, y,宽度,高度)和一个置信度得分。在此基础上,YOLOv3引入了多标签分类(与FasterRCNN的多类别分类不同),在PASCAL VOC和COCO数据集上显示出优异的性能。

2.3 Y0L0v4

YOLOv4(You Only Look Once version 4)架构基于CSPDarknet53,该架构能够有效降低计算复杂度并提高处理速度,采用PANet(Path Aggregation Network)增强特征融合网络结构可以改善小尺度对象的检测性能。在数据增强方面,YOLOv4使用Mosaic和CutMix等技术对多张图像中的部分区域进行组合,并生成新训练样本,以增加模型训练的复杂度及多样性。

3 基于機器学习的公路桥梁裂缝检测方法

3.1 特征提取

特征提取主要包括两个方面:利用卷积神经网络(CNN)、应用传统图像处理技术。在进行裂缝检测时可以使用VGG-16、ResNet-50等预训练网络,其包含多个卷积层,每个层都能从图像中提取不同层次的特征。VGG-16包含16层,其中有13个卷积层和3个全连接层,而ResNet-50则有50层,包括卷积层、批归一化层和残差连接等。神经网络可以从桥梁图像中提取边缘、纹理、形状等特征,用于后续的裂缝识别。

传统的图像处理技术可以应用Sobel算子边缘检测技术,以突出裂缝边缘特征,Canny边缘检测算法则能够在降噪后计算梯度的幅值以检测边缘。灰度共生矩阵(GLCM)可以计算像素对的频率分布,以描述图像的纹理特征,帮助分析裂缝周围的纹理模式。综合运用上述方法,能够在特征提取阶段得到包含多维特征的特征向量,以用于裂缝的识别和分类。在实际操作中,需要根据具体图像数据和裂缝特性调整CNN模型,如学习率、批大小、Canny算法的阈值、GLCM的窗口大小,进而优化特征提取过程。

3.2 裂缝识别

支持向量机(SVM)是常用裂缝识别分类器,其可以根据特征提取阶段得到的特征向量来识别裂缝和非裂缝区域。SVM关键参数包括核函数类型(线性核、多项式核、径向基函数核)、正则化参数C和核函数的参数(多项式核度数或RBF核γ值),使用RBF核的SVM需要调整γ值和C值以获得最佳性能。其中,RBF核的表达式为:

(4)

式中,K(xi,xj)——RBF核函数,用于计算样本xi、xj间相似度;γ——RBF核的自由参数,决定了决策边界的平滑程度;——两个样本点之间的欧几里得距离的平方。

随机森林(Random Forest)由多个决策树组成,每棵树在训练过程中使用随机选择的特征子集,其关键参数包括树的数量、树的深度和特征选择的方法,增加树的数量可以提高模型的稳定性和准确性。神深度神经网络可以利用多层非线性变换捕捉复杂特征关系,其关键参数包括网络层数、每层神经元数量、激活函数类型(ReLU、Sigmoid)、学习率和正则化策略(Dropout、L2正则化)。YOLOv3或YOLOv4等目标检测模型能够利用卷积神经网络提取特征,并利用锚框机制进行边界框预测,其关键参数包括输入图像的尺寸、锚框的尺寸和纵横比、置信度阈值和非极大值抑制(NMS)的阈值。

4 图像分类模型与目标检测模型实验分析

4.1 实验准备

4.1.1 数据集采集

该次实验数据集共包含15 000张高分辨率图像,每张图像的分辨率统一调整至1 280×960像素,图像均有明确的裂缝位置、参数以及裂缝类型。

4.1.2 评价指标

图像分类任务主要关注准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1得分。目标检测模型除上述指标外,还专注于平均精度均值(Mean

Average Precision, mAP)及交并比(Intersection over Union,

IoU)。mAP计算公式为:

(5)

式中,N——类别总数;APi——第i个类别的平均精度,代表该类别上模型的精确率-召回率曲线下的面积。

具体指标如表1所示。

4.1.3 实验环境

该次实验配置了具有高性能计算能力的专业硬件,以及当前领先的深度学习框架,具体如表2所示。

4.2 实验分析

4.2.1 图像分类识别算法模型对比分析

该次实验深入分析了三种图像分类识别算法模型:AlexNet、VGG16和ResNet34。AlexNet结构相对简单,裂缝检测任务精确度大约86.9%。VGG16模型计算负荷有明显增加,但能更深入地提取图像特征。ResNet34裂缝检测精确度约为95.8%,证明了深度和残差连接的有效性。具体对比分析结果如表3所示。

整体而言,三种模型各有优势和局限性。AlexNet能够在简单网络结构下具备良好的基准性能,VGG16精确度较高,ResNet34则在保持相对较低模型大小的同时实现了最佳精确度。

4.2.2 目标检测模型对比分析

该次实验对FasterRCNN、YOLOv3和YOLOv4三种目标检测模型进行了详尽的对比分析,具体结果如表4所示。其中,FasterRCNN模型的参数量大约为210 MB,裂缝检测召回率为88%、精确度达到91.7%、F1得分为0.89,其mAP达到90%,而IoU分数为0.75。

YOLOv3模型的参数量为236 MB,裂缝检测召回率为83.9%,精确度为88.6%、F1得分为0.79,其mAP为85%,IoU分数为0.72。尽管YOLOv3模型在速度方面具备优势,但在精确度和召回率方面略逊于FasterRCNN模型。

YOLOv4模型的参数量为244 MB,裂缝检测召回率为85.7%、精确度为90.8%、F1得分为0.87,其mAP为87.4%,IoU分数为0.74,能够在维持高速检测的同时显著提升检测精确性。

表1 评价指标参数

指标 描述

准确率Accuracy 正确分类的样本数/总样本数

精确率Precision 真正类(TP)/[真正类(TP)+假正类(FP)]

召回率Recall 真正类(TP)/[真正类(TP)+假负类(FN)]

F1得分F1 Score 2*(Precision*Recall)/(Precision+Recall)

平均精度均值mAP 平均精度均值,模型在所有类别和

召回率条件下的平均表现

交并比IoU 预测边界框与实际边界框的交集/并集

表2 软硬件配置数据

软硬件配置 具体名称

CPU Intel Core i9-10900K

GPU NVIDIA GeForce RTX 3080

内存 64GB DDR4 RAM

存储 1TB NVMe SSD

操作系统 Ubuntu 20.04 LTS

深度学习框架 TensorFlow 2.4.1

PyTorch 1.8.1

Keras 2.4.3

并行计算框架 CUDA 11.2

深度学习库 cuDNN 8.1

表3 图像分类识别算法模型的对比分析

模型 模型复杂度 模型参数量/MB 精确度P/%

AlexNet 简单 55.71 86.9

VGG16 中等 275.63 95.6

ResNet34 复杂 81.6 95.8

5 结束语

该文对基于机器学习的公路桥梁裂缝检测技术进行了全面分析和实验验证,研究结果证明VGGNet在精确度上表现优异,而ResNet则能够有效解决深度网络训练问题;FasterRCNN裂缝识别更为准确,而YOLOv3和YOLOv4则更适用于实时检测。未来研究可以聚焦于优化模型的计算效率,以探索更高效的数据增强和迁移学习策略。

参考文献

[1]曹升亮, 赵礽晔. 基于图像分析的桥梁裂缝检测技术应用[J]. 建筑机械, 2023(6): 78-81.

[2]丁少强. 道路桥梁裂缝识别技术的研究[J]. 汽车周刊, 2023(1): 114-115.

[3]贾潇宇. 基于卷积神经网络的桥梁裂缝识别研究[J]. 中国新通信, 2022(9): 34-36.

[4]廖祥灿, 李彩林, 姚玉凯, 等. 基于改进YOLO V5的公路桥梁裂缝检测方法[J]. 山东理工大學学报: 自然科学版, 2023(4): 1-7.

[5]李国燕, 梁家栋, 刘毅. MFC-DeepLabV3+: 一种多特征级联融合裂缝缺陷检测网络模型[J]. 铁道科学与工程学报, 2023(4): 1370-1381.

[6]杨帆. 基于数字图像的混凝土桥梁裂缝检测技术[J]. 科学技术创新, 2023(10): 126-129.

猜你喜欢
机器学习公路桥梁
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
针对公路桥梁路基路面施工技术的分析
公路桥梁加固设计及其施工建议
基于支持向量机的金融数据分析研究
钻孔灌注桩施工技术在公路桥梁施工中的应用
浅谈在公路桥梁施工环节的质量管理及控制
试析公路桥梁检测技术与现实中的运用
阐述公路桥梁施工工艺及技术管理