基于卷积神经网络的桩完整性分类

2021-10-15 12:40刘伟平田思文
南昌大学学报(工科版) 2021年3期
关键词:基桩完整性卷积

刘伟平,田思文

(南昌大学建筑工程学院,江西 南昌 330031)

桩基础是一种广泛使用的深基础形式,经常应用于高层建筑、桥梁和港口等重要结构中。其施工质量和完整性对保证建筑工程整体质量和安全具有十分重要的作用。由于灌注桩通常是地下成桩方式,存在施工难度大、工艺复杂和隐蔽性强等特点,在施工过程中很容易产生孔洞、裂缝、夹层、缩颈等缺陷,进而破坏桩身的完整性[1]。所以,采用合理可靠方法对桩身完整性进行检测是保证建筑安全的必要条件。

低应变应力波反射法是工程上常用的基桩完整性检测方法,具有检测快速、经济、无损等特点。使用这一方法时,利用力棒或手锤敲击桩顶,激发一维应力波沿桩身向下传播,应力波在传播过程中遇到诸如桩截面缩颈、离析、断桩等缺陷时发生反射(表现为波阻抗的改变),通过安装在基桩顶部的传感器(速度型和加速度型)接受反射信号。通过综合分析反射波时程曲线,对桩身的完整性进行判断。目前,根据反射波信号检测桩身完整性常用[1]方法主要有两种:一是人工检测方法;二是基于机器学习的模式识别方法。使用第1种方法时,需要检测人员应用实际检测经验进行判断,检测精度受到多种人为因素(如经验、注意力和熟练程度)的影响,存在成本高、效率低、主观性强的问题[2-3]。使用第2种方法时,对应人工神经网络既有极强的大规模处理能力,又有非线性映射能力、良好的自适应性、强大的训练和容错功能[4],可以通过分析信号参数信息、提取相关特征来进行完整性分类判断。

鄢泰宁等[5]利用对应于某一缺陷的已知频谱响应来训练多层神经网络、进而指出存在于桩基的缺陷,表明神经网络在基桩检测方面具有良好的应用前景。此外,通过结合小波分析与神经网络技术对桩身缺陷信息学习,可以预测基桩完整性程度[6]。王成华等通过限制连接权重范围、改进激励函数、采用二阶学习算法,将桩身应力波曲线、几何尺寸和混凝体波速等作为网络输入信息来提高网络的可行性和计算速度[7]。TAM等[8]采用概率神经网络、结合遗传算法,调整网络结构、使用随机种子来避免过拟合,分析所建模型的分类行为。由于BP神经网络初始权重和阈值由网络系统随机产生,会干扰预测结果,包龙生等[9]将遗传算法得到的相关参数代入网络,提高算法效率。以上人工神经网络在基桩检测中进行了很好的尝试,但基于模式识别的机器学习方法检测过程相当复杂,检测精度虽比人工检测有一定程度的提高、但仍略显不足。

近年来,深度学习发展迅猛,在语音识别、目标检测、图像分类自然语言处理等领域获得了大量成功的应用[10-11],成为解决各种分类识别问题强有力的方法。深度学习最早由Hinton[12]提出,利用多个隐含层从大规模数据中逐层、逐级学习到更有用的深层判别特征[12-14]。其中,卷积神经网络(CNN)[15]是一种重要的深度学习结构,其灵感来源于生物的视觉中枢系统,主要用于图像分类。CNN在图像分类识别中取得了许多显著的研究成果,逐渐成为识别和检测任务的主导方法[16-17]。CNN是一种多层有监督学习、可以从数据集中自动学习特征,由一个输入层、一个输出层和多个隐含层组成,隐含层通常包含卷积层、池化层和全连接层,分别用于特征提取、特征压缩和分类。目前,图像分类效果非常好的卷积神经网络模型有很多,如AlexNet[18]、VGG[15]、GoogLeNet[19]、ResNet[20]等经典网络在ILSVRC竞赛中取得了巨大成功,展现了卷积神经网络的巨大潜力。

然而,现在还未将卷积神经网络用于桩身完整性分类。本文将深度学习引入基桩检测领域,使用卷积神经网络算法构建的模型进行桩身完整性分类。

1 基于CNN的桩身完整性分类

1.1 构建数据集

桩身的完整性主要分为4类,分别为Ⅰ类:完整桩;Ⅱ类:轻度缺陷桩;Ⅲ类:较重缺陷桩;Ⅳ类:严重缺陷桩或断桩。本文采用低应变应力波反射法采集得到曲线图像,并由此构建数据集。所采集的图像共3 200张,完整桩、轻度缺陷桩、较重缺陷桩和严重缺陷或断桩4种类型图像各800张。

为了提高网络的鲁棒性和识别率,避免计算量大、学习效率低下等问题,在图像输入CNN模型之前,先对图像进行预处理。由于CNN需要大量的数据集进行特征学习,因此,本文使用数据增强技术生成新的图像,主要使用上下翻转、左右翻转、添加噪点和改变亮度等方式。初始采集到的图像700×1 200像素,考虑到计算机可承受的数据量和计算速度[21],采用photoshop软件将图像数据压缩为统一的64×64像素,图片格式为jpg,如图1所示。

增强后的数据集包含4类图像、共计9 600张,每种类型的图像为2 400张,把整个图像数据集按照4:1的比例划分为训练集和验证集。为了充分利用数据集,在模型训练过程中,验证集和测试集全部使用验证集的数据。由于该方法是有监督学习,因此,需要对数据集进行相应的标注。在PyCharm编程平台下,首先将整个数据集在一个公共数据目录中划分成两个目录:Train和Validate;然后Train和Validate两个目录分别由4个目录组成,分别是Ⅰ类:完整桩;Ⅱ类:轻度缺陷桩;Ⅲ类:较重缺陷桩和Ⅳ类:严重缺陷桩或断桩。图像分别存储在相关文件目录下。卷积神经网络模型对Train目录中的图像进行训练,对Validate目录中的图像进行验证。

1.2 CNN架构

卷积神经网络主要由卷积层、池化层和全连接层组成[22]。卷积层由一定数量的卷积核组成,使用一组卷积核对前一层的输出执行卷积运算、以提取对分类重要的特征。池化层对卷积层输出特征图进行压缩;Softmax函数作为输出层实现桩身完整性的识别结果并进行分类。本文所使用的网络结构由3个卷积层组成,分别有32、64和128个卷积核,卷积层的输出经过激活函数的非线性映射,然后每个卷积层后接一个最大池化层。在第3个卷积层之后,二维平面图被展平为一维向量,之后是两个全连接层和输出层。整个网络结构的示意图和相关参数如图2和图3所示。

1.2.1 卷积层

卷积层是卷积神经网络的主要组成部分,具有局部连接和参数共享的特点。局部连接与全连接方式相比,模型的参数数量大大降低;参数共享使网络获得了良好的平移不变性。卷积层包括一组卷积核,这些卷积核与给定输入进行卷积生成输出特征图。卷积核包括权重矩阵W和偏置项b。在CNN训练期间,通过学习得到每个卷积核的权重和偏置。卷积层在卷积核和该层输入之间执行卷积操作(本文网络模型全部使用3×3卷积核、卷积步长设置为1)。卷积运算是线性滤波,滤波器沿输入特征图的宽度和高度滑动;对于图像中的每个像素,计算以该像素为中心的局部窗口内像素和卷积核的内积,将其作为该像素的新值、遍历图像中的每个像素。

卷积神经网络中卷积层和全连接层之后是非线性激活函数,它允许神经网络学习非线性映射,能有效缓解网络中的梯度消失问题。常用的激活函数是可微分的,以实现误差反向传播。为了提高网络性能和训练速度,本文网络模型将ReLU激活函数[23]安排在卷积层和全连接层之后,最后的输出层使用Softmax激活函数。

1.2.2 池化层

在卷积神经网络中,卷积层是一堆特征图,每个卷积核有一个特征图。卷积核的数量增多会增加卷积的维数。卷积核的维度越高,说明参数越多。池化层是对卷积层的输出数据进行采样,能够对特征图进行降维,而保持深度维度不变,减少了网络中的参数数量和计算量,提高了模型的泛化能力,控制过拟合现象。最常使用的池化操作有平均池化和最大池化两种,最大池化指选取局部窗口数据的最大值,平均池化指选取局部窗口数据内的平均值。本文CNN模型均采用最大池化的操作方法,选用步长为2,尺寸大小为2×2,像素不进行填充,图像经过最大池化操作后减小为原来的一半。

1.2.3 全连接层

全连接层放置在架构的末端,它的每个神经元密集地连接到两个相邻层中的所有神经元,这类似于传统的人工神经网络。它(全连接层)是一种多层感知器、起到分类的作用,最后连接输出层(Softmax分类器)。Softmax是Sigmoid类激活函数的扩展,计算输入样本被分到每一类别的概率。

1.2.4 Dropout层

神经网络训练期间的主要缺点之一是过拟合,正则化的常用方法之一是随机失活(Dropout层)技术[24]。在过拟合情况下,模型被特别调整得适应于训练数据集、不能用于泛化。因此,虽然过拟合的网络模型在训练集上表现良好,但是缺乏泛化能力、在验证集和测试集上将会表现较差。Dropout层可以避免将所有神经元放在一个层来同步优化权重,这种对神经元的随机分组可以防止所有神经元收敛到相同目标、从而降低了权重的相关性。Dropout层还会让隐含层神经元的激活变得很稀疏,减弱了不同特征的协同效应、提高了网络的鲁棒性。本网络模型在全连接层后面加入Dropout层。Dropout层参数(丢弃概率值)设置为0.5,表示50%的概率设置神经元的输出值为零。

1.2.5 模型训练与测试

卷积神经网络训练过程属于监督学习,学习过程包括前向传播和后向传播两个步骤。在卷积神经网络模型训练过程中,选择随机梯度下降算法对训练集中的输入和输出执行参数更新。损失函数采用交叉熵代价函数,其表达式为:

(1)

式中:C为损失;m为样本总数;y为真实值;a表示网络的输出值;x为输入样本个数。

为了控制模型的学习容量、减弱过拟合的风险,本文采用L2正则化(即权重衰减),通过直接惩罚目标中所有权值参数的平方和来实现。通过正则化使权重的绝对值变小,这样输入的每个属性通过与权重相乘,都能对分类产生影响。添加惩罚项后的总损失函数表示如下:

(2)

其中,正常数λ是正则化系数。λ越大,正则化强度越大,使得模型训练得出的模型权重值较小实现权重衰减。

2 实验结果与分析

2.1 评价标准

本文主要对基桩完整性进行分类,模型测试阶段通过以下几个指标进行评估和分类:精度(Precision)、召回率(Recall)、F1-score和混淆矩阵综合评价模型性能。

(3)

(4)

(5)

式中:TP表示Ⅰ类桩被正确分为Ⅰ类桩的样本数量;FP表示不属于Ⅰ类桩被错误分为Ⅰ类桩的样本个数;FN表示属于Ⅰ类桩,但被错误地分为其类别样本个数。

2.2 结果分析

本研究基于Windows10 X64操作系统,计算机的CPU为Intel(R)Core(TM)i9-9900K CPU @3.60GHz,32 GB运行内存,算法使用Python语言编程环境,基于深度学习框架Keras完成实验。

模型的超参数包括训练次数(100)、学习率(0.001),训练批量大小(32)。在训练过程中,模型的初始权重参数用均值为0、标准差为0.01的高斯分布生成。

在对卷积神经网络模型进行训练过程中,将训练(Training)和验证(Validation)过程中的数据参数保存并可视化,得到准确率(Accuracy)和损失率(Loss)的变化趋势(图4和图5)。由图4可以看出,训练集的准确率在前20次迭代时,识别准确率上升较快;经过150次迭代后逐渐趋于一个稳定状态;识别准确率可以达到98%。验证集的变化趋势和训练集变化趋势基本一致,数值快速收敛后、在第50次迭代后基本趋于稳定状态,识别准确率达到97.8%。图5为模型训练和测试过程中的损失值。比较训练集和验证集的损失变化趋势可以看出,模型在训练和测试过程中损失值呈下降趋势;训练过程前20迭代以较快的速率下降,随后100次迭代的下降速度开始放缓并趋于一个平稳收敛的过程;验证过程的损失值在经历快速收敛后呈现小范围震荡,第125次迭代后在一个较小范围震荡且仍有下降趋势,最后达到较为平缓的稳定状态。对比图4和图5的准确率和损失值可知,网络整体收敛较好,未出现过拟合情况,收敛速度较快。当迭代200次后,模型训练阶段结束,保存模型参数,对模型进行性能测试。

Epoch

Epoch

为了验证所提出的CNN模型的性能,由它生成的混淆矩阵如图6所示。在混淆矩阵中,x轴表示预测标签,y轴表示真实标签。由于有4类图像,因此生成了4×4大小的混淆矩阵,矩阵中每个数字表示这个数字横坐标对应的真实基桩类别被预测为纵坐标对应基桩类别的概率。Ⅰ类、Ⅱ类和Ⅲ类的分类准确率大于95%,Ⅳ类桩达到了100%,可以看出本文所测试的模型具有良好的鲁棒能力和泛化性能。此外,为了判断所提出方法的效率,计算了准确率(Accuracy)、精度(Precision)、召回率(Recall)和F1评分(F1-score)如表1所示。模型训练阶段的通过测试可以看出,模型性能优越、稳定,平均准确率达到了平均96.51%,能够完成对基桩完整性的分类识别工作。本文所建立的卷积神经网络模型与其他文献[7,25,26,27]的方法比较,结果表明,卷积神经网络在基桩完整性的分类效果均有一定程度提升。

图6 桩身完整性分类准确率的混淆矩阵

表1 模型测试结果

3 结论

1) 本文提出将深度学习理论应用到基桩完整性分类检测领域,利用深度学习技术在检测分类方面的优越性能,提高基桩完整性分类的识别率。

2) 卷积神经网络理论可以解决用传统手段难以辨析基桩完整性分类的工程技术问题,可以与基桩低应变检测仪配合使用。

3) 针对人工提取特征存在的操作复杂、成本高和主观性强等缺陷,本文基于卷积神经网络构建了层数较少、复杂度低的网络模型框架,在测试集上平均准确率可达96.51%,可以满足预测精度要求。

4) 本文训练样本和验证样本有限,还能进一步试验,训练优化改进网络和增强网络的鲁棒性。如何基于基桩低应变反射波图像通过神经网络确定桩身缺陷位置也是需要进一步研究的内容。

猜你喜欢
基桩完整性卷积
工字形布桩群桩基础在大跨度拱形建筑结构中的应用*
基桩检测技术在房屋建筑中应用剖析
基于3D-Winograd的快速卷积算法设计及FPGA实现
基桩超声检测有限元数值模拟研究
关于防火门耐火完整性在国标、英标、欧标和美标中的比对分析
卷积神经网络的分析与设计
ELM及IS/OS完整性对年龄相关性黄斑变性预后视力的影响
更正说明
基桩检测中的静载试验法与高应变法的应用探讨
从滤波器理解卷积