一种基于卷积神经网络的结构损伤检测方法

2020-06-03 07:17张盼盼张健飞
河南科学 2020年4期
关键词:池化层准确率卷积

张盼盼, 张健飞

(河海大学力学与材料学院,南京 211100)

工程结构在服役周期之内受到自然灾害、荷载和环境作用会产生不同程度的损伤,从而影响结构的正常使用和安全,因此检测结构损伤和确保结构完整性一直以来成为科研学者的关注重点[1-3]. 目前,很多重要工程都安装了结构健康监测系统,获得了大量监测数据,然而如何通过对这些海量数据的有效分析,检测识别结构的损伤,从而为工程的维护和管理提供依据,仍然是一个挑战性课题. 为此,国内外学者提出了很多损伤识别理论,其中包含模态识别法、模型修正法、小波分析法、统计分析法、模式识别法和神经网络法等[4-5].

神经网络是近几十年以来人工智能领域兴起的研究热点,在结构损伤识别领域里已经广泛应用[6-8]. 比如:张刚刚等[9]分别采用频率、振型模态、曲率模态3种指标作为网络的输入参数,利用径向基函数(RBF)神经网络对某斜拉桥进行了损伤识别研究;孙杰[10]采用曲率模态和柔度曲率组合成多模态参数作为BP神经网络的输入进行了损伤定位及定量分析;肖书敏等[11]采用小波包分析方法构造结构损伤指标,并结合结构损伤指标和BP人工神经网络方法进行桥梁结构的损伤定位. 传统应用神经网络多是将其作为分类器,将通过信号处理技术提取的特征或结构动力指纹作为网络输入,通过训练网络,实现损伤识别的目的. 网络识别精度很显然会受到信号处理精度的影响,而直接将实际结构的海量监测数据作为网络输入,训练参数会指数级增加,而且容易出现过拟合现象.

卷积神经网络(Convolution Neural Network,CNN)具有其他神经网络不具备的特点:权值共享、局部连接、卷积层和池化层,从而可以大幅减少网络训练的权重数量,减少模型复杂度,防止过拟合等,目前已经在语音识别、自然语音处理等方面取得了大量的研究成果[12-16]. 在结构损伤识别方面,Cha等[17]利用卷积神经网络通过识别混凝土裂缝的图片来检测损伤,将训练好的CNN对来自不同条件下(例如强光、阴影和非常薄的裂缝)结构的55 张5888×3584 像素分辨率的图像进行预测,结果表明该方法具有良好的鲁棒性和适应性. Lin等[18]和李雪松等[19-20]分别研究了简支梁损伤识别和框架结构损伤识别的一维卷积神经网络模型,即主要是在时间维度上进行卷积.

本文建立了一种结构损伤识别的二维卷积神经网络损伤识别模型,以空间不同位置的加速度信号为输入数据,在空间维度上进行卷积,尤其适用于板壳类. 本文给出了网络结构、网络参数和训练方法,分析了CNN损伤识别模型分别在不含噪声和5%、10%噪声以及含5%和10%混合噪声环境下的损伤识别精度和抗噪性,获得了良好的识别效果.

1 卷积神经网络

卷积神经网络是一类包含卷积计算的深度神经网络. LeNet5作为最早的深度卷积神经网络之一,推动了深度学习的发展,近些年,卷积神经网络快速发展,其中较为经典的卷积神经网络有AlexNet、VGGNet、Google inception Net和Res Net.CNN,起初CNN解决图像识别的问题,如今在语音识别、人脸识别、运动分析、自然语言处理等领域都有应用.

卷积神经网络主要由输入层、卷积层、池化层、全连接层和输出层组成. 与其他神经网络的区别在于:①局部连接,各层只有部分神经元相连. ②权值共享,同一层神经元的权值是共享的.

1.1 卷积层

卷积层是卷积神经网络最为重要的部分,有多个不同的卷积核构成,输入数据通过卷积核过滤器,提取局部特征,生成下一层神经元矩阵也就是特征图,每一个卷积核对应一个特征图,同一个特征图上的神经单元使用的卷积核是一样的,即这些神经元可以实现共享权值,减少神经网络的参数量. 卷积操作公式如式(1)所示:

式中:Ci表示卷积神经网络第i 层的特征图;Wi表示第i 层卷积核的权重;⊗表示第i-1 层特征图与第i 层卷积核之间的卷积计算;bi表示第i 层的偏置;f( x )表示激活函数.

卷积计算如图1所示,在3×3的输入数据上使用2×2的卷积核,卷积核每移动1步,便得到一个输出. 图1中X 为输入数据,K 为卷积核,O 为卷积结果,⊗为卷积操作.

图1 卷积层计算示意图Fig.1 Schematic diagram of convolutional layer calculation

1.2 池化层

对卷积层的输出结果进行池化处理,池化层主要对提取的特征进行降维,减少参数数量且有效防止过拟合化. 池化层主要的两个池化操作分别是最大池化层、平均池化层.

本文采用最大池化层操作,可以保留数据中最显著的特征. 使用多次卷积—池化操作来实现数据特征提取. 如图2 所示,采用2×2 的过滤器输出每个区域的最大值,步长为2. 图2 中M 为池化层的输入数据,max pool为最大池化操作,O 为池化结果.

图2 池化层计算示意图Fig.2 Schematic diagrams of pooling layer calculation

1.3 全连接层和softmax层

将数据的特征提取完之后,用全连接层完成分类任务,Softmax层主要应用于分类问题,将网络的输出结果变成一个概率分布.

2 数据生成

板是工程中常见的一种结构,本文以一四边固定的方形薄板为例,进行损伤识别研究. 薄板的几何尺寸和材料特性为:长×宽=10 m×10 m;材料弹性模量E=192 GPa;泊松比ν=0.3;密度ρ=7800 kg/m3. 其有限元模型如图3工况1所示,将板划分为25×25 个有限单元,通过降低薄板不同位置的弹性模量来模拟损伤工况,共有9种工况:包含8种损伤工况和1种无损工况,各工况的损伤情况如表1和图3所示,图3中加黑色圆圈的有限单元为损伤单元. 各工况的加速度数据,采用有限元法模拟生成,在板的中心施加高斯白噪声荷载,以模拟外界环境激励. 每种工况选择除了四边固定结点外的24×24=576 个结点的加速度数据作为卷积神经网络的输入数据,加速度采样频率为200 Hz,采样时间为5 s. 从而得到9×1000 个样本,即每个时刻点上为一个样本,每个样本由24×24 个结点上的加速度组成.

表1 损伤情况Tab.1 Damage situation

神经网络将加速度数据组织为便于卷积神经网络计算的二维矩阵,网络的输入层样本大小为24×24,每种工况有1000个样本,共9种工况. 本文数值试验选取了不含噪声、5%噪声、10%噪声以及混合噪声水平下进行网络训练. 选择输入样本的70%作为训练数据,训练卷积神经网络,剩下的作为测试样本用于训练好的网络模拟预测,测试样本不参与训练. 每个样本的标签采用独热编码的方式以便卷积神经网络处理.

图3 损伤区域示意图Fig.3 Schematic diagrams of the damage area

3 卷积神经网络损伤识别模型

为了确定网络结构和网络参数,本文首先比较了不同卷积神经网络的层数下的准确率,如表2所示.

表2 二维卷积神经网络模型层数比较Tab.2 Comparison of two-dimensional convolutional neural network model layer number

由表2可知神经网络模型4的准确率最高,模型4的基本框架由3层卷积层、两层池化层和两层全连接层组成;之后在模型4的基础上对CNN的卷积核大小及数量、激活函数、批大小(Batch_size)等参数进一步地比较和调优,结果对比如图4所示. 最终确定的二维卷积神经网络模型如图5所示.

在表2中,convX-Y表示卷积核的边长大小为X,深度为Y. 比如conv3-32表示卷积核大小为3×3,深度为32. 方括号中的数字表示池化层的深度、全连接层的节点个数. 比如[32]表示池化层的深度为32;[100]表示全连接层的节点个数是100. 在卷积核深度上,大部分卷积神经网络都采用逐层递增的方式[21].

通过调节图4 的各参数进行模型准确率对比发现:除了子图(e)之外,其余子图的模型均可充分迭代1000步,可以得到较为稳定的准确率曲线. 主要由于当初始学习率设置过小时,网络在收敛过程中将变得非常缓慢,学习效率较低,所以初始学习率设为0.001最合适. 子图(a)比较了两种常用的卷积核大小对网络模型的影响,选择了准确率较高的3×3的卷积核. 子图(c)显示Sigmoid、Tanh和ReLU三种激活函数的模型最佳准确度分别为11.11%、82.31%和85.42%,Tanh激活函数的最佳准确率相比ReLU函数略低,所以网络层与层之间的激活函数选用ReLU 函数. 因此,本文中卷积神经网络的参数最佳设置为:卷积层每层深度为32、32、64;Batch_size取1500;全连接层的网络节点选用100、100.

图4 各参数下CNN模型准确率结果对比Fig.4 Comparison of CNN model accuracy results under various parameters

由图5可知,本文采用3层卷积层、两层池化层和两层全连接层的卷积神经网络. 为加快学习速率,卷积核步长取2. 两个池化层均采用最大池化操作2×2,步长取2. 分类函数使用Softmax函数. 采用Adam优化算法实现参数的更新,利用梯度的一阶矩估计和二阶矩估计实现动态调节参数学习率. 充分迭代训练1000步,保存识别效果最好的网络模型.

图5 卷积神经网络结构图Fig.5 Convolutional neural network structure

4 损伤识别

网络模型在不同的噪声水平下充分迭代训练1000 步,在训练集上的准确率均稳定在80%以上,如表3所示.

利用训练好的卷积神经网络去预测测试集,网络模型在不同噪声水平下的测试集准确率如表3 所示,可以看出卷积神经网络在不同的噪声水平下其预测准确率仍然保持较高的水平,说明网络具有良好的泛化能力.

为了直观显示损伤识别效果,在不参与训练的测试集中随机选取了9个测试样本预测其损伤工况. 这9个测试样本实际损伤情况分别为工况1、工况2、工况3、工况4、工况5、工况6、工况7、工况8、工况9. 卷积神经网络在不含噪声、5%、10%和混合噪声4 种水平噪声下预测的这9 个测试样本的工况的概率如表4~表7 所示,其中主对角位置上加粗字体的一项所对应的工况为神经网络预测情况.

从表4~表7预测工况概率结果可以得出,卷积神经网络在预测不含噪声、含5%噪声、10%噪声和混合噪声水平下的9个测试样本时,预测的工况概率比其他工况有着明显的区别,与样本的实际工况相一致. 说明卷积神经网络在以上四种水平噪声下的结构损伤识别效果良好,几乎能够精准识别出每个样本的损伤工况情况.

表3 各噪声水平的训练、测试准确率Tab.3 Training and test accuracies of each noise level

5 结论

本文建立了一种结构损伤检测识别的空间卷积神经网络模型,并以板结构损伤识别为例,通过数值试验确定了最佳网络结构和网络参数,主要包括网络的层数、CNN的卷积核大小及数量、激活函数、批大小等.

在不同噪声水平的数据上的数值试验结果显示本文的模型在训练集和测试集上都取得了较高的准确率,具有较好的抗噪性. 从而验证了卷积神经网络用于识别结构损伤的可行性和有效性.

本文目前的研究是基于简单模型和数值模拟数据开展的,今后还要进行实验验证,并考虑实际环境影响等因素,进一步提高损伤识别的精度和鲁棒性,开展实际工程应用研究.

表4 不含噪声水平下9个测试样本的预测工况概率Tab.4 Probability of test set conditions for 9 samples without noise level

表5 5%噪声水平下9个测试样本的预测工况概率Tab.5 Probability of test set conditions for 9 samples at 5%noise level

表6 10%噪声水平下9个测试样本的预测工况概率Tab.6 Probability of test set conditions for 9 samples at 10%noise level

表7 5%、10%混合噪声水平下9个测试样本的预测工况概率Tab.7 Probability of test set conditions for 9 samples at 5%and 10%mixed noise levels

猜你喜欢
池化层准确率卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络模型研究分析*
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于卷积神经网络的纸币分类与点钞
基于深度学习卷积神经网络的人体行为识别研究
卷积神经网络的分析与设计
从滤波器理解卷积