基于GoogLeNet的混凝土细观模型应力-应变曲线预测*

2022-04-19 06:38赵婷婷陈青青王志勇王志华
应用数学和力学 2022年3期
关键词:骨料卷积神经网络

周 杰,赵婷婷,陈青青,王志勇,王志华

(1.太原理工大学 机械与运载工程学院 应用力学研究所,太原 030024;2.材料强度与结构冲击山西省重点实验室,太原 030024)

引 言

非均质材料通常指由两种或者两种以上材料组成的复合材料,细观力学认为,材料细观尺度下的特性对其宏观性能具有决定性的影响.其中,混凝土由骨料、水泥砂浆和初始孔隙和裂缝等组成,是一种典型的非均质复合材料.随着计算力学的发展,不同学者使用数值计算方法在细观尺度下研究了混凝土材料的力学响应,涉及强度、弹性模量、导热性能等问题[1-4].但是,由于不同细观组分形态、分布、力学参数差异显著,建立细观模型特征与材料宏观性能之间的多尺度关联具有难度.如今,随着深度学习技术的飞速发展和广泛应用,为跨尺度的力学研究问题提供了方向.不同于其他研究,本文基于计算力学和深度学习方法,提出了一种准确、快速预测混凝土细观模型应力-应变曲线的方法.

Hinton 和Salakhutdinov[5]首次提出了深度学习框架.深度学习是一种数据驱动的方法,基于大量数据信息,通过搭建神经网络模型就可以在复杂输入输出数据之间建立隐式函数关系.随着计算机科学技术的不断发展,深度学习为越来越多的领域带来灵感和启发,尤其在计算机视觉领域中有着突出的表现[6].其中,卷积神经网络作为深度学习模型中最重要的结构之一[7],被广泛应用于图像识别、分类,语义分割[8],目标检测[9]等不同的场景,涵盖了生活、交通、安全、医疗、工程、社交媒体等诸多领域.深度学习正在成为一种改变“游戏规则”的技术[10].在复合材料力学性能预测方面,其同样也发挥着越来越突出的作用.近年来,不同学者先后开展了大量相关研究工作:Ye 等[11]提出了一种改进的卷积神经网络,以具有任意形状和分布的夹杂物复合材料微结构为窗口图像,预测其有效弹性模量和Poisson 比.Li 等[12]提出利用计算力学方法和卷积神经网络,预测了具有五种组成成分随机页岩模型的弹性模量.Yang 等[13]利用深度学习方法预测了由两相材料构成的复合材料的应力-应变曲线.Shin 等[14]通过数码相机获得了真实混凝土表面图片和深度学习预测试件抗压强度.

应力-应变曲线是反映材料力学性能的重要表达形式,具有高维度特点,强度、等效弹性模量等重要宏观性能都能够从应力-应变曲线中获取.因此,本文基于GoogLeNet 卷积神经网络以及训练集,实现了对混凝土细观模型单轴压缩应力-应变曲线进行预测.首先介绍了卷积神经网络和GoogLeNet 模型,对数据集的收集过程以及数据集的预处理方式进行了详细阐述.其次使用数据集训练改进的卷积神经网络,在测试集上进行预测.从预测曲线中提取弹性模量和峰值应力两个重要的力学性能,定量地评估了卷积神经网络的预测精度.最后根据预测结果得出初步结论,对未来的工作提出规划.

1 GoogLeNet 卷积神经网络

1.1 卷积神经网络

卷积神经网络是深度学习的代表算法之一[15],其基本组成如图1 所示.和传统的神经网络类似,卷积神经网络同样是由具有权重、偏置等参数的人工神经元构成,网络结构主要包括输入层、卷积层、池化层、全连接层和输出层等.其中,图像从输入层进入网络结构.卷积层是整个卷积神经网络的基础和核心,其功能是对输入层接收的图像数据进行特征提取.池化层又称为下采样层,位置一般处于卷积层的下一层,目的是对卷积层采集到的特征信息进行选择和过滤.通常,卷积神经网络通过多个卷积层和池化层堆叠,可以逐步提取图像特征信息,最后有效掌握整个图像所表达的特征.

图1 卷积神经网络基本组成Fig.1 The basic composition of a CNN

1.2 GoogLeNet 和inception 模块

随着先进算法的不断挖掘,研究人员提出了AlexNet[16]、GoogLeNet[17]、VGGNet 和ResNet 等不同模型的卷积神经网络.不同于其他的卷积神经网络模型,GoogLeNet 使用inception 模块代替卷积层.本文使用的inception 模块如图2 所示,由1×1,3×3,5×5 的卷积核以及3×3 的最大池化层组成.Inception 模块对输入特征图同时进行多个不同类型的卷积层以及最大池化层操作最后再聚合,相当于对一个特征图执行多次非线性操作并叠加,能够获取不同感受野(receptive field)[18]下的特征信息.在增加网络深度的同时改善了网络结构的稀疏性,能显著降低参数规模.

图2 Inception 模块Fig.2 The inception module

1.3 激活函数

激活函数的功能是增加神经网络的非线性特性,有助于建立神经元输入和输出之间的复杂映射.早期神经网络使用的激活函数(sigmoid 和tanh 等)如图3(a)~(c)所示,适用于训练浅层神经网络,对于深层神经网络,在反向传播过程中会出现梯度消失、学习困难等情况.Nair 和Hinton[19]提出将ReLU 函数作为深层神经网络的激活函数,如图3(d)所示.ReLU 函数的梯度只有0 和1,这在一定程度上抑制了部分神经元的活性,无论在正向传播还是反向传播中都显著地减少了计算资源,提高了训练效率.

图3 激活函数:(a) sigmoid;(b) tanh;(c) Leaky ReLU;(d) ReLUFig.3 Activation functions: (a) sigmoid; (b) tanh; (c) Leaky ReLU; (d) ReLU

2 建立数据集

2.1 数值模拟试验

本文在笔者现有工作[4,20]的基础上,考虑到孔隙以及骨料在基质中分布的不确定性和随机性,借助基于Monte-Carlo 方法的随机骨料模型[21]进行混凝土二维细观模型建模:通过Monte-Carlo 方法产生满足均匀分布的随机变量,并且保证在基体空间中,骨料与骨料、骨料与孔隙间、孔隙与孔隙之间两两分离.骨料的粒径同样需要满足一定的分布,使用Walaraven 公式[22]表示二维平面中随机骨料的分布:

式中,Pc为不同骨料级配在二维平面中出现的概率,Pk为骨料体积占混凝土体积的百分比,D0为当前级配骨料粒径.

为了增加数据集的样本空间,设置骨料体积分数范围在20%~40%之间,孔隙率范围在0%~10%之间.如图4的有限元模型,试件尺寸为150 mm×150 mm,骨料级配采用三级配,粒径分别为18 mm,12 mm,6 mm,孔隙直径取为2 mm[23],骨料颗粒形状和孔隙形状均假设为圆形[24],骨料与孔隙数目分别通过Walaraven 公式以及孔隙率计算.

图4 混凝土细观模型Fig.4 Concrete’s meso-model

在材料参数方面,由于骨料相比砂浆基质有较高的强度,不会产生贯穿裂缝引起的断裂破坏,使用线弹性模型模拟骨料的力学性能;水泥砂浆的力学行为与混凝土相似,宏观应力-应变曲线达到峰值应力后都会出现软化行为,采用ABAQUS 中的混凝土损伤塑性(concrete damage plasticity)模型[25]模拟其损伤及断裂行为.本文中,各细观组分的材料参数按照文献[26]定义,见表1.

表1 细观组分的力学参数Table 1 Mechanical parameters of meso-compositions

鉴于表现良好的神经网络需要大量数据集进行训练,本文通过编写ABAQUS 内置脚本语言Python 程序自动实现前处理操作,包括重复且繁琐的建立随机骨料模型、赋予材料属性、施加荷载、划分网格等一系列操作.使用ABAQUS/standard 隐式模块进行数值模拟计算,采用准静态单轴压缩实验加载,如图5 所示,在试件底部边界约束竖向位移,并且在底部边界中点处约束水平位移;有限元模拟采用位移控制加载,在试件顶部边界施加均匀位移荷载.最后获取对应的应力-应变曲线.一共收集训练集1 512 组、验证集168 组、测试集21 组.

图5 单轴压缩实验加载示意图Fig.5 Diagram of uniaxial compression test loading

2.2 数据预处理

2.2.1 细观模型窗口图像预处理

输入数据会对卷积神经网络的输出结果产生较大影响,需要对输入图像数据进行预处理操作.首先将输入的细观模型窗口图像编码为RGB 色彩的数据形式,不同的细观组分需要设置不同颜色,在本文中,绿色代表骨料,蓝色代表砂浆,而红色代表孔隙.另外,用于训练以及测试的图像分辨率设置为200 dpi,部分图像数据集如图6 所示.

图6 混凝土细观模型图像Fig.6 The image of concrete meso-structure

2.2.2 应力-应变曲线预处理

经过数值模拟得到的应力-应变曲线是由无数点组成的高维度数据,将未经处理的应力-应变曲线作为神经网络的输出数据,会显著增加神经网络的负担,消耗大量计算资源的同时降低神经网络的学习效率.鉴于此,本文分两个步骤简化应力-应变曲线[7]:1)使用曲线上41 个固定横坐标的点表征一条应力-应变曲线;2)不同的应力-应变曲线之间,41 个点的横坐标是重复的信息,因此可以暂时省略,只保留纵坐标的信息.经过以上两步简化,如图7 所示,每条应力-应变曲线简化表达为41 维的向量.

图7 应力-应变曲线预处理Fig.7 Preprocessing of the stress-strain curve

2.2.3 自定义损失函数

由于预测任务目标为41 维的向量,是多回归问题,因此需要修改GoogLeNet 神经网络的输出层激活函数:应力数值的值域包含于ReLU 函数的值域,所以采用ReLU 函数作为最后输出层的激活函数,设定输出维度为41,分别对应简化后的应力-应变曲线.另一方面,损失函数是反向传播中权重更新的基础,具有多种形式,不同的问题需要设置对应的损失函数.本文通过自定义的均方根误差(RMSE)函数作为损失函数:

式中L(y,)为损失值,y为真实的应力值,yˆ为神经网络预测的应力值.

3 训练过程及预测结果

卷积神经网络架构中参数规模巨大,为了提高并行计算和训练效率,本实验在搭载了NVIDIA GeForce GTX 1650 的计算机上完成.基于深度学习开源框架Keras 搭建GoogLeNet 卷积神经网络,在TensorFlow[27]后端上进行训练.依赖的Python 库有Pillow、h5py、protubuf、numpy 等.

3.1 训练过程

训练过程使用Adam[28]优化器作为反向传播算法.设定神经网络的学习率为1E-3,批处理大小为4,epoch 值Eepoch为100.训练过程中训练集和验证集的损失曲线如图8 所示.从图中可以观察到,随着训练迭代轮次的逐步增加,验证损失显著减少最后趋于稳定.

图8 训练集和验证集损失曲线:(a)训练集损失曲线;(b)验证集损失曲线Fig.8 Loss curves of the training set and the validation set: (a) the loss curve of the training set; (b) the loss curve of the validation set

3.2 预测结果

训练过程中,当验证集损失值降低到最小为1.061 时,载入对应的权重参数到神经网络,可以快速预测得到测试集的应力-应变曲线.图9 为部分测试集的真实应力-应变曲线和预测得到的应力-应变曲线对比情况.

图9 部分测试集的预测结果和数值计算结果对比:(a) 骨料体积分数39%,孔隙率1%;(b) 骨料体积分数39%,孔隙率6%;(c) 骨料体积分数39%,孔隙率9%;(d) 骨料体积分数40%,孔隙率1%;(e) 骨料体积分数40%,孔隙率3%;(f) 骨料体积分数40%,孔隙率8%Fig.9 Comparison of prediction results with numerical test data: (a) aggregate volume fraction at 39%, porosity at 1%; (b) aggregate volume fraction at 39%,porosity at 6%; (c) aggregate volume fraction at 39%, porosity at 9%; (d) aggregate volume fraction at 40%, porosity at 1%; (e) aggregate volume fraction at 40%, porosity at 3%; (f) aggregate volume fraction at 40%, porosity at 8%

通过观察预测结果发现,基于混凝土细观模型图像信息,使用训练良好的神经网络预测得到的曲线能够拟合真实曲线.在弹性阶段,预测曲线与真实曲线几乎重合;在塑性阶段,曲线的拟合效果存在一定差异.分析认为:在弹性阶段,混凝土内部几乎不产生损伤演化,神经网络输入的图像信息和弹性阶段的细观模型差异细微,所以曲线拟合效果好;随着荷载的持续施加,混凝土内部独立微裂缝之间开始贯通,形成宏观裂缝,造成混凝土局部破坏,此时神经网络输入的图像和细观模型差异逐渐显著,图像信息与细观模型匹配度降低,一定程度上增加了神经网络学习的难度.

3.3 卷积神经网络测试结果对比

表2 展示了基于数据集的不同卷积神经网络模型的对比.可以看出,在引入了算法更为先进的inception模块后,GoogLeNet 无论是在模型参数数量还是验证集损失上都具有明显的优势.GoogLeNet 训练所花费的时间,分别是AlexNet 和ResNet 的60.3%和36.8%.其次,在验证集损失方面,GoogleNet 和ResNet 分别为1.016 和1.773,而AlexNet 高达6.139.图10 展示了不同卷积神经网络模型预测得到的应力-应变曲线对比.通过观察可以得到:AlexNet 无论是在弹性阶段还是塑性阶段都无法较好地拟合曲线;ResNet 则无法较好地预测和捕获应力-应变曲线的峰值应力信息;GoogLeNet 无论在弹性阶段还是曲线峰值处都有着良好的预测效果.

表2 各卷积神经网络模型的对比Table 2 Comparison of CNN models

图10 不同CNN 预测结果对比Fig.10 Comparison of different CNN prediction results

3.4 定量评估预测结果

从全局定量地描述曲线预测结果难度较大,本文从应力-应变曲线中提取到峰值应力和等效弹性模量两个重要力学性能,使用相对误差定量评估局部曲线预测结果的精度.相对误差计算方法如下:

式中,εr为相对误差,P代表预测值,A代表真实值.

如图11(a)、(c)所示,从预测曲线中提取到的等效弹性模量和峰值应力都分布在直线附近,表明预测结果和真实结果非常接近.如图11(b)所示,在21 组测试数据中,20 组峰值应力相对误差小于10%,10 组峰值应力的相对误差小于2%.在图11(d)中,20 组测试数据的等效弹性模量相对误差小于5%,10 组测试数据的弹性模量相对误差小于2%.

图11 预测结果:(a) 峰值应力预测值;(b) 峰值应力预测值误差;(c) 弹性模量预测值;(d) 弹性模量预测值误差Fig.11 Predictions: (a) peak stress prediction; (b) errors of peak stress prediction; (c) elastic modulus prediction; (d) errors of elastic modulus of prediction

4 结论及展望

本文以混凝土这种非均质复合材料为研究对象,基于细观模型图像信息,利用GoogLeNet 卷积神经网络对混凝土细观模型进行了单轴抗压应力-应变曲线预测.经过大量数据训练得到的神经网络,在测试集上预测得到的曲线与数值计算得到的曲线吻合度较高.研究结果表明,基于GoogLeNet 的卷积神经网络能够提取混凝土细观模型中的特征信息,表现出良好的泛化能力.这项研究为高效、准确地建立混凝土细观模型和应力-应变曲线之间的非线性映射提供了方法,展示了数据驱动模式下混凝土跨尺度力学行为研究的潜力.

在建立混凝土二维细观模型时,为了减少数值模拟计算时间,提高数据收集的效率,我们假设骨料和孔隙的几何形状为圆形,以后的工作中,会建立包含几何形状更为复杂的二维细观模型数据集,同样可以使用CT 扫描图像建立细观模型数据集.不仅仅局限于混凝土,对于其他非均质复合材料也同样可以采取类似的研究方法,甚至推广到新型复合材料的设计研究.在未来的工作中,我们一方面将引入成功的经验模型或者算法,实现材料宏观性能的更高效预测;另一方面,将成熟的有限元方法逐步“嵌入”到神经网络模型,将数据驱动的深度学习方法变得可解释,也是一个值得攻克的难点.

猜你喜欢
骨料卷积神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
MIV-PSO-BP神经网络用户热负荷预测
免烧轻骨料在城市轻轨站台工程中的应用研究
再生骨料混凝土强度离散性试验研究
基于深度卷积网络与空洞卷积融合的人群计数
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
卷积神经网络概述