基于机器学习的钢管混凝土剪力墙破坏模式预测与解释

2022-07-21 08:24高,王
地震工程与工程振动 2022年3期
关键词:腹板剪力墙钢管

马 高,王 瑶

(1.湖南大学土木工程学院,湖南长沙 410082;2.工程结构损伤诊断湖南省重点实验室(湖南大学),湖南长沙 410082)

引言

剪力墙作为高层建筑结构中重要的主体抗震和侧力支撑构件,在高层建筑结构抗震设计中具有重要地位。钢管混凝土剪力墙作为一种新型剪力墙,能有效改善传统剪力墙的延性与耗能能力,应用前景广阔。出于抗震需求的考虑,需充分发挥钢管混凝土剪力墙的延性和耗能性能,应尽量避免剪力墙发生脆性破坏。因此,预测其破坏模式可以辅助设计人员寻找钢管混凝土剪力墙结构中易发生脆性破坏的部位,并对其进行设计上的优化。现有的文献和规范普遍认为低矮墙易受剪切破坏影响,然而试验证明该观点并不完全正确。例如Greifenhagen 等[1]试验中2 片剪跨比为0.69 的低矮剪力墙发生了弯曲破坏,Teng 等[2]试验中3 片剪跨比为2.2 的高剪力墙发生了剪切破坏。其原因在于剪力墙的破坏模式受多种设计参数的影响,仅用剪跨比并不能确定剪力墙的破坏模式,如何精准预测剪力墙的破坏模式成为有待解决的难题。

机器学习是该问题的一个可行解决方案,近年来已有不少研究人员进行了相关尝试。Mangalathu 等[3]尝试用多种机器学习算法对RC 剪力墙破坏模式进行预测,并建立了一个包含393 个RC 剪力墙的试验数据库。Siam 等[4]收集了93 个配筋砌体剪力墙的试验数据,使用聚类分析方法对其破坏模式进行分类。Feng等[5]使用集成学习的方法对钢筋混凝土柱的破坏模式进行了预测。虽然机器学习在预测结构构件破坏模式上已取得了一定成效,在建立多个变量间的复杂非线性关系时也很有效率,但机器学习的“黑箱”特性使得解释输入变量和输出变量间的关系很困难,这也给机器学习模型的实际应用带来了阻碍。针对该问题,Štrumbelj 等[6]提出用Shapley Additice Explanations(SHAP)法解决,SHAP 法是一种基于博弈论对机器学习模型进行解释的方法,其以一个线性模型解释各个特征参数对模型输出结果的影响,用Shapley 值量化反映各个特征参数的贡献。已有研究人员进行了相关探索,如:Mangalathu等[7]在已有的模型基础上,使用SHAP法对各个参数对剪力墙破坏模式的影响进行了量化分析;Parsa 等[8]利用SHAP 法对基于XGBoost 的高速公路事故预测模型的结果进行了解释,并分析了各个特征参数的重要性。

类间样本不均衡是机器学习中的重要问题。类间不均衡是指多数类的样本数远超少数类样本数,可能会导致分类器失去应有的分类功能,模型预测效果较差[9]。例如对于一个二分类问题,少数类样本与多数类样本数比值为1∶1000,分类器仅需忽略少数类样本即可达到99.9%的分类准确率。在Mangalathu 等[3]对RC剪力墙进行破坏模式预测的过程中,类间样本不均衡对模型预测结果也有不利影响。此外,由于钢管混凝土剪力墙破坏模式的影响因素相较于普通RC 剪力墙更为复杂,现有的预测模型并不适用,所以有必要建立适用于钢管混凝土剪力墙破坏模式的预测模型。

在此背景下,文中收集了107个钢管混凝土剪力墙试验数据,使用6种机器学习算法对钢管混凝土剪力墙的破坏模式进行预测,比较各类算法的稳定性和可靠性,以此筛选出综合性能最优模型;使用SHAP 法对模型进行解释性分析,挖掘出破坏模式的内在影响因素;针对类间样本不均衡的问题,文中采用SMOTE法对训练集样本进行过采样处理,对比发现经SMOTE法处理过后,机器学习模型的预测精度有一定的提高。

1 数据库的建立及分析处理

1.1 数据库简介

文中从文献[10-31]收集了107个钢管混凝土剪力墙试验数据建立数据库。为让所使用的特征参数尽可能地反映剪力墙的实际特征和破坏情况,文中从几何特征、力学特征和破坏模式3个方面进行描述。考虑到剪力墙截面形式、纵向尺寸均对破坏模式均存在影响,采用的几何特征参数为:剪跨比λ、宽厚比lw/bw、腹板面积占比Aw/A。其中lw为腹板宽度;bw为腹板厚度;Aw为腹板截面积;A为剪力墙截面积。通过引入配筋指数[2]进行无量纲处理,选用的力学特征参数为:轴压比n、腹板水平钢筋配筋指数ρhw,s fy/fc、腹板纵筋配筋指数ρvw,s fy/fc、腹板钢管配筋指数ρw,st fy/fc、边缘构件钢管配筋指数ρc,st fy/fc、边缘构件纵筋配筋指数ρvc,s fy/fc、边缘构件水平钢筋配筋指数ρhc,s fy/fc。其中ρhw,s、ρvw,s、ρw,st分别表示腹板中水平钢筋配筋率、纵筋配筋率、钢管配筋率;ρc,st、ρvc,s、ρhc,s分别表示边缘构件中钢管配筋率、纵筋配筋率、水平钢筋配筋率;fy为钢材抗拉强度;fc为混凝土抗压强度。图1为所收集的钢管混凝土剪力墙特征参数分布直方图。

图1 特征参数分布直方图Fig.1 Distribution histogram of characteristic parameters

1.2 钢管混凝土剪力墙破坏模式

剪力墙破坏模式分为:弯曲破坏、弯剪破坏、剪切破坏和剪切滑移破坏。由于在现有的钢管混凝土剪力墙试验中,并未出现剪切滑移破坏,文中不予讨论。各破坏模式具体破坏特征如下:(1)剪切破坏,墙体斜裂缝交错,通常有混凝土剥落现象,边缘约束构件也表现为剪切破坏;(2)弯剪破坏,墙体弯曲裂缝和剪切裂缝均有发展,但仍以剪切破坏现象为主。边缘约束构件表现为受弯破坏,底部混凝土被压碎或钢管压屈;(3)弯曲破坏,墙体和边缘约束构件均表现为因弯曲破坏而发生的底部混凝土压碎或钢管压屈。图2 为3 种破坏模式的典型破坏形态图。

图2 典型破坏特征图Fig.2 Typical failure characteristic

1.3 数据的处理

图1 特征参数分布结果表明数据库中发生弯剪破坏的样本明显少于发生弯曲破坏和剪切破坏的样本。He 等[32]指出分类器中样本不均衡会对模型训练结果产生不良影响。Mangalathu 等[3]在进行RC 剪力墙破坏模式预测时,因类间样本不均衡使得模型对于少数类的预测效果较差。改善该问题的方法有过采样、欠采样等[32],由于文中所使用的数据集样本量较小欠采样并不适用,故采用过采样进行处理。简易的随机过采样是用复制少数类样本的方式来增加样本数量,该方法会产生过拟合现象[33],为此Chawla 等[34]提出了SMOTE法进行人工合成数据以解决简单随机过采样易产生过拟合的问题。

SMOTE法是一种基于KNN技术人工合成数据进行随机过采样的方法,其原理如图3所示。对于少数样本集y={y1,y2,.......,yn},SMOTE 法首先选取任一样本yi作为基样本,再选取与yi邻近的n个同类样本(图中n取5)按式(1)进行随机线性插值合成新样本,该过程重复多次直至少数样本与多数样本的样本数相近。

图3 SMOTE原理图Fig.3 Schematic diagram of SMOTE

式中:xn代表基样本yi的第n个特征值;xn_synthesis代表合成样本的第n个特征值;xn_near代表邻近样本的第n个特征值。

2 机器学习方法简介

文中所涉及的机器学习方法为有监督学习,具体算法有朴素贝叶斯、支持向量机、决策树、随机森林、XGBoost和LightGBM。依据所使用学习器的数量分为单一学习和集成学习,其中朴素贝叶斯、支持向量机、决策树为单一学习,随机森林、XGBoost、LightGBM为基于决策树的集成学习,下面对算法的原理进行简要介绍。

(1)朴素贝叶斯

朴素贝叶斯是一种以概率为决策方式的分类算法,其原理是贝叶斯定理和特征独立假设[35]。算法的主要思想是通过贝叶斯公式计算钢管混凝土剪力墙在其自身特征x下,破坏模式fi发生的概率,并判定发生概率最高的破坏模式即为该钢管混凝土剪力墙的破坏模式:

式中:fi表示破坏模式的类别;xi为x在第i个特征上的取值。

(2)支持向量机

支持向量机是一种通过分析类分布边缘的训练集样本(即支持向量),以此拟合类间最优超平面的分类器算法。例如,由式(3)表示在q维空间中的一个含有r个样本的训练集:

最佳超平面存在于不同破坏模式类型之间,并使得不同破坏类型的类间差距最大。在样本空间中,超平面可以用式(4)来描述:

式中:x是位于超平面上的点;ω是超平面的法线;b是偏差。超平面划分的具体过程及原理见文献[36]。

(3)决策树

决策树是一种经典的分类算法,在决策树模型的构建过程中主要有2 个步骤[37]:(1)分析每个特征属性的分割并选择最佳分割;(2)使用最佳分割来定义分类区域,确定最佳分割的指标主要有熵和基尼系数。上述步骤均在训练集中完成。

(4)随机森林

随机森林属于有监督集成机器学习模型,使用决策树作为基础分类器。相比传统决策树,随机森林在训练基学习器的过程中进行了特征参数的随机筛选用于分类[38]。

(5)Boosting算法

Boosting 族算法是通过组合一组弱分类器形成强分类器以此来提高模型性能的强化学习方法。Hastie等[39]提出了一种称为梯度提升的强化方法,该方法对在前一次迭代中评估的损失函数的梯度向量的函数进行回归,从而得到损失函数最优的模型。XGBoost、LightGBM方法均是基于决策树的梯度增强模型。

3 机器学习预测结果与分析

以上所使用的机器学习模型均使用Python库中的Scikit-learn进行开发。剪力墙数据库中的数据按照7∶3的比例随机分配为训练集和测试集。训练集用于建立预测钢管混凝土剪力墙破坏模式的机器学习模型,测试集用来评估模型性能。文中采用混淆矩阵展示模型的具体性能。矩阵中的元素Aij表示破坏模式为i的剪力墙被预测为破坏模式j的数量。对模型预测性能进行量化评估的指标为:准确率(Accuracy)、精确度(Pre‐diction)、召回率(Recall)、F1-score。其中:

准确率:

精确率:

召回率:

F1-score:

式中:TP为真正例,指实际破坏模式为i同时被预测破坏模式为i的样本数量;TN为真负例,指实际破坏模式不为i同时被预测破坏模式不为i的样本数量;FN为假负例,指实际破坏模式为i但被预测破坏模式不为i的样本数量;FP为假正例,指实际破坏模式不为i但被预测破坏模式为i的样本数量。F1-score 能反映模型在特定破坏模式预测中的性能,准确率能反映模型整体的预测准确性。

为反映破坏模式类间样本分布不均衡对模型性能的影响,SMOTE算法处理前后的混淆矩阵对比见图4,各方法的性能指标对比见表1。

表1 SMOTE算法处理前后各模型性能指标Table 1 Performance indexes of each model before and after smote algorithm processing

图4 SOMTE算法处理前后各模型在测试集中的混淆矩阵Fig.4 Confusion matrix of each model in the test set before and after SMOTE algorithm processing

通过分析图4、表1,可得到如下结论:

(1)SMOTE 算法处理前,随机森林的平均F1-socre 与弯剪破坏F1-socre 最高(0.87、0.67);SMOTE 算法处理后,随机森林的平均F1-socre 与弯剪破坏F1-socre 最高(0.92、0.80)。可见,在SMOTE 算法处理前后,随机森林在类间分布不均衡样本集中的整体性能与弯剪破坏的预测性能最好,其在类间样本不均衡情况下的表现较其它模型更为优异。

(2)各个机器学习模型中,剪切破坏及弯曲破坏的F1-socre 相差较小且接近1,弯剪破坏的F1-socre 与其他破坏模式的F1-socre相差较大,说明弯剪破坏的预测难度较大。

(3)SMOTE 算法处理后各模型的平均F1-socre 均有一定提升,其中XGBoost 的提升幅度最大,为27.9%,其次是支持向量机(13.4%)、决策树(13.0%)。可见,SMOTE 算法对于改善模型在类间样本不均衡情况下的性能具有积极作用。

(4)SMOTE 算法处理后支持向量机模型的准确率反而有所降低,而在SMOTE 算法处理前,弯曲破坏、剪切破坏的精准率与召回率都很高,但这并不代表SMOTE 算法对模型产生了负面影响。其原因是SMOTE 算法处理前训练集中弯剪破坏样本所占比例很少,在模型预测时很容易对弯曲破坏和剪切破坏产生过拟合,导致了模型预测结果准确率的虚高,其准确率并不能真实反映模型性能。

4 基于SHAP法的模型解释

SHAP 法是由Štrumbelj 等[6]提出的一种用于解释机器学习模型的方法,通过计算各个特征参数的Shap‐ley值来量化解释特征参数对模型最终输出值的影响。可用式(9)表示为:

式中:f(x)表示初始的机器学习模型;g(x′)表示对应的解释模型;x表示f(x)的输入变量;x′为与x存在映射关系的简化输入变量;M表示特征参数的数量;φ0表示所有特征参数为0时的输出值;φk为第k个特征参数的Shapley值。

使用SHAP 法对上一节中经SMOTE 算法处理后的随机森林模型进行解释,各特征参数的平均绝对Shapley值分布见图5。

由图5可见,在钢管混凝土剪力墙破坏模式的预测中,剪跨比λ 的影响最大,其次是腹板水平钢筋配筋指数ρhw,s fy/fc、边缘构件钢管配筋指数ρc,st fy/fc、轴压比;腹板截面积占比Aw/A对预测结果几乎没有影响。

图5 各特征参数平均绝对Shapley值Fig.5 Average absolute Shapley values of characteristic parameters

图6~图8给出了各个特征参数对不同破坏模式的相应贡献,可得出如下结论:

图6 剪切破坏模式下各特征参数的Shapley值分布Fig.6 Shapley value distribution of characteristic parameters under shear failure mode

图7 弯剪破坏模式下各特征参数的Shapley值分布Fig.7 Shapley value distribution of characteristic parameters under bending shear failure mode

图8 弯曲破坏模式下各特征参数的Shapley值分布Fig.8 Shapley value distribution of characteristic parameters under bending failure mode

(1)从3种破坏模式中各特征参数的Shapley 值来看,对破坏模式起主导作用的特征参数为:剪跨比λ、腹板分布钢筋配筋指数ρhw,s fy/fc、ρvw,s fy/fc、边缘构件钢管配筋指数ρc,st fy/fc与轴压比n。由Shapley 值分析可知,当剪跨比λ、腹板分布钢筋配筋指数ρhw,s fy/fc、ρvw,s fy/fc较高,边缘构件钢管配筋指数ρc,st fy/fc适中且轴压比n 处于中低水平时将发生弯曲破坏。结合正文第1 部分各参数的实际分布,可知当λ≥2、ρhw,s fy/fc≥0.06、ρvw,s fy/fc≥0.06、0.10 ≤ρc,st fy/fc≤0.175、n≤0.35时,将发生弯曲破坏。同理可得出发生剪切破坏与弯剪破坏时各特征参数的大致取值,具体见表2。需要说明的是,该参数取值范围依据的是所收集的107个试件的试验数据,对于所收集数据库参数范围外的取值可能需要进一步讨论。

表2 不同破坏模式下的特征参数分布区间Table 2 Distribution range of the characteristic parameters under different failure modes

(2)剪跨比λ越大发生弯曲破坏的概率越高,λ越低发生剪切破坏的概率越高。只有在剪跨比λ适中时才会增加弯剪破坏发生的概率,并推高其对应破坏模式的Shapley 值。这是由于当剪跨比较高或较低时,剪力墙的荷载分别由弯矩或剪力控制,故发生弯曲破坏或剪切破坏的概率会增加。当剪跨比适中时,剪力墙荷载由弯矩和剪力共同控制,此时发生弯剪破坏的概率将增加。

(3)腹板分布钢筋配筋指数ρhw,s fy/fc、ρvw,s fy/fc越高,发生弯曲破坏的概率越高,其在弯曲破坏模式中的Shapley值越高,与之对应的是发生弯剪破坏的概率越低,其在弯剪破坏模式中的Shapley值越低。这是由于随着腹板内分布钢筋配筋的增加,其约束腹板内斜裂缝发展的能力也就越强,同时提升了腹板的抗剪承载力,有效限制了腹板剪切破坏的发生。

(4)边缘构件内的钢管配筋指数ρc,st fy/fc与轴压比n越高,其在弯剪破坏模式中的Shapley值越高,发生弯剪破坏的概率越高。这是由于当边缘构件的配筋率增加时,边缘构件的承载力随之增加,边缘构件中的钢管同时也发挥了水平抗剪的作用,限制了斜裂缝在边缘构件中的发展。而此时腹板内的裂缝发展较深,在轴压比较高时,腹板混凝土发生剥落,剪力墙发生弯剪破坏。

(5)相较于弯曲破坏与剪切破坏,弯剪破坏中产生较高Shapley值的特征参数更多,说明弯剪破坏的影响因素更复杂,预测难度更大。

鉴于弯剪破坏模式的预测较为困难,下面对典型弯剪破坏样本进行Shapley值分析。图9中红色箭头代表将预测结果推向弯剪破坏的特征参数,蓝色箭头代表将预测结果导向其他破坏模式的特征参数。由该典型样本图9(a)与(b)的Shapley值分析结果可知,弯剪破坏Shapley基础值为0.583,将图9(a)中该值推高的主要特征参数为:适中的剪跨比λ(1.5)、较低的腹板配筋指数ρhw,s fy/fc(0.031)与ρvw,s fy/fc(0.031)、较高的边缘构件钢管配筋指数ρc,st fy/fc(0.173)。同时较低的轴压比n(0.2)降低了该样本在弯剪破坏中的Shapley值。将样本图9(b)中该值推高的主要特征参数为:较高的边缘构件钢管配筋指数ρc,st fy/fc(0.258)、较低的腹板配筋指数ρhw,s fy/fc(0.031)与ρvw,s fy/fc(0.031)。同时较低的剪跨比λ(1.0)降低了该样本在弯剪破坏中的Shapley 值。从典型样本的Shapley 值分析结果可知,较低的腹板配筋率与较高的边缘构件配筋率有利于弯剪破坏的发生。尤培波等[10]基于试验和理论认为对于中高剪力墙,在边缘构件配筋率较高且腹板墙体配筋率较低的情况下,剪力墙将发生弯剪破坏。该结论与典型样本的Shapley值分析结果相符合。

图9 弯剪破坏典型样本Shapley值分析图Fig.9 Analysis of Shapley value of typical specimens under bending shear failure

5 结论

基于文献数据,文中建立了一个含有107个钢管混凝土剪力墙的试验数据库,提出了基于机器学习预测钢管混凝土剪力墙破坏模式的方法,该方法通过SMOTE 算法降低了样本类间分布不均衡对模型的负面影响,并通过SHAP法对机器学习模型进行了解释与分析,得到了如下结论:

(1)使用SMOTE 算法能降低样本类间分布不均衡对模型的负面影响,在文中使用的机器学习模型中随机森林的性能最好。

(2)在3种破坏模式中,弯剪破坏中产生较高Shapley值的特征参数更多,说明弯剪破坏的影响因素更复杂,预测难度更大。

(3)剪跨比λ越高发生弯曲破坏的概率越高,剪跨比λ越低发生剪切破坏的概率越高。只有在剪跨比λ适中时才会增加发生弯剪破坏的概率,并推高其对应破坏模式的Shapley 值。腹板内的配筋指数ρhw,s fy/fc、ρvw,s fy/fc越高,发生弯剪破坏的概率越低。边缘构件内的配筋指数ρc,st fy/fc与轴压比n 越高,发生弯剪破坏的概率越高。

(4)对于钢管混凝土剪力墙,对其破坏模式起主导作用的特征参数为:剪跨比λ、腹板分布钢筋配筋指数ρhw,s fy/fc、ρvw,s fy/fc、边缘构件钢管配筋指数ρc,st fy/fc与轴压比n。文中根据Shapley 值分析与参数分布,给出了不同破坏模式下这几个特征参数的分布区间,具有一定的指导意义。

(5)弯剪破坏样本的Shapley 值分析与基于试验的理论分析对影响弯剪破坏主要因素的判断相符合,基于机器学习模型对钢管混凝土剪力墙弯剪破坏模式的预测具有一定的可靠性。

猜你喜欢
腹板剪力墙钢管
剪力墙结构抗震性能影响因素
非对称腹板束设计方法在地铁大跨变宽变高连续梁中的应用
论建筑工程框架剪力墙结构工程施工技术
不同截面类型钢管RPC界面粘结性能对比研究
微型钢管桩在基坑支护工程中的应用
木质工字梁腹板厚度的设计和应用
五叔
短肢剪力墙结构设计中若干问题的探讨
浅谈剪力墙结构设计在建筑中的应用
波形钢腹板PC箱梁桥发展应用浅析