喻泽成,李启明,谢龙隆,余 波,2,3
(1. 广西大学土木建筑工程学院,广西,南宁 530004;2. 工程防灾与结构安全教育部重点实验室,广西,南宁530004;3. 广西防灾减灾与工程安全重点实验室,广西,南宁 530004)
历次地震灾害显示,桥梁、建筑等工程结构的钢筋混凝土(RC)柱在强震作用下可能发生弯曲破坏、弯剪破坏或剪切破坏,影响工程结构的安全性[1-3]。因此,有必要识别RC 柱地震破坏模式的重要特征参数,并建立地震破坏模式的判别方法。
目前,RC 柱的地震破坏模式判别方法主要有经验判别法和机器学习判别法两大类。其中,经验判别法基于工程经验或试验数据分析,建立位移延性系数[4]、剪跨比[5]、抗剪需求与抗剪承载力比[6]等特征参数与地震破坏模式之间的关系。例如,文献[7]综合考虑剪跨比、轴压比、纵筋特征参数和箍筋特征参数的影响,提出了RC 柱地震破坏模式的经验判别指标;文献[8]根据抗剪需求与抗剪承载力比、剪跨比、箍筋间距与截面有效高度比来综合判别RC 柱的地震破坏模式。分析表明:经验判别法具有简便实用的优点,但通常是基于工程经验或试验数据相关性分析建立的,导致特征参数与地震破坏模式之间缺乏内在联系,判别准确率不高[9]。机器学习判别法结合试验数据和各种机器学习算法,构建特征参数与地震破坏模式之间的联系[10]。其中,文献[11]采用随机森林算法判别RC 柱的地震破坏模式;文献[12]对比分析了6 种机器学习算法对于RC 柱地震破坏模式的判别精度;文献[13]结合机器学习的回归算法和分类算法,建立了RC 柱的地震破坏模式判别方法。然而,上述机器学习判别法存在以下缺陷:一是所建立的判别模型虽然可以构建输入特征参数与输出破坏模式之间的映射关系,但是没有建立二者之间的显式函数表达式,属于“黑盒”模型[11-14];二是建模过程中没有遴选特征参数,通常将全部特征参数作为模型输入变量,导致所建立的判别模型复杂程度高、计算效率低[15];三是难以定量分析输入特征参数对输出破坏模式的影响程度,导致模型的可解释性差。因此,有必要合理遴选RC 柱地震破坏模式的最优特征参数,并建立具有明确函数表达式且简便实用的地震破坏模式判别模型。
鉴于此,本文首先基于穷举搜索策略,分别遴选了判别弯曲破坏与非弯曲破坏以及弯剪破坏与剪切破坏的最优特征参数;然后结合最优特征参数和逻辑回归算法,建立了RC 柱地震破坏模式判别的两阶段逻辑回归模型(即先判别弯曲破坏和非弯曲破坏,然后判别弯剪破坏和剪切破坏);最后通过与经典逻辑回归算法和传统经验判别方法进行对比分析,验证了该模型的有效性。
图1 Logistic 函数曲线Fig. 1 Curve of Logistic function
根据逻辑回归模型[17],当第i条RC 柱属于特定类的概率大于非特定类的概率(即Rp>0)时,判定类标签yi=1;当第i条RC 柱属于特定类的概率小于非特定类的概率(Rp<0 ) 时,判定类标签yi=0。
为了求解式(2)中的参数w和b,假定m组地震破坏模式样本之间相互独立,根据式(1)可以构造逻辑回归模型的极大似然估计函数L(w,b)[18]:
影响RC 柱地震破坏模式的特征参数较多,包括抗剪需求与抗剪承载力比(Vp/Vn)、箍筋间距与截面有效高度比(s/h0)、纵筋特征参数、箍筋特征参数、剪跨比和轴压比等[5-8,20-21]。然而,不同特征参数对RC 柱地震破坏模式的影响程度存在明显差异。因此,本文首先基于穷举搜索策略,分别遴选了判别弯曲破坏与非弯曲破坏以及弯剪破坏与剪切破坏的最优特征参数。
国内外学者围绕RC 柱地震破坏模式的特征参数分析开展了广泛研究。其中,文献[7]研究分析了纵筋特征参数(αl=ρlfyl/fc′)、轴压比(n)、箍筋特征参数(αv=ρvfyv/ft)和剪跨比(a/h0)对RC 柱的地震破坏模式的影响,发现随着αl和n的增大,或者αv和a/h0的减小,RC 柱的地震破坏模式逐渐从弯曲破坏向弯剪或剪切破坏转变;文献[8]研究表明:箍筋间距与截面有效高度比(s/h0)对RC柱的地震破坏模式具有显著影响,随着s/h0的增大,RC 柱的地震破坏模式逐渐由弯曲破坏向弯剪破坏和剪切破坏转变;文献[20]研究了αl和a/h0对RC 柱地震破坏模式的影响,发现随着αl增大或a/h0减小,RC 柱的地震破坏模式逐渐由弯曲破坏向剪切破坏转变;文献[5]研究发现剪跨比与RC 柱的地震破坏模式具有较强相关性,对于高、中和低剪跨比,RC 柱依次发生弯曲破坏、弯剪破坏和剪切破坏;文献[6]认为抗剪需求与抗剪承载力比(Vp/Vn)与RC 柱的地震破坏模式密切相关,Vp/Vn越大,RC 柱越容易发生剪切破坏;文献[21]分析发现,RC 柱的地震破坏模式与Vp/Vn和a/h0密切相关,Vp/Vn越大,RC 柱越容易发生剪切破坏,而当Vp/Vn较小且a/h0较大时,RC 柱容易发生弯曲破坏和弯剪破坏;这里,ρl和ρv分别为配筋率和配箍率,fyl和fyv分别为纵筋和箍筋的屈服强度,fc′和ft分别为混凝土圆柱体抗压强度和混凝土抗拉强度,a为剪跨,h0为截面有效高度,s为箍筋间距,Vp为抗剪需求,Vn为抗剪承载力。综上所述,Vp/Vn、s/h0、αl、αv、a/h0和n对RC 柱的地震破坏模式具有重要影响。因此,本文将上述6 个特征参数选取为RC 柱地震破坏模式的原始特征参数。由于上述特征参数均为无量纲量,所以可以排除量纲的影响。
为了分析上述6 个特征参数对RC 柱地震破坏模式的影响规律,本文从国内外文献[7, 21 - 42]中收集了270 组矩形截面RC 柱的破坏试验数据,基本信息见表1。综合考虑参考文献中报道的破坏模式、RC 柱的裂缝分布形态、滞回曲线以及破坏过程中箍筋和纵筋的屈服状态等因素确定了上述270 组RC 柱的破坏模式。绘制不同地震破坏模式下各特征参数的半小提琴图,如图2 所示。图2 中,半小提琴左侧为频率分布图,右侧为小提琴图,小提琴外部形状为核密度估计图,中间白点表示均值,黑线表示标准差范围。由图2 可知,当RC 柱的地震破坏模式由弯曲破坏向弯剪破坏转变、由弯剪破坏向剪切破坏转变时,Vp/Vn的均值增加率分别为85.5%和32.4%,s/h0的均值增加率分别为40.7%和44.7%,αl的均值增加率分别为20.8%和24.1%,αv的均值减小率分别为43.7%和25.9%,a/h0的均值减小率分别为30.7%和30.3%,n的均值减小率和增大率分别为2.8%和4.5%。由此可见,随着特征参数Vp/Vn、s/h0和αl的增大,以及αv和a/h0的减小,RC 柱的地震破坏模式逐渐由弯曲破坏逐渐向弯剪破坏和剪切破坏转变,但是不同特征参数的变化趋势不同,说明不同特征参数对地震破坏模式的影响程度存在差异。因此,有必要从地震破坏模式的原始特征参数中遴选出RC 柱地震破坏模式的最优特征参数。
图2 对应不同地震破坏模式时各特征参数的半小提琴图Fig. 2 Half violin plot of characteristic parameters for different failure modes
表1 270 组RC 柱试验数据的基本信息Table 1 Basic information of experimental data of 270 RC columns
式中,子集评价函数f(ak)为地震破坏模式判别模型的性能评价指标(如总体判别准确率)。通过式(6),可以从k个候选特征参数子集中,遴选出地震破坏模式判别模型的性能评价指标最优时对应的特征参数子集,进而可以遴选出RC 柱地震破坏模式的最优特征参数。需要说明的是,式(6)的最优化问题涉及到两阶段求解:第一阶段是计算子集评价函数f(ak)的取值,其关键是确定式(5)中的最优参数wˆ 和bˆ,采用的算法为梯度下降法和牛顿法;第二阶段是在2n-1 个特征子集对应的子集评价函数f(ak)中选取最大值,采用的是简单排序算法。值得注意的是,穷举搜索策略属于完全搜索策略,能克服其他启发式搜索策略(如序列前向选择和序列后向选择等)陷入局部最优的弊端,适用于最优特征参数遴选问题。
由于在强烈地震作用下RC 柱可能发生弯曲破坏、弯剪破坏和剪切破坏,所以RC 柱的地震破坏模式判别属于多分类问题。然而,传统的逻辑回归模型属于二分类模型[15],所以无法直接用于RC柱的地震破坏模式判别。因此,本文提出了RC 柱地震破坏模式判别的两阶段逻辑回归模型:第一阶段逻辑回归模型判别RC 柱是否发生弯曲破坏或非弯曲破坏(包括弯剪破坏和剪切破坏);第二阶段逻辑回归模型进一步针对非弯曲破坏类别判别RC 柱发生弯剪破坏或剪切破坏。
为了建立具有明确函数表达式且简便实用的RC 柱地震破坏模式判别模型,基于穷举搜索策略,分别遴选了对应于第一阶段逻辑回归模型(判别弯曲破坏和非弯曲破坏)和第二阶段逻辑回归模型(判别弯剪破坏和剪切破坏)的最优特征参数。
为遴选第一阶段逻辑回归模型(判别弯曲破坏和非弯曲破坏)的最优特征参数,首先基于穷举搜索策略,利用由前述6 个特征参数组成的原始特征 参 数 集 {Vp/Vn,a/h0,s/h0,α1,αv,n} 生 成26-1=63个特征参数候选子集;然后将逻辑回归模型的最高准确率指标作为确定最优特征参数子集的性能评价指标;最后基于第一阶段270 组试验数据(弯曲破坏135 组和非弯曲破坏135 组),结合十折交叉验证方法,确定第一阶段逻辑回归模型的最优特征参数子集,计算结果如图3(a)所示。由图3(a)可知,当候选特征参数子集编号k=15 时(对应的特征参数子集为 {Vp/Vn,n}),逻辑回归模型达到最高判别准确率峰值点;随着k继续增加(与候选特征参数子集中特征参数数量增加保持一致),模型判别准确率并不会明显提高,甚至反而有所降低。由此可见,第一阶段逻辑回归模型(判别弯曲破坏和非弯曲破坏)的最优特征参数子集为{Vp/Vn,n}。
为遴选第二阶段逻辑回归模型(判别弯剪破坏和剪切破坏)的最优特征参数,基于135 组非弯曲破坏的试验数据(弯剪破坏62 组、剪切破坏73组),结合穷举搜索策略、逻辑回归算法和十折交叉验证方法,可以确定第二阶段的最优特征参数子集,计算结果如图3(b)所示。由图3(b)可知,当k<48 时,逻辑回归模型的准确率整体上呈增大趋势,表明逻辑回归模型的判别性能受到了更多特征参数的影响;当候选特征参数子集编号k=48时(对应的特征参数子集为 {a/h0,s/h0,α1,αv}),逻辑回归模型达到最高判别准确率,随着k的继续增大,逻辑回归模型的判别准确率无法得到明显提高,说明此时逻辑回归模型已达到最优判别性能。因此,第二阶段逻辑回归模型(判别弯剪破坏和剪切破坏)的最优特征参数子集为{a/h0,s/h0,α1,αv}。
图3 基于穷举搜索策略的最优特征参数遴选Fig. 3 Selection of optimal characteristic parameters based on exhaustive search mechanism
综上所述,判别弯曲破坏与非弯曲破坏的最优特征参数为抗剪需求与抗剪承载力比和轴压比,而判别弯剪破坏与剪切破坏的最优特征参数为箍筋特征参数、纵筋特征参数、剪跨比、箍筋间距与截面有效高度比。
当建立第一阶段逻辑回归模型(判别弯曲破坏和非弯曲破坏)时,对所收集的270 组(弯曲破坏135 组、弯剪破坏62 组和剪切破坏73 组)RC 柱地震破坏模式试验数据进行分类,将非弯曲破坏划分为特定类(共135 组数据),将弯曲破坏划分为非特定类(共135 组数据),然后按照训练集与测试集的比例为7∶3 将数据集进行分层随机抽样,最后以第一阶段所遴选的最优特征参数Vp/Vn和n作为输入变量,利用189 组训练集样本数据(包括特定类95 组和非特定类94 组),训练第一阶段逻辑回归模型:
根据式(7),当Rp1<0时,表明RC 柱发生非弯曲破坏的概率小于弯曲破坏的概率,则判别RC 柱为弯曲破坏;当Rp1>0时,表明RC 柱发生非弯曲破坏的概率大于弯曲破坏的概率,则判别RC 柱为非弯曲破坏,进一步可以继续对该样本进行弯剪破坏和剪切破坏的判别。
当建立第二阶段逻辑回归模型(判别弯剪破坏和剪切破坏)时,将剪切破坏划分为特定类(共73 组数据),将弯剪破坏划分为非特定类(共62 组数据),然后按照训练集与测试集的比例为7∶3 将数据集进行分层随机抽样,最后以第二阶段所遴选的最优特征参数a/h0、s/h0、 α1和 αv为输入变量,利用94 组训练集样本(包括特定类51 组和非特定类43 组),训练第二阶段逻辑回归模型:
根据式(8),当Rp2<0时,表明RC 柱发生剪切破坏的概率小于弯剪破坏的概率,则判别RC 柱为弯剪破坏;当Rp2>0时,表明RC 柱发生剪切破坏的概率大于弯剪破坏的概率,则判别RC 柱为剪切破坏。
需要说明的是,由式(7)和式(8)所建立的RC柱地震破坏模式两阶段逻辑回归模型具有以下几方面优势:一是构建了RC 柱的特征参数与地震破坏模式之间的显式函数关系,克服了传统机器学习判别方法属于“黑盒”模型,导致预测结果解释性较差的缺陷;二是基于穷举搜索策略,通过合理遴选最优特征参数,在保证判别准确度的前提下简化了判别模型的函数形式,解决了传统机器学习判别方法存在的判别模型复杂程度高、计算效率低的问题;三是在两阶段逻辑回归模型的函数表达式中,其特征参数系数表征了各特征参数对地震破坏模式的影响程度。其中,系数的绝对值反映了影响程度的大小,而正负号则反映二者属于正相关和负相关。
为验证本文模型的有效性,选取经典逻辑回归算法[15,17]进行对比分析。其中,经典逻辑回归算法基于原始特征参数建立两阶段逻辑回归判别模型(简称对比模型),而本文模型基于最优特征参数建立两阶段逻辑回归判别模型(简称本文模型)。根据上述第一阶段和第二阶段判别的训练集样本数据,分别建立两个阶段的对比模型,其特征参数系数取值见表2。由表2 可知,两个阶段的对比模型均与所有原始特征参数有关,所以两个阶段的对比模型均包含6 个特征参数,其判别模型的函数形式均有7 项,比式(7)和式(8)所描述的函数形式更加复杂。
表2 对比模型的模型参数取值Table 2 Model parameters of comparative models
根据训练集建立的第一阶段对比模型和本文模型,在测试集上的判别结果混淆矩阵如图4 所示。图4 中:F 表示弯曲破坏,FS 表示弯剪破坏,S 表示剪切破坏;混淆矩阵左上角2×2 矩阵中数字和百分比分别代表正确或错误判别样本的个数和比例;混淆矩阵的最后一行和最后一列分别为精确度和召回率,前者表示每一类预测结果中正确预测的样本所占的比例,后者表示每一类真实样本中正确预测的样本所占的比例,召回率和精确度越大,判别性能相对就越好,误判的样本就越少;混淆矩阵右下角的数字代表准确率,代表模型的总体判别准确度。由图4 可知,对于弯曲破坏和非弯曲破坏,对比模型的正确判别数分别为33 和34,而本文模型的正确判别数分别为35 和38,说明对比模型对弯曲破坏和非弯曲破坏的样本数均发生较多的误判;对于弯曲破坏,对比模型的召回率和精确度均为82.5%,而本文模型的召回率和精确度分别为87.5%和92.1%;对于非弯曲破坏,对比模型的召回率和精确度均82.9%,而本文模型的召回率和精确度分别是92.7%和88.4%;由此可见,对于弯曲破坏和非弯曲破坏,本文模型的召回率和精度均明显优于对比模型;同时,对比模型的总体判别准确率是82.7%,而本文模型的总体判别准确率是90.1%,比对比模型提高9%左右,说明本文模型具有较高的判别准确率。
图4 第一阶段判别结果混淆矩阵Fig. 4 Confusion matrix of the 1st stage’s classification result
类似地,根据训练集建立的第二阶段本文模型和对比模型,在测试集上的判别结果混淆矩阵如图5 所示。由图5 可知,对于弯剪破坏和剪切破坏,对比模型的正确判别数分别为16 和19,而本文模型的正确判别数分别为16 和21,说明对比模型发生较多的误判;对于弯剪破坏,对比模型的召回率和精确度均为84.2%,而本文模型的召回率和精确度分别为84.2%和94.1%,说明本文模型的精确度更高;对于剪切破坏,对比模型的召回率和精确度均为86.4%,而本文模型的召回率和精确度分别是95.5%和87.5%,说明本文模型的召回率和精度均较好;同时,对比模型的总体判别准确率是85.4%,而本文模型的总体判别准确率是90.2%,比对比模型提高5%左右,说明本文模型具有较高的判别准确率。
图5 第二阶段判别结果混淆矩阵Fig. 5 Confusion matrix of the 2nd stage’s classification result
为了进一步综合对比分析本文模型和对比模型对于三种地震破坏模式的判别精度,计算三种地震破坏模式的F1值,见表3。其中,F1值定义为精确率P与召回率R的调和均值,综合考虑了精确率和召回率的影响,F1值越大,说明判别精度越高。由表3 可知,对于弯曲破坏、弯剪破坏和剪切破坏,对比模型的F1值分别为0.83、0.84和0.86,而本文模型的F1值分别为0.90、0.89 和0.91,比对比模型均提高5%左右,说明对于三种地震破坏模式本文模型均具有更好的判别精度。
表3 RC 柱三种地震破坏模式的F1 值Table 3 F1 score of three failure modes for RC column
下面通过与五种传统经验判别方法(见表4)进行对比分析,以验证本文模型的有效性。对于所收集的270 组RC 柱地震破坏模式试验数据,五种传统经验判别方法(分别记为CM1~CM5)与本文模型的判别结果混淆矩阵如图6 所示。
图6 传统经验判别方法与本文模型的混淆矩阵Fig. 6 Confusion matrix of traditional empirical methods and proposed model
表4 五种传统经验判别方法Table 4 Five traditional empirical classification methods
由图6(a)可知,本文模型对于弯曲破坏的正确判别率、召回率和精确度分别为44.4%、88.9%和89.6%,对于弯剪破坏的正确判别率、召回率和精确度分别为16.7%、72.6%和71.4%,对于剪切破坏的正确判别率、召回率和精确度分别为23.7%、87.7%和87.7%,模型的总体判别准确率是84.8%,说明本文模型对三种地震破坏模式的判别效果均较好,对弯曲破坏、剪切破坏和弯剪破坏的召回率和精确度分别达到89%、88%和72%左右,说明对三种地震破坏模式产生的误判较少。由图6(b)可知,判别方法CM1 对于弯曲破坏的正确判别率、召回率和精确度分别为17.0%、34.1%和90.2%,对于弯剪破坏的正确判别率、召回率和精确度分别为20.7%、74.2%和30.9%,对于剪切破坏的正确判别率、召回率和精确度分别为10.7%、39.7%和76.3%,模型的总体判别准确率是48.5%,说明判别方法CM1 对弯曲破坏和剪切破坏样本的判别精确度相对较高,但是对弯剪破坏样本的判别精确度只有30%左右,而且对弯曲破坏和剪切破坏的召回率均不到40%,较多的弯曲破坏或剪切破坏样本被误判为弯剪破坏。由图6(c)可知,判别方法CM2 对于弯曲破坏的正确判别率、召回率和精确度分别为27.0%、54.1%和83.0%,对于弯剪破坏的正确判别率、召回率和精确度分别为14.8%、64.5%和32.8%,对于剪切破坏的正确判别率、召回率和精确度分别为17.8%、65.8%和80.0%,模型的总体判别准确率是59.6%,说明判别方法CM2对弯曲和剪切破坏样本的判别精确度相对较高,但是对弯剪破坏样本的判别精确度仅为35%左右,而且对三种地震破坏模式的召回率都仅有60%左右,说明每一类地震破坏模式中都存在较多的样本被误判。由图6(d)可知,判别方法CM3 对于弯曲破坏的正确判别率、召回率和精确度分别为20.4%、40.7%和80.9%,对于弯剪破坏的正确判别率、召回率和精确度分别为13.0%、56.5%和31.3%,对于剪切破坏的正确判别率、召回率和精确度分别为20.4%、75.3%和61.1%,模型的总体判别准确率是53.7%,说明判别方法CM3 对弯曲破坏样本的判别精确度相对较高,但对弯剪破坏和剪切破坏样本的判别精确度都较低,分别为30%和60%左右,而且对弯曲破坏样本的召回率仅有40.0%左右,说明较多的弯曲破坏样本被误判为弯剪破坏或剪切破坏,对弯剪破坏的召回率也仅有60%左右,较多的弯剪破坏样本被误判为弯曲破坏或剪切破坏。由图6(e)可知,判别方法CM4 对于弯曲破坏的正确判别率、召回率和精确度分别为20.4%、40.7%和98.2%,对于弯剪破坏的正确判别率、召回率和精确度分别为20.7%、90.3%和37.8%,对于剪切破坏的正确判别率、召回率和精确度分别为21.5%、79.5%和87.9%,模型的总体判别准确率是62.6%,说明判别方法CM4对弯曲破坏和剪切破坏样本的判别精确度相对较高,但对弯剪破坏样本判别精确度较低,而且对弯曲破坏的召回率仅有40%左右,较多的弯曲破坏样本被误判为剪切破坏或弯剪破坏。由图6(f)可知,判别方法CM5 对于弯曲破坏的正确判别率、召回率和精确度分别为44.1%、88.1%和86.2%,对于弯剪破坏的正确判别率、召回率和精确度分别为15.6%、66.7%和43.8%,对于剪切破坏的正确判别率、召回率和精确度分别为11.5%、42.5%和86.1%,模型的总体判别准确率是71.1%,说明判别方法CM5 对弯曲破坏和剪切样本的判别精确度相对较高,但对弯剪破坏样本的判别精确度较低,且对剪切破坏的召回率仅有40%左右,较多的剪切破坏样本被误判为弯曲破坏或弯剪破坏。
综上所述,五种传统的经验判别方法无法兼顾三种地震破坏模式的召回率。根据判别精确度可知,存在较多的弯曲破坏和剪切破坏样本被误判为弯剪破坏,从而导致判别准确率较低;而本文模型对于三种地震破坏模式都具有较高的召回率和判别精确度,相较于五种传统的经验判别方法,总体判别准确率提高20%左右。
对于多分类问题,除了采用以上准确率、精确率和召回率等性能评价指标外,可采用统计学中评估多分类一致性的Kappa 系数[43]进行评估:
式中:Ka为Kappa 系数;po为与实际观测一致的百分比,即准确率;pc为与理论期望一致的百分比,为每一类真实结果样本数占样本数的比例与预测结果样本数占样本数的比例的乘积之和。Ka的取值范围为[0, 1],其一致性评价标准[44]见表5。
表5 Kappa 系数一致性评价标准Table 5 Conformance evaluation criteria of Kappa coefficient
本文模型与五种传统经验判别方法的Ka值见表6。由表6 可知,判别方法CM1 和CM3 的Ka值分别为0.279 和0.328,均属于[0.2, 0.4)区间取值范围内,表明该两种方法对三种地震破坏模式的判别效果较差,一致性等级评价较低,判别结果不具有实际参考价值;判别方法CM2、CM4和CM5 的Ka值分别为0.400、0.469 和0.539,属于[0.4, 0.6)区间取值范围内,表明该方法对三种地震破坏模式的判别准确率一般,一致性等级评价结果为中度一致性,判别结果具有一定的实际参考价值;本文模型的Ka值为0.757,属于[0.6, 0.8)区间取值范围内,表明本文方法预测结果大多数准确,一致性等级评价结果为高度一致性,具有较好的判别效果和实际参考价值。
表6 不同判别方法的Kappa 系数Table 6 Kappa coefficient of different classification methods
基于穷举搜索策略和逻辑回归算法,提出了一种RC 柱地震破坏模式判别的两阶段逻辑回归模型,并与传统判别方法进行了对比。分析结果表明:
(1)基于穷举搜索策略,遴选了RC 柱地震破坏模式的最优特征参数。其中,判别RC 柱发生弯曲破坏和非弯曲破坏的最优特征参数为Vp/Vn和轴压比,判别RC 柱发生弯剪破坏和剪切破坏的最优特征参数为箍筋特征参数、纵筋特征参数、剪跨比和s/h0。
(2)对于RC 柱的三种地震破坏模式,本文模型对于三种地震破坏模式的判别准确率均达到90%以上,比经典逻辑回归算法的准确率提高5%左右,比传统经验判别方法的判别准确率提高20%左右。
(3)本文模型不仅构建了特征参数与地震破坏模式之间的显式函数关系,克服了传统机器学习判别方法属于“黑盒”模型,导致预测结果解释性较差的缺陷,而且通过合理遴选最优特征参数,在保证判别准确度的前提下简化了判别模型的函数形式,解决了传统机器学习判别方法存在的判别模型复杂程度高、计算效率低的问题。
(4)需要说明的是,本文方法具有广泛适用性,不仅适用于RC 柱的地震破坏模式判别,同样也适用于其他三分类识别问题。