基于神经网络的建筑结构安全评估模型研究

2022-07-18 02:04王俊杰彭子祥
建筑科学与工程学报 2022年4期
关键词:查准率神经网络样本

王俊杰,焦 柯,彭子祥

(广东省建筑设计研究院有限公司,广东 广州 510010)

0 引 言

因房屋安全问题导致的事故会造成重大的经济损失,危害生命安全。由于使用年限已久、材料的正常老化、维护不到位、未按图纸施工等原因,房屋的安全风险会随时间慢慢累积。常规的可靠性鉴定流程成本高且耗时耗力,较少业主会在房屋发生重大损伤前主动进行安全鉴定,因此有必要推出快速的安全评估算法,实现建筑群大批量的结构安全监测,及时排查房屋安全隐患。

结构安全评估方法在国内外已有不少研究。张协奎等[1]运用层次分析法对房屋完损等级进行评定;李静等[2]基于上海市房屋情况,探讨了上海市房屋安全管理体系的架构,并运用故障树方法来查找分析房屋安全隐患;袁春燕[3]建立了层次结构模型,利用模糊积分的综合评定方法对房屋安全状态进行评定;赵克俭[4]基于邓聚龙[5]的灰色系统理论提出房屋可靠性灰色综合评判的基本理论。此外,也有基于结构动力响应进行安全评估的方法,例如Cawley等[6]最先提出使用固有频率对结构进行损伤识别;Yuen等[7]利用振型改变量对损伤进行识别;Pandey等[8-9]提出了基于曲率模态和柔度改变量的损伤识别方法。然而结构的动力响应只能反映当前的结构状态,当缺乏结构初始无损状态的动力响应数据时,一般不能对结构的损伤程度进行精确识别。

目前《民用建筑可靠性鉴定标准》(GB 50292—2015,以下简称《标准》)采用实用鉴定法和概率鉴定法对建筑物及环境应用各种检测手段进行周密的调查、检查和测试,并应用有限元分析建筑物的性能和状态,是一种基于数据统计推断建筑物可靠性的方法。该方法的优点是鉴定结论准确性高,且能够全面地对结构承载能力、整体牢固性等安全等级进行评估,缺点是鉴定成本高且耗时耗力。采用神经网络代替传统的结构有限元分析实现快速的评估和预测已有一定研究,如基于循环神经网络(RNN)和贝叶斯训练的地震响应预测[10];基于LSTM神经网络的实时震损评估[11];利用神经网络预测RC框架结构的地震损伤[12]等。本文亦采用通过数据学习把复杂的结构计算转换为简单的神经网络前馈计算的方法,使构件承载力等指标通过神经网络从更基础的数据推理、映射得出,实现快速评估。

本文从实际应用的角度出发,论述输入和输出参数的选择、判别模型的选择、缺值问题、小样本问题、评估的可靠性等应用难点。

1 结构安全评估模型

1.1 应用神经网络的可行性

房屋可靠性鉴定流程可看作收集的结构特性数据与房屋安全等级的映射,因此可利用神经网络强大的非线性拟合能力,对已有鉴定项目进行深度挖掘,本质上属于机器学习中的分类任务。

基于神经网络的识别方法受建模误差和测量误差的影响,识别结果有一定任意性,但随着该方法的应用,新增的样本能促进和完善模型的评估性能,理论上具有准确率高、不受建筑类型限制的优势。从预警决策的角度考量,应用神经网络具有一定可行性。

1.2 神经网络原理

神经网络的原理近似某个函数f*。对于分类器,y=f*(x)将输入x映射到一个类别y,即神经网络定义了一个映射y=f(x;θ),并通过学习获得参数θ的值,使它能够得到最佳的函数近似[13]。神经网络通常表示为许多不同函数的复合f(x)=f(3){f(2)[f(1)(x)]},从而实现不同深度的模型容量来匹配应用问题的复杂度,并且通过激活函数引入非线性变换,在网络隐藏单元足够的前提下,神经网络可以以任意精度来近似任何从一个有限维空间到另一个有限维空间的Borel可测函数[14]。神经网络结构如图1所示。

图1 神经网络结构

1.3 输入和输出参数

1.3.1 输入参数

输入和输出参数的选择,直接影响评估模型的合理性。参考《标准》的调查和检测要求(表1),兼顾数据采集的便利性和普适性,使非专业人士也能快速进行调查,确定结构特征输入参数,如表2所示。

表1 调查和检测内容

表2 结构特征输入参数

输入参数的取值按类型分为数值型、布尔型和分桶型。本文大部分的输入特征属于程度描述的连续型变量,经分桶(Bucketized)处理后变为几个有代表性的离散值,如无、少量、大量等程度描述。典型输入参数取值如表3所示。

表3 典型输入参数取值

1.3.2 输出参数

与输入参数对应,输出参数亦参考《标准》的评定结果。《标准》第10.0.3条规定,系统各层次的可靠性等级按安全性和使用性等级中较低的一个等级确定。由于本系统旨在评估结构安全隐患,因此采用安全性等级作为输出参数。其中,围护结构的安全性等级依赖于与其连接的承重构件,而且围护结构的状况对结构安全影响较小,因此输出参数中不包括围护结构的安全等级。此外,上部承重结构的安全性等级可由承载功能、整体性、侧向位移等级推断,而房屋安全性等级则依赖于地基基础、上部结构和围护系统安全等级,因此取承载功能、整体性、侧向位移、地基基础安全等级作为输出参数。《标准》中安全等级可分为4级,从程度上区分,Au级为完好,Bu级为轻微损伤,Cu级和Du级均为有隐患,从预警的角度看,Cu和Du级可归并为C级,本文输出参数取值见表4。

表4 输出参数取值

1.3.3 最优网络架构

关于最优的隐藏层个数、每层神经元个数等超参数的选择已有深入的研究,例如网格搜索、随机搜索等[15]。本节关注作为映射关系的主体,输入和输出参数,探讨输入参数的选择对判别准确率的影响。现实学习任务中常根据经验或专家知识选取输入和输出参数,但输入参数对输出分类评定的贡献度有所差异,不排除有部分输入参数与输出分类没有明显相关性。因此本节通过人为和随机两种方式选择部分输入参数,探究其对分类准确性的影响。

本学习任务共有4个输出参数,每个参数均有3个等级,因此面临4个参数同时学习和4个参数分别学习的选择。由于同时学习4个参数所需的模型容量显然比只学习1个参数更大,训练难度可以理解为从用1条曲线划分二维空间,到用高维的超平面划分高维空间。理论上说,当训练样本数量不满足模型容量需求时,拆分为独立任务学习的准确性更高,而有充足的样本时,同时学习多个输出参数能使神经网络综合考虑各输出参数的相关性,对输入参数的误差有更强的适应性。因现阶段可用样本不足,本文均采用拆分为独立任务的学习方式对4个输出参数建立神经网络。

对比模型分别以 “全部特征”“重要特征”“随机特征1”“随机特征2”作为神经网络的输入参数进行训练。其中,“全部特征”指表2中的所有输入参数;“重要特征”指根据工程师经验选择的15个重要输入参数;“随机特征1”和“随机特征2”指用随机算法从45个特征里随机抽取的15个特征。为最大限度保证不同输入情况下神经网络性能的可比性,各学习任务保持相同的初始超参数,如隐藏层数、每层神经元个数等。训练样本为有完整鉴定报告的样本和根据工程师经验创造的共352个样本,按7∶3的比例划分训练集和评估集,其中训练集按7∶3的比例划分为训练组和验证组。验证组和评估集均不作为训练样本,验证组的作用是确定模型的训练完成点,评估集则用于评价模型的性能。模型的训练完成点取为训练过程中验证组的计算损失(Loss)达到平稳或有增加趋势时的过拟合点。由于神经网络训练受训练批顺序和大小的影响,评估准确率取10次按不同批顺序训练的平均值,结果见图2。

图2 不同输入组合下模型的评估准确率

3个输出参数均为独立训练,可看作在3个独立分类任务下,采用不同输入参数时,模型评估性能的对比。由图2可知,采用全部输入特征时模型的评估性能最好,主要原因是采用全部输入参数时可避免因个人经验的差异而遗漏重要参数,而且与输出相关性不大的输入特征一定程度上近似于噪声的作用,增强了模型的鲁棒性。

1.4 判别模型的选择

神经网络训练的一大难题是容易陷入局部最优解,导致模型仅对训练样本有较好的评估能力,即过拟合。深度置信网络(DBN)[16]综合了判别式模型和生成式模型的优点,先把网络结构看作层叠的受限玻尔兹曼机(RBM)[17],通过贪心法训练逐层搜索最优参数,利用无监督训练的思想提炼输入参数的内在特征,然后以此参数作为判别式模型的初始权重值,深度置信网络架构如图3所示,其中h1、h2、h3为隐藏层。深度置信网络结合生成式模型改进分类模型,理论上能更准确地找到全局最优解。

图3 深度置信网络结构

采用相同网络结构的前馈神经网络(NN)和深度置信网络的评估准确率如图4所示,结果表明在当前学习任务难度下,深度置信网络的评估性能与前馈神经网络相近,但深度置信网络能更快找到最优解,在大规模训练下能显著提升训练效率。

图4 前馈神经网络和深度置信网络的评估准确率

2 应用难点

2.1 缺值问题

由于种种原因,已有房屋安全数据库的某些输入特征缺值和待评估的房屋数据收集不全等情况难以避免。大部分机器学习算法都要求训练集无缺失值。研究指出,当数据缺失率超过60%时,无论如何补救,研究数据将失去使用意义[18],而缺值处理的方法不当亦会导致分析结果的偏差。

早期简单的插补方法有均值插补、回归插补等,后期较为成熟且应用广泛的插补算法有KNN插补法[19]、EM(Expectation Maximization)算法[20]以及多重插补法(MI)[21]。

大部分缺值插补算法只能处理单一数据类型,如EM算法只适用于连续性数据。由于本应用的输入特征涉及连续性和分类型(Categorical),采用基于随机森林(Random forest)[22]的迷失森林(Miss forest)算法更加适合。Stekhoven等[23]提出的迷失森林算法在连续型变量、分类型变量和混合变量插补任务中与KNN插补法、MissPALasso算法[24]和MICE算法[25]的对比结果表明,迷失森林算法在连续型变量插补任务中与MissPALasso算法性能相当;在分类型变量插补任务中与MICE算法性能相当;在混合数据类型的插补任务中表现领先。

迷失森林的算法流程如下:

(1)对所有缺值以均值进行初始插值。

(2)根据各输入特征缺失值的数量进行排序,选出缺失值最少的输入特征作为标签,以该输入特征没有缺失的样本作为训练样本,有缺值的作为预测样本,采用随机森林进行学习和预测,填补缺失值。

(3)重复步骤2对所有输入特征进行迭代插补,直至满足收敛条件。

以本文采用的房屋安全数据库为例,验证迷失森林的缺值填补性能,采用均方根误差(RMSE)作为插补性能的度量,均方根误差越小,插补值与真实值越相近。同时应用均值插补法、MICE算法和KNN插补法进行对比。由于用于对比的3种算法仅支持单一数据类型,因此先将数据集看作连续型变量进行插补,然后对分类型变量进行取整处理。

令80%的样本缺失数据,验证数据缺失率分别为5%、10%、20%、30%时的算法插补准确率,结果如图5所示。

图5 四种缺值插补法性能对比

由图5可知,采用机器学习的插补算法比均值插补的均方根误差小约一半,性能提升明显。其中,迷失森林插补法的插补性能领先,其次为MICE算法和KNN插补法。当数据缺值率逐渐增大时,MICE算法和KNN插补法的性能逐渐降低,趋近于均值插补,仅迷失森林插补法保持稳定的插补性能。

2.2 小样本问题

有完整可靠性鉴定报告的房屋数据收集难度较大,靠工程师经验创造样本效率低下,对于有45个输入特征的学习复杂度而言,只有352个样本的训练集可能会面临过拟合、泛化性能差等问题。

神经网络在实际应用中的训练样本获取代价不低,如何在少量训练数据下,提高学习器的泛化能力已有大量的研究。其中,虚拟样本法作为扩充样本的直接手段,在小样本领域获得广泛应用。虚拟样本法主要分为基于专家经验知识构造虚拟样本、基于扰动的思想生成虚拟样本以及基于研究领域的分布函数生成虚拟样本[26]。

对于神经网络在结构安全评估的应用中,基于专家经验构造样本的方法和基于研究领域的分布函数生成虚拟样本均可行。因为结构安全鉴定的本质是基于收集到的数据,结合规范要求和专家经验对结构安全进行鉴定,所以反向地由专家经验和依据规范创造出的样本满足合理性要求。

基于研究领域的分布函数生成虚拟样本是采用算法对训练样本各特征的潜在关系进行挖掘,适用于研究领域先验知识难以掌握的情况,其代表为变分自编码器(VAE)[27]和对抗神经网络(GAN)[28]及其衍生算法。基于VAE的虚拟样本法有不对样本集分布采取强制假定和准确拟合样本集分布的特点,而GAN具有利用生成器和判别器的相互博弈、促进彼此性能的特性,其生成的样本较为真实。

变分自编码器是一种包含潜变量的生成模型,它利用神经网络训练得到编码器和解码器,通过标准高斯分布的潜变量Z加一个足够复杂的函数映射(由神经网络求解)得到输入特征的任意分布,进而从标准高斯分布中抽样输出原样本集中不包含的数据,变分自编码器架构见图6。

图6 变分自编码器架构

本文采用基于专家经验构造部分少数类样本,然后应用变分自编码器生成样本,扩充输入特征空间,扩充后的样本输入特征空间如图7所示。

图7 扩充输入特征空间示意图

对无扩充样本、扩充300样本、扩充600样本、扩充2 000样本以及扩充5 000样本的模型评估性能进行对比,结果如图8所示。由图8可知,采用VAE扩充样本对模型评估准确率的提升显著,随着扩充数量的增加,提升效果趋于稳定。模型性能的提升主要得益于VAE可以产生满足总体联合分布且不包含原有样本的样本。小样本训练较为显著的问题是训练样本和预测样本的输入特征空间交集小,对模型的泛化能力提出很高的要求。采用VAE扩充样本是通过扩充训练样本的输入特征空间,使其涵盖预测样本的输入特征空间,间接提高了模型的泛化性能。

图8 VAE扩充样本对评估准确率的影响

2.3 评估的可靠性

神经网络的评估有一定任意性,与训练样本分布不均、输入参数误差、神经网络黑盒子特性有关。本文提出的结构安全评估模型主要起风险警示作用,快速、大批量地评估出有安全隐患、需进一步深入鉴定的结构。因此,有安全隐患的结构识别准确率比无安全隐患的结构识别准确率更重要。通过调节查准率(Precision Rate)和查全率(Recall Rate)的平衡,可提高模型对不安全类别的敏感性。

本文提出的评估模型每个独立任务均有A、B、C三个等级,为得到多分类任务的混淆矩阵,把C级归为正例,A、B级归为反例,混淆矩阵如表5所示。

表5 分类结果混淆矩阵

查准率P和查全率R的定义分别为

(1)

(2)

提高对不安全类别的查全率会牺牲查准率。当把尽量多的真实情况为正例(C级)的样本识别出来,尽量降低假反例的占比时,模型会有把样本判别为正例的倾向性,从而导致假正例的情况增多,查准率降低。从风险警示的角度看,把安全类别判断成不安全比把不安全类别判断为安全代价更低。因此,有必要引入倾向性训练,增加对正例的查全率以减小错分类的代价。

本文提出一种加权交叉熵损失函数,在神经网络训练中引入对不安全类别的倾向性训练。加权交叉熵损失函数L的计算公式为

(3)

式中:yi为真实标签中类别i的概率值;pi为预测标签中类别i的概率值;wi为赋予类别的权重;n为输出等级的数量。

对于本文的学习任务有A、B、C三个输出等级,损失函数的展开式为

L=-[wAyAlg(pA)+wByBlg(pB)+wCyClg(pC)]

(4)

损失函数决定了神经网络模型优化的方向,对交叉熵损失函数各类别的贡献进行加权可放大或缩小特定错判的损失,且仅对目标类别错判为假反例时才起作用。

交叉熵的主要部分yilg(pi)有如下特性:

(1)lg(pi)为信息量的表达式,预测概率pi越小,信息量lg(pi)的值越大。

(2)预测标签pi与真实标签yi的取值相近时,yilg(pi)的值很小。

(3)真实标签yi的取值为0或1,yilg(pi)仅当真实标签类别值为1时,才对损失函数有贡献。

由yilg(pi)的特性可知,当目标类别被神经网络正确判断时,yilg(pi)的值很小,wiyilg(pi)的值亦很小,此时该权重几乎没有影响;当目标类别被神经网络错判时,在正例损失项yClg(pC)前加大权重wC,可提高正例错判为反例(假反例)时产生的“损失”,达到增加正例查全率的目的。

以承载功能等级学习任务为例,逐步增加交叉熵损失函数正例项的权重占比,考察查全率和查准率的变化。先将352个样本按7∶3的比例划分训练集和评估集,准备8个神经网络模型并对其交叉熵损失函数分别采用不同比例加权,如第一个神经网络交叉熵损失函数权重为[wA,wB,wC]=[0.33,0.33,0.33],第二个为[wA,wB,wC]=[0.3,0.3,0.4],以此类推。为保障8个神经网络模型训练结果的可比性,神经网络训练准则同第1.3.3节。记录评估集评估的查准率和查全率,结果见图9。

图9 加权交叉熵函数对查准率、查全率的影响

理论上随着正例权重的提升,正例错判为反例导致的损失占总损失比越来越大,驱使模型往尽量减少假反例的方向优化,计算结果亦符合此规律。值得注意的是,查准率在正例权重占比逐渐增加的过程中没有明显下降趋势,说明一定范围内增加正例的权重能在保持查准率不变的情况下提升查全率。

神经网络模型评估的可靠性体现在是否对真实房屋有同样的准确性。由于神经网络学习的本质是对大数据进行规律统计,导致其内部推理过程难以解释,只能通过测试集测评模型的性能。因此,对真实样本评估的准确性依赖于测试集样本数量是否足够和能否代表总体。

本文的学习任务结构安全性评估样本集通过专家经验和规范构造,因此结合已有的样本集和专家经验可构造出接近总体分布的测试集,当评估模型对该测试集的评价指标如准确率、查准率、查全率等满足需求时,可保证神经网络模型对真实样本评估的准确性。VAE等虚拟样本生成技术和本文提出的加权交叉熵损失函数可提高小样本训练时的模型性能,使评估模型对测试集的评估结果达到设定的评价指标标准。

3 案例应用

为验证评估模型的性能,把有完整鉴定报告的样本和根据工程师经验创造的共352个样本按照7∶3的比例划分训练集和评估集,然后对训练集应用VAE扩充5 000样本,并融入各等级权重值为[0.15,0.15,0.7]的加权交叉熵函数进行训练后,评估模型对所有类别样本有94.3%的准确率,对C级样本有88.1%的查准率和97.4%的查全率,对不安全类别的样本有非常高的识别度。

选取了2个实际鉴定工程(以下分别称为A工程、B工程)案例进行神经网络评估模型与房屋安全鉴定意见对比。其中A工程建于1975年,办公功能,混凝土框架结构,共6层,高度20.6 m;B工程建于1980年,办公功能,混凝土框架结构,共7层,高度27.5 m;2个工程均经过房屋安全鉴定,有完整鉴定报告的安全评级。工程鉴定评估与神经网络评估对比结果如表6、7所示,其中的数字代表某项指标处于某一等级的概率。

根据最大隶属度原则,表6、7中神经网络评估模型的评估结果中发生概率最大对应的安全等级与鉴定评估结果基本吻合,并且可通过概率数值大小体现结构各安全等级区间的细微变化,有利于辨识和判断潜在安全风险。

表6 A工程鉴定评估与神经网络评估模型对比

表7 B工程鉴定评估与神经网络评估模型对比

4 结 语

(1)对基于神经网络的建筑结构安全评估模型进行了可行性、算法架构和应用难点等研究。参考《标准》确定输入和输出参数,采用深度置信网络学习输入参数与输出参数间的非线性映射关系,能较准确且快速地实现结构安全性评估。

(2)无法准确判断输入参数与输出参数的相关性时,采用全部输入参数的评估模型有更高的准确率,冗余的输入特征一定程度上近似于噪声的作用,增强了模型的鲁棒性。

(3)迷失森林算法相较其他常用的缺值插补算法有更好的插补性能,可解决现场调查数据缺失的情况。

(4)采用变分自编码器扩充训练样本集能有效提高神经网络的泛化能力和分类精度。

(5)深度置信网络引入加权交叉熵损失函数加以改进可增加训练时对不安全类别的敏感性,牺牲少量不安全类别的查准率可以大幅提高其查全率。

(6)神经网络模型评估性能随训练样本增加而增强,与传统结构安全鉴定流程相比,该方法具有快速且大批量运算的优势,是实现大范围建筑群结构安全监测的有效手段。

猜你喜欢
查准率神经网络样本
基于递归模糊神经网络的风电平滑控制策略
用样本估计总体复习点拨
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
规划·样本
基于数据挖掘技术的网络信息过滤系统设计
大数据环境下的文本信息挖掘方法
基于深度特征分析的双线性图像相似度匹配算法
随机微分方程的样本Lyapunov二次型估计
基于支持向量机回归和RBF神经网络的PID整定