申建红, 刘树鹏
(1. 青岛理工大学管理工程学院, 山东 青岛 266520; 2. 青岛理工大学城乡建设信用与风险管理研究中心, 山东 青岛 266520)
地铁作为城市化进程中高效快捷的出行方式,近年来得到迅速发展。由于地铁施工开挖规模大、地下土质及管线情况复杂、施工工艺和技术要求高、风险因素众多且多变,使得地铁施工事故时有发生,并呈现增长趋势[1]。因此,分析地铁施工事故关键致因,从而为风险预防和控制提供决策支持,对保障施工安全至关重要。
目前,相关学者针对地铁施工事故从多角度进行了广泛研究。大部分学者采用主观定性或半定性的方法展开分析,例如: 魏丹[2]将故障树与层次分析法相结合,对造成竖井基坑围护结构失稳的影响因素进行重要度排序; 郑学召等[3]、周盛世等[4]分别采用梯形模糊层次法和基于PPC-D-S证据理论的方法,对地铁施工风险等级进行评价; Liu等[5]采用调查问卷提取影响盾构施工安全的风险因素,为构建主客观相结合的EFA-SEM风险分析模型奠定了基础。为解决地铁施工风险评估中专家认知的不确定性并有效聚合专家意见,Hou等[6]提出CNs网络和EDAS的集成框架; 王乾坤等[7]研究了基于事故树和相互作用矩阵的地铁深基坑施工风险耦合评价方法。少部分学者采用客观定量的方法进行研究,如于海莹等[8]对地铁施工期事故进行简单统计分析,以揭示其内在规律; 李解等[9]、Xu等[10]通过对事故案例进行文本挖掘,识别出影响施工安全的关键致险因素; Zhou等[11]对5个方面的多源信息进行定量测量并融合,提出评价海底隧道施工风险等级的新方法,以实现对监测数据的有效利用。
上述研究成果对事故风险因素识别和风险等级评价起到了积极作用,但研究方法多为定性,其结果的准确性容易受到专家知识的主观影响; 而现有的定量分析研究较少,且主要集中在对事故报告和案例的分析及对监测数据的利用。事故报告记录了施工事故的详细经过,建立方法与模型充分挖掘报告潜在的信息,可以对客观定量研究方法进行补充。同时,关键致险因素识别多针对单一事故类型进行分析,少有模型对全部事故类型进行统一研究,且现有研究成果在实践中的决策支持能力较弱。基于上述问题,本文在收集的202起事故报告数据的基础上,采用树增强朴素贝叶斯(tree augmented naive,TAN)和EM算法构建模型对数据进行分析,挖掘不同事故类型的针对性致险因素,并利用模型为事故预测和控制进行决策辅助,以期为地铁区间隧道和车站施工事故风险预控提供支撑。
贝叶斯网络(Bayesian networks,BN)是基于图论和概率论的一种有向概率图模型,其可以利用不确定知识进行因果推理和风险预测,在海洋、化工等领域[12-13]的风险管理中已发展相对成熟。模型由风险节点、连接弧和条件概率表(conditional probability table,CPT)组成。风险节点代表各风险变量,连接弧反映节点间的条件依赖关系,CPT定义为子节点与父节点间的传递概率。BN中一组变量X=(x1,x2,x3,…,xn)的联合概率分布P(X)可描述为
(1)
式中Pa(xi)是变量xi的父集合。
BN具有双向分析能力,可以在给出新的证据E时更新节点概率[12],节点的后验概率如式(2)所示。
(2)
TAN网络是贝叶斯网络的多种形式之一,包括1个类变量C和1个属性变量A={A1,A2,…,AI}。其中: 类变量C包含m个状态,由集合Sc={c1,c2,…,cm}表示; 每个属性变量Ai(i=1,2,…,I)包含n个状态,由集合SX={ai1,ai2,…,ain}表示[14]。TAN网络克服了朴素贝叶斯网络基于条件独立性的假设,它允许每个属性变量在有1个类变量作为父节点的基础上,至多还可以有1个属性变量作为父节点,考虑了属性变量间的相互关系,如图1所示。这与事故风险分析实际情况十分相符,各风险因素间具有内在联系而非独立存在,TAN网络可以充分考虑这一点,以提高分析的准确性。
图1 树增强朴素贝叶斯网络结构图Fig. 1 Structure of TAN Bayesian
采用TAN网络模型对地铁施工事故进行风险分析的技术路线如图2所示。
图2 基于TAN网络的地铁施工事故风险分析流程Fig. 2 Risk analysis process of metro construction accidents based on TAN network
数据收集范围为国内2011—2021年间公布的地铁施工阶段事故报告,其中,东部城市约占数据总量的75%,中部城市约占数据总量的25%。大部分数据来源于政府网站,如各地应急管理局网站、安全生产监督管理局网站、住建部网站;少部分数据来源于网络媒体,如百度文库、新闻报道等。据不完全统计,初次共收集到220份事故报告。结合对报告内容的审查,剔除内容遗失和信息错误的事故报告,最终确定202份有效数据作为本文数据库。
数据处理对提高机器学习性能至关重要。数据处理包括样本重分类、特征选择和属性离散化等策略[15],本文从3个步骤对数据进行处理,以完成风险识别。
2.2.1 风险指标提取及合并
从事故经过、直接原因、间接原因3个角度对风险因素的定性语言描述内容进行手动提取,同时记录相对应的事故类型,实现初始样本的重分类。基于事故报告内容并参考文献[4,5,8-9],经一次提取,共得到4个事故经过因素(季度、发生时间、发生位置、施工工法)、62个直接因素、7个间接因素(安全交底培训教育不到位、管理问题、安全隐患排查不到位、安全意识不足、监理失职、建设单位安全生产责任未落实、违法分包)、9种事故类型(坍塌、涌水涌砂、物体打击、地面沉降、火灾爆炸、高处坠落、管线破裂、机械伤害及其他)。
对于直接原因,由于事故报告对风险因素采用非结构化数据进行记录,导致同一因素存在多种描述形式,在查阅GB 50715—2011《地铁工程施工安全评价标准》并咨询专家意见后,对同类风险因素进行归类合并,经数据降维,最终得到24个直接风险因素。地铁施工事故直接风险因素及说明如表1所示。
表1 地铁施工事故直接风险因素及说明Table 1 Direct risk factors and descriptions of metro construction accidents
2.2.2 风险指标筛选
基于特征选择的思想,指标过多会增加网络的复杂性,而去除无关和冗余信息通常可以提高机器学习算法的性能,从而获得具有良好预测性和计算密集度较低的模型[15]。因此,本文基于发生频率对指标较多的直接因素和间接因素进行筛选,选取位于频率均值之上的前10个直接因素和前5个间接因素用于模型构建。直接因素和间接因素的发生频率分别如表2和表3所示。
表2 直接因素的发生频率Table 2 Frequency of direct factors
表3 间接因素的发生频率Table 3 Frequency of indirect factors
2.2.3 节点确定与状态划分
将筛选后的风险指标和事故类型确定为模型节点,同时根据事故数据内容将节点属性离散为不同状态,各节点代号及状态划分如表4所示。
表4 各节点代号及状态划分Table 4 Identification and status division
TAN网络结构学习本质上是一个优化问题,其利用信息论中2个属性变量在给定类变量下的条件互信息来定义网络结构[16],将事故类型定义为类变量,其余风险因素定义为属性变量。属性之间的条件互信息计算如式(3)所示。
IP(Ai;Aj|C)=
(3)
式中:IP表示条件互信息;aii是风险因素Ai的第i个状态;aji是风险因素Aj的第i个状态;ci是事故类型的第i个状态。
网络结构学习过程如下[16-17]:
1)计算地铁施工风险分析中每对属性变量之间的条件互信息IP(Ai;Aj|C),i≠j。
2)建立1个以全部属性变量两两相连成弧、弧权重为IP(Ai;Aj|C)的完全无向图。
3)找出最大权重生成树。
4)从属性变量中选择1个根变量,并将所有边的方向设置为向外,将生成的无向树转换为有向树。
5)添加1个由类变量C标记的顶点,并为每个Ai添加1条从C出发的弧来构建TAN模型。
模型参数学习包括确定节点先验概率和转移概率2部分。学习过程基于事故数据库和网络图形结构,采用参数学习算法并借助软件完成训练。考虑到已有数据可能存在缺失值的情况,为降低缺失值对参数精确度的影响,本文采用EM算法。该算法在应对数据缺失情况时具有良好的性能[18],其完整参数学习过程如下。
分别定义不完整数据集D=(l1,l2,…,lM)和完整数据集Y=(c1,c2,…,cM),D∈Y。设ζ=(V,E,P)是具有参数Θ={Θq}的BN,其中Θq={Θqs}且Θqs={Θqst},满足对于每个q,s,t,都有Θqst=P(Xq=t|pa(Xq)=s)。基于初始化参数算法,不断交替迭代E步和M步逼近最优。
1)E步通过式(4)和式(5)建立1个完整的数据集Y。
(4)
(5)
式中:Mqst是(Xq,pa(Xq))=(t,s)的计数;lq是D的第q种情况。
(6)
E步和M步交替迭代直至2个连续迭代的对数似然差不超过阈值δ乘以对数似然的值,即k(Θ)收敛,如式(7)所示。
kq(Θ)=kq+1(Θ)≤δ|kq+1(Θ)|。
(7)
式中:kq(Θ)为第q次迭代后Θ的对数似然;kq+1(Θ)为第q+1次迭代后Θ的对数似然。
2.5.1 概率分析
参数学习后的模型可以推理各节点不同状态的发生概率,对不同事故类型和风险因素进行概率分析,可得到一般统计分析下的初步风险认知。
2.5.2 正向推理
将事故类型节点不同状态设置为100%,利用贝叶斯网络正向推理能力,对各风险因素节点进行敏感性分析,可以识别出关键致险因素。对于只有2个状态的节点,可以计算节点变化前后的风险变化(variation of risk, ROV),根据ROV值的大小对风险的重要程度进行排序[19],该方法对于具有2个以上状态的变量存在无法界定是哪2个状态的不足。基于此,本文引入真实风险影响(true risk influence,TRI)[20],分析风险因素对事故类型的重要程度。该方法首先将变量全部状态分别设置为100%,然后根据事故类型节点后验概率分别记取对事故影响最大的状态,即高风险推断(HRI),以及对该事故产生最小影响的状态,即低风险推断(LRI)。通过计算HRI和LRI的平均值,得出每种风险因素对此类事故的TRI,根据TRI值大小对风险因素进行重要度排序,如式(8)所示。
(8)
2.5.3 反向诊断
将不同事故场景下已知的风险因素状态作为证据输入模型,利用贝叶斯网络反向诊断能力,对可能发生的事故类型及发生概率进行预测,结果可为事故相关方的风险预防提供决策支持。同时,可将正反向推理相结合,在特定事故类型发生后,将事故类型和已探明的风险因素状态同时输入模型,以便快速识别事故发生的最可能风险源,为风险控制提供支持。
考虑到样本数据量较少,为充分利用样本信息,本文采用10折交叉验证方法对模型的有效性进行检验。该方法允许使用相同的数据集验证模型,通过将数据集划分为大小相等的10部分,轮流将其中9份作为训练集,其余1份作为测试集,训练和测试数据重复10次,取10次正确率的平均值为验证结果。同时,可根据接受者操作特性曲线(ROC曲线)判别模型的性能[21],具体见3.2节。
借助GENIE软件对202起事故数据进行结构学习和参数学习,最终得到完整的地铁施工事故风险分析模型,如图3所示,利用此模型并按照2.5节流程对地铁施工事故进行多角度分析。
图3 地铁施工事故风险分析的TAN模型Fig. 3 TAN model for risk analysis of metro construction accidents
3.1.1 概率分析
根据图3对各节点进行概率分析,得出初步风险认知。
1)事故类型节点的概率分析。坍塌(T1)在地铁施工事故中有着最高的发生率43%,其次是涌水涌砂(T2)和物体打击(T3),约为12%,高处坠落的发生率约为10%,其他事故类型的发生率为4%~5%。这与文献[1]和文献[8]有着相似的结论,其中涌水涌砂事故在分析中较其他文献发生率较高,这可能与统计样本选择不同有关,本文数据来源于东部沿海城市的样本比例较大,受地理位置影响,涌水涌砂事故发生率较高。
2)事故经过因素的概率分析。每年的4—6月份事故发生率最低,为17%,其他月份为26%~30%,这与夏季和冬季的不利气候条件密切相关。在一天的时间中,00:00—05:59有着最高的事故发生率,为37%; 12:00—17:59事故发生率最低,为17%。在发生位置方面,区间事故发生率(54%)略高于车站事故发生率(46%)。在施工工法方面,明挖法和盾构法事故发生率较高(分别为32%和29%),其次为暗挖法(21%),而其他工法事故发生率较低。
3)事故直接因素的概率分析。地质条件差、施工方案执行问题、支护系统失效、违章施工的事故发生率在30%以上,对事故的发生有重要影响;应急处理措施不当、勘察设计错误、施工技术问题和临边荷载过大的事故发生率在20%~30%,对事故的发生也有较大影响;水文条件差和不良天气事故发生率小于20%,影响相对较小。
4)事故间接因素的概率分析。安全交底培训教育不到位和安全隐患排查不到位是事故发生率最高的间接因素(42%),其次是管理问题和安全意识不足(39%),监理失职的事故发生率较低(24%)。
3.1.2 基于TAN的正向推理
根据TRI的定义及式(8)计算风险因素和全部事故类型的TRI值,如表5所示。
表5 事故类型和风险因素的TRI值Table 5 True risk influence of accident types and risk factors
TRI的均值可以反映风险因素对地铁事故发生的总体影响程度。在直接因素方面,施工技术方法不适用、专业水平低(X7),缺乏应急处理措施或不及时、不适用的处置措施(X5),违章施工(X4)对事故的发生有着关键作用; 其次是施工方案(X2)、临边荷载过大(X9)和地质条件差(X1);其他风险因素相对影响较小。在间接因素方面,安全隐患排查不到位(Y3)是最关键的因素,其次是施工及管理人员缺乏安全意识(Y4),管理问题(Y2)、安全交底培训教育不到位(Y1)和监理失职(Y5)相对影响较小。在事故经过方面,引发施工事故的风险因素重要度排序为: 施工工法(Z4)、发生时间(Z2)、季度(Z1)、发生位置(Z3)。与概率分析得到的初步风险认知相比,基于TRI均值的分析考虑了各节点间的相互作用,分析结果更加贴近实际。
根据事故类型与风险因素的TRI值,对不同事故类型的风险因素进行重要度排序,如表6和表7所示。以坍塌事故(T1)为例,其直接风险因素重要度排序为: X5>X3>X7>X4>X2>X9>X10>X6>X1>X8。在预防坍塌事故发生中,应按照风险因素重要程度制定针对性措施,应对应急处理措施、支护系统安全、施工技术水平、违章施工等排序靠前的因素予以更多的关注。其间接风险因素重要度排序为: Y3>Y4>Y2>Y1>Y5。在日常巡查及施工安全管理中,应着重加强对安全隐患的排查,防止施工事故的发生。其事故经过因素重要度排序为: Z4>Z2>Z1>Z3。施工工法和发生时间相对于季度和发生位置对事故影响作用更大,在事故风险研究中可按照重要程度优先依次分析。
表6 不同事故类型对应直接风险因素重要度排序Table 6 Importance ranking of direct risk factors corresponding to various accident types
表7 不同事故类型对应间接风险因素和事故经过因素重要度排序Table 7 Importance ranking of indirect risks and accident process factors corresponding to various accident types
3.1.3 基于TAN的反向诊断
为探究不同风险因素组合对事故发生的影响,通过实际案例对该模型在风险预测方面的支持作用进行说明。某涌水涌砂事故为区间施工项目,发生时间为2012年9月12日01:00左右,采用盾构法施工,事故发生前因遭遇未探明的不良地质水文条件,便安排现场施工人员进行围挡加固处理,但因加固处理施工方法不当且现场安全监理未及时发现隐患,导致涌水涌砂事故发生。将上述证据输入模型,结果如图4所示。
图4 风险组合下的预测模型Fig. 4 Prediction model under various risk combinations
模型预测结果显示,有85%的概率会发生涌水涌砂事故,预测结果与实际事故一致,说明了该模型对风险预测的积极作用。施工方或其他利害相关者可以以此模型作为风险预测和风险控制的决策辅助工具,以降低施工事故带来的不良影响。
以事故类型为检测节点,借助GENIE软件对数据集进行10折交叉验证,结果显示此模型的正确预测率为89.6%,表明该模型具有较好的参考性。样本验证详细结果如表8所示。
表8 样本验证详细结果Table 8 Detailed results of sample validation
ROC曲线同样能反映模型的性能,通过ROC曲线的曲线下面积(AUC)来评估,AUC值越大,表明模型的性能越好,一般认为AUC值在[0.85,0.95]的模型具有很好的性能[22]。以事故类型节点T5状态为例,其AUC值为0.856,表明模型预测具有较高的准确率,T5的ROC曲线如图5所示。对于部分节点状态,如T7存在AUC值过高(为1)的情况,这是由于此类型数据较少(仅有7起),需在今后的研究中通过收集更多的数据量进行重新评测。
图5 事故类型T5状态的ROC曲线Fig. 5 ROC curve for accident type in T5 state
1)借助TAN网络和EM算法,构建地铁施工事故致因分析模型,对2011—2021年间的202起事故数据进行训练学习,所建模型实现了对事故报告潜在信息的挖掘和利用,采用客观数据从3个角度对地铁施工事故进行深入分析,避免受专家知识的主观影响。
2)基于模型分析,明确了不同类型事故的关键致险因素,并对各风险因素造成事故发生的总体影响程度进行重要度排序,丰富了地铁施工安全事故管理理论; 该模型可将实际工程项目的已知信息作为证据输入,为风险预防和控制提供决策支持,同时可为类似工程的事故报告挖掘和致因分析提供参考。
3)限于样本数量较少,模型的准确率及部分节点状态的AUC值有待改进,未来将收集更多的数据用于提高模型性能,以期为减少地铁事故发生提供更多支撑。