基于社会网络分析法的建筑施工高处坠落事故成因研究
——以华东地区为例

2024-02-05 07:31孙家坤姚慧
山东建筑大学学报 2024年1期
关键词:度数成因建筑施工

孙家坤,姚慧

(山东建筑大学管理工程学院,山东 济南 250101)

0 引言

近年来,我国建筑业持续快速发展、规模不断扩大,然而,由于建筑施工场地复杂、高处作业多,致使安全事故频发,建筑工程安全生产形势严峻[1]。 据住房和城乡建设部数据显示,全国房屋市政工程生产安全事故起数和死亡人数呈上升的趋势,其中高处坠落是施工致死事故的主要类型,居于“五大伤害”(高处坠落、物体打击、机械伤害、触电、坍塌)之首[2]。 据统计,2017—2021 年,我国建筑行业发生的高处坠落事故占总事故的53%[3],高处坠落事故预防是当前建筑施工安全事故防控工作的重点。

通过识别高处坠落事故成因,研究其关联性是预防事故发生的基础。 目前,对于事故成因的识别多采用文献分析、问卷调查及描述性统计分析等方法[4-5],便于收集数据,但处理数据时有一定的主观性,且难以处理非结构化数据,以致事故成因提取困难。 相比之下,文本挖掘方法能够通过自动信息检索,从大规模文本库中提取隐含、有效的知识文本数据,发现信息,并基于文本数据信息价值可再应用[6-7]。 文本挖掘方法可从事故调查报告中获取特征值并进行统计分析,对于提取事故致因效率更高。Esmaeili 等[8]运用文本挖掘技术在1 700 多份建筑工程事故报告中提取了22 个安全风险因素;李解等[9]将文本挖掘技术应用于地铁施工事故致因研究领域,并根据致险因素的共现规律,构建了事故致因集合。 针对高处坠落事故影响因素的研究,学者们采用了诸多方法进行研究:杨慧[10]通过运用德尔菲法,构建解释结构模型,从“人-物-环-管”4 个方面总结出13 个建筑施工过程高空坠落事故的影响因素;仇国芳等[11]分析了123 例典型高处坠落事故调查报告案例,运用系统结构模型法提取出19 种致因要素,明确了一般事故中与较大事故中的关键因素;宋少卿等[12]运用人因失误理论框架的方法研究确定了教育培训不到位等7 类建筑施工高处坠落发生的主因;崔勇[13]通过对近5 年上海市建设工程中58 起高处坠落事故的统计分析,确定了高处坠落事故中最主要的因素是个人意识不到位;宋洋[14]通过事故树法分析典型案例的方式找出了高处坠落事故的影响因素,即安全意识不强、培训教育不够等。 对于高处坠落事故影响因素的研究大都是通过定性分析或者统计分析的方式研究事故因素本身影响程度,往往忽略了各因素之间的关联性[15-17]。 社会网络分析是用于社会科学、自然科学、建设管理和安全等多个领域的分析方法,主要分析不同个体、群体或社会所构成的各因素相互之间的关联性。 通过构建社会网络模型,对模型进行量化分析,从而得出诸多因素中较为关键的影响因素[18],已在舆情传播、风险投资、事故分析等方面得到广泛运用[19-21]。

为找出影响高处坠落事故的主要因素及其关联性,文章基于华东地区2012—2021 年间的145 份建筑施工高处坠落事故调查报告,利用文本挖掘技术提取建筑施工高处坠落事故成因,运用社会网络分析,识别出高处坠落事故的关键成因并研究事故成因之间的关联性,以期为有效防控高处坠落事故提供依据。

1 事故成因提取

1.1 数据收集与工具选取

通过在国家应急管理部、住房与城乡建设部、各省市应急管理厅、局等网站中查询事故案例调查报告,收集2012—2021 年间145 份华东地区建筑施工高处坠落事故调查报告。 为消除文本挖掘中无关词组的干扰,选用事故调查报告中“事故发生经过”“事故原因分析”“事故性质”3 部分内容为“.txt”文本集,形成文本挖掘语料库。

运用文本挖掘技术旨在提取关于影响建筑施工高处坠落事故的成因,而且研究涉及建筑安全管理领域的专业知识,需要有自定义词库的功能支持,同时需要有词云等可视化功能做数据分析支撑。 选择内容挖掘系统ROST CM[22]作为建筑施工高处坠落安全事故调查报告文本挖掘的工具。

1.2 文本预处理

(1) 数据清洗

将145 份事故调查报告汇总另存为ROST CM软件可识别的“.txt”格式。 报告文本语料达11 万字,在众多的文本语料中难免会出现错别字、字词缺失或者重复等现象,因而通过文本预处理对不合规范的语料进行数据清洗或修正,保证待挖掘文本语料规范化。

(2) 文本拟分词

文本拟分词运用ROST CM 软件原有词库,在分词的操作中先把非结构化内容割分为单个的名词、动词和形容词等,再将非结构化用语转换成统一性的标准用语,最终得到节选项次>100 的301 项文本集原始特征项,见表1。 从拟分词结果可以看出:多数安全因素被拆分为两个及以上的词语,如“主体”“责任”“落实”“不到位”,会使不安全影响因素表达不够明确;有些不同的语义表达还会产生相同的分词结果,如对“严重违反施工升降机安装使用有关规定”和“经调查,未违反施工升降机安装使用规定”进行分词,都会产生包括“违反”“施工”“升降机”“使用”的分词结果。 为确保建筑施工高处坠落事故的安全因素高效提取,需要自定义专业词库,以准确识别专业术语。

表1 文本拟分词结果表(部分)

(3)自定义词库

自定义词库包括专业词库、过滤词词库和归并词词库。 其中,专业词库包括《土木工程专业词典》《建筑工程安全术语字典》《安全工程词典》以及《建筑工程专业词汇》;过滤词词库包含了中文停用词词库以及《现代汉语虚词词典》;归并词词库主要是完成对同义词的统一表达。

1.3 数据分析与可视化表达

在ROST CM 软件中启用自定义词表、过滤词表、归并词群表之后,对文本语料进行分词整理,得到词频统计结果。 将词频统计结果在ROST CM 软件中可视化处理得到词云图,如图1 所示,特征词频越大,其词云字体越大。

图1 事故成因词云图

由图1 可看出,建筑施工高处坠落事故调查报告中的高频词为安全意识淡薄、安全教育培训不到位、作业人员、监督检查不力等,但是通过ROST CM软件筛选出的高频词只是初步包含高处坠落事故影响因素的含义,若要清晰准确地表达出事故成因,还需深化处理这些高频词。

1.4 事故成因关键词识别

在文本挖掘的过程中,词频并不能完全反映一个词在整个语料库中的重要性,为找到事故致因中的关键项,选择使用词频-逆文档频率算法(Term Frequency-Inverse Document Frequency,TF-IDF),其可用于评估一个词在整个文件集或者语料库的重要程度,可通过计算文档中关键词的权重提取出特征关键词[23],具体计算由式(1)~(3)表示为

式中TFij为某特征项在语料库中出现的频率;IDFi为逆文本频率指数;为语料库的文档总数;nij为某特征项在语料库中出现的次数;为所有特征项在语料库中出现次数之和;为包含某特征项的文档数,加1 是为了避免分母为零;Wij为每个特征项在文本中的权重。

某个特征项对文档的重要性越高,其TF-IDF值就越大,最终提取出权重值>0.01 的25 项建筑施工高处坠落事故成因关键词,见表2。

表2 事故成因关键词表

2 共线矩阵及事故成因网络构建

共现矩阵是语料库中两两词组之间共同出现的次数,表明两个特征项之间的关系程度,构建共现矩阵是绘制可视化图谱的前提[24]。 通过计算25 个关键词在不同事故调查报告中的共现频率,构建建筑施工高处坠落事故成因特征的共现矩阵,见表3。

表3 事故成因矩阵表(部分)

基于社会网络分析软件Ucinet 绘制建筑施工高处坠落事故成因特征网络图,如图2 所示。 影响高处坠落事故发生的各因素之间的关联性以网络的形式连成一个整体,可清晰地看到各要素间的关联和分布情况。

图2 事故成因整体网络图

3 关键成因识别

基于建筑施工高处坠落事故成因网络的构建,为识别出建筑施工高处坠落事故关键成因,使用社会网络分析(Social Network Analysis,SNA)方法,通过整体与个体网络密度分析、网络中心性分析以及核心边缘结构分析,定量分析事故成因网络。

3.1 整体网络密度分析

整体网络密度是指各节点之间相互连边的紧密程度,即表明各节点间的相互影响程度。 密度越大,各节点之间关系越紧密。 一般以0.5 作为衡量密度大小的标准,若密度>0.5,则表明各节点间有关联且密度关联性较高[25]。

基于Ucinet 软件,通过Dichotomize 函数将共现矩阵转化成二值化矩阵,并分析整体网络密度。 结果显示,整体网络的密度为0.893,说明整体网络密度较大,建筑施工高处坠落事故成因特征网络中各影响因素间关联性紧密,相互影响性相对较高。

3.2 个体网络密度分析

基于Ucinet 软件“Network-Ego networks-Egonet Density”计算得出整体网络中的个体网络密度,如图3 所示。 通过测度大小计算,得出个体网络密度的平均值为21.44,位于平均值之上的影响因素有主体责任不落实、防护措施不到位、安全教育培训不到位、现场管理不到位、监督检查不力、违规作业、安全技术交底不到位、安全意识淡薄、防护用品使用不当、安全隐患排查治理不到位、安全隐患整改不到位、施工方案不合理、违法建设、支撑系统失稳,说明这些因素的个体网络密度较大,与其有紧密关系的因素较多。 另外,设备故障、无资质、临边防护不到位、无证上岗、冒险作业、违法分包、作业环境复杂、警示标志不齐全、技术不规范、违章指挥、施工工序不当等因素的“ 个体网络弱成分数占比(pWeakComp)”较大,说明其个体网络密度较小,在整体网络规模中影响较弱。

图3 事故成因个体网络密度分析图

3.3 网络中心性分析

网络中心性分析是对网络中各因素的重要程度进行量化描述,用以度量网络各节点的中心化程度,表达每个点在整个网络中与其他点之间的关联程度[26]。

(1) 度数中心度分析

度数中心度是在社会网络分析中刻画节点中心度最直接的度量指标,一个节点的节点度越大意味着这个节点的度中心性越高,该节点在网络中就越重要。 度数中心度可以分为绝对度数中心度和相对度数中心度。 绝对度数中心度即点的度数,是与点直接相连的其他点的个数,若某点具有度数值最高,就称该点位居核心位置。 对绝对度数中心度进行标准化处理后得到相对度数中心度,可由式(4)和(5)[26]表示为

式中CADi为节点i 的绝对度数中心度;CRDi为节点i的相对度数中心度;n-1 为节点的个数;∑iXij为用于计算节点i 与其他n-1 个节点间的直接相连的点数。

借助Ucinet 软件得到度数中心度分析结果,见表4。 分析建筑施工高处坠落事故整体网络中点的相对度数中心度并取0.130 的平均值,位于平均值之上的影响因素有主体责任不落实、防护措施不到位、安全教育培训不到位、现场管理不到位、监督检查不力、违规作业、安全技术交底不到位、安全意识淡薄、防护用品使用不当、安全隐患排查治理不到位。 这10 个因素的度数中心度较高,说明对建筑施工高处坠落事故发生的影响较大。

表4 事故成因网络中心性分析结果表

(2) 中间中心度分析

在建筑施工高处坠落事故成因网络分析中,仅分析点的度数中心度,得出的结果有些片面,因为度数中心度刻画的是节点的局部中心指数,测量尺度仅是与某点直接相连的点数,忽略了间接相连的节点,故还需要进行点的中间中心度分析。 中间中心度可衡量节点对整体网络的控制程度,即某一影响因素对其他因素的影响程度。 中间中心度较高的点在整个社会网络中起桥梁作用,若丢失这个点,则许多节点关系将丧失,同时若着重控制这些点,将有效降低风险因素影响程度。 点的中间中心度分为绝对中间中心度和相对中间中心度,绝对中间中心度标准化就得到相对中间中心度[27],分别由式(6)和(7)[26]表示为

式中CABi为节点i 的绝对中间中心度;CRBi为节点i的相对中间中心度;n 为节点的个数;bjk(i)为点i 能够控制点j、k 的连接能力,即是点i 位于点j、k 之间捷径上的概率;gjk(i)为点j、k 之间存在的经过点i的捷径数量;gjk为点j、k 之间存在的所有捷径数量。

运用Ucinet 软件“Network-Centrality Power-Freeman Betweenness-Node Betweenness”分析得出结果,见表4。 通过分析结果可知,各个节点的相对中间中心度平均值为1.460,在平均值之上的影响因素有主体责任不落实、监督检查不力、违规作业、现场管理不到位、防护措施不到位、施工方案不合理、安全教育培训不到位,表明这7 个影响因素的中介性较强,这些影响因素在事故成因整体网络中发挥了主要作用,对其他影响因素的调节控制能力较强。

网络中心性分析能够衡量局部核心,仅表明一个节点(影响因素)在整体网络图中的重要性,若要提取出整体网络中的关键节点致因,还需要测定核心边缘结构,通过核心度指标,衡量节点的主动地位,进而识别出关键节点[24]。

3.4 核心-边缘结构分析

在个体网络密度以及网络中心性分析的基础上,为进一步确保高处坠落事故关键成因识别的精准度,进行核心-边缘结构分析。 核心-边缘结构分析能够区分网络中高密度的核心致因,以及低密度的边缘致因,通过核心-边缘结构分析确定整体网络中处于核心地位的影响因素,以提取出高处坠落事故发生的关键成因[21],分析结果见表5。 处于核心区域的网络密度为36.91,而位于边缘区域的网络密度为8.06,说明处于核心区域的影响因素的关联程度较高。 最终将各影响因素项归类为核心因素与边缘因素。 核心因素包括安全教育培训不到位、安全意识淡薄、现场管理不到位、主体责任不落实、防护措施不到位、防护用品使用不当、监督检查不力等7 项,其余影响因素项均为边缘因素。

表5 事故成因网络核心-边缘结构分析结果表

3.5 关键成因分析与识别

基于建筑施工高处坠落事故成因网络分析,通过相应指标衡量整体网络中处于局部核心与全局核心的节点,从而提取出关键成因。

(1) 通过SNA 中个体网络密度、度数中心度和中间中心度3 个指标的分析,筛选出对高处坠落事故成因整体网络有显著影响的因素。 将各自指标分析出的重要影响因素取交集[22],得出主体责任不落实、安全教育培训不到位、安全意识淡薄、监督检查不力、违规作业、现场管理不到位、防护措施不到位、安全隐患排查治理不到位等8 个影响因素,这些影响因素在整体网络中处于重要的地位,对建筑施工高处坠落事故的发生影响显著。

(2) 通过核心-边缘结构分析,发现处于核心地位的主体责任不落实、防护措施不到位、监督检查不力、现场管理不到位、安全教育培训不到位、安全意识淡薄、防护用品使用不当等7 项影响因素是建筑施工高处坠落事故的关键成因。 这7 个核心节点不仅联系紧密,而且每个核心节点都与其他18 个节点之间存在关联性,说明这7 个核心节点的出现会牵引出其他因素,且对高处坠落事故的发生影响力较大,故这些节点在高处作业中应重点防范。

4 结语

通过文本挖掘技术提取出25 项建筑施工高处坠落事故成因关键词,在此基础上,运用社会网络分析法,借助Ucinet 软件构建建筑施工高处坠落事故成因整体网络图,从整体网络密度分析、个体网络密度分析、网络中心性分析以及核心-边缘结构分析等4 个方面进行致因网络分析。 确定了影响建筑施工高处坠落事故发生的关键成因,即主体责任不落实、防护措施不到位、监督检查不力、现场管理不到位、安全教育培训不到位、安全意识淡薄、防护用品使用不当等7 个关键成因。 关键致因的识别有助于为预防高处坠落安全事故的发生提供管控重点。

猜你喜欢
度数成因建筑施工
眼镜的度数是如何得出的
建筑施工及加强建筑施工安全管理
说说两种『白气』的成因
土木工程建筑施工技术创新
建筑施工管理工作探讨
土木工程建筑施工技术创新初探
图形中角的度数
晕纹石成因解读(上)
隐形眼镜度数换算
翻译实践问题及成因