吕月颖,季嘉琪,陈修杰,王文浩,苗德俊
(山东科技大学 安全与环境工程学院,山东 青岛 266590)
近年来煤矿安全形势有很大改善,百万吨死亡率逐年下降,但煤矿事故仍时有发生,整体安全形势依旧严峻,其中人因因素在事故致因中的比例约70%。国内外有关学者在人因管控方面从微观层面的神经机制[1]角度到宏观层面上安全监管机制[2]分析均有研究,但现有研究往往忽略行为产生的诱发规律,制定管控策略治标不治本。因此,有必要在宏观的基础上,对人因规律进行研究,协助资源合理配置,提高人因管控效率。对事故原因进行深层次研究是预防事故发生的重要手段之一[3]。事故报告作为在事故发生后专业人员考察事故现场搜集资料形成的细节还原度、可信度以及真实性普遍较高的文本数据,可作为事故人因研究的文本数据。叶贵等[4]、李钰等[5]充分利用结合建筑事故报告,对建筑行业安全预控提供参考。在计算机技术的发展下,利用文本挖掘技术研究事故报告成为可能。目前,数据挖掘技术在各个领域延伸[6]。赵明静[7]借用关联规则分析等研究城市物流公共安全事故,预测风险等级并提出风险防控机制,借助关联分析溯源事故原因。利用数据挖掘技术研究事故致因机理和隐患风险已成为事故致因研究新方法。为此,通过收集2015 年到2021 年的煤矿事故报告,借用数据驱动的方法,自然语言分析技术和机器学习技术研究导致事故发生的人因因素,按照分层思想由大到小、从上至下,进行人因关联规则挖掘,为提高矿山安全水平提供数据支撑。
在国家应急管理局网站、各省份煤矿安全生产网等网站进行事故报告收集处理,继而开展煤矿人因关联规则研究。分析流程如下:①对事故报告进行Gephi 网络分析,分析煤矿事故现状;②运用WordCloud 分析确定监督、管理、生产3 个层面上事故人因管控方向,LDA 分析深度挖掘煤矿事故人因;③采用Apriori 算法[8]挖掘煤矿事故人因间的强关联模式,探究事故发生的人因规律性。
事故报告涵盖煤矿事故中所存在的主要不安全行为。通过收集、人工查阅处理后,共获得符合要求的事故报告391 篇,事故报告数据整理见表1,篇幅有限,只体现部分数据。
表1 事故报告数据统计(部分)Table 1 Accident report statistics(department)
将事故报告中的事故时间、等级、类型、省份、地点和工种进行Gephi 网络分析,事故报告网络联络如图1。
图1 事故报告网络联络图Fig.1 Incident reporting network contact diagram
1)事故等级。一般事故占总事故等级的79.54%,顶板事故在事故类型中占比30.4%;根据网络图节点连接,一般事故相比其他类型事故事故地点更加多样,如综采工作面、采煤工作面、掘进工作面、主斜井、井底车场等;较大事故主要发生在综采工作面、采煤工作面、掘进工作面等地;重大事故发生地点主要是在各类工作面以及主斜井和运输巷道。顶板事故在一般、较大事故中尤为突出,根据事故回溯,重视“问顶敲帮”等措施可以在一定程度上避免一般顶板事故的发生,而在预防重大煤矿事故发生时,瓦斯事故是重点关注事故类型。
2)事故类型。通过事故报告网络分析,确定管控地点以各类工作面为主,瓦斯事故由于其在重大、特别重大事故中的高占比,成为重点管控对象,一般事故以及顶板事故事故因其在事故等级和事故类型分析中出现较频繁成为日常监督管理重点。
WordCloud-LDA 分析前需先进行文本分词,将文本分解为若干个独立的词语,为提升分词效果,在基础词典基础上,扩充专用词典及停用词词典,将“劳动组织”、“违规施工”等分至专用词典,“仅有”、“全部”、“其它”等分至停用词词典。根据文本分词形成的高频词汇和逆文档概率对报告中的直接原因、间接原因进行WordCloud-LDA 研究。
2.2.1 WordCloud 分析
1)直接原因词。直接原因词云图如图2,图中字体的大小代表出现频率的多少。工作面作为事故主要发生地点在图中着重突出;应力、支架、顶板等词比较突出,表明顶板事故在事故类型中比例较大;而违章、违规、违反、操作、不当等点明事故人因具体形式。
图2 直接原因词云图Fig.2 Direct causes word cloud
2)间接原因词。间接原因词云图如图3。管理、现场、落实、不到位、教育、生产、履行、培训等词说明在间接原因中主要存在监督、管理层面不足。
图3 间接原因词云图Fig.3 Indirect cause word cloud
综上所述,直接原因多数与生产层面人因息息相关,间接原因往往涉及到煤矿管理、监督层面人因管控不足,因此明确煤矿事故人因需从监督、管理、生产层面3 个层面展开管控。
2.2.2 直间接原因主题分析
进一步对直接间接原因文本挖掘,利用Python语言针对分词结果进行LDA 主题分析,并从直接原因及间接原因中分析出7 个主题和4 个主题,通过对主题的分析研究归纳总结其主题含义,并由此来获取相应的人因因素,结果如下:
1)直接原因。危险现象重视不足、专业技能不足、违章违法操作、现场管理人员违章指挥、应急不足、无安全措施、爆破作业不标准。
2)间接原因。安全生产管理落实不到位、安全管理制度执行不到位、安全思想教育培训不到位、日常监督检查不严。
WordCloud 分析确定3 个层面事故人因管控方向,LDA 分析深度挖掘直接、间接原因文本后,参照事故人因理论、煤矿事故报告,构建由监督层面、管理层面、生产层面3 个一级因素,以及安全监督计划制定不科学、缺乏有效的安全监管机制等22 个二级因素的煤矿事故人因因素体系。煤矿事故人因因素体系见表2。
表2 煤矿事故人因因素体系Table 2 Human factors system for coal mine accidents
在煤矿事故人因因素体系上添加事故类型、事故等级2 个参数进行关联分析,事故等级从一般事故至特别重大事故,由L1~L4表示;事故类型中顶板、运输、其它、放炮、水灾、火灾、瓦斯及机电事故由T1~T8表示。确定每件事故是否存在所判因素,若存在当前因素则编码为“1”,若不存在则编码为“0”,为减少主观评判影响,本数据由3 位统计者同时进行统计,如有差异,则通过分析来决判差异部分。
按 照[S1,S2,…,S6,E1,E2,…,E8,P1,P2,…,P8,L1,L2,L3,L4,T1,T2,…,T8]将每一个事故报告其转变为1 个长度为34 的一维矩阵形成391×34 的矩阵—煤矿事故人因矩阵集MAHCS(Mine Accident Human Causes Set),每1 行代表1 个具体事故的人因信息。
对MACLS 进行关联分析。选择2 组最小的支持度和置信度阈值,分别为0.1、0.2,Apriori 算法推算出583 575 条规则。
依托于置信度和支持度,在设定的置信度基础上,选取满足提升度大于1 的数据,结合事故数据报告分析,从事故等级和事故类型2 个角度选取一般事故和顶板事故进行关联规则分析研究,从规则中分别提取出后项为L1、T1的关联规则,依照提升度,提取关联规则。一般事故关联规则见表3,顶板事故关联规则见表4。
表3 一般事故关联规则Table 3 General accident association rules
表4 顶板事故关联规则Table 4 Roof accident association rules
规则1~规则3 为:管理层安全思想教育不到位时,生产中职工常出现不安全心理、违章违法操作,对危险现象重视不足等问题,容易发生一般事故;规则4 为在管理层安全思想不到位,生产中制定的安全技术措施实施管控不到位情况下,职工较容易产生不安全心理以及违章违法行为,导致一般事故发生;规则5 为当日常检查不严,对职工安全教育管控不到位的前提下,当生产时存在违章违法操作时,通常伴随一般事故的发生。
规则1~规则3 指出:管理层面出现隐患排查、整改跟踪不力,技术措施制定、管控不到位、安全检查人员、设备配备不充分,安全思想教育不到位等问题时,职工往往会对危险现象重视不足且经常出现违章违法操作,并最终导致顶板事故的发生;规则4、规则5 表明管理制度、技术措施、思想教育以及相关设备人员不足的情况下,违章违法操作问题出现的频次也会增多。
综上所述:针对事故人因的管控应从监督、管理、生产3 层面同时展开,日常监督不断、制度指定、措施实施、思想在线、人员遵章守纪的情况下层层管控[9-10]。
在深入研究文本数据挖掘方法和事故诱发机制基础上,对事故报告文本数据进行WordCloud-LDA分析,构成由监督-管理-生产3 个一级因素,安全监管计划制定不科学,缺乏有效的安全监管机制等22 个二级因素组成的煤矿事故人因因素体系。通过煤矿事故人因矩阵集的Apriori 关联分析,从不安全监督、不安全管理和不安全生产3 个层面针对一般事故及顶板事故,找出人因因素间的规律性,为相应职工管控措施的实施提供了依据和基础。