于博帆 严嘉兴
(中国地质大学(武汉)地质调查研究院)
作业条件危险性评价法被简称为LEC 评价法,其作为一种半定量的评价方法,被广泛运用于评价操作人员在具有潜在危险性环境中作业时的危险性、危害性的场合。通过人工给L(事故发生的可能性)、E(人员暴露于危险环境中的频繁程度)和C(一旦发生事故可能造成的后果)3 种不同因素的不同等级分别确定不同的分值,以3 个分值的乘积D(危险性)来评价作业条件危险性的大小。其中L值的评价受不同作业环境、作业类型的影响较大,故在LEC 评价中一直是重难点。
目前,人工对LEC 评价指标进行打分仍然是主流方法。陈勇杰[1]介绍了LEC 评价法的模型搭建和指标赋值方法,最后以非煤矿山透水事故为案例,展示了LEC 评价法在非煤矿山安全评价中的优势和效果。曹文涛等[2]通过结合PHA 危险源识别与LEC 评价法,为某综采工作面的安全管理提供了科学依据。邵勇等[3]介绍了一种基于改进专家LEC 法的水电工程建设中的危险评估方法,通过考虑不同因素对事故的重要性顺序,给出了相关安全管理建议。与主流LEC评价法不同,李艺彤等[4]认识到受限于打分人专业程度不同、心理状态等原因,LEC 法评价值的客观性与合理性受评价主体的影响较大,尤其是在高危行业煤矿开采中,由于发生事故概率高、造成危害大等特点,在对其进行安全风险评估时需更加谨慎,评价结果的合理与否会对工程项目的安全性产生很大影响,故采用专家权重计算分析,对不同专家进行资格分类分级,以达到较高的可信度。杜春秧等[5]针对LEC 法存在的缺陷,提出了优化设计思路和方法,包括引入管理抵消因子、对事故后果参数进行细化和组合、重新设计评价流程等,以某水闸工程为例,对改进前后的LEC 法进行了对比分析,验证了改进后方法的可行性和有效性。
针对这一现状,运用深度学习模型进行辅助判断具有较好的前景,通过AI 辅助人工进行判断可以有效提高判断的逻辑性,消除判断者不同带来的差异性。其中,BERT 预训练模型由于具备强大的上下文理解能力、消除歧义以及增强学习等功能,在文本训练预测中受到众多学者认可。杨瑞森等[6]指出,BERT 强化学习能够更好地学习上下文语言信息,很好地解决了一词多义的问题,在引入主流的命名实体识别模型后,较高地提升了命名实体识别的准确性。杨进等[7]介绍了TMS 与BERT 的原理和优势,再将两者结合起来构建了藏文多粒度语义匹配模型,结果表明,该模型在精确度上有显著的提升。章振增[8]介绍了一种基于BERT 的WWM 语义分析模型,一种Doc2SpSPO 联合SPO 抽取模型,并在此基础上分析了BERT 模型在分析语言相似度方面的优势,在真实数据集上进行了试验,结果表明,该模型的实体识别率与分类关系准确率均较高。高茂娇等[9]针对电商评论筛选复杂的现状,提出了一种基于TS-BiLSTM 模型的筛选系统,通过预训练以及加权分类,证明了该模型在文本分类上的准确度。代杨等[10]提出了一种将BERT 预训练模型与卷积神经网络融合的BERT-CNN 模型,通过BERT 模型的预训练,实现分类的高准确率。为此,本文基于煤矿行业中LEC 法,尤其是L值判断人工操作难度大的现状,提出了对L值判别的改良,并在此基础上运用BERT 预训练模型代替人工进行赋值,进一步证明深度学习代替人工打分的可行性。
作业条件危险性评价法中的L值指代事故发生的可能性,在LEC 法的一般打分过程中,通常情况下会着重强调事件本身的客观不利因素对事件本身进行评价,在评价事故时通常会给出较低的评分,由于某些高危风险的评分很低,即代表其发生的可能性较小,这种情况很容易导致管理人员与作业人员出现思想怠慢的心理。徐威等[11]认识到了L值的操作困难性,采用了概率统计与计算对其判断进行了优化;王晔等[12]针对高校实验室L值判断的不具体性,结合人、物、管理对L值的判断进行了优化;崔勇[13]意识到了事故L值很小时,事故的严重程度可能很大这一不合理点,通过加入其他控制因素优化L值。与高校实验室类似的是,施工项目尤其是煤矿施工项目具有复杂、危险性大、难以简单判断等特点,同一类型事故的发生可能是由于不同类型的原因导致的,例如操作人员操作不当、施工环境与物质因素或者安全管理本身存在问题。因此,在对事故发生可能性进行评价时,需综合考虑多方因素。
本文针对482起煤矿事故案例,选取事故经过、事故原因等事故发生关键因素全面的事故案例400起,通过专家归类概况得到目前煤矿事故发生的原因主要有3点,分别是操作人员操作不当、施工环境与物质因素本身存在危险以及施工安全管理本身存在问题。
在LEC 法L值的评价过程中,较为完善地考虑操作人员因素、施工与物质因素以及施工安全管理因素,可以很大程度上使L值的判别更加准确。
针对此现状,本文提出了改进后的L值计算公式
式中,L为总值;L1、L2、L3分别代表环境物体因素、施工操作人员因素和安全管理因素对安全事故可能性影响的取值,根据专家意见、煤矿事故相关经验确定相对取值标准,具体评分标准见表1;γ1、γ2、γ3分别代表环境物体因素、施工操作人员因素和安全管理因素对安全风险(事故)发生影响的可能性权重。
在确定400 个事故案例发生的主要因素后进行频数统计,确认每个主要因素的事故占总事故数量的百分比,结果为环境物体因素占比44%、施工操作人员因素占比36%、安全管理因素占比20%,即γ1=0.44,γ2=0.36,γ3=0.2。
最后,通过专家打分结合BERT 预训练模型进行确认L1、L2、L3。
?
BERT(Bidirectional Encoder Representations from Transformers)是一种预训练的语言模型,由Google 在2018 年提出并发布,它是基于Transformer 架构的深度学习模型,用于处理自然语言处理(NLP)任务[14]。
BERT 的预训练过程包括遮蔽语言建模(Masked Language Model,MLM)和下一句预测(Next Sentence Prediction,NSP)[15]2 个主要步骤。在遮蔽语言建模中,BERT 模型会随机地遮蔽输入文本中的一些单词或词片段,然后尝试预测这些被遮蔽的部分,这个过程可以帮助模型学习上下文信息和词之间的关系。在下一句预测任务中,BERT 模型接收2 个句子作为输入,并判断它们是否在语义上是连续的,这有助于模型学习句子之间的关联和语义关系。
通过2 个预训练任务,BERT 模型能够学习到深层次的语言表示,包含了丰富的上下文信息和词汇知识。在预训练完成后,BERT 可以通过微调在各种NLP 任务上进行特定的训练,如文本分类、命名实体识别、句子相似度等。
在文本训练过程中,BERT 模型会根据对其投喂数据的类型以及预定义的类型标签进行判断,在微调过程中,BERT 模型通过结合预训练的语言表示和特定任务的标签信息进行学习,最后得到句子属于每个类别的可能性,并且选择可能性最高的类别。BERT预训练模型文本分类过程见图1。
首先根据提前收集到的事故经过以及主要事故原因完整的400 份煤矿事故报告,按照6∶4 的比例划分训练集与预测集,最终得到240 份训练集数据与160 份预测集数据,通过专家对训练集中240 份数据事件经过以及事故原因进行分析,可以较为清晰地判断出事故是由环境物体因素、施工操作人员因素和安全管理因素中哪一种因素主要导致的以及对安全事故可能性影响的取值。为了避免单人判断的片面性,同时由3 名专家对煤矿事故报告进行分析,并讨论得到最终结果。
在BERT 预训练模型中,由于模型学习能力的局限性,只能分别对L1、L2、L3与事件发生的关联性进行依次打分,通过将240份数据交给BERT模型学习,并经过16 次拟合运算得到单个L值的预测模型,随后利用之前拟合运算得到的预测模型对预测集中160份数据的打分样板进行再次打分,以对比AI 打分与人工打分的区别,具体BERT 预训练模型打分流程及部分判别结果见图2、表2。
在模型对数据完成拟合运算后,为了将训练好的预测模型推广到煤矿事故风险评估手册以及对其他事故的打分中,需要对预测模型的预测准确度进行保证,在BERT预测模型对160份数据完成预测后,再让3 位专家对160 份预测集中L值数据进行打分,通过对比预测模型的判别结果以及专家的打分结果,即可对预测模型的准确性进行判断。
通过统计可以得到L1、L2、L3的打分数据。L1为环境物体因素对安全事故可能性影响的取值。专家打分时对160个事故共给出54个2分(环境及物体本身几乎不可能独立发生事故),31个4分(环境及物体本身发生事故的可能性很小,完全意外),32 个6 分(环境及物体本身可能发生事故,但不经常),43 个8 分(环境及物体本身发生事故的风险较高),0 个10 分(环境及物体本身发生事故的风险极高)。通过BERT 预测模型,结果为49 个2 分,34 个4 分,37 个6分,40个8分,0个10分。经对比不一样的打分项,最终得到专家预测值与BERT 预测模型预测值重合度为95%,具有较高的准确率。
?
L2为施工操作人员因素对安全事故可能性影响的取值。专家打分时对160个事故共给出120个2分(安全意识牢固,能够严格遵守操作流程),6 个4 分(安全意识良好,基本按照操作流程操作),24 个6 分(安全意识一般,偶尔违规操作),10个8分(安全意识较差,经常违规操作),0个10分(安全意识差,违规操作)。通过BERT 预测模型,结果为85 个2 分,4 个4分,47 个6 分,23 个8 分,0 个10 分。经对比不一样的打分项,最终得到专家预测值与BERT 预测模型预测值重合度为85%。
L3为安全管理因素对安全事故可能性影响的取值。专家打分时对160 个事故共给出120 个2 分(制定了严格的管理制度,并且按照制度严格执行),6 个4 分(虽然制定了较为合理的管理制度与规定,但是执行与监督不到位),24个6分(虽然制定了合理的管理制度与规定,但是执行与监督存在漏洞),10个8分(制定了管理制度与规定,但是规定与制度的可操作性很差),0个10分(没有制定相关管理制度或规定)。通过BERT 预测模型,结果为115 个2 分,6 个4 分,28个6 分,11 个8 分,0 个10 分。通过对比不一样的打分项,最终得到专家预测值与BERT 预测模型预测值重合度为96.9%,具有较高的准确率。
综上,3 项的综合重合率为92.09%,具体对比结果见表3。
?
根据先前对BERT 预训练模型的数据投喂,L1、L2、L3与240 个安全事件的对应预测模型已经得到。由于在安全生产中,在事故发生后对事故进行分析的作用有限,并不能很全面地起到事故预防的作用,在煤矿作业前,一般会通过班组长采用LEC 法煤矿安全作业打分表对作业场所、作业活动进行打分。因此,为了保证BERT 预测模型的应用价值,将其推广到煤矿安全检查分析表中很有必要。
为了验证BERT 预训练模型的预测模型是否可应用推广到煤矿安全作业打分表中,此次的打分对象为某综采作业面作业安全评估表,具有较强的通用性,打分任务则是对不同作业场所下、不同作业活动的潜在风险进行安全评估,以判断相对应的潜在风险,以及不同因素对作业风险发生可能性的影响,进而对影响较大的影响因素进行重点监控。与前文的打分步骤类似,通过依次判断环境物体因素、操作人员因素以及安全管理因素对安全风险发生产生的影响,对煤矿作业中的潜在风险进行评估。
为了判断潜在风险整体发生的可能性,还需对L值的总值进行计算,最终才能得出优化L值的结果是否合理。基于先前得到的L1(环境物体因素)、L2(施工操作人员因素)、L3(安全管理因素)预测模型,对煤矿安全作业打分表中的潜在风险进行打分,随后根据γ1=0.44、γ2=0.36、γ3=0.2 以及L值判别公式得到计算结果,见表4、表5。
根据评价结果可以看出,优化后的L值判别公式可以较为客观地体现出潜在风险发生的可能性,且由于对L1、L2、L3进行评价后存在一个最大值,通过最大值也可以直观反映出导致事故发生的主要影响因素,并且通过对主要因素进行额外关注,可以更好地避免事故的发生。
?
本文提出了一种基于人工智能深度学习模型的LEC 法L值优化思路,用于评估煤矿行业中的事故并进行风险预防,以提高煤矿行业事故评估的准确性和减少人工赋值的工作量。运用BERT 预训练模型取代了人工赋值的试验结果表明,该方法具有高准确性和可行性,在需要判断的文本量较大且判断者客观性不足时,通过引入BERT 预训练模型可以达到较好的判断效果,该方法具有良好的预测效果和实际应用潜力。此外,新提出了L值评价优化公式,综合考虑了环境物体因素、施工操作人员因素和安全管理因素对安全事故可能性的影响。通过对比结果,证实了该公式能够更客观地体现潜在风险发生的可能性,并能直观反映出导致事故发生的主要影响因素,当需要考虑可能导致事故发生的主要因素并精细判断时,该改良公式具有较高的可行性。