韩红桂, 王 远, 甄 琪
(1.北京工业大学信息学部, 北京 100124; 2.北京工业大学计算智能与智能系统北京市重点实验室, 北京 100124)
在化学实验室运行过程中,易燃、易爆、有毒、有害的危险化学品是广泛存在的,其存取与使用存在诸多安全隐患,威胁着师生的生命与财产安全. 科学有效的化学实验室安全风险评估是加强实验室安全管理的重要措施[1]. 然而,由于化学实验室药品种类繁多、理化特性复杂、实验室消防规定繁缛、实验操作流程复杂,难以对化学实验室安全进行有效评估. 因此,如何建立科学、可量化且具有广泛适用性的实验室安全状况评估体系,提供客观准确的化学实验室安全评估方案,已得到越来越多研究者的关注.
为了对化学实验室安全状况进行评估,阳富强等[2]提出使用数理统计方法对实验室安全进行分析和评估. Zhu等[3]建立了一种化学实验室安全评估方法,该方法通过结合故障树分析法和二元决策图分析化学实验室中的“人”“机”“环境”和“管理”4个关键因素,实现对实验室中易爆气瓶、压力装置和危险化学品的评估. 吴立荣等[4]建立了一种基于重要性加权的高校实验室安全评价方法,该方法通过层次分析法和专家咨询法确定评价指标并对其加权,并利用模糊综合评价法对高校实验室安全状况进行评价. 张永利等[5]构建了基于D-S证据理论的安全评估方法,通过使用组合规则法和证据信息修正法改变信息的分配方式,实现了对安全风险的评估. 上述评价方法可以利用专家经验实现化学实验室安全风险的评估,但专家经验是一种主观的信息,会影响评估的准确性. 此外,在缺少专家指导的情况下将无法进行评估.
近年来,一些机器学习方法被引入到实验室安全风险评估中. 机器学习以统计学为基础,对获取的训练数据进行统计分析并获得其规律,再运用获取的规律对未知数据进行评估分析. 作为机器学习方法,人工神经网络不仅具有联想存储、自学习和高速寻找优化解的功能,而且在建模过程中不依赖主观信息,具有科学性和客观性. 因此,一些学者在研究中引入人工神经网络方法对客观事物状况进行评估[6-9]. 韩红桂等[10]建立了基于模糊神经网络的废旧手机价值评估方法,该方法利用基于最大类差异的边缘检测算法解析手机图像的区域特征,将区域特征作为评价指标,实现了对废旧手机价值的准确评估. 王宗杰等[11]提出一种基于BP神经网络(back propagation neural network, BPNN)的医患关系风险评估模型,并通过粒子群算法优化风险评估模型,仿真结果表明该模型可以以较高的精度评估医患关系风险. 韩红桂等[12]提出了一种基于递归径向基神经网络的膜透水率检测方法,该方法利用主成分分析法提取评估指标,实现了对膜透水率的准确预测. 在安全预警方面,也有学者运用神经网络方法进行研究[13-14]. 上述神经网络通过大量训练样本进行建模学习时,能够在仿真时取得较高的精确度,但是,在用于对高校化学实验室安全状况进行评估时会遇到训练样本数量较少、训练样本数据不全面等问题,导致神经网络无法通过训练输出正确的评估结果.
离散Hopfield神经网络(discrete Hopfield neural network,DHNN)具有良好的动力学特性以及联想记忆功能,在缺少训练样本的情况下,能够通过记忆学习模式代替大量训练样本,提高网络输出精度[15]. 多项研究表明,DHNN可以广泛地应用于能力评估[16-17]、图像分类[18]、混合光谱分解[19]、最大切割问题[20]、信号检测[21]、模式识别[22]等领域. 王劲松等[23]构建了一种基于DHNN的网络空间信息防御能力评估模型,实验结果表明,该方法能够对网络空间信息防御能力直观、快速、准确地评估且误差较小. 上述研究表明,DHNN可以应用于能力和性能评估且泛用性较强. 因此,文中构造一种基于DHNN的实验室安全状况评估模型,并且引入学习率和调整率对网络的学习过程进行优化,实现在缺少训练样本的情况下完成对实验室安全状况的完整评估. 本文主要从以下几个方面进行研究:首先,分析化学实验室中与安全风险相关的指标,建立化学实验室安全风险多指标评估体系;然后,利用模糊综合评价法对评估体系中各项二级指标进行分析量化,得到编码后的待评估数据;最后,构建一种基于DHNN的安全状况评估模型,对网络的学习过程进行优化,并且对网络的泛化能力进行验证.
为了对化学实验室安全状况进行全面评估,建立化学实验室多指标评估体系及评语体系,并为每个指标编码. 构建基于DHNN的实验室安全状况定性评估模型,流程如图1所示.
图1 基于DHNN的实验室安全状况定性评估模型Fig.1 Qualitative evaluation model of laboratory safety status based on DHNN
遵循全面性、科学性、代表性与可比性的原则,通过查阅化学实验室安全事故事件资料、现场考察北京某大学实验室实际情况、查阅法律法规以及国内外高校实验室安全管理手册,并参考专家意见,设立5个一级指标[4,24]:人员安全状况、仪器设备安全状况、环境安全状况、管理制度安全状况和应急响应安全状况. 这5项一级指标涵盖了实验室实验活动的主体和客体,并且考虑了管理和应急层面的因素,具有代表性. 利用层次分析法,以实验室安全状况评估作为目标层,以人员安全状况、仪器设备安全状况、环境安全状况、管理制度安全状况和应急响应安全状况作为因素层,建立化学实验室安全状况评估体系,即
I(t)=[A(t),B(t),C(t),D(t),E(t)]
(1)
式中:I(t)为评估指标体系矩阵;A(t)为人员安全状况一级指标向量;B(t)为仪器设备安全状况一级指标向量;C(t)为环境安全状况一级指标向量;D(t)为管理制度安全状况一级指标向量;E(t)为应急响应安全状况一级指标向量. 对5个一级指标进行细化,得到每个一级指标下的二级指标.
1.1.1 人员安全状况评估指标
人员是进行实验操作的主体,实验人员的主观能动性影响其他参与实验的客体,人员的综合素质与实验室安全状况直接相关. 以人员安全状况为因素层一级指标,其包括的二级指标为
A(t)=[a1(t),a2(t),…,a8(t)]
(2)
式中:a1(t)为人员身体状况;a2(t)为人员安全意识状况;a3(t)人员实验水平;a4(t)为人员实验经验;a5(t)为人员心理素质;a6(t)为人员安全知识掌握情况;a7(t)为人员应急反应水平;a8(t)为人员应急反应知识掌握情况.
1.1.2 仪器设备安全状况评估指标
仪器设备为人员提供了进行实验操作的平台,通过分析仪器设备的各方面状况,能够确定实验室发生危险状况的概率. 以仪器设备安全状况为因素层一级指标,其包括的二级指标为
B(t)=[b1(t),b2(t),…,b8(t)]
(3)
式中:b1(t)为实验仪器保养状况;b2(t)为实验仪器存放状况;b3(t)为实验仪器安全检查状况;b4(t)为实验仪器使用时遵守安全规范状况;b5(t)为实验仪器安全运行状况;b6(t)为安全指示标志状况;b7(t)为安全警报状况;b8(t)为安全防护设施状况.
1.1.3 环境安全状况评估指标
环境指的是实验操作所处的空间,对环境安全状况中包含的各个因素进行分析,能帮助维护实验室的安全运行. 以环境安全状况为因素层一级指标,其包括的二级指标为
C(t)=[c1(t),c2(t),…,c7(t)]
(4)
式中:c1(t)为通风照明设备运行状况;c2(t)为三废处理状况;c3(t)为三废排放状况;c4(t)为控温控湿设备运行状况;c5(t)为防火防爆设备运行状况;c6(t)为实验环境卫生状况;c7(t)为电路与水气管道设备运行状况.
1.1.4 管理制度安全状况评估指标
依靠管理制度对危险化学品进行细致的管理,能够降低实验室发生危险状况的概率. 以管理制度安全状况为因素层一级指标,其包括的二级指标为
D(t)=[d1(t),d2(t),…,d7(t)]
(5)
式中:d1(t)为危险化学品存放状况;d2(t)为危险化学品化学性质稳定状况;d3(t)为危险化学品领用记录情况;d4(t)为危险化学品取用报备清单填写情况;d5(t)为危险化学品管理人员负责情况;d6(t)为安全设备管理人员负责情况;d7(t)为定期安全检查运行情况.
1.1.5 应急响应安全状况评估指标
应急响应指的是在实验室发生险情时,利用应急设备、应急预案、应急资源,通过应急通道和定期应急培训与演习保护人员的生命安全,降低财产损失的能力. 以应急响应安全状况为因素层一级指标,其包括的二级指标为
E(t)=[e1(t),e2(t),…,e5(t)]
(6)
式中:e1(t)为应急设备状况;e2(t)为应急预案状况;e3(t)为急救资源状况;e4(t)为应急疏散通道状况;e5(t)为定期应急培训和演练执行情况.
通过建立一个合理的安全事故风险等级评语体系,实现对每一项二级指标赋予风险等级评语,完成对该项二级指标风险状况的直观描述.
合理的安全事故风险等级评语体系需要综合考虑安全事故发生概率与发生安全事故时造成的危害程度. 通过专家咨询法将安全事故发生概率从低到高进行排序,完成对安全事故产生概率和危害程度的层次划分,如表1所示.
表1 安全事故产生概率及危害等级评估
对每个安全事故的危害等级与安全事故发生概率进行综合考虑,得到每个危害等级在不同概率下的安全事故风险程度,将安全事故风险程度划分为5个等级,得到的5个安全事故风险等级评语为理想、可容忍、不理想、很差和无法接受. 使用这些评价结果构建的评价集为
P(t)=[p1(t),p2(t),…,p5(t)]
(7)
式中:p1(t)表示理想;p2(t)表示可容忍;p3(t)表示不理想;p4(t)表示很差;p5(t)表示无法接受. 根据风险等级评语构建安全状况评语体系,如表2所示. 表中:p1表示安全事故等级评语为理想,代表危害造成影响较小,损失较小且发生概率低于中等概率;p2表示安全事故等级评语为可容忍,代表危害造成轻微影响且发生概率低于稍高概率;p3表示安全事故等级评语为不理想,代表危害造成一定程度影响且发生概率低于较高概率;p4表示安全事故等级评语为很差,代表危害造成严重影响,损失很大且发生概率低于较高概率;p5表示安全事故等级评语为无法接受,代表危害造成严重影响且发生概率接近较高概率.
表2 安全事故风险等级评语集矩阵
模糊综合评价法是应用模糊数学理论的综合评估方法,运用多指标评价来获得事物的隶属度信息,具有系统性强、结论清晰等特点. 由于对实验室安全状况的评估是一个多层次、多因素的复杂综合评价问题,可以使用划分层次的风险等级评语体系定性描述一级和二级指标,故可以使用模糊综合评价法对实验室安全状况进行量化描述.
以人员安全状况为例,模糊综合评价法的执行步骤[25]如下.
1) 建立因素集和评价集
因素集是以人员安全状况影响因素为元素所组成的一个普通集合,与前述A(t)相同. 评价集是评价者对人员安全状况做出的评价结果集合,用P(t)表示.
2) 建立模糊综合评价矩阵
因素集的评价矩阵为
(8)
3) 确定因素权值
评价工作中各因素的重要程度有所不同,为此,建立因素权向量
VA(t)=[v1(t),v2(t),…,v8(t)]
(9)
式中vq(t)为A(t)中第q个因素的权值.
4) 建立综合评价模型
评价结果为
BA(t)=VA(t)RA(t)
(10)
式中BA(t)表示因素集的得分矩阵. 对于BA(t)中包含的各项二级指标,使用高斯型隶属度函数将评价集P(t)中5个安全事故风险等级评语的得分区间划分为(95,100]、(85,95]、(75,85]、(65,75]、(55,65],根据最大隶属度原则,确定人员安全状况中各项二级指标的评价等级.
创建用于评估人员安全状况、仪器设备安全状况、环境安全状况、管理制度安全状况、应急响应安全状况的神经网络评估模型输入矩阵. 以人员安全状况为例,输入矩阵的行数为8,分别表示1.1.1中设计的8个二级指标:a1(t)、a2(t)、a3(t)、a4(t)、a5(t)、a6(t)、a7(t)、a8(t),输入矩阵的列数为5,分别表示1.2中设计的5个评语:理想、可容忍、不理想、很差和无法接受.
根据2.1中提出的方法,得到对人员安全状况、仪器设备安全状况、环境安全状况、管理制度安全状况与应急响应安全状况中每一项二级指标的评语,根据以上评语为每个输入矩阵编码[26]. 当某二级指标评语为理想时,该二级指标所在行的第1列编码为1,其余列为-1;当某二级指标评语为可容忍时,该二级指标所在行的第2列编码为1,其余列为-1;当某二级指标评语为不理想时,该二级指标所在行的第3列编码为1,其余列为-1;当某二级指标评语为很差时,该二级指标所在行的第4列编码为1,其余列为-1;当某二级指标评语为无法接受时,该二级指标所在行的第5列编码为1,其余列为-1. 以人员安全状况为例,其输入编码矩阵为
(11)
为了对化学实验室安全状况进行客观评估,建立用于评价人员安全状况、仪器设备安全状况、环境安全状况、管理制度安全状况、应急响应安全状况的DHNN评估模型. 这里以人员安全状况为例建立评估模型.
1) 神经元输入
DHNN在第t次迭代时,某一神经元的输入为其他神经元的加权输出,第1行第1列神经元的输入为
(12)
(13)
2) 神经元的输出
DHNN神经元的输出由二值函数计算,第1行第1列神经元的输出为
(14)
由式(14)得到HA神经网络的输出矩阵为
(15)
在对高校化学实验室安全状况进行评估时,会遇到训练样本数量较少、训练样本数据不全面等问题,可以通过对样本进行记忆以替代大量训练样本,同时提高网络输出精度,从而提高评估的准确性. DHNN进行记忆的过程本质上是建立权值矩阵的过程[28],因为网络依次将待记忆样本加入权值矩阵,所以有可能出现遗忘已记忆样本的情况,无法在仿真阶段对某些样本实现正确回忆. 本文使用以下方法来修正DHNN在记忆多个样本时无法准确回忆的问题.
设网络具有m个输入模式的记忆样本为Km,当网络经过多次迭代达到稳态后,此时的输出矩阵YA(t)也应为某一输入模式Km,即
(16)
(17)
(18)
(19)
式中δ为调整率.
采用以上学习方式,将具有m个模式的记忆样本Km中每个模式依次进行学习,通过对它们的反复学习不断修正权值矩阵,使得DHNN可以对任意记忆的模式进行正确回忆,增强了网络的记忆性能,从而提高评估时的识别率.
利用因素层的二级指标建立各个一级指标的评估模型,并利用一级指标建立目标层的评估模型. 具体运行步骤如下.
步骤1利用因素层的二级指标A(t)、B(t)、C(t)、D(t)、E(t)建立因素层中各个一级指标的评估模型,确定每个评估模型的初始结构和连接权值.
步骤2计算一级指标的评估模型中每个神经元在第t次迭代时的状态.
步骤3判断一级指标的评估模型是否处于稳定状态:若未达到稳定状态,则返回步骤2,重新执行步骤2、3;若达到稳定状态,则到步骤4.
步骤4利用一级指标I(t)建立目标层的评估模型,确定目标层评估模型的初始结构和连接权值.
步骤5计算目标层评估模型中每个神经元在第t次迭代时的状态.
步骤6判断目标层评估模型是否处于稳定状态:若未达到稳定状态,则返回步骤5,重新执行步骤5、6;若达到稳定状态,则输出评估结果.
以完成编码的实验室安全状况评估数据为输入,以DHNN对这些信息的评估结果为输出. 创建5个DHNN,分别对人员安全状况、仪器设备安全状况、环境安全状况、管理制度安全状况和应急响应安全状况进行评估.
将5个完成打分的实验室数据根据前文规则进行编码,把编码后的数据输入对应的DHNN中,以神经网络最终的输出状态作为安全状况评估结果. 此处以人员安全状况评估结果为例,见图2.
为了增强数据的可读性,使用●代表神经元处于激活状态,使用○代表神经元未激活. 图2(a)为5个评语标准值的编码;图2(b)为5个待评估对象的编码;图2(c)为通过DHNN得到的仿真评估结果. 5个评估对象的结果分别为:B、B、A、A和D.
在获得全部5个一级指标的评估结果后,将每个一级指标的评估结果作为新的输入变量输入到DHNN中,经过多次迭代DHNN处于稳态,即可获得综合全部一级指标状况评估的全因素安全状况评估结果,见图3.
通过DHNN进行评估,得到综合全因素指标的实验室安全状况评估结果分别为B、B、B、A和D,将评估结果与通过数理统计方法得到的结果进行对比,发现评估结果一致. 这说明DHNN成功在样本数量较少、数据不全面的情况下通过回忆将输入的评估数据正确分类,证明DHNN可以客观、方便、有效地对实验室安全状况进行分类与评估.
图3 实验室整体安全状况的等级指标、输入的 评估数据和DHNN评估结果Fig.3 Level indexes, input data and DHNN evaluation results of laboratory overall safety status
为了验证DHNN实验室安全状况评估模型的评估能力,证明其科学性与有效性,利用收集到的35份实验室人员安全状况数据,经过编码后将其输入至构建的DHNN评估模型中. 同时,将相同数据作为分类对象,输入至K最近邻算法(K-nearest neighbor, KNN)、BPNN和支持向量机(support vector machine, SVM)评估方法中进行对比实验[29],结果如表3所示. 结果表明,DHNN评估模型可以很好地进行实验室安全状况评估,与其他几种典型的分类方法相比,克服了在训练样本较少以及训练样本维度缺失的情况下评估结果不可靠的问题,仍然保持很高的准确度以及收敛速度,验证了DHNN的泛用性以及准确性.
表3 DHNN以及其他评估方法对实验室人员安全 状况的评估准确率
1) 构建的化学实验室安全风险多指标评估体系全面包括了影响实验室安全的因素.
2) 基于DHNN的化学实验室安全评估方法可以实现在训练样本较少的情况下对实验室安全进行有效评估.
3) 将所提出的评估方法应用于实际实验室的评估中,并与其他4种评估方法进行对比实验,结果表明所提出的方法具有较高的评估精度.