张佳明, 金仁东, 王文瑞, 孙 浩, 衣红钢
(北京科技大学a.机械工程学院;b.资产管理处,北京100083)
实验室安全作为高校安全稳定工作的重要组成部分,其管理水平直接反映了高校的现代管理水平与管理理念,越来越多得到社会和国家的关注[1]。教育部在2019 年1 号文件《教育部办公厅关于加强高校教学实验室安全检查工作的通知》中指出,要将实验室安全定期评估作为安全检查要点,长期化、制度化地执行。同年4 月份发布《教育部关于加强高校实验室安全工作的意见》,明确要求建立安全风险评估制度。高校实验室安全管理要主抓源头管理,以预防为主,通过安全评价提前发现并消除隐患、避免发生伤亡事故、保障实验室安全[2]。
随着高等教育的快速发展与高校科研创新能力的提升,实验室的功能与规模不断扩大,环境变得更加复杂、专业技术性更强、危险源增多、由于教师和学生安全意识淡薄,更容易出现实验室安全问题甚至安全事故,对实验室工作者的管理水平提出了新的要求[3-4]。
高校实验室涉及的危险因素多、随机性强,一直以来,实验室安全评价以管理人员主观评定为主要方式,对于繁多复杂的实验室安全因素易产生随机性、不确定性和模糊性等缺陷,其评价结果也很难做到客观、准确、令人信服,在实验室安全管理与安全隐患防范方面无法提供明确的指导。如何建立实验室安全评价指标体系,形成科学、量化的评价方法,提供更具指导性的意见,已越来越多地得到研究者的重视。
李志红[5]对100 起实验室安全事故进行统计分析,发现科学的实验室安全评价标准是实验室管理的薄弱环节,已成为实验室安全事故发生的主要原因之一。陆琳睿等[6]基于BP神经网络建立了的实验室安全评价模型,进行仿真并得到了较好结果,验证了基于BP神经网络的神经模型在实验室安全评价中的适用性。刘音等[7]建立了实验室火灾风险评价指标体系,并将模糊综合评价法运用到高校实验室火灾风险评价模型。然而,上述方法均存在随机性强、收敛速度慢、易陷入局部极小状态、学习效率低等问题[8-9]。因此,引入一种前馈神经网络的方法,在BP 网络神经元权值和阈值初始化的过程中采用改进粒子群算法(Improved Particle Swarm Optimization,IPSO),并对粒子群算法中的惯性系数与学习因子进行针对性优化策略,使模型更加高效地学习实验室安全评价样本信息,吸收专家评价经验,为高校实验室安全管理提供科学、规范的评价标准。
在现代风险管理理论中,风险管理工作要立足于预防,通过风险分析和评价的方法发现系统中潜在的风险因素,从而制定对应的预防和整改措施,保证系统安全。实验室安全评价中涉及的内容较多,为了能够科学、全面地反映安全影响因素,在建立评价指标体系时应当遵循以下原则[10]:
(1)科学性原则。要求在选择评价指标、建立计算方法以及收集相关信息的过程中,有科学的依据可寻。
(2)系统性原则。要求能够将实验室安全工作中各环节、各方面因素按照系统的特性进行组合,形成层次分明、条理清晰、简明扼要的指标体系,从而准确描述实验室安全风险和安全状态。
(3)可操作性原则。要求在设计指标时,各项指标有明确的定义、评分有统一的标准,数据采集和计算方便,能够充分考虑实验室的实际情况,做到实验室安全评价不流于理论层面,真正落于实处。
针对目前学院管理的40 个实验室,对3 年时间共35 次安全检查所发现的问题与隐患进行归纳整理,基于上述构建原则,通过对国内高校现有实验室安全评价体系的研究,以教育部科技司发布的《高等学校实验室安全检查项目表》为参考,针对高校机械类实验室安全因素设计了评价指标体系,包含一级指标9 个,二级指标27 个,如表1 所示。聘请专家组对实验室安全状况进行评价,对照27 个2 级指标所描述的要求,按照优(10 ~9 分)、良(9 ~8 分)、中(8 ~6 分)、差(6~0 分)的标准进行评分,形成实验室安全评价的基础数据。
BP神经网络作为一种多层前馈神经网络,一般由输入层、隐含层、输出层三部分组成,按照由输入至输出的方向,开展实际输出的计算,而按照由输出至输入的方向,开展权值与阈值的修正,得到尽可能接近希望输入、输出关系的网络映射。在解决非线性、不确定性或模糊关系等问题方面具有良好的效果,能够形成学习、记忆以及自适应的能力,图1 所示为典型的3 层BP神经网络结构,具体训练步骤如下:
(1)信号的前向传播。隐含层节点i 的输出值neti为:
式中:xj表示输入层节点j的输入,j =1,2,…,M;ωij表示隐含层节点i到输入层节点j之间的权值;θi表示隐含层节点i的阈值;yi为隐含层节点i的输出值;函数f为隐含层节点i的激活函数。
表1 高校实验室安全评价指标体系
图1 3层BP神经网络结构图
(2)误差的反向传播过程。计算各层神经元的输出误差,根据误差不断调节优化各层的权值和阈值,使网络能够得到接近期望值Yk的输出。对系统中p 个训练样本的总误差进行计算,得到:
PSO算法模拟鸟群随机搜寻食物的捕食行为,将每个优化问题的解看成一只空间飞行的鸟,在解空间中搜索个体最优解和全局最优解。将BP 网络各层的权值和阈值以一个向量形式保存,记作Wi,将其作为一个粒子,即粒子群算法空间中的一个解。
在BP神经网络中,将权值向量Wi即粒子i 作用于BP神经网络,将训练集带入进行前向运算,得到n个训练样本对应的网络输出,则神经网络以该粒子为权值时,训练误差为:
式中,yp和dp分别为第p个训练样本的目标输出与网络的实际输出。
得到该粒子的适应度函数
因此,粒子的适应度随着训练误差减小而增大,神经网络训练效果也随之变好。
每个粒子根据解空间中的个体极值与全局极值来不断进化更新自己的当前值,通过迭代计算找到最优粒子(最优解)。每个粒子在进化中找到的适应度最大的值,就是该粒子本身的最优解,称之为个体极值,将第i个粒子的个体极值记为Wpbest(i)。将当前种群整体所能找到的最优解称为全局极值,记为Wgbest(i)。
对于粒子i,其根据个体极值与全局极值得到个体更新的增量ΔWi与更新后的值Wi为:
式中:k为惯性系数;c1,c2为学习因子,也称为加速常数,通常为非负数;r1,r2为[0,1]范围内的均匀随机数;Wpbest为当前粒子的个体极值;Wgbest为当前全体粒子的全局极值。
在设置PSO算法寻优策略时,许多学者都使用了自己独特的参数更新方法。陈祺[11]将遗传算法引入,改进BP神经网络的权值和阈值,使模型得到优化;吴冲等[12]在寻优过程中对学习因子和惯性系数进行了动态调整;肖理庆等[13]在PSO改进中使用了改进精英策略、区间算法和轮盘赌算法;张世钦[14]则在种群拓扑方面进行改进。
针对PSO 算法的缺点,提出新的更新策略,引入非线性函数对惯性系数和学习因子进行优化,使PSO算法尽快获得最优解。
(1)惯性系数优化。惯性系数k与粒子上一次修正的增量有关,代表粒子有保持其运动速度的趋势。引入非线性递减函数作为惯性系数公式,在迭代前期以较大的步长进行全局搜索,在后期以较小的步长进行局部的精细搜索。改进的惯性系数曲线如图2(a)所示。其公式为:
式中:η为惯性系数改进策略中的函数调整因子;kmin和kmax分别为惯性系数的最小值和最大值;Kmax为最大迭代次数;j为当前迭代次数。
(2)学习因子优化。学习因子c1为认知部分,反映了粒子向自身最优值的学习;c2为社会部分,是粒子向全局最优值学习的部分。一般情况下,设置c1=c2=1.494 45,为了能够更快得到全局最优解,在迭代初期增大c1减小c2,使算法在整个解空间内快速搜索;在进化后段,减小c1增大c2,既提高了收敛速度,又提高了计算精度。改进的学习因子c1、c2曲线如图2(b)所示。其公式为:
式中:λ为学习因子改进递减策略中的函数调整因子;cmin和cmax分别为学习因子的最小值和最大值。
图2 改进的PSO算法惯性系数和学习因子曲线
(3)粒子移动速度限制。为了避免出现粒子发生不稳定的跳动,对粒子速度是否超出极限进行判断,将速度ΔWi限制在[-Wmax,Wmax],每次迭代更新后做如下判断:
目前,对于预测精度的评价仍没有形成统一的标准方法,本文采用多种评价指标衡量模型的预测效果,主要有相对误差绝对值中最大值max、相对误差绝对值中最小值min、平均绝对误差MAE、均方误差MSE、平均相对误差MAPE,其中:
式中:yq和分别为第q 组评价数据的实际值和预测值;N为评价样本数量。
在实验室安全评价模型中,输入层为实验室安全2级评价指标,神经元数量为27;输出层为评价结果,神经元数量为1。目前,隐含层神经元个数没有统一的计算方法,一般利用经验公式计算,即:
式中,a和b分别为输入层和输出层神经元的个数,计算得到隐含层节点个数为10 个,因此评价模型为27-10-1 结构的BP神经网络。BP神经网络训练函数、传递函数、训练次数、学习速率、训练目标等参数设置如表2 所示。
根据神经网络结构,对粒子群维度进行计算,权值数量为27 ×10 +10 ×1 =280,阈值数量为10 +1 =11,得到粒子群维度n =280 +11 =291,粒子群规模、迭代次数、惯性系数、学习因子、粒子增量限值等参数如表3 所示。
表2 BP神经网络参数设置
表3 改进粒子群算法参数设置
实验室安全评价指标数据如表4 所示,其中前25组数据设置为训练样本,用于IPSO-BP神经网络训练,后15 组数据设置为评价样本,用于验证模型精度。
表4 实验室安全评价指标数据
为了加快训练速度,避免某些数值低的特征被淹没,在载入训练样本后首先对数据进行归一化处理[15]。然后通过优化惯性系数和学习因子的策略改进PSO算法,通过迭代计算逼近全局最优解作为BP神经网络的初始权值和阈值。最后进行神经网络训练,当达到训练要求或训练次数时结束训练,IPSO-BP神经网络算法流程如图3 所示。
如2.3 节所述,惯性系数函数调整因子η 和学习因子函数调整因子λ 对PSO 算法的优化能力有直接的影响。因此,令η在1.0 ~2.0 之间取10 个点,λ在1.5 ~2.5 之间取11 个点,向IPSO-BP模型输入T1至T25共25 组数据进行训练,然后对C1至C15共15 组数据进行预测,根据预测结果计算该模型的平均相对误差MAPE。
如图4 所示,IPSO-BP 模型预测结果的MAPE 值随η和λ的取值发生明显变化,η和λ 值过大或过小都会使模型预测结果MAPE 值增大。在本组预测结果中,当η =1.6,λ =2.0 时得到最优结果,此时MAPE=1.528;当η =1.0,λ =1.5 时,MAPE 值最大,为9.654。因此在本模型中,取η =1.6,λ =2.0。
如图5 所示,IPSO算法寻优过程中全局最优解的误差随迭代次数增加而减小,在第24 次迭代时达到0.02,将此时的全局最优解设置为BP 神经网络的权值和阈值,经过5 步训练后误差由0.02 降至1.524 ×10-7,如图6(a)所示。而单独使用BP 神经网络训练时,经过55 步训练,误差降至约0.02,在95 步训练时误差达到1.895 ×10-7,如图6(b)所示。可见,本文的IPSO算法能够快速在全局优化BP神经网络模型的权值和阈值,使其具有更高的训练效率和精度,避免发生训练不收敛、陷入极小值等现象。
图3 IPSO-BP算法流程图
图4 不同调整因子下IPSO-BP模型预测结果的MAPE值
图5 IPSO算法优化过程
将C1至C15共15 组测试样本分别输入本文建立的IPSO-BP神经网络、经典线性修正惯性系数与学习因子的PSO-BP模型、普通PSO-BP模型、BP模型进行预测,对输出的预测结果进行误差分析。如表5 所示,IPSO-BP模型预测精度提升非常明显,MAE、MAPE、max、min 四项误差指标均降低至BP 模型的20% ~25%,而MSE指标降低至BP模型的4%。同时,各项误差评价指标较PSO-BP 模型、线性修正PSO-BP 模型,均有明显下降。
图6 BP神经网络算法训练误差
表5 4 种算法预测误差分析结果对比
图7 所示为4 种模型对15 组评价样本预测结果的相对误差绝对值,IPSO-BP 模型对不同评价样本的相对误差稳定在0.78% ~2.38%之间,预测精度大幅提高、误差波动明显下降,运行效果明显优于其他3 种神经网络模型。
图7 4种算法评价样本预测结果相对误差绝对值对比
在本文建立的评价模型运行的1 年时间中,各实验室未出现安全事故,在例行安全检查中发现的安全隐患数量明显减少,各实验室安全评价结果分数逐渐升高。可见,通过本评价模型的运行,实验室安全状况明显得到改善,该模型能够有效评价实验室安全状况、提高实验安全意识、预防安全事故的发生。
通过国内高校现有实验室安全评价体系的研究,结合自身工作经验,提出了一种基于改进粒子群算法优化BP神经网络的高校实验室安全评价模型,对实验室安全评价具有积极的现实意义。主要得到以下结论:
(1)建立了包含9 个1 级指标、27 个2 级指标的实验室安全评价指标体系,通过专家评分得到了25 组训练样本和15 组测试样本。
(2)建立了基于IPSO-BP神经网络的实验室安全评价模型,针对粒子群算法中的惯性系数和学习因子引入了非线性函数进行优化,确定了最优的惯性系数函数调整因子η =1.6、学习因子函数调整因子λ =2.0。
(3)通过评价样本验证了IPSO-BP神经网络模型预测结果的平均相对误差为1.5276%,较传统BP 模型、PSO-BP 模型、线性修正PSO-BP 模型的预测精度大幅提升,且具有更快的收敛速度、更短的运行时间、更小的误差波动以及更强的适应性,说明本文提出的改进粒子群算法对BP神经网络模型的优化具有良好效果。
(4)该模型的建立弥补了当前实验室安全评价方法中存在的单一性与主观性等问题,实现了高校实验室安全评价定量分析,为有效预测实验室安全隐患,客观评价实验室安全状况,提供了科学有效的解决方法。