谷 月,杨 力
安徽理工大学 1.经济与管理学院,2.人文社会学学院,淮南,232001
随着我国煤矿行业改革的不断深化,煤矿安全事故有所下降,但仍不容乐观。与国外发达国家相比,我国煤矿事故量偏大。煤矿事故致因理论认为,事故的发生不是孤立的,是多元素的共同作用结果。导致事故发生的根本原因是管理的失误,如安全管理组织结构不合理,职责不清晰,管理理念和模式陈旧;煤矿安监部门安全制度不健全、监管不到位、执法力度不大等[1]。面对当前严峻的煤矿安全管理形势,要想真正实现煤矿安全本质化、精细化管理,必须对安全管理中存在的风险进行充分的识别与评价,建立科学、完整的煤矿安全管理评价模型,有效减少和避免安全事故的发生。
近年来,国内外学者对煤矿安全风险评价作了大量研究,取得丰硕成果。在国外,煤矿安全风险评价大都以概率评价为主,Poplin[2]通过收集1996—2003年美国和澳大利亚煤矿员工伤亡数据,运用广义估计方程对煤矿安全风险进行评价。在国内,学者对煤矿安全风险评价方法研究多集中于BP神经网络法、ANP、模糊综合评价法、事故分析法等。如王爽英[3]将煤矿安全生产系统分为过程维、因素维和功能维,构建了煤矿安全生产风险集成管理层次结构,应用模糊层次法(Fuzzy-AHP)对其进行实证分析;曹树刚等人[4]根据危险源理论建立瓦斯爆炸危险源风险评价模型,利用模糊数学综合评价法对矿井瓦斯爆炸进行动态评价,确定事故危险等级,有效预警预控瓦斯爆炸;曾丽君[5]将事故树分析法运用到风险评价中,该方法可以定性、定量分析系统的安全性。但在煤矿安全管理方面,由于煤矿安全管理具有复杂性、非线性、小样本等特点,上述传统的风险评价方法在实施中存在一定局限。本文提出基于熵值法和支持向量机的煤矿安全管理风险评价。首先运用熵值法求出指标权重,然后运用具有很好泛化能力的支持向量机进行综合评价。
煤矿安全管理评价是一个复杂的系统工程,受多方面因素影响。因此,构建指标时要遵循科学性与系统性、稳定性与动态性、实用性与简明性等原则,设计科学合理的煤矿安全管理风险评价指标[6]。在总结国内外相关研究文献,并结合我国煤矿安全管理现状以及大量的实地调研基础上,确定了包括4个一级指标,13个二级指标的煤矿安全管理风险评价指标体系。具体内容见表1。
表1 煤矿安全管理风险评价指标体系
熵值法[7-8]是一种客观赋权法,根据各项评价指标观测值所提供的信息量的大小来确定指标权重。在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也相应就越小;反之亦然。设有n个评价方案,m项评价指标,形成原始指标数据矩阵X=(xij)n×m,对于给定某项指标xj,指标值xij的差距越大,则该指标在综合评价中所起的作用越大。在具体的使用过程中,熵值法根据各指标的变异程度,利用信息熵计算出各指标的熵值。再通过熵值对各指标的权重进行修正,从而得出较为客观的指标权重。具体步骤如下:
(1)建立数据矩阵。
(1)
其中xij为第i个评价方案中的第j项指标的数值。
(2)指标的标准化处理。
正向指标:
(2)
负向指标:
(3)
(3)计算第j项指标下第i个方案占该指标的比重。
(4)
(4)计算第j项指标的熵值。
(5)
式中,k>0,ej>0,常数k与样本数m有关,一般令k=1/lnm,则0≤e≤1。
(5)计算第j项指标的差异系数。
对于第j项指标,指标值xij的差异越大,对方案评价作用越大,熵值就越小。因此,gj=1-ej,gj越大该指标越重要。
(6)确定权数。
(6)
(7)计算各方案的综合得分。
(7)
支持向量机[9-10]是Vapnik于20世纪90年代提出,以统计学中VC理论和结构风险最小化为基础,借助于最优化方法解决小样本机器学习的一种新工具,能够较好解决非线性、多维度等问题,具有很好的范化能力和鲁棒性。目前在风险评价、数据挖掘、样本分析、文本及图像识别等领域有广泛应用。
设已知训练集T={(x1,y1)…,(xl,yl)}∈(X×Y)l,其中xi∈X=Rn,yi∈Y={1,-1},i=1,…,l。试据此Rn空间寻找一个实值函数g(x),以便用决策函数f(x)=sgn(g(x))来推断任一输入x对应的输出y。由此可见,求解分类问题,实质上就是找到一个把Rn空间分成两部分规则。
2.2.1 线性问题
对于线性问题,支持向量分类机可以用一个超平面将训练集正确划分。其最优原始问题如下:
s.tyi((w·xi)+b)≥1-εi,i=1,…,l
εi≥0,i=1,…l,
(8)
其中ε=(ε1,…,εl)T,εi是一个松弛变量,C>0是一个惩罚参数。
引入Lagrange函数,求出原始问题的对偶问题:
(9)
(10)
2.2.2 非线性问题
对于非线性分类问题,引入核函数K(xi,xj),通过映射将输入空间转化为一个高维空间,将非线性问题转变为线性问题,求解最优超平面。其相应的对偶问题:
0≤ai≤C,i=1,…,l,
(11)
(12)
求得决策函数:
(13)
从安全管理模式、安全管理监控、安全管理组织、安全管理要素四个方面构建的煤矿安全管理风险评价指标,共4个一级指标,13个二级指标。以安徽省淮南、淮北矿业集团下煤矿为研究对象,运用熵值法和支持向量机进行实证研究。
选取安徽省淮南9个煤矿,淮北5个煤矿,共14个煤矿作为本文的研究样本,采用定性和定量相结合的方法,实地调研、考察2013—2015年这14个煤矿相关的数据资料,并请煤矿高校的教授和煤矿企业安全管理人员对不可定量化、缺失数据进行打分[11-12],以百分制为基准,进行加权平均,得样本数据如表2所示。
表2 样本数据
由于各评价指标之间各自的量纲及量级不同而存在不可公度性,需要对指标进行标准化处理。对表2中的数据按公式(2)进行归一化处理。结果见表3。
表3 数据归一化结果
用EXCEL表格按照熵值法的求解步骤求出指标的特征权重、熵值、差异系数,得出指标的权重。熵值法计算结果见表4。
表4 熵值法计算结果
从表4中可知,运用熵值法计算出的指标权重分别为0.247、0.262、0.238、0.254,根据公式(7)得到各样本总评分,并对其进行归一化处理,处理结果见表5。
表5 样本评价结果
将表5中14组样本数据作为支持向量机的输入,随机将14组样本数据分为3类,1—8为建模的训练样本,9—11为优化参数的实验样本,12—14为检验模型的检验样本。同时设煤矿安全管理风险输出y=±1,y=1表示无风险,y=-1表示有风险。基于CMSVM2.0软件,选择径向基核函数,通过网络搜索得最优C=3.3,g=1,然后将C和g带入软件进行运算得出基于熵值法和支持向量机预测结果。保持参数不变,将表3中的数据没有经过评价指标权重设计代入软件运算,对比预测结果(表6)。
表6 预测结果对比表
从表6中可知,基于熵值法和支持向量机的煤矿安全管理评价模型与SVM评价相比,具有更高的准确度,与表5归一化的总评分的实际情况也更接近。
(1)本文在相关文献、专家建议、实地调研的基础上,构建了煤矿安全管理风险评价指标体系,包括4个一级指标,13个二级指标。较为全面地涵盖了煤矿安全管理的各方面,为煤矿安全管理风险评价奠定了基础。
(2)运用熵值法和支持向量机进行评价,结果表明,与SVM模型相比,基于熵值法与支持向量机的评价模型具有更高的精确度,也与实际情况相符。