赵 嵘,齐黎明,葛须宾,吉丹妮
(1.华北科技学院 研究生院,北京 东燕郊 101601;2.河北省矿井灾害防治重点实验室,河北 廊坊 065201;3.华北科技学院 安全工程学院,北京 东燕郊 101601)
基于系统聚类分析和判别分析的煤与瓦斯突出预测
赵 嵘1,齐黎明2,3,葛须宾1,吉丹妮1
(1.华北科技学院 研究生院,北京 东燕郊 101601;2.河北省矿井灾害防治重点实验室,河北 廊坊 065201;3.华北科技学院 安全工程学院,北京 东燕郊 101601)
煤与瓦斯突出是一种非常复杂的动力现象,影响因素众多,发生原因复杂。文中采用SPSS软件对典型突出矿井的煤层瓦斯压力(P)、瓦斯放散初速度(ΔP)、煤的破坏类型(D)、煤的坚固性系数(f)4个参数的实测数据进行了系统聚类分析。分析结果与17个已知样本实际发生的动力现象一致,说明了综合4个指标来预测煤与瓦斯突出的合理性。然后通过判别分析建立了煤与瓦斯突出预测函数。实践证明,该函数较准确地预测了17个已知样本和4个未知样本的煤层突出危险性,为煤与瓦斯突出预测提供了一种新方法。
聚类分析;判别分析;煤与瓦斯突出;预测
煤与瓦斯突出是严重威胁煤矿安全生产的自然灾害。因此,对煤与瓦斯突出危险进行准确预测显得尤为重要。长期以来,研究人员提出了种种预测方法和指标,如把煤层瓦斯压力(P)、瓦斯放散初速度(ΔP)、煤的破坏类型(D)、煤的坚固性系数(f)等作为预测煤层突出危险性的主要指标[1~4]。这些指标在预测煤与瓦斯突出的时候起到了一些积极作用,但忽略了以往预测工作中所积累的大量数据。因此可以从数据统计分析的角度去研究煤层的突出危险性来预测煤与瓦斯突出。
多元分析是研究多指标问题的统计分析方法。聚类分析和判别分析都是多元分析的方法,不同的是聚类分析事先并不知道研究对象的类别,它根据研究对象本身提供的信息,通过统计手段做出分类决策,有一定的探索性;而判别分析是事先已知研究对象的类别,根据有关类别的信息建立判别函数,再利用该判别函数判断未知类别个体属于何种类别。在实际分析当中,当对样本分类不清楚时,可以先聚类分析,然后进行判别分析[5]。
文中把多元分析方法中的聚类分析和判别分析应用于煤与瓦斯突出预测中,提出了一种新的煤与瓦斯突出预测方法。
聚类分析是根据某些数量特征将观察对象进行分类的一种数理统计方法[5]。
系统聚类分析是实际工作中使用的最多的一种聚类方法。它具有十分明显的优点[5~6]:可以对样品聚类,也可以对变量聚类;变量可以是连续性或分类变量;提供的距离测量方法和结果表示方法十分丰富;可以指出由粗到细的多种分类情况;典型的系统聚类结果可由一个聚类图展示出来。
系统聚类分析的基本原理是将n个样品或变量看成不同的n类,然后将距离接近(针对样品聚类)或性质接近(针对变量聚类)的两类合并为一类;再从这n-1类中找到最接近的两个类合并,以此类推,直到所有样品或变量被合为一类。整个过程可以绘成聚类图,按图和具体问题来决定分类。
1.2. 系统聚类分析样本
选取国内17个典型突出矿井的4个指标的实测数据作为系统聚类分析的样本[7~8],如表1所示。此时样本可以看作是不同的17类。
表1 系统聚类分析样本[7-8]
1.2.2 对样本进行聚类分析
通过SPSS软件对表中17个样本进行系统聚类分析,其聚类过程如表2所示。从表中可以看出:经过16步之后样本被聚为1类。第1步是将样本2和样本11合并,此时样本被分为16类;第2步是将样本10和样本14合并,此时样本被分为15类;第3步是将样本5和样本12合并,此时样本被分为14类;第4步是将样本3和样本7合并,此时样本被分为13类;第5步是将样本8和样本17合并,此时样本被分为12类;第6步是将样本1和样本2、11合并,此时样本被分为11类;第7步是将样本4和样本13合并,此时样本被分为10类;第8步是将样本3、7和样本10、14合并,此时样本集被分为9类;第9步是将样本6和样本15合并,此时样本被分为8类;第10步是将样本5、12和样本8、17合并,此时样本被分为7类;第11步是将样本1、2、11和样本9合并,此时样本被分为6类;第12步是将样本3、7、10、14和样本16合并;此时样本被分为5类;第13步是将样本5、12、8、17和样本6、15合并;此时样本被分为4类;第14步是将样本4、13和样本5、12、8、17、6、15合并,此时样本被分为3类;第15步是将样本2、11、1、9和样本10、14、3、7、16合并,此时样本被分为2类;第16步是将样本2、11、1、9、10、14、3、7、16和样本4、13、6、15、5、12、8、17合并,此时样本被合并为1类。
表2 样本聚类表
1.2.3 绘制聚类图
为了更直观形象地说明系统聚类情况,绘制聚类图。如图1所示。
图1 样本聚类图
1.2.4 决定类的个数和类
从聚类过程可知在第15步把样本集聚为2类。从图1可以看出:第一类包含样本点1、2、3、7、9、10、11、14、16;第二类包含样本点4、5、6、8、12、13、15、17。将以上两类中的样本点分别与样本实际发生的动力现象对比,发现第一类中的样本点均发生了煤与瓦斯突出;第二类中的样本点均没有发生过突出。聚类分析结果说明了突出煤层和非突出煤层的4个指标具有各自的特性,从而为综合煤层瓦斯压力P、瓦斯放散初速度ΔP、煤的破坏类型D、煤的坚固性系数f4个指标来预测煤与瓦斯突出提供前提条件。
判别分析是一种对观察对象进行分类的统计学方法[5],它与聚类分析不同,它在分析之前就非常明确观察对象分为几个类别,该分析方法的目的就是从现有已知类别的观察对象中建立一个判别函数,然后再用该判别函数去判别同质的未知类别的观察对象。
判别函数的一般形式如下:
Y=a1X1+a2X2+…+anXn
(1)
式中:Y为判别指标,X1,X2,…,Xn为反应研究对象特征的变量;a1,a2,…,an为各变量的判别系数。
常用的判别法有Fisher判别分析、Bayes判别分析和距离判别分析等。Fisher判别也称典型判别,它的基本思想是投影,将原来在R维空间的自变量组合投影到维度较低的S维空间,然后在S维空间中再分类。
在总体为两类的情况下,Fisher判别分析的线性判别函数[6]为:
Y(x)=(μ1-μ2)T∑-1x-K
(2)
Fisher判别分析的判别规则为:当x使得Y(x)≥0,x∈X1;当x使得Y(x)<0,x∈X2。
如果两总体的均值向量及公共协方差阵未知,Wald和Anderson提出用相应的估计来代替[6]。设xi(i=1,2,…,n1),yi(i=1,2,…,n2)分别是来自总体X1和X2的样本,令
(3)
那么判别函数[6]可取为:
(4)
2.2.1 判别分析样本
通过对17个典型突出矿井的4个指标的实测数据进行聚类分析之后,发现煤层瓦斯压力P、瓦斯放散初速度ΔP、煤的破坏类型D、煤的坚固性系数f4个指标可以综合预测煤层的突出危险性。而判别分析是从已确定类别样本中拟合判别函数,再把判别函数应用于相同变量所记录的新数据集,以判断新样本的类别归属。因此我们考虑把17个典型突出矿井的4个指标的实测数据作为已知明确类别的样本,并另外选择4个样本作为需要预测的未知样本[8],对这21个实测数据进行判别分析。在判别分析中把实际发生过煤与瓦斯突出的样本归类为1,把没有发生过突出现象的样本归类为0。表3为判别分析样本。
表3 判别分析样本[7-8]
2.2.2 对样本进行判别分析
(5)
式中:X1为煤层瓦斯压力;X2为瓦斯放散初速度;X3为煤的破坏类型;X4为煤的坚固性系数。
从生产经验可知,瓦斯压力,瓦斯放散初速度,煤的破坏类型越大突出危险性越大,而煤的坚固系数越大越不利于瓦斯突出。因此瓦斯压力、放散速度、煤的破坏类型为正极性指标,而煤的坚固系数为负极性指标[1]。这与预测函数(5)中各指标系数的正负是一致的。
将表3中各样本的实测数据带入式(5)中,依据Fisher判别准则(Y值大于等于0预测为具有突出危险性,小于0预测为无突出危险性)对17个已知样本和4个未知样本进行预测。预测结果如表4所示。
表4 预测结果表
续表
2.2.3 判别分析结果评价
从表4中的预测结果一列可以对预测的情况做出评价:(1)17个已知样本的预测结果与实际发生的动力现象一致,正确率达到了100%,说明判别分析的效果十分理想;(2)样本18、21被预测为无突出危险煤层,样本19、20被预测为突出危险煤层。将预测结果与试验矿井的生产过程中的数据记录进行对比[8],对比结果显示预测结果与实际生产时遇到的情况是一致的,表明基于聚类分析和判别分析的煤与瓦斯突出预测是可行的。
文中从数据分析的角度,应用聚类分析和判别分析提出了一种新的煤与瓦斯突出预测方法并得出以下结论:
1) 通过系统聚类分析说明了综合煤层瓦斯压力P、瓦斯放散初速度ΔP、煤的破坏类型D、煤的坚固性系数f4个指标来预测煤与瓦斯突出的合理性;
2) 在聚类分析的基础上应用判别分析建立了煤与瓦斯突出预测函数,避免了因要求全部指标达到或超过临界指标而产生隐患的缺陷;
3) 不同的矿井可以根据具体的实测数据通过聚类分析和判别分析建立适合本矿井的预测函数。
[1] 景国勋,张强,周爱桃. 基于灰色系统理论的煤与瓦斯突出[J].中国安全科学学报,2004,14(8):19-21.
[2] 王超,宋大钊,杜学胜,等.煤与瓦斯突出预测的距离判别分析法及应用[J].采矿与安全工程学报:2009,26(4):470-471.
[3] 郭德勇,李念友,斐大文,等.煤与瓦斯突出预测灰色理论-神经网络方法[J].北京科技大学学报:2007,29(4):354-357.
[4] 念其锋,施式亮,李润求.基于网络分析和联系熵的煤与瓦斯突出预测研究[J].中国安全生产科学技术:2014,10(2):22-27.
[5] 武松,潘发明等. SPSS统计分析大全 [M]. 北京:清华大学出版社,2014.
[6] 杨虎,刘琼荪,钟波. 数理统计[M]. 北京:高等教育出版社,2004.
[7] 刘黎明,肖红飞. 神经网络在煤与瓦斯突出预测中的应用[J].矿业安全与环保,2003,30(1):34-37.
[8] 田云丽, 周丽华. 基于BP神经网络的煤与瓦斯突出预测方法的研究[J]. 系统工程理论与实践,2005,12:102-106.
ThePredictionofCoalandGasOutburstBasedonSystematicClusterAnalysisandDistinguishAnalysis
ZHAO Rong1, QI Li-ming2, 3, GE Xu-bin1, JI Dan-ni1
(1.GraduateSchool,NorthChinaInstituteofScience&Technology,Yanjiao,101601,China;2.KeyLabofMineDisasterPrevention&ControlinHebeiProvince,Langfang, 065201,China;3.SchoolofSafetyEngineering,NorthChinaInstituteofScience&Technology,Yanjiao,101601,China)
Coal and gas outburst is an extraordinarily complicated dynamic phenomenon: plenty of influential factors and complex causes. So the measured values of coal seam gas pressureP, gas initial diffusion velocityΔP, coal destruction typeD, coal solidity coefficientfof representative outburst mines were conducted systematic cluster analysis by the soft of SPSS (Statistical Package for the Social Science) first. The analysis result agreed with actual dynamic phenomenon of 17 known samples, which illustrated that it is reasonable to use four indexes synthetically for forecasting coal and gas outburst. Then a forecasting function of coal and gas outburst was built by conducting distinguish analysis. The outburst danger of 17 known samples and 4 unknown samples could be identified correctly by forecasting function in practice, providing a new method for prediction of coal and gas outburst.
systematic cluster analysis; distinguish analysis; coal and gas outburst; prediction
2015-02-03
赵嵘(1992-),男,山西永济人,华北科技学院在读研究生,主要研究方向为矿井瓦斯灾害防治。E-mail: 675732635@qq.com
TD713+.2
A
1672-7169(2015)02-0014-06