基于PCA-Bayes综合判别的矿井突水水源判别研究*

2021-06-06 09:51扶祥祥江泽标余照阳郭亚玲吴少康
采矿技术 2021年3期
关键词:突水水源正确率

扶祥祥,江泽标, ,余照阳, ,郭亚玲,吴少康

(1.贵州大学 矿业学院, 贵州 贵阳 550025;2.贵州省非金属矿产资源综合利用重点实验室, 贵州 贵阳 550025)

在煤矿的生产过程中,矿井突水事故是矿井安全事故中危害最大的自然灾害之一[1−2]。当矿井突水事故时,及时、有效、准确地判别突水水源的种类是预防和解决突水事故的重要前提。因此,准确判断突水水源类型,预测其涌水量,对于矿井水害防治和矿井生产安全具有十分重要的意义。

利用水文地球化学数据进行判别分析突水水源的方法,得到广泛的应用和研究,取得了一些进步和发现[3−4]。水文地球化学数据的差异性是水源的本质特征,通过这些有差异性的数据结合各种方法来判别分析突水水源类别必然十分快捷、有效[5−6]。聂荣花等[7]以邢台煤矿为研究对象,通过Bayes逐步判别法建立了矿山涌水快速判别模型。张春雷等[8]以淮南顾桥矿为例,结果表明,贝叶斯多类线性判别模型优于神经网络模型,其计算过程简单,模型结构稳定。徐星等[9]用逐步 Bayes 判别方法判别突水水源,结果表明其具有易建模、准确率高的优点。曲兴玥等[10]用因子分析和距离判别法判别突水水源,提高了判别准确率。

本文采用PCA法和Bayes逐步判别法建立Bayes逐步判别模型和PCA-Bayes综合判别模型对福建煤矿突水水源进行判别分析,通过结果预测对比,PCA-Bayes综合判别法比Bayes逐步判别法更准确。

1 突水水源样本确定

1.1 样本指标的确定

突水水源的含水层中的水源水化学成分众多。本文选取Na++K+、Ca2+、Mg2+、Cl−、SO42−、HCO3−等6种离子及酸碱度共7项指标的组分作为预测矿井突水的判别因子。

1.2 判别模型的样本数据

以文献[11]中福建典型煤矿的35个水源数据为样本,其中老空水13份,灰岩水7份,地表水6份,裂隙水9份。随机选取样本编号为2,5,10,17,25为待测样本,以剩余样本为训练样本。样本数据见表1。

2 模型建立

2.1 Bayes判别模型建立

利用SPSS软件[12]对训练的样本数据进行Bayes逐步判别处理,可以得到4种水源的判别分类函数,其函数表达式:

表1 福建典型煤矿突水水源数据

式中,S1、S2、S3、S4分别为老空水、裂隙水、灰岩水以及地表水的判别函数值;X1、X2、X3分别为碳酸氢根离子浓度、硫酸根离子浓度、pH值。

将每一组样本数据代入表达式,得到最大值的样本数据归于该类。由SPSS判别的分类结果可知,第1类水源误判率为0,第2类水源误判率为37.5%,即有3个第2类水源被判为第3类水源,第3类水源误判率为0,第4类水源误判率为0,在该模型下判别正确率为90.0%。

2.2 PCA-Bayes综合判别模型建立

2.2.1 训练样本的主成分分析

先对原始样本数据进行因子分析,从因子分析的结果中可知KMO的值为0.647,显著性值为0,小于0.05,说明变量间存在相关关系,适合进行因子分析,亦适合进行主成分分析。

各主成分的解释总方差见表2,从表2中可知,提取3个主成分累积贡献率已达到86.18%,提取3个成分即可,可以达到降维的目的。

表2 解释的总方差

根据主成分分析的成分矩阵可以得到特征向量矩阵,从而得到成分矩阵和特征向量矩阵(见表3),从而可以得到PCA处理的综合指标数据的表达式:

式中,X1、X2、X3、X4、X5、X6、X7分别代表钠钾离子浓度、钙离子浓度、镁离子浓度、氯离子浓度、碳酸氢根离子浓度、硫酸根离子浓度、pH值。

表3 成分矩阵和特征向量矩阵

将原始数据标准化处理后,代入函数表达式,即可得到主成分分析后的综合指标数据(见表4),用于建立综合模型。

2.2.2 PCA-Bayes综合模型

用PCA处理过的综合指标数据在SPSS软件上进行Bayes判别处理,可以得到4类突水水源的判别分类函数表达式:

表4 PCA处理得到的综合指标数据

式中,W1、W2、W3、W4分别为老空水、裂隙水、灰岩水以及地表水的判别函数值;X1、X2分别为综合指标Z1、Z2的值。

由SPSS判别的分类结果可知,第1类水源误判率为18.2%,一个判别为2类水源,一个判别为3类水源;第2类水源误判率为0;第3类水源误判率为0;第4类水源误判率为0。所以该样本数据在PCA-Bayes综合判别模型下判别正确率为93.3%。

2.3 待测样本预测验证

首先将待测样本代入Bayes逐步判别模型得到判别函数,然后将待测函数进行主成分分析并将所得到的主成分样本数据代入PCA-Bayes综合判别模型得到判别函数(见表5)。

由表5可知,5个待测样本在Bayes逐步判别模型中有一个判别错误,判别的正确率为80%,5个待测样本在PCA-Bayes综合判别模型下的判别全部正确,判别正确率为100%。

3 结论

(1)本文对福建典型矿的突水水源建立Bayes判别模型和PCA-Bayes综合判别模型,并对待判样本进行判别。

(2)运用Bayes逐步判别模型对训练样本的回判正确率为90%,待测样本的判别正确率为80%;运用PCA-Bayes综合判别模型对训练样本的回判正确率为93.3%,待测样本的判别正确率为100%。

(3)从两个模型的对比分析可以看出,通过PCA降维的PCA-Bayes综合判别法的正确率要优于单一的Bayes逐步判别法,PCA-Bayes综合判别法是一种对突水水源判别快捷、准确、有效的方法。

表5 待测样本模型验证

猜你喜欢
突水水源正确率
保护水源
矿井突水水源的判别方法
峰峰矿区突水类型划分及突水模式
门诊分诊服务态度与正确率对护患关系的影响
南水源头清如许
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
寻找水源
大相岭隧道高压突水机理与预测分析