杨 峰,海 玲,刘 文,2
(1.新疆工程学院,新疆 乌鲁木齐 830000;2.新疆畅森数据科技有限公司,新疆 乌鲁木齐 830000)
在矿井水文地质的灾害中,水害是当前急需处理的问题,开采煤矿时导致含水层遭到破坏,水力平衡无法维持。在水压的作用下,地下水以滴淋方式或以大量地下水的形式向巷道和开采场涌入,导致矿井水害的发生[1]。水害事故的发生,让矿工的生命安全受到威胁,给矿区的环境造成了严重破坏,也给国家经济带来了影响,导致后续的煤矿开采不能正常开展[2]。
随着矿区开采工作的深入发展,水害的威胁也越来越大,因此对水文地质大数据水害的预测是非常重要的[3]。
贝叶斯分类算法使用概率统计的方式对大数据进行预测,具有结合先验概率和后验概率的特点,既避免了只使用先验概率的主观偏见,也可以对单独使用样本时易造成的过拟合现象进行避免[4]。本文采用贝叶斯分类算法对矿井涌水量数据进行分析[5]。
大数据不是一种固定的产品,所谓大数据不只是在时代变化数据增长的情况下生成的产物,也是如今这个充满数据的社会化的一种现象。
大数据的特点在表现形式上具有多元,快速,价值高、海量等特点;这些特点是与以往的数据相比体现出来的特点,而大数据在实际上应是具有变化性、可视化、真实性和不稳定性。
本文针对伊犁一矿进行相关探讨,伊犁一矿的煤层存储量巨大,仅仅12.4m就有600多亿吨。据勘探资料显示,伊犁一矿的开采条件与我国东部地区的矿区差异很大,因此面临的水文地质问题有很多。
在大数据社会中数据挖掘是一个关键技术,就是从不规律、不完整的海量大数据中筛取出人们所需要的信息或规律。
根据不同类型的数据挖掘,数据挖掘的方法也不相同,数据挖掘的方法如表1所示。
表1 数据挖掘技术方法分析
贝叶斯分类算法以概率统计学为基础,由于其误判率低,计算方式结合先验概率与后验概率。故贝叶斯算法在进行运算时可以避免只使用先验概率时的主观偏见,同时对避免单独使用样本时的过拟合现象。面对大数据计算时仍具有很高的准确率,运行计算时的过程也相对简单,所以被广泛使用于各个领域行业中。
贝叶斯分类算法主要是以概率统计为原理进行计算。当事件发生的概率已知时,可以依据数学理论的方式预测将要发生的概率。假设数据样本集合为是事件A的概率,是事件B的概率。事件A和事件B同时发生的概率用表示。那么当事件A已发生时概率为
贝叶斯算法的定理可以用数学公式进行表示,即为贝叶斯公式。具体如下所示:
贝叶斯预测方式的目的是为了能够的得到一个准确的判别。传统的预测方式是先根据过去的信息建立模型,再进行预测,这种方式只是将输入的以往信息转变成现在输出的信息,处理方式比较单一,不能处理异常发生的情况;贝叶斯预测能够很好的处理这方面的问题,不仅可以处理以往的信息,还可以应对突发异常的情况。
据查阅资料显示,在伊犁一矿的数据中新生代的地层中以第四系为主,第四系的地层在全矿区分布广泛,并且由南向北逐渐加深,有砂土、砾石等组成,沉积物的粒度由大变小,地形由陡峭变平缓。统计第四系的含水层厚度如表2所示。
表2 含水层参数选取
由表2可得,在伊犁一矿的开采区的含水层厚度是3.40至52.43之间,平均厚度为20.47。对表2进行统计,分别为试采区中部北部跟南部三部分,从而进行直观的看出含水层的统计宏观变化特征,如表3所示。
表3 含水层厚度统计表
由表3可知,试采区南部的第四系的含水层平均厚度最小,而从南到北的厚度逐渐增加,因为南部的沉积颗粒比较大,所以渗透性比较好,地下水的流速比较快。
对矿区含水层进行求参可得如表4所示。
表4 含水层求参
由表4可知,第四系的含水层的富水性中等,渗透性比较好。第四系含水层水量补给充沛,透水性好,所以会容易对矿区的开采造成很大的影响。
因为第四系含水层是非承压的含水层,所以先采用稳定流理论公式进行涌水量的计算。公式如(2)所示。
计算的涌水量为南部试采区,所以根据表3可得含水层平均的厚度为11.17m。引用半径带数值为250m,当第四系的地下水涌入试采区时,含灰层中的水将会被疏通,所以h应该为0m。据资料显示,渗透系数为K=1.47,影响半径为300m,最大涌水量的变化系数是1.5。将这些数据代入稳定流理论公式可得Q(正常)=60m3/h,Q(最大)=93m3/h。
由上可得,正常情况下的涌水量为60m3/h,最大涌水量为93m3/h。当超过正常涌水量时就会容易发生突水水害。
用贝叶斯分类算法进行涌水量的预测,首先要进行突水的概率计算分析,也就是先验概率。表示后验概率,也就是在B已知的情况下A事件表示发生突水的概率,表示的是先验概率,就是A事件本身发生的概率。在这里以往发生突水的概率用A事件表示。涌水量超过正常值用B事件表示。
运用贝叶斯分类算法预测将来会发生突水的概率,公式如下:
本文从大数据介绍,数据挖掘方式,贝叶斯算法简介,涌水量预测四个方式进行介绍。通过贝叶斯算法的先验概率来验证后验概率的性质对水文地质的涌水量进行预测,预测结果为80%,从预测结果来看发生水害的概率很大应提前做好预防措施。