闫鹏程,周孟然*,刘启蒙, 张开远,何晨阳
1. 安徽理工大学电气与信息工程学院,安徽 淮南 232001 2. 矿山地质灾害防治与环境保护安徽省重点实验室,安徽 淮南 232001 3. 安徽理工大学地球与环境学院,安徽 淮南 232001
LIF技术与SIMCA算法在煤矿突水水源识别中的研究
闫鹏程1,周孟然1*,刘启蒙2, 3, 张开远1,何晨阳1
1. 安徽理工大学电气与信息工程学院,安徽 淮南 232001 2. 矿山地质灾害防治与环境保护安徽省重点实验室,安徽 淮南 232001 3. 安徽理工大学地球与环境学院,安徽 淮南 232001
煤矿突水水源类型的快速识别对于煤矿水害预警防治意义重大。针对传统水化学方法水源识别耗时较长的问题,提出一种基于激光诱导荧光光谱(LIF)技术与簇类的独立软模式(SIMCA)算法的煤矿突水水源快速识别方法。激光诱导荧光光谱技术具有分析速度快、灵敏度高等特点,在激光器的辅助下,荧光光谱仪实时采集荧光光谱,根据水样的荧光光谱即可进行水源类型识别,在数据库完备的情况下,只需几秒即可进行煤矿水源判断,对于煤矿的水害预警以及灾后救援来说意义重大。实验利用405 nm激光器发射激光,打入被测水体,得到五种常见突水水样的共100组荧光光谱,对各水样的荧光光谱进行光谱预处理。每种水样使用15组共75组荧光光谱作为预测集,剩余的25组水样的荧光光谱作为测试集。利用主成分分析(PCA)分别对五种水样进行建模,而后依据所建模型进行SIMCA分类。实验发现不同水样的荧光光谱差异明显,经过Gaussian-Filter预处理后的荧光光谱,在主成分数为2,显著性程度α=5%的情况下,利用SIMCA算法进行水样分类,预测集和测试集的正确率皆为100%。
煤矿突水;水源识别;激光诱导荧光光谱;簇类的独立软模式;主成分分析
瓦斯、煤尘、水、火和顶板灾害是煤矿五大灾害,根据“十一五”期间全国煤矿水害事故分析报告,“十一五”期间全国煤矿事故发生10 339起,死亡人数16 811人,其中水害事故发生306起,死亡人数1 325人。无论是从事故数量上还是死亡人数上,水害事故均仅次于瓦斯事故,位居煤矿五大灾害第二位[1-3]。水害事故成为威胁煤矿生命财产安全的最主要风险之一,面对水害危害的严重性,迫切需要进行水害预警防治工作。煤矿现场工作不仅需要预防、预测突水,也需要在发生突水后及时对突水来源做出正确判断,这样才能对突水采取有效的治理措施[4-5]。
传统的煤矿突水水源类型识别全部以水化学为基础,以获得离子浓度、pH值、电导率等参数,根据这些参数建立水源类型识别模型[6-11]。一般实验室测量这些参数需要2 h才能完成,对于煤矿水害预警防治来说,耗时过长。
本文提出使用LIF技术结合SIMCA分类法进行煤矿突水水源类型识别。激光诱导荧光光谱分析具有分析速度快、灵敏度高等特点,在激光器的辅助下,荧光光谱仪实时采集荧光光谱,根据水样的荧光光谱即可进行水源类型识别,在数据库完备的情况下,只需几秒即可进行煤矿水源判断,对于煤矿的水害预警以及灾后急救来说意义重大。在光谱技术日益更新的今天,依据LIF技术进行煤矿涌水水源类型识别的重点与难点就在于不同水源的荧光光谱的识别。近年来荧光光谱分析技术开始应用在环境科学、农业生产等方面,SIMCA算法开始应用在烟叶、油脂鉴别方面[12]。本文将LIF技术结合SIMCA算法应用于煤矿突水水源类型识别尚未见诸任何相关文献。
1.1 材料
选取突水事故较为常见的五种水样:奥陶系灰岩岩溶水、煤系砂岩裂隙水、煤系灰岩水、第四系冲积层水和老窑水作为实验对象。于2014年4月15日采集淮南市新集一矿的五种水样,每种水样采集20个样本。所取水样样本皆避光密封存储在棕色玻璃瓶中。
1.2 光谱采集
实验采用仪器为激光诱导荧光光谱仪(USB2000+美国Ocean optics公司),设定入射激光波长405 nm,入射激光功率120 mW,检测荧光光谱范围400~800 nm,分辨率设定为0.5 nm,积分时间设置为1 s/1 000 nm。为达到实验的在线测量目的,为下一步的实际应用做准备,实验探头采用可浸入式激光激发荧光探头(FPB-405-V3广东科思凯公司),可直接放入实验水体进行浸入式接触测量,而不使用比色皿进行采样式非接触测量。为避免背景光影响,荧光探头与存放水样样本的玻璃瓶皆放入暗室进行激光诱导荧光光谱测量。荧光光谱由SpectraSuite软件采集并记录。
1.3 光谱模式识别
光谱识别系统由光谱信号的特征提取、光谱信号的标准特征库和光谱信号的比较识别构成。其分类方法可分为有管理识别方法和无管理识别方法。有管理识别方法需要训练集,其方法包括:LDA法、K最近邻法、神经网络法、SIMCA法和决策树等方法。无管理识别方法不需要训练集,其方法有:主成分分析法、最小生成树法和聚类分析法等。
2.1 波长范围选择
实验时对淮南市新集一矿奥陶系灰岩岩溶水(奥灰水)、煤系砂岩裂隙水(砂岩水)、煤系灰岩水(灰岩水)、第四系冲积层水(冲积层水)和老窑水共五种水样,100个样本进行光谱采样,为减小随机误差,每个样本采样5次,并取平均值,共得到光谱曲线100个,如图1所示。
Fig.1 Original fluorescence spectra of water samples
为了能够比较直观的反映出各水样的荧光光谱差异,对各水样20个样本的光谱数据取平均值,得到各水样的光谱图如图2所示。
由图1和图2可以看出,五种水样的光谱总体趋势分类明显,但是在400~420和670~800 nm波段,五种水样的荧光光谱分布趋于一致,分辨度较小,为了减小数据处理量,提高运算效率和识别精度,将这两段波段删除,只对420~670 nm波段进行数据处理。这时每个样本的数据量即从801点降到501点。
Fig.2 Average spectra of water samples
2.2 数据预处理
为消除噪声,减小误差,以寻找最佳的识别处理方法,对原始光谱进行数据预处理。分别采用correlation optimized warping(COW),median-filter(MF),gaussian-filter(GF),moving-average(MA),standard normal variate(SNV)法对原始光谱进行处理,加上原始光谱,共六种预处理方法。由图3可以看出,前五种预处理方法的去噪效果良好,基本看不出有何差距,而经SNV法处理的光谱却出现了较大的噪声,水样的光谱分类出现模糊。
2.3 PCA建模
鉴于SNV的预处理效果较差,以原始光谱加另外四种预处理方法处理后的光谱进行PCA建模。实验随机选择五种水样的15个样本共75个样本做为训练集,剩余五种水样的5个样本共25个样本做为测试集。
Fig.3 Different preprocessing results of spectra
在420~670 nm范围内,对这75组数据进行主成分分析,各预处理方法皆取7个主成分数,由于第1主成分贡献度极大,因此建模选择主成分数为2,观察累积贡献度,如表1所示。由表1可以看出,在主成分数同为2的情况下,各预处理方法的累积贡献度皆在99.5%以上,其中原始光谱的累积贡献度最低,为99.65%,Moving-Average的累积贡献度最高,为99.86%。因此在主成分数为2时即可较好的表示原始光谱的数据信息。
图4为各预处理方法训练集的第1主成分和第2主成分的得分图。从图4的各图中可以看出,五种水样的聚类效果明显。横向对比各图,在同一坐标系的情况下,COW的聚类效果较差,其次为原始光谱和Median-Filter,聚类效果最好的是Gaussian-Filter和Moving-Average。由各图也可以看出灰岩水和砂岩水距离最近且皆处于第四象限,而灰岩水、砂岩水、冲积层水距离奥灰水皆较远。这可以从地质年代进行解释,灰岩水和砂岩水所处的地层地质年代皆为晚古生代石炭纪,因此其所含物质成分较为接近;冲积层水所处的地层地质年代为新生代第四纪,是地质年代最新的一个纪;奥灰水所处的地层地质年代为早古生代奥陶纪,是所有水样(除老窑水)中,地质年代最古老的一个纪;老窑水与地质年代无关,它是煤矿开采后遗留的采空区被地下水或地表水充满所致,而且由于属于人工工作区域,人为的带入了一些物质成分,因此其水成分构成复杂,这也就造成了各地的老窑水成分相差极大,荧光光谱也各不相同。水样所处地层的不同造成了其所含物质成分的不同,物质成分的不同在荧光光谱上会反映出一定的差异,差异越大,就造成其在空间上的距离也就越大。
由于奥陶系灰岩岩溶水(奥灰水)与煤系灰岩水(灰岩水)皆属于石灰岩水,在水化学分析中分辨困难,常造成误判,而从图2却可以看出,两种水样的荧光光谱图分类明显,从图4也可以看出两种水样的聚类效果明显,且相距较远。
Table 1 Contribution rate of different preprocessing models
Fig.4 Score cluster plot of PC-1 and PC-2 with different preprocessing models
2.4 SIMCA分类
在显著性程度α=5%的情况下,以PCA建模的主成分作为分类模型,用SIMCA法对各水样进行识别。所建立的预测集及测试集的结果如表2所示。
由表2可以看出,不同方法处理后的荧光光谱,识别效果皆较好。预测集分类错误个数最多只有2个(Median-Filter),经Gaussian-Filter处理后的预测集分类全部正确;五种预处理方法的测试集分类正确率全为100%。
Table 2 Result of classification
对同一煤矿不同含水层五种水样的激光诱导荧光光谱数据进行分析,依据光谱曲线特征,舍去部分波段光谱,并对数据进行不同方式的预处理,而后分别进行PCA建模和SIMCA分类。由实验过程可以发现,Gaussian-Filter的整体表现优于其他方法,这也表明首先进行Gaussian-Filter预处理,而后进行PCA建模和SIMCA分类是最佳方法。实验充分证明了LIF技术结合SIMCA识别法在煤矿水源识别中的可行性。
[1] WU Qiang, GUAN En-tai(武 强, 管恩太). Journal of China Coal Society(煤炭学报), 2006, 31(4): 409.
[2] GAO Jian-ning(高建宁). Safety In Coal Mines(煤矿安全), 2013, 44(3): 156.
[3] ZHAO Shan-shan, SUN Jian-hua(赵珊珊, 孙建华). Safety In Coal Mines(煤矿安全), 2009, ?40(4): 127.
[4] YANG Hai-jun, WANG Guang-cai(杨海军, 王广才). Coal Geology & Exploration(煤田地质与勘探), 2012, 40(3): 48.
[5] QIAN Jia-zhong, PAN Jing, ZHAO Wei-dong(钱家忠, 潘 婧, 赵卫东). Systems Engineering-Theory & Practice(系统工程理论与实践), 2011, 31(12): 2425.
[6] LIAN Hui-qing, LIU De-min, YIN Shang-xian(连会青, 刘德民, 尹尚先), Coal Engineering(煤炭工程), 2012, 8: 107.
[7] YAO Jie, TONG Min-ming, LIU Tao(姚 洁, 童敏明, 刘 涛). Safety in Coal Mines(煤矿安全), 2013, 44(2): 29.
[8] LU Jin-tao, LI Xi-bing, GONG Feng-qiang(鲁金涛, 李夕兵, 宫凤强). China Safety Science Journal(中国安全科学学报), 2012, 22(7): 109.
[9] CHEN Hong-jiang, LI Xi-bing, LIU Ai-hua(陈红江, 李夕兵, 刘爱华). Journal of Central South University(Science and Technology)(中南大学学报·自然科学版), 2009, 40(4): 1114.
[10] ZHANG Yang, MA Yun-dong, WU Hao(张 洋, 马云东, 吴 浩). Hydrogeology & Engineering Geology(水文地质工程地质), 2014, 41(4): 32.
[11] WEN Ting-xin, ZHANG Bo, SHAO Liang-shan(温廷新, 张 波, 邵良杉). China Safety Science Journal(中国安全科学学报), 2014, 24(2): 100.
[12] HUANG Yue-hua, FAN Lu, LI Juan(黄月华, 范 璐, 李 娟). Journal of Henan University of Technology(Natural Science Edition)(河南工业大学学报·自然科学版), 2009, 30(5): 13.
*Corresponding author
Research on the Source Identification of Mine Water Inrush Based on LIF Technology and SIMCA Algorithm
YAN Peng-cheng1, ZHOU Meng-ran1*, LIU Qi-meng2, 3, ZHANG Kai-yuan1, HE Chen-yang1
1. College of Electrical and Information Engineering, Anhui University of Science and Technology, Huainan 232001, China
2. Anhui Provincial Key Lab of Geohazards Prevention and Environment Protection, Huainan 232001, China
3. College of Earth and Environment, Anhui University of Science and Technology, Huainan 232001, China
Rapid source identification of mine water inrush is of great significance for early warning and prevention in mine water hazard. According to the problem that traditional chemical methods to identify source takes a long time, put forward a method for rapid source identification of mine water inrush with laser induced fluorescence (LIF) technology and soft independent modeling of class analogy (SIMCA) algorithm. Laser induced fluorescence technology has the characteristics of fast analysis, high sensitivity and so on. With the laser assisted, fluorescence spectrums can be collected real-time by the fluorescence spectrometer. According to the fluorescence spectrums, the type of water samples can be identified. If the database is completed, it takes a few seconds for coal mine water source identification, so it is of great significance for early warning and post-disaster relief in coal mine water disaster. The experiment uses 405 nm laser emission laser into the 5 kinds of water inrush samples and get 100 groups of fluorescence spectrum, and then put all fluorescence spectrums into preprocessing. Use 15 group spectrums of each water inrush samples, a total of 75 group spectrums, as the prediction set, the rest of 25 groups spectrums as the test set. Using principal component analysis (PCA) to modeling the 5 kinds of water samples respectively, and then classify the water samples with SIMCA on the basis of the PCA model. It was found that the fluorescence spectrum are obvious different of different water inrush samples. The fluorescence spectrums after preprocessing of Gaussian-Filter, under the condition of the principal component number is 2 and the significant levelα=5%, the accuracy of prediction set and testing set are all 100% with the SIMCA to classify the water inrush samples.
Mine water inrush; Source identification; Laser induced fluorescence; Soft independent modeling of class analogy; Principal component analysis
Nov. 20, 2014; accepted Feb. 25, 2015)
2014-11-20,
2015-02-25
国家“十二五”科技支撑计划重点项目(2013BAK06B01)和国家自然科学基金项目(51174258)资助
闫鹏程,1988年生,安徽理工大学电气与信息工程学院博士研究生 e-mail: pcyan1988@126.com *通讯联系人 e-mail: mrzhou8521@163.com
O657.3
A
10.3964/j.issn.1000-0593(2016)01-0243-05