郭瑞 董振良 乔鹏举 闫涛 苗壮 田丰
摘 要:針对传统卷积神经网络(CNN)在电磁反演中提取数据特征时冗余信息多,导致网络反演精度降低的问题,提出一种变步长卷积神经网络电磁反演方法,将输入数据拓展为一维行向量,在各层网络中交替使用不同步长的卷积核进行卷积运算提取数据特征,利用变步长卷积方式替代传统网络的池化层,完成对冗余信息的过滤和特征信息的选择,并通过小卷积核级联的方式增大网络感受野提高网络的非线性表达能力。通过二维时域有限差分法(2D-FDTD)对不同电磁参数的富水区模型进行正演计算,并根据计算得出的电场时域响应特征建立样本数据集;将变步长卷积神经网络应用于电磁反演研究,建立适用于富水区问题的变步长卷积神经网络电磁反演模型,并验证变步长卷积神经网络电磁反演方法的精度。结果表明:该方法对坐标位置的反演平均相对误差为2.85%,对相对介电常数的反演平均相对误差为6.07%,反演结果与实际模型吻合度较高。所提方法对提高矿井富水区电磁反演的精度和效率具有一定的理论参考价值。关键词:矿井富水区;电磁探测;电磁反演;卷积神经网络;变步长CNN中图分类号:TD 745
文献标志码:
A
文章编号:1672-9315(2023)06-1186
-09
DOI:10.13800/j.cnki.xakjdxxb.2023.0617开放科学(资源服务)标识码(OSID):
Electromagnetic inversion of mine water-rich area based on CNN
GUO Rui1,DONG Zhenliang2,QIAO Pengju1,YAN Tao1,MIAO Zhuang1,TIAN feng3
(1.China Coal Shaanxi Yulin Energy Chemical Co.,Ltd.,Yulin 719000,China;
2.China Coal Energy Research Institute Co.,Ltd.,Xian 710054,China;
3.College of Communication and Information Engineering,Xian University of Science and Technology,Xian 710054,China)
Abstract:
Aiming at the problem that the traditional convolutional neural network(CNN) has a lot of redundant information when extracting data features in electromagnetic inversion,which leads to the reduction of network inversion accuracy,this paper proposed a variable-step convolutional neural network electromagnetic inversion method.The method expands the input data into a one-dimensional row vector,and alternately uses convolution kernels with different convolution steps in each layer of the network to extract data features.The method is used to replace the pooling layer of the traditional convolutional neural network to complete the filtering of redundant information and the selection of feature information.And the network receptive field is increased by cascading small convolution kernels to improve the nonlinear expression ability of the network.The two-dimensional finite-difference time-domain method(2D-FDTD) is used to calculate the water-rich area model with different electromagnetic parameters,and the sample data set is established according to the calculated electric field time-domain response characteristics.The variable step-size convolutional neural network is applied to establish the electromagnetic inversion model suitable for the problem of water-rich area,and its accuracy is verified.The results show that the average relative error of the method for the inversion of coordinate positions is 2.85%,and for the inversion of relative permittivity is 6.07%,and the inversion results are in good agreement with the actual model.The method has some theoretical reference value for improving the accuracy and efficiency of electromagnetic inversion in water-rich area of mine.
Key words:water-rich area of mine;electromagnetic detection;electromagnetic inversion;convolutional neural network;variable-step CNN
0 引 言
由于中国水文地质条件相对复杂,矿产资源的开发长期以来受到水患灾害的制约和威胁[1-2]。为进一步满足煤矿安全开采的需求,研究新的反演算法对矿井富水区超前探测具有重要意义。电磁探测技术是地球物理勘探的重要手段之一,反演算法是电磁探测数据解释的关键技术,直接影响实际资料的成像效果[3-5]。反演的实质是根据仪器测得的电磁场响应曲线,将曲线与电磁参数进行数学关联,从而推导出合理的模型结构,通常反演如介电常数、电导率、几何结构等参数。电磁反演目前已被广泛应用于地震波探测、电磁波探测、矿产勘测和安全检测等,具有十分重要的意义[6]。国内外研究学者在电磁反演领域进行了一系列研究工作,传统的电磁反演方法包括Occam反演、最小二乘反演、非线性共轭梯度法(NLCG)、采用降维处理技术的快速松弛迭代反演等,这些研究极大地促进了电磁反演技术的发展[7-8]。然而,传统反演计算方法通常采用正则化的计算方法,对于先验模型信息要求相对较高。虽然基于线性关系的传统反演能有效反映异常体的位置、大小以及埋深等相关信息,但其反演精度较低。近年来随着非线性反演方法的兴起,新的理论和研究方法开始蓬勃发展。卷积神经网络(Convolutional Neural Networks,CNN)因其优秀的计算机视觉识别能力而备受广大研究学者的关注[9-11]。目前,CNN在图像、语音处理、自然语言识别等领域已经取得了巨大的成就,但在电磁探测领域的研究尚处于起步阶段[12-15]。由于神经网络是一种复杂的数学模型,具有非常强大的非线性拟合能力,理论上可以拟合任意函数。根据George Cybenko和Kurt Hornik提出的神经网络的万能逼近定理可知,具有足够数量的隐藏神经元的网络可以逼近任意连续函数,即使这个函数是高维非线性函数。这意味着,只要有足够的计算资源与训练数据,就可以使用合适的神经网络来实现高度非线性的电磁场反演建模。PUZYREV V提出一种基于深度全卷积网络的电磁反演新方法,将电场和磁场分量形成的三维阵列数据提供给深度卷积网络,供其学习从测量数据到模型的映射关系,在具有垂直电偶极子的井-地结构的模型上证明了深度神经网络在二维反演中的性能,通过利用足够深的完全卷积网络,可以精确且快速地预测地下电阻率模型[16];XIAO L Y等提出一种双模机器学习方案来重构具有高对比度的非均匀散射体[17];
PUZYREV V和
SWIDINSKY
A针对非线性共轭梯度法在电磁数据反演中容易陷入局部极小值的问题,提出将深度CNN应用于海洋频域可控源电磁(CSEM)数据和陆上时域电磁数据的反演,该方法完全是数据驱动的,不使用传统的基于梯度的技术[18];王青等提出一种通过小波转换将反演参数映射到小波域进行反演的方法,该方法通过对小波域模型进行修正,实现小波推导空间域反演模型[19];XIAO等提出一种基于玻恩近似(BA)和CNN的三维电磁反演方法,在训练阶段,首先利用BA获得一系列形状规则的均匀散射体的初步三维图像,再用蒙特卡罗方法对其进行改进,然后将改进后的图像输入到神经网络模型中进行训练,最后利用训练好的三维U-Net和传统的迭代方法变分玻恩迭代法(VBIM)对形状复杂的非均匀散射体进行重构[20];高明亮等设计一种将BP神经网络和免疫遗传算法进行有机结合的全局优化反演策略,并成功应用于二维高密度电法数据反演[21];廖晓龙等为了提高电磁反演精度,将电阻率和相位数据分别作为CNN的一个分支输入,相应的模型参数作为网络的输出,实现了对地电模型的精准定位[22];嵇艳鞠等为解决半航空探测问题中视电阻率反演精度低、效率慢的问题,通过建立感应电动势和视电阻率单一映射的数据集,采用BP神经网络对样本进行训练,建立神经网络反演模型[23];王鹤等将遗传神经网络引入大地电磁反演当中提高反演的数值稳定性、计算效率及准确度,并通过试验验证了遗传神经网络算法在电磁反演中的可靠性[24]。综上,基于CNN的电磁反演理论,针对电磁响应数据存在冗余信息的特点,引入变步长卷积的方法,通过控制卷积过程中的步长大小,进行信息融合,降低了信息冗余度,并基于此搭建了变步长CNN的电磁反演模型。该模型将输入层的电场时域响应序列通过各层不同步长的卷积核进行卷积运算并提取特征變量,利用变步长卷积方式替代传统池化层,完成对冗余信息的过滤和特征信息的选择,并通过小卷积核级联的方式提高网络的非线性表达能力,网络的输出为反演目标的位置、几何形状及电磁参数信息。该方法有利于提高矿井富水区电磁探测精度,为煤矿的安全开采提供技术支撑。
1 基于神经网络电磁反演方法
1.1 基于卷积神经网络的电磁反演理论
电磁反演研究的目的是根据观测点的电磁响应计算目标的位置、形状及其电磁参数等[25]。利用CNN方法求解电磁反演问题的基本思想是建立一种映射关系,将每一个电场时域响应序列视为图像数据,每一个电场数据视为图像中的一个像素点[26]。因此,将电场时域响应序列作为网络的输入,其对应的反演目标位置、相对介电常数、电阻率等信息作为神经网络的输出,建立基于CNN的电磁反演模型。反演流程如图1所示。
1.1.1 数据集建立首先根据Maxwell方程组建立电磁正演模型。由于矿井中地质构造复杂电磁干扰严重,正演时可以忽略位移电流,且由于煤质为非磁性介质,可设置其相对磁导系数为1。电磁场空间与时间关系的Maxwell方程如下
(12)损失函数Loss以网络自变量为参数,函数值为误差值,用于描绘预测值与真实值之间的误差变化曲线,梯度即损失函数Loss的导数,通过梯度下降,计算损失函数最小值时自变量的对应取值。全局最小值点所对应的参数所代表的曲线与真实数据的分布最为符合,此时可以通过这条最佳曲线拟合真实数据的分布,
进而预测数据集中未出现过的数据。在网络训练中,训练函数由于其本身的特点,选择不同的训练函数会对网络的收敛速度和精度造成不同的影响。对于电磁场反问题,由于其模型较为复杂,训练方式选择不合理将会导致网络陷入局部最小值,收敛速度慢,预测性能降低。
2 富水区电磁反演数值算例在矿井富水区电磁反演问题中,数据集通过二维时域有限差分法进行获取。由于富水区与背景场电性差异比较大,直接通过总场时域响应序列进行神经网络训练,网络难以收敛,训练结果不佳。因此针对电磁反演问题,常用的方法为计算富水区二次响应曲线。为测试基于变步长CNN的电磁反演算法的有效性,建立正演模型如图3所示,入射波频率0.75 GHz,在地面下有一处宽5 m、深度2.5 m的矩形探测区域(ε=3,ρ=200),其中ε为相对介电常数,ρ为电阻率。探测区域内有一边长为d(d=0.2,0.3,0.4,0.5,0.6 m)的富水区,富水区位置在探测区域内进行遍历,其电磁参数未知(ε,ρ)。在地表上方长为4 m的一条直线上,等间距放置5个接收点。
假设富水区边长为d(d=0.2,0.3,0.4,0.5,0.6 m),以探测区域的上表面中点为坐标轴原点建立坐标轴,富水区的左上坐标点为(x,y),富水区在探测区域内以一定步长进行移动从而建立数据样本。假设训练样本的电阻率分别为50,100,150,250,300,400;测试样本的电阻率分别为50,100,150,200,300,400。样本数据集通过改变富水区的大小、位置及电阻率等电磁参数信息,共建立训练样本9 618组,测试样本8 592组,其中选择测试样本的10%用作验证样本。基于所提出的算法,建立基于卷积神经网络电磁反演模型。模型输入为二次场电场响应特征,输出为富水区的位置信息和电阻率。模型包含4层卷积层,交替使用步长为1和步长为3的卷积核进行卷积运算,共有4层全连接层,神经元个数逐层减少。为了验证基于CNN的电磁反演模型是否收敛,给出CNN的损失函数变化曲线,如图4所示。
训练集和验证集的平均绝对误差随着迭代次数的增加逐渐下降,网络逐渐收敛。如图5所示,对部分测试样本的反演结果进行可视化,反演区域大小为5 m×2.5 m,其中图像横坐标x为探测区域的水平位置,纵坐标y为探测区域的深度。
为进一步检验基于变步长CNN的电磁反演精度,在测试集上分别统计不同边长d(d=0.2,0.3,0.4,0.5,0.6 m)的富水区反演的位置和电阻率误
差。其中d=0.2 m的测试样本4 788组,d=0.3 m
的测试样本1 944组,d=0.4 m的测试样本960组,d=0.5 m的测试样本540组,d=0.6 m的测试样本360组,对比结果见表1和表2。
数值试验结果表明,不同边长的富水区坐标位置反演平均绝对误差为0.011,平均相对误差为2.55%。不同边长的富水区电阻率反演平均绝对误差为1.587,平均相对误差为0.91%。
从图5可以看出,CNN预测结果与真实结果基本吻合,基于变步长CNN的电磁反演方法可以有效地对地下富水区的位置信息及电阻率进行反演。
此外,为检验基于变步长CNN的电磁反演方法的反演精度,對所有测试样本进行反演测试。图6为富水区真实电磁参数与反演的电磁参数对比结果。其中,横坐标为测试样本的真实电磁参数,纵坐标为文中所提出方法预测的电磁参数。图6(a)~(d)分别为富水区4个顶点坐标的反演结果与真实结果的对比;图6(e)为富水区的电阻率反演结果与真实结果的对比。从图中可以看到,基于变步长CNN的电磁反演结果中,坐标误差较小而在电阻率误差相对较大。
最后,为了验证变步长CNN算法的精确度,图7为传统CNN与变步长CNN电磁反演方法反演位置误差的对比。
如图7所示,分别计算变步长CNN电磁反演方法和传统CNN电磁反演方法的准确率,当真实坐标与预测坐标的绝对误差小于0.3 m时,基于CNN的反演算法准确率为95.74%,基于变步长CNN电磁算法的准确率为
98.12%;当真实坐标与预测坐标的绝对误差小于0.2 m时,基于CNN的反演算法准确率为83.28%,基于变步长CNN电磁算法的准确率为93.11%。
根据测试数据集的反演结果,通过对传统CNN误差的分析可知,基于变步长CNN的电磁反演方法准确有效,成像精度较传统CNN更高。
3 结 论
1)提出了变步长CNN电磁反演方法,并成功将其应用到矿井富水区的反演问题中。通过设计与训练过程,给出了网络的损失函数、网络结构等参数。试验证明,采用该算法可以准确高效地反演矿井
富水区位置、电导率、相对介电常数等信息。
2)变步长卷积神经网络电磁反演方法在矿井富水区算例验证中,对坐标位置的反演平均相对误差为2.85%,对相对介电常数的反演平均相对误差为6.07%,反演结果与实际模型吻合度较高。
3)通过二维时域有限差分法建立了关于地电模型的时域电磁响应特征数据集,并通过建立CNN电磁反演模型验证了该反演算法。其反演结果是准确有效的,为矿井富水区的反演提供了一种新的解决方法。
参考文献(References):
[1]
吴晓军,赵飞.新疆大南湖七号煤矿首采区水文地质条件研究[J].煤炭科学技术,2018(S2):210-215.WU Xiaojun,ZHAO Fei.Study on hydrogeological conditions in the first mining area of Da Nanhu No.7 coal mine in Xinjiang[J].Coal Science and Technology,2018(S2):210-215.
[2]江志鹏.水文地质工作在矿产资源勘察中的作用分析[J].世界有色金属,2020(18):95-96.JIANG Zhipeng.Analysis on the role of hydrogeology in mineral resources exploration[J].World Nonferrous Metals,2020(18):95-96.[3]王家刚.电磁法超前探测在巷道掘进中的应用现状分析[J].能源与节能,2018(2):16-17.WANG Jiagang.Analysis of application status of electromagnetic method for advanced detection in roadway tunneling[J].Physical and Chemical Exploration,2018(2):16-17.
[4]张鹏.中国煤炭矿井物探技术现状及展望[J].工矿自动化,2017,43(3):20-23.Z
HANG Peng.Status and prospect of coal mine geophysical exploration technology in China[J].Industry and Mine Automation,2017,43(3):20-23.
[5]李云波,李好.礦井瞬变电磁法富水体超前探测及应应用研究[J].矿业安全与环保,2013,40(2):69-72.
LI Yunbo,LI Hao.Principle of advance detection of water-enriched body with Mine transient electromagnetic method and its application[J].Mining Safety and Environmental Protection,2013,40(2):69-72.
[6]杜铃铃.大地电磁测深法在矿山地质构造探测中的应用[J].世界有色金属,2018(22):215-217.DU Lingling.Application of magnetotelluric sounding method in mine geological structure exploration[J].World Nonferrous Metals,2018(22):215-217.
[7]LIANG B,SHEN F,WANG S,et al.Reconstruction of three-dimensional objects in layered composite structures from multimode orbital angular momentum[J].
Physical Review E,2022,105(2):025302.[8]韩晓冰,郭涛,李航,等.基于CFS-PML的高阶有限元在地质雷达数值模拟中的应用研究[J].电波科学学报,2022,37(5):837-843.
HAN Xiaobing,GUO Tao,LI Hang,et al.Application research on CFS-PML-based high-order finite element method in GPR numerical simulation[J].Chinese Journal of Radio Science,2022,37(5):837-843.
[9]GAO C Q,LI X D,
ZHOU F S,et al.Face liveness detection based on the improved CNN with context and texture information[J].Chinese Journal of Electronics,2019,28(6):1092-1098.
[10]缪祥华,单小撤.基于密集连接卷积神经网络的入侵检测技术研究[J].电子与信息学报,2020,42(11):2706-2712.MIAO Xianghua,SHAN Xiaoche.Research on intrusion detection techniques based on densely connected convolutional neural networks[J].Journal of Electronics and Information,2020,42(11):2706-2712.[11]JIN J,GONG J Q.An interference-tolerant fast convergence zeroing neural network for dynamic matrix inversion and its application to mobile manipulator path tracking[J].Alexandria Engineering Journal,2021,60(1):659-669.[12]李新叶,龙慎鹏,朱婧.基于深度神经网络的少样本学习综述[J].计算机应用研究,2020,37(8):2241-2247.LI Xinye,LONG Shenpeng,ZHU Jing.A review of deep neural network-based learning with few samples[J].Computer Application Research,2020,37(8):2241-2247.
[13]李泽宇.基于微波辐射计的大气温湿廓线反演算法及应用研究[D].哈尔滨:哈尔滨工程大学,2018.LI Zeyu.Atmospheric temperature and humidity profile inversion algorithm based on microwave radiometer and application research[D].Harbin:Harbin Engineering University,2018.
[14]孫洲鑫,王文松.深度学习中激活函数权重初始值的选取[J].信息技术与信息化,2020(9):100-102.SUN Zhouxin,WANG Wensong.Selection of initial val-ues of activation function weights in deep learning[J].Information Technology and Informatization,2020(9):100-102.
[15]章琳,袁非牛,张文睿,等.全卷积神经网络研究综述[J].计算机工程与应用,2020,56(1):25-37.ZHANG Lin,
YUAN Feiniu,ZHANG Wenrui,et al.A review of research on fully convolutional neural networks[J].Computer Engineering and Applications,2020,56(1):25-37.
[16]PUZYREV V.Deep learning electromagnetic inversion with convolutional neural networks[J].Geophysical Journal International,2019,218(2):817-832.
[17]XIAO L Y,LI J,HAN F,et al.Dual-module NMM-IEM machine learning for fast electromagnetic inversion of inhomogeneous scatterers with High contrasts and Large electrical dimensions[J].IEEE Transactions on Antennas and Propagation,2020,68(8):6245-6255.[18]PUZYREV V,
SWIDINSKY A.Inversion of 1D frequency-and time-domain electromagnetic data with convolutional neural networks[J].Computers & Geosciences,2021,149:104681.
[19]王青,刘云鹤,殷长春,等.基于模型空间压缩的大地电磁三维反演研究[J].地球物理学报,2019,62(2):752-762.
WANG Qing,LIU Yunhe,YIN Changchun,et al.Research on geomagnetic 3D inversion based on model space compression[J].Journal of Geophysics,2019,62(2):752-762.
[20]XIAO J,LI J,CHEN Y,et al.Fast electromagnetic inversion of inhomogeneous scatterers embedded in layered media by born approximation and 3-D U-Net[J].IEEE Geoscience and Remote Sensing Letters,2019,17(10):1677-1681.[21]李瑞友,张淮清,吴昭.基于在线惯序极限学习机的瞬变电磁非线性反演[J].物探与化探,2021,45(4):1048-1054.LI Ruiyou,ZHANG Huaiqing,WU Zhao.Online sequen-tial extreme learning machine for transient electromagnetic nonlinear inversion[J].Geophysical and Geochemical Exploration,2021,45(4):1048-1054.
[22]廖晓龙,张志厚,姚禹,等.基于卷积神经网络的大地电磁反演[J].中南大学学报(自然科学版),2020,51(9):2546-2557.LIAO Xiaolong,ZHANG Zhihou,YAO Yu,et al.Geomagnetic inversion based on convolutional neural network[J].Journal of Central South University(Natural Science Edition),2020,51(9):2546-2557.
[23]李赓,曹飞翔.基于深度学习的二维航空大地电磁数据反演[J].科学技术与工程,2021,21(4):1272-1278.
LI Geng,CAO Feixiang.Nversion of two-dimensional airborne magnetotelluric data by deep learning[J].Science Technology and Engineening,2021,21(4):1272-1278.
[24]王鹤,刘梦琳,席振铢,等.基于遗传神经网络的大地电磁反演[J].地球物理学报,2018,61(4):1563-1575.
WANG He,LIU Menglin,XI Zhenzhu,et al.Geomagnetic inversion based on genetic neural network[J].Journal of Geophysics,2018,61(4):1563-1575.
[25]甘露,吴庆举,黄清华,等.大地电磁与接收函数结构约束联合反演[J].地球物理学报,2022,65(11):4460-4470.
GAN Lu,WU Qingju,HUANG Qinghua,et al.Structure constrained joint inversion of magnetotelluric data and receiver function[J].Chinese Journal of Geophysics,2022,65(11):4460-4470.
[26]馬琰祁,李伟勤,吴育涵,等.基于CNN-GAN组合模型的可控源电磁反演方法[J].大地测量与地球动力学,2023,43(10):1095-1100.
MA Yanqi,LI Weiqin,WU Yuhan,et al.A controllable source electromagnetic inversion method based on CNN-GAN combinatorial model[J].Journal of Geodesy and Geodynamics,2023,43(10):1095-1100.
[27]韩晓冰,张辉,梁冰洋,等.基于HIE-FDTD方法的太赫兹频段石墨烯吸收器的设计[J].电波科学学报,2022,37(1):106-112,136.
HAN Xiaobing,ZHANG Hui,LIANG Bingyang,et al.Designing graphene absorber in Terahertz band using HIE-FDTD method[J].Chinese Journal of Radio Science,2022,37(1):106-112,136.
[28]葛德彪,闫玉波.电磁波时域有限差分方法(第3版)[M].西安:西安电子科技大学出版社,2011.
(责任编辑:高佳)