刘发发,韩红太,张 敏,麻连伟
(1.河南省地球物理空间信息研究院,河南 郑州 450009;2.河南省地质物探工程技术研究中心,河南 郑州 450009)
矿产资源作为重要的不可再生自然资源,储量极其有限,是社会生产发展的重要物质基础,是国家发展的重要经济命脉[1]。近年来,非法开采屡禁不止,不仅损失资源,还存在重大的安全隐患,随时随地都有可能威胁国家财产和矿工安全。因此,寻找有效控制非法开采的解决办法迫在眉睫。若可以早发现非法开采的迹象,就可将非法开采扼杀在萌芽阶段,从而有效打击非法开采行为,从根上解决非法开采带来的巨大危害。
遥感影像具有宏观性、时效性、大面积覆盖等获取地物直观图的特点[2],从最新时相的遥感影像中及时发现非法开采的行迹,对遏制非法开采至关重要,如何从遥感影像中自动提取露天矿就是关键问题所在。目前,基于遥感影像的矿区提取多依赖人工经验,这影响了排查非法开采矿区的效率,而传统的自动提取方法,大多通过提取诸如光谱、纹理、几何形状等简单特征,或基于像素、或采用面向对象的方法[3-4],其提取精度、准确度均有一定的限制。
近年来,人工智能逐渐在数据挖掘、信息提取中崭露头角[5],而深度学习是人工智能技术最受关注的算法之一[6]。本文将深度学习模型与露天矿的自动提取相结合,利用深度学习从训练样本中学习的大量特征,增加特征提取层数,提高特征抽象程度,进行露天矿的智能提取,提高露天矿的自动化提取精度与效率,为快速找到露天矿、进行后续与管理数据的叠加分析、进而及时发现非法开采,提供准确可靠的数据支撑,为执法部门决策判断提供有效的技术支持。
本文采用深度学习模型进行基于光学遥感影像的露天矿提取。深度学习隶属于人工智能范畴,起源于神经网络,因其网络模型层数多、网络深度更深而得名[7]。神经网络,基于人体视觉学习特征的过程——分层处理,视觉皮层处理较低级的皮层区域特征为简单特征,较高级的皮层区域为复杂特征,且每一级神经元都表现为对上一级特征的选择性(表现在多方面,如方向、空间频率、速度、颜色等),从低级到高级别视觉皮层区域,视觉特征的不变性逐级增加[8]。基于这种视觉处理认知,可从深度学习的角度认识图像语义,即根据人类视觉的各层特征,进行有监督或无监督的学习,建立深度框架来学习层次化语义特征,跨越底层特征与高层语义理解的“语义鸿沟”。
基于深度学习的语义分割算法,目前有2大门类[9]:一类从CNN(Convolutional Networks,卷积神经网络)派生;另一类使用FCN(Fully Convolutional Networks,全卷积神经网络)及其衍生。二者的最大区别在于,后者将网络模型的全连接层改为反卷积层,将特征空间反映射到原始图像,保留空间性,实现端到端的编码—解码,进行影像语义的分割。
本文采用FCN的语义分割模型。FCN 是典型的深度学习语义分割算法[10],FCN网络模型将网络划分为2部分:①第1部分同经典的卷积神经网络一样,通过图像卷积的方式来分层提取特征信息,获得特征空间;②第2部分,不同于CNN网络模型的全连接层,通过反卷积、融合的方式来实现图像语义的分割。全连接层包含大量节点,上下层之间的每个节点均由参数连接,数量极大,同时将导致像素的空间特性的丢失。采用反卷积联合融合的方法可以避免全连接层导致的像素之间位置关系的忽略,充分利用空间关系。
反卷积从特征空间映射到与原图像同样大小,从小变大,类似于从1个像素上采样到4个像素上,就会出现4个像素值如何确定的问题,这也不可避免地导致许多像素位置上出现精度损失的现象。因此,需要将反卷积后的特征图与原图同等大小的反卷积操作之前的特征图进行融合,来解决精度损失的问题。由于反卷积的功能是获得全局特征的,越是下层网络中的特征越能保留更多的局部细节信息(角点、边缘信息),而上层的网络保留的是图像的全局特征信息。因此,采用多次的反卷积操作,将上、下层中不同的信息进一步融合,这样既保证找到的类别信息是准确的,同时也在一定程度上保留边缘位置信息。
技术流程如图1所示。
图1 技术流程
本文选取河南省驻马店市泌阳县典型矿区作为实验区。泌阳县,位于河南省驻马店市西南部,矿藏丰富,东北部有典型矿区。搜集泌阳县2017年多源光学遥感影像数据,经匀光匀色、镶嵌拼接,重采样为分辨率1 m,从东北区域截取大小为2 983×4 424像素,形成如图2所示的试验区。
图2 试验区影像及位置
以露天矿为目标,构建基于光学遥感影像的露天矿样本库。样本库包括样本影像与影像Label图(caffe框架样本标准格式,矿区填充为红色,背景填充为黑色)。首先将已有露天矿矿权业务数据与2017年遥感影像进行叠加分析,人工检查一遍,筛选出备选露天矿区域,经矢量栅格化,将矿区内填充为红色,矿区外填充为黑色,构建样本Label图,影像数据与Label图同步分块裁切为256×256,这样,既可标准化样本,又可增大样本量,完成初步样本库的构建。
采用Caffe框架搭建FCN网络模型,配置文件train.prototxt,val.prototxt,deploy.prototxt,solver.prototxt,修改ImageSets和Label图路径及参数,运行文件solver.py,监控loss曲线,根据结果分析原因,调整参数(学习率、批处理量等)。
样本于实验结果至关重要。好的样本库,能够让模型快速收敛,获取较小的loss值和较高的整体精度。实验的样本更新流程:首先,基于初步构建的样本库,进行网络初步训练,获得caffemodel.model;然后,用获得的初步模型,反过来,对样本库进行分类,得到每个样本的accuracy值,选取accuracy阈值,对低于阈值的分类结果样本,从样本库中剔除,逐样本遍历,更新样本库,总体循环3次,得到更为纯净的样本库,作为最终的网络模型训练输入。
进行深度学习网络测试输出,矿业权业务数据与影像的叠加如图3所示,最终的实验结果如图4所示。
图3 矿区管理数据
图4 深度学习提取矿区图
本文采用的分类精度评价指标为总体分类精度和Kappa系数,搭配二者来反映分类质量的好坏,便于更加客观得对分类结果进行评价。总体分类精度是被正确分类的像元总和与总像元数的比值,是衡量分类结果正确程度的大小。其数学公式为:
(1)
式中,pii为类别i正确分类的像元数;N为像元总数。
Kappa系数表示分类影像与参考影像之间的吻合程度,是检验二者一致性的客观评价标准。其数学公式为:
(2)
式中,ppi为对应制图精度,为类别i真实参考的总像元数;pqi对应用户精度,为经分类器被分类为类别i的总像元数。
实验结果显示,采用FCN模型提取露天矿的方法,提取区域比较完整,不存在太多碎图斑,其总体精度为78.356 2%,Kappa系数为0.743 1。观察实验结果发现,因实验过程中采用样本、图像分块处理,样本边缘空间性质表达不充分,导致提取结果中相邻分块间存在微小缝隙,且部分影响了整体提取矿区区域的完整性。然而,提取矿区片区数目上基本与管理业务数据保持一致,这说明基本所有矿区得到提取,虽然边界的鲁棒性不是很令人满意,对矿区片区均提取到了这点优势,足以说明将该方法运用到辅助发现非法开采的执法行动中的可行性。将提取出来的区域,进行人工筛选,从中排查无开采根据的矿区,将缩减工作量。
将基于深度学习的露天矿提取方法,与传统的机器学习方法SVM算法进行对比实验。SVM(Supported Vector Machines,支持向量机)是传统机器学习算法中最健壮、最准确的方法之一[11],该方法在处理非线性分类问题时,首先在低维空间中完成计算,然后通过核函数将输入空间映射到高维特征空间,最终在高维特征空间中寻找支持向量到超平面间隔最大的最优分离超平面,将2类样本准确分开,保证分类器误差尽可能小,尽可能健壮。实验中,先采用分水岭分割的方法对影像进行分割,面向分割对象,选取光谱(直方图、均值、标准差)、纹理(同质性、对比度、熵)性质作为特征空间基本判断单元,建立样本集,对影像数据进行训练,获得特征空间,利用特征空间完成影像分类。
SVM提取结果如图5所示。
图5 SVM分类结果
与基于深度学习的分类方法相比,SVM分类方法明显效果较差,存在大量的碎图斑,错分、误分率均比较高,本文方法明显优于该方法。
本文采用深度学习FCN语义分割模型,对驻马店市泌阳县东北部分辨率为1 m的三波段遥感影像进行了露天矿区提取,并与基于面向对象的支持向量机分类方法进行了对比。通过分类结果对比分析发现,本文采用的方法能够克服支持向量机分类带来的“椒盐现象”,整体提取区域完整,总体精度和Kappa系数均有一定程度的提高,为露天矿的光学遥感影像自动化提取带来便利。但同时发现,本文采用的方法有一定局限性,如样本区块相邻区域存在很明显的缝隙;另外,训练时间较长,这些都是今后的研究中需要进一步加强和改进的。