韩 磊,何 超,黄 洁,杨显华,田 立
基于GF-2卫星数据的矿山开发信息自动提取
韩 磊1,2,何 超1,2,黄 洁1,2,杨显华1,2,田 立1,2
(1. 稀有稀土战略资源评价与利用四川省重点实验室,成都 610081;2. 四川省地质调查院,成都 610081)
我国高分系列卫星数据因具有重访周期短、价格低廉、精度较高的特点,在矿山开发监测工作中得到了广泛的应用。本文在深入了解高分二号卫星数据特征的基础上,以甘肃永登县为例,利用机器学习模型中支持向量机算法(Support Vector Machine,SVM)自动提取矿山开发信息,在处理的遥感影像上进行样本采集,借Matlab平台对样本及影像数据进行归一化、降维处理(PCA)。利用SVM模型进行信息自动提取过程中,选取径向基核函数(RBF),运用量子粒子群算法进行参数寻优,最终对提取结果进行野外调查。查证结果表明利用SVM模型进行矿山开发信息自动提取是可行的。该研究为国产数据在矿山监测应用中提供了新的思路。
遥感影像;矿山开发信息;自动提取;支持向量机
进入21世纪,随着我国航空卫星的迅猛发展,国产卫星数据逐渐覆盖全国。高分二号卫星的成功发射,标志着我国民用卫星进入亚米级时代,为矿山监测工作提供了可靠的数据源。目前,在矿山活动监测工作中,获取矿山开发信息的主要方式为实地勘测及人机交互解译。实地勘测虽能获得较高的精度和置信度,但具有费用高、工作量大、低效率的缺点;同样人机交互解译也存在因解译人员的水平不同,其质量难以保证。因此,借助遥感技术以及近年来发展较快的人工智能技术,自动提取矿山开发信息,是一项重要的研究趋势。
表1 高分二号卫星有效载荷技术指标
注:资料来源中国资源卫星应用中心网
研究以GF-2卫星数据作为数据源,对其进行系统的预处理。以甘肃省永登县为研究区,通过已有矿山开发资料,进行样本采集,并对影像数据及样本进行归一化、降维处理(PCA)。在SVM模型中,至关重要一点就是选择核函数和参数,通过反复试验,选择径向基核函数及量子粒子群算法进行参数寻优。通过该模型,最终自动提取出矿山开发信息,为矿山开发信息自动提取提出了一种新的技术方法。
永登县地处甘肃中部,兰州市西北部郊区,西南接青海,北通宁夏、内蒙古,是古丝绸之路的门户,亚欧大陆之要冲。该县地形特征可概括为"两河夹三山"形成黄土丘陵区和秦王川盆地。地貌上表现为石质山地与黄土丘陵交错分布。地势位于青藏高原东北部与黄土高原西部过渡地带,也是祁连山支脉东延与陇西沉降盆地间交错的过渡地区。境内山峦重叠,丘陵起伏,河水纵贯[1]。
高分二号卫星作为我国第一颗亚米级光学遥感卫星,具有高定位精度和快速姿态机动能力等特点[2]。其有效载荷技术指标见下表1。
研究区矿山主要为露天开采,开采面所暴露的基岩具有独特的光谱特征,与周围土层及植被覆盖产生强烈的反差。利用这一特点,为矿山开发信息自动提取提供了基础。工作具体流程如下:
1)影像预处理:在自动提取过程中使用的为高分二号Level 1A所获得的各项原始数据,因此要求开展配套的预处理工作,其中主要有大气校正以及几何精校正等多个方面的图像处理,才能作为后续自动提取的数据源。因为矿山开发信息自动提取中重点使用影像光谱信息,因此预处理重点为相关的辐射定标,同时包括波谱响应函数、FLAASH大气校正、几何精矫正及影像融合[3]。
2)ROI采样:查阅前人成果,利用矿山占地为样本,对矿山开发信息的特征进行归纳总结。其中选取SVM样本5703件(包括1140个测试样本),其中感兴趣区样本2114个,非感兴趣区样本3598个。
3)归一化处理:利用图像归一化、图像的不变矩阵来寻找一组参数,从而消除其他变换函数对图像变换的影响。在MATLAB中,图像数据本身是0~255单位数据,因此需要归一化并转换成0-1。同时,为了加快机器学习的速度,对训练样本进行归一化处理,使所有样本的输入信息的平均值接近或小于其平均方差,避免一些过大、过小的参数对预测结果产生较大影响[4]。
4)降维处理(PCA):主成分分析法是图像处理中常用的降维方法,其目的是利用降维思想将多个指标转化为几个综合指标[5]。在研究中,降维处理时,设参数间相关性为97%,根据运算结果,模型中采用前两个主成分(F1、F2)进行分类。
5)支持向量机模型训练:支持向量机(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,该算法在小样本、非线性及高维模式识别具有其独特的优势,与工作区中矿山开发样本特征相符。
图1 量子粒子群参数寻优步骤图
图2 量子粒子群算法寻优结果图
在SVM模型中,至关重要的一点就是选择核函数和参数。对于任意对称函数K(x,y)可在特殊空间表示为内积形式:K(x,y)=充要条件是K(x,y)是半正定的,即òò,为Mercer定理。满足上述定理的函数是可行的SVM核函数。
表2 SVM模型分类结果展示(黑色区域为矿产开发信息)
径向基核函数因为自己具备的相应特征,如区域性等,因此其一般出现在样本数目多的分类问题中,参数要求较低,具有较宽的收敛域,是较为理想的分类函数,故本次研究选取径向基核函数(RBF)[6]。
RBF核函数包含两个参数:惩罚因子和核参数γ,其参数决定了高维映射的形态,直接影响分类精度。惩罚因子能够改变相关算法模型的复杂状况,进而实现样本占比跟复杂状况之间的匹配和调整。值得注意的是,SVM模型的学习训练过程耗时相对较长,提高参数区域内的寻找概率是完成优化的重点思路。对于相关函数参数选定的问题,通常能够借助穷举法、网格法等多样化手段进行,当下广泛运用的一类智能式方法能够对全部参数完成查找,其满足相应的优势性特征,比如量子粒子群算法(PSO)等,因此本文在建立SVM分类模型时,选用量子粒子群算法进行为参数寻优[7]。其具体流程图如下(图1):
将处理后的样本数据进入SVM分类器(在matlab实现),应用量子粒子群算法寻找最大值(最佳适应度)的结果如图2所示,可以发现:在迭代次数达到10左右即选出最佳适应度,说明算法耗时较短,寻优结果良好。
2.5.3模型应用(分类)
将选取5703个样本(包括1140个测试样本),进入SVM分类器(在matlab中实现)。根据运算结果可知,数据分类精度为95.43%,效果客观。将分类结果输出,对比处理后影像,实现矿山开采信息自动提取可视化,结果如表2:
依据上述实验结果来看,基于机器学习模型中支持向量机算法(SVM)进行矿山开发信息自动提取的方法基本达到了预期效果,能够完整地将矿山开发信息提取并展示出来。
为了更好地计算该方法提取的准确性,本次研究对提取的数据进行野外查证。在自动提取结果的基础上,剔除细小图斑的干扰,依据处理后的提取结果采取点、线、面相结合的方法,利用GPS定位,对典型矿山的分布位置进行野外查证。具体情况如下表3。
表3 自动提取结果与野外查证后对比分析表
野外查证表面,基于支持向量机所提取的矿山开发信息边界清晰,位置较为精确,可靠程度高,具有一定的应用价值。根据野外查证分析,自动提取结果中出现错误提取、缺失提取及边界不准的问题主要原因为:①部分区域影像质量一般,矿山开发信息与周围地物反差不够明显;②部分矿山已经废弃,开采面出现风化以及植被覆盖现象,干扰了自动提取的结果。
1)随着我国航空卫星的迅猛发展,国产卫星数据应用越来越广泛。特别是国产高分系列数据,具有较高的空间分辨率,能够将地物的光谱差异精确地展示出来。基于研究区内高分二号卫星数据中,矿山开发信息与周围地物存在较大的光谱差异这一特点,选取合适的信息提取模型,为自动提取所需信息提供了可能,也是对国产卫星数据在矿山监测应用中一次探索。
2)目前矿山遥感监测主要依据人工目视解译,该方法耗时耗力、效率较低,且依赖解译人员的经验。随着人工智能的快速发展,机器学习模型在各个领域开始广泛地应用,将机器学习模型引入到矿山开发信息提取中,能够实现信息的快速自动提取,可节约大部分的人力、物力,具有极高的应用价值。
3)研究基于机器学习模型中支持向量机算法(SVM)进行矿山开发信息自动提取。选取研究区内典型样本,针对样本及影像数据进行归一化、降维处理(PCA),模型选取量子粒子群算法进行参数寻优,应用SVM分类器进行信息提取,最终得到矿山开发信息的自动提取结果。对提取结果剔除细小的干扰图斑,并进行野外调查查明精度。查证结果表明利用SVM模型进行矿山开发信息自动提取是可行的,为国产数据在矿山监测应用中提供了新的思路。
[1] 鲁得方, 董辉. 层次分析法在永登县地质灾害易发性评价中的应用[J]. 甘肃科技纵横, 2013, 42(12): 10-13.
[2] 潘腾, 关晖, 贺玮.“高分二号”卫星遥感技术[J]. 航天返回与遥感, 2015, 36(04): 16-24.
[3] 肖瑶. 高分系列卫星在煤矿区地质灾害监测方面的应用[D]. 合肥工业大学, 2017.
[4] 汤荣志. 数据归一化方法对提升SVM训练效率的研究[D]. 山东师范大学, 2017.
[5] 李瑞光, 臧国轻. 基于主成分分析-支持向量机的土石坝渗流监测数据预测模型[J]. 计算机时代, 2018(06): 5-8.
[6] 刘路民根. 支持向量机径向基核参数优化研究[J] .科学技术创新, 2018(26): 48-49.
[7] 周頔. 基于改进量子粒子群算法的支持向量机参数优化方法[J]. 计算机与现代化, 2018(09): 27-31.
Automatic Extraction of Mine Development Information Based on Gf-2 Satellite Data
HAN Lei1,2HE Chao1,2HUANG Jie1,2YANG Xian-hua1,2TIAN Li1,2
(1-Evaluation and Utilization of Strategic Rare Metals and Rare Earth Resource Key Laboratory of Sichuan Province,Chengdu,Sichuan 610081;2-Geological Survey of Sichuan Province, Chengdu 610081)
Gf series satellite data of China is characterized by short revisiting cycle, low cost and high accuracy, therefore widely applied to mine development monitoring. This study carries out automatic extraction of mine development information of Yongdeng County, Gansu Province with Matlab platform by means of Support Vector Machine based on GF-2 satellite data. The field investigation indicates that the extracted information is reliable.
remote sensing image; mine development information; automatic extraction; Support Vector Machine
2018-10-10
中国地质调查局地质调查项目“全国矿产资源开发环境遥感监测”(121201203000160009);
“全国2017年新增的矿山恢复治理状况监测”(121201003000172718)
韩磊(1983-),男,四川成都人,工程师,主要从事资源环境遥感研究工作
何超(1993-),男,四川成都人,助理工程师,主要从事遥感地质工作
P627
A
1006-0995(2018)04-0689-05
10.3969/j.issn.1006-0995.2018.04.034