李迎双,李恒凯*
1.江西理工大学土木与测绘工程学院,江西赣州 341000
土地荒漠化是发生在干旱、半干旱及半湿润地区的土地退化过程,当今人类所面临的重大环境与社会问题之一,严重威胁着我国生态安全与经济社会发展[1]。稀土是我国宝贵的战略资源,是很多高精尖产业必不可少的原料。我国离子型稀土资源占世界同类资源的90%,赣南离子型稀土资源就占到全国同类资源的2/3,极具稀缺性和不可替代性[2]。然而,矿产资源开发在促进当地经济发展的同时,也因长期大规模的开发给当地造成了非常严重的土地荒漠化问题。
稀土开采带来的矿区地表荒漠化问题,是一个长期的历史过程,与南方丘陵地区特殊的红壤背景、离子稀土独特的成矿方式以及在不同历史阶段的开采工艺有紧密联系。目前,利用遥感影像对矿区荒漠化进行动态监测已成为区域尺度荒漠化的有效监测评价方式[3-4]。随着遥感数据时空分辨率的提高、数据共享性的增加以及遥感信息处理技术的进一步发展,其在土地荒漠化监测中的应用将更加客观、科学和可靠。近年来,随机森林算法因具有极好的准确率,处理多维数据能力强,训练和预测速度快的特点,已在土地利用分类[5]、病虫害监测[6]、植被生物量计算[7]等方面得到应用,显示出较强的应用潜力。Landsat 卫星系列是迄今持续时间最长的地球监测卫星项目,丰富的数据为研究更大时空范围的矿区地表荒漠化演变过程提供了重大的机遇。基于此,本研究以随机森林算法为基础,提取了1986-2019 年间29 期岭北稀土矿区土地荒漠化信息,并制作了土地荒漠化分类专题数据集,以期为稀土矿区荒漠化演变过程的认知和生态环境治理提供决策支持。
赣南地区位于江西省南部,地形分布以山地、丘陵为主,属于南方丘陵地区,易发生崩塌、滑坡、泥石流等自然地质灾害。同时赣南地区的矿产资源十分丰富,享有“稀土王国”的美誉。南方离子型稀土矿区以定南县岭北地区为主,其位置如图1 所示,其储量达到整个离子型稀土产量的70%,采矿现象极为严重。近30 年来,由于人类对于赣南离子型稀土矿的开发利用,矿区生态环境日益恶化,赣南地区不同矿区的荒漠化程度也发生着明显的变化。2001 年以前,以池浸、堆浸采选工艺为主要方式。该工艺在开采过程中需剥离表土和矿体,容易造成植被退化、水土流失,加上开采规模的不断扩大,矿区、浸池周边堆积的大量废石和尾砂,会导致土地沙化和荒漠化地表;2002 年以后,开采方式主要以原地浸矿为主,该开采方式虽然在一定程度上减少了对生态环境的破坏,但并未从根本上改变开采方式。而且由于不可避免发生浸矿液体泄漏,并产生大量的尾渣、废液,会导致更大范围的生态破坏,植被茂密的山地变成裸露的地表,从而带来水域污染、植被破坏、土地荒漠化等问题[8-9]。
图1 研究区地理位置
本研究采用了1986-2019 年中的29 期Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI 影像,空间分辨率均为30 m。数据来源于地理空间数据云和美国地质勘探局(USGS)官网,表1 为选取长时序变化监测分析影像数据的详细信息。考虑到南方地区常年多云多雨,因此影像采集时间均集中在10 月至次年1 月,时相基本接近,且由于研究区位于南方区域,无明显四季变化,常年植被覆盖,能够确保同类地物光谱一致性。其中1992 年、1998 年、2007 年、2012 年、2015 年因云量和回访周期等因素影响,无合适影像选择。DEM 数据来自于2009 年美国航空航天管理局(NASA)和日本经贸及工业部(METI)共同发布的空间分辨率为30 m 的DEM,与多光谱图像分辨率一致。岭北矿区边界是2010 年赣州市实测的拐点坐标生成的矢量边界。
针对Landsat 系列数据,预处理过程包括:辐射定标、大气校正、几何校正和影像配准。其中大气校正采用的FLAASH 模型;几何校正则采用二次多项式进行校正;影像配准以2013 年的Landsat 8 OLI 影像作为参考,对其他的影像进行配准;最后利用2010 年赣州市实测的拐点坐标生成的岭北矿区矢量边界对Landsat 影像进行剪裁和掩膜,得到研究区的影像。
随机森林算法由Leo Breiman 于2001 年提出,是一种基于Bagging 集成学习理论的分类器,通过训练样本和变量的子集建立一系列决策树,每棵决策树都是一个分类器,对于一个输入样本,N 棵树会有N 个分类结果,而随机森林算法集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出[10]。这种方法不需要先验知识,易于使用,在当前所有算法中,具有极好的准确率,并能容忍一定的噪声和异常值,是一种高效灵活的机器学习算法。本研究基于Landsat 影像和地形特征,选取了光谱特征变量、纹理特征变量以及地形特征变量3 种类型的指标参与分类。实验流程如图2 所示。
1.4.1 特征选择
光谱特征变量分别提取了Landsat 影像的Blue 波段、Red 波段、Green 波段、Nir 波段、Swir 波段,归一化植被指数(Normalized Difference Vegetation Index,NDVI),地表反照率(Albedo)。其中,NDVI 作为指示植被生产力的直接指标,已成为土地荒漠化遥感监测研究中的重要依据[11],如式(1)所示。荒漠化程度逐步加重过程中,地表植被减少,水量降低,裸露表面的粗糙度降低,Albedo 增加。因此,Albedo 可作为反映荒漠化程度的重要参数[12]。Albedo 的计算采用Liang S[13]建立的反演模型完成,如式(2)所示。
图2 数据处理流程图
式(1)和式(2)中:地表反照率为Albedo,ρBlue,ρRed,ρNIR,ρSWIR1,ρSWIR2分别为所选数据的Blue波段、Red 波段、Nir 波段、Swir1 波段、Swir2 波段的反射率,NDVI 为植被指数。
纹理特征变量是利用灰度共生矩阵在原始多光谱数据基础上分别提取图像的纹理特征,包括均值(MEA)、方差(VAR)、同质性(HOM)、对比度(CON)、非相似性(DIS)、熵(ENT)、二阶矩(SM)、相关性(COR)共8 个参数[14],各项指标计算公式如下。通过灰度共生矩阵获得纹理特征量后,采用主成分分析(PCA)获取合适的纹理波段数据,选取信息量在占95%以上的成分作为纹理特征变量。
其中,用Pδ表示灰度共生矩阵,Pδ(i,j)表示矩阵元素,i,j分别为两个像素的灰度,N为图像的灰度级数,δ为两个像素间的位置关系,u为Pδ(i,j)均值,ui、uj表示均值,σi2、σj2表示方差。
高程特征变量是利用GDEM 影像提取的,并利用岭北矿区边界进行剪裁,得到研究区DEM。
1.4.2 建立荒漠化解译标志
荒漠化程度不仅是直接反映土地荒漠化严重程度的指标,也是间接反映和衡量荒漠化土地恢复生产力和恢复生态系统功能难易程度的指标[15]。因此,本实验针对岭北地区地表荒漠化状况,结合水利部组织制定的《南方丘陵山区水土流失综合治理技术标准》(SL757-2014)[16]以及实地调研,利用Google 高分影像确立了不同荒漠化程度的解译标志如表2 所示,并以此为土地荒漠化分级标准进行评价。
表2 稀土矿区土地荒漠化解译标志
1.4.3 样点选取与分类
本实验借助ENVI 平台完成,训练过程如下:①随机抽样训练决策树:从谷歌影像上选取训练样本,如图3 所示。采用bootstrap 方法随机且有放回地从原始样本中抽取N 个训练样本,每次大约抽取原始训练样本的2/3,生成样本集,选择好的样本用来训练决策树,并作为决策树根节点处的样本。②随机选取属性做节点分裂属性:在每棵树生长过程中,决策树的每个节点需要分裂,随机从这M 个特征变量中选取出m 个,满足条件m< 1986-2019 年赣南岭北稀土矿区土地荒漠化数据集共计29 期数据,每期数据以相应的年份命名,总数据量为1.69 MB。空间分辨率均为30 m,投影坐标为UTM 50N,坐标系为WGS1984。2018 年岭北矿区土地荒漠化分级如图4 所示。 本文采用高分辨率数据来评价荒漠化分级数据的质量,从定量角度出发对岭北矿区土地荒漠化分级结果进行精度评价。以2018 年数据为例,在2018 年Google Earth 高分辨率影像上随机选取样点200 个进行精度验证,每种荒漠化土地类型各占50 个。结合不同荒漠化程度的解译标志和影像特征(图3),并以此为真实的土地荒漠化标准进行评价,对岭北矿区荒漠化土地分级情况进行评价验证。建立误差矩阵如下,并计算出分类总体精度和Kappa 系数,来评价荒漠化信息提取的精确度。总体精度表明了每一个随机样本的分类结果与真实地物类型一致的概率,Kappa 系数考虑了混淆矩阵的所有元素,能全面反映总体分类精度,公式如下。 式中:pc为总分类精度;m为分类类别数;N为样本总数。Pkk为第k 类的判对样本数。 式中:K为Kappa 系数;N为总样本数;ppi为某一类所在列总数;pli为某一类所在行总数。 图4 2018 年土地荒漠化分级图 表3 分类精度误差矩阵 按照表3 中的数据计算得,本实验中基于随机森林算法得到的稀土矿区土地荒漠化分级结果总体精度为93%,Kappa 系数为90.67%,满足精度要求。 离子吸附型稀土由于特殊的开采方式及红壤背景,带来矿区大面积土地退化及荒漠化,因此准确了解矿区土地荒漠化发生发展的过程,对于矿区生态治理与恢复至关重要。本数据集以Landsat 影像为主要的数据来源,结合野外调查和Google 高分影像,随机选取样本点验证,以岭北矿区为研究区,制备了1986-2019 年间29 期岭北矿区土地荒漠化数据集。一方面在较大时空尺度上验证了随机森林算法在南方红壤区提取矿区土地荒漠化信息的适用性,另一方面为定量监测和分析矿区荒漠化动态变化特征和规律,以及不同稀土开采模式、管理手段以及复垦措施对矿区土地荒漠化的影响奠定了数据基础。 1986-2019 年岭北矿区土地荒漠化数据集保存格式为TIF,ArcGIS、QGIS、ENVI、ERDAS 等常用的GIS 与遥感软件均支持本数据集的读取和操作。 致 谢 感谢USGS 和地理空间数据云提供Landsat 系列数据。 数据作者分工职责 李迎双(1995—),女,湖北省安陆市人,硕士研究生,研究方向为矿区环境遥感。主要承担工作:数据预处理及土地荒漠化信息提取。 李恒凯(1980—),男,湖北省安陆市人,博士,副教授,主要研究方向为遥感建模与分析。主要承担工作:总体方案设计,数据质量控制,数据论文修改。2 数据样本描述
3 数据质量控制与评估
4 数据价值
5 数据使用方法和建议