基于Landsat的石漠化信息提取方法研究

2024-12-31 00:00:00龙思佳胡向荣亓梦茹戴亮亮张洪潮
河南科技 2024年12期
关键词:面向对象石漠化决策树

摘 要:【目的】对湖南省怀化市辰溪县的石漠化提取方式进行研究分析,为南方丘陵的生态修复提供可靠依据。【方法】基于Landsat-9 OLI影像,结合基岩裸露率和植被覆盖度,构建石漠化分级指标,并利用专家经验决策树和基于向量机的面向对象模型进行石漠化提取,将石漠化程度分为重度、中度、轻度、潜在、无石漠化5个等级。通过真彩色遥感影像、谷歌地球历史影像和野外实地核查进行精度对比。【结果】专家经验的决策树法验证总精度(89%)高于基于向量机的面向对象法的验证总精度(64%),Kappa系数分别为0.852 052和0.530 209。研究区石漠化总体呈轻度,主要分布在东北部。【结论】建议在南方丘陵地区广泛应用专家经验的决策树提取方法,以提高石漠化监测的准确性和实用性。地势陡峭和坡耕地等特征区域应重点关注。

关键词:石漠化;Landsat;决策树;面向对象;混淆矩阵

中图分类号:X171 " " 文献标志码:A " " "文章编号:1003-5168(2024)12-096-08

DOI:10.19968/j.cnki.hnkj.1003-5168.2024.12.020

Research on Extraction Method of Rocky Desertification Information Based on Landsat

——Take Chenxi County as an Example

LONG Sijia HU Xiangrong QI Mengru DAI Liangliang ZHANG Hongchao

(Changsha Natural Resources Comprehensive Survey Center, China Geological Survey, Changsha 410600, China)

Abstract:[Purposes] The author aims to study and analyze the extraction method of rocky desertification in Chenxi County, Huaihua City, Hunan Province, in order to provide a reliable basis for ecological restoration of southern hills. [Methods] Based on Landsat-9 OLI image, combined with the exposure rate of bedrock and vegetation coverage, the rocky desertification classification index was constructed, and the expert experience decision tree and object-oriented model based on vector machine were used to extract rocky desertification, and the degree of rocky desertification was divided into five levels: severe, moderate, mild, potential and no rocky desertification. The accuracy was compared by true color remote sensing image, Google Earth historical image and field check. [Findings] The total validation accuracy of expert experience decision tree method (89%) was higher than that of vector machine-based object-oriented method (64%), with Kappa coefficients of 0.852 052 and 0.530 209, respectively. The rocky desertification was generally mild and mainly distributed in the northeastern part of the study area. [Conclusions] The study suggests that the decision tree extraction method based on expert experience should be widely applied in the hilly areas of South China to improve the accuracy and practicability of rocky desertification monitoring, and the characteristic areas such as steep terrain and sloping farmland should be paid more attention.

Keywords: rocky desertification; landsat; decision tree; object-oriented; confusion matrix

0 引言

石漠化自古以来就是我国西南地区严重且典型的生态环境问题,据文献可追溯到明朝的徐霞客撰写的《徐霞客游记》[1]。石漠化的实质是植被退化丧失、土壤侵蚀、地表水流失、基岩溶解和土地生物生产力的降低结合在一起,导致土地退化所生成的产物[2]。碳酸盐岩的低成土率和高渗透性造就了岩溶地带易于形成石漠化的特性,频繁的人类活动干扰是石漠化形成的根本原因[3]。

石漠化提取的影响因素较多,近年来石漠化的提取方式层出不穷。国内外学者基于多源数据,在算法模型及构建特征空间等方面有较多的研究,但并没有形成较为统一的石漠化提取体系。Pu等[4]基于不同算法及数据源研究得出随机森林法(RF)优于袋装决策树(BDT)和极度随机树(ERT);Xu等[5]为在区域尺度上提取石漠化信息,基于ETM图像利用Enhanced Thematic Mapper Plus开发了一种基于对象的支持向量机(SVM)耦合方法,取得了良好的结果;Cai等[6]基于Landsat 8的SWIR、Red和NIR波段构建了二维SWIR-NIR、Red-NIR和SWIR-Red反射光谱特征空间,得出垂直石漠化指数1(PRDI1)提取效果最佳;Tan等[7]基于土地覆盖样本的光谱统计和可分离性分析得出光谱指数归一化差值氧化铁指数(NDIOI)、归一化反射率范围指数(NRRI)、归一化差异红砂砾岩和砂岩指数(NDGI)等,使用空间决策规则构建决策树进行分类也得到了令人满意的结果。

由于Landsat[8]系列卫星影像时间回溯长且数据较全,可为南方丘陵区大面积石漠化时空变化研究提供更全面的参考。因此,本研究基于Landsat-9 OLI影像,利用植被覆盖度和基岩裸露率因子构建石漠化指标体系,引进基于专家经验的决策树和基于向量机的面向对象等提取方法进行对比研究,选出最优提取方法,研究的新颖之处在于将传统的专家经验提取与决策树融合,提高分类精度,使分类效率得到极大提升。

1 研究区概况及数据来源

1.1 研究区概况

选取湖南省怀化市辰溪县北部石漠化典型区(110°25′15″E~110°3′20″E,28°13′9″N~27°47′50″N)为研究区(如图1所示)。由船溪乡、田湾镇、孝坪镇、辰阳镇等10个石漠化典型乡镇[9]组成,总面积约为914 km2,占辰溪县总面积的46 %。辰溪县位于湖南省西北部,地处湘西山区和湘南平原的过渡地带,区内地形起伏较大,属于闽江、珠江流域交汇的新化河流域,地势由西北向东南逐渐升高,山地、丘陵和平原分布格局复杂多样,最高海拔为976 m。区内主要土地利用类型以灌木林地为主,其次为耕地。研究区属于亚热带季风气候,年平均气温为16~18 ℃,年降水量为1 100~1 300 mm。

1.2 数据来源

本研究使用2022年10月18日Landsat-9 OLI影像数据,数据来源于美国地质调查局(USGS)官网(https://earthexplorer.usgs.gov/),云量0.15%,空间分辨率30 m。数字高程模型(DEM)数据来源于美国国家航空航天局(NASA)分布式活动档案中心网站(https://search.asf.alaska.edu/#/),空间分辨率12.5 m。土地利用数据来源于Google Earth Engine平台1985—2020年全球30 m精细地表覆盖动态监测产品GLC_FCS30-1985_2020。岩溶区数据来源于中国科学院航空遥感中心。

2 研究方法

2.1 石漠化指标提取

由于植被覆盖和岩石裸露情况是区分岩溶地带石漠化等级最直观的地表覆盖现象,因此将植被覆盖度(VCF)和基岩裸露率(BFR)两大重要指标作为本研究的基础指标。本研究利用李苗苗等[10]的像元二分模型对植被覆盖度进行提取,基岩裸露率的提取则借鉴张晓伦等[11]的NDRI模型,计算方法及公式见表1。

表1 石漠化指标提取公式

[指标

公式 NDVI

(归一化植被指数) [NDVI=(NIR−RED)/(NIR+RED)] VCF

(植被覆盖度) [VCF=(NDVI−NDVISOIL)/(NDVIveg−NDVISOIL)] NDRI

(归一化岩石指数) [NDRI=(SWIR2−NIR)/(SWIR2+NIR)] BFR(基岩裸露率) [BFR=(NDRI−NDRISOIL)/(NDRIveg−NDRISOIL)] 注:[NIR]、[RED]、[SWIR2 ]分别代表Lansat-9 OLI影像的band5、band4、band7。

[NDVIveg]指完全由植被所覆盖的像元值,[NDVISOIL]指完全由泥土所覆盖的像元值。

[NDRIveg]指完全由裸露岩石所组成的值,[NDRISOIL]指完全由无裸露岩石组成的值。 ]

2.2 石漠化分级指标体系构建

本研究石漠化等级划分标准基于LY/T 1840—2020《喀斯特地区植被恢复技术规程》[12]。通过实地考察充分了解石漠化现状,并考虑到岩溶区和土地利用类型分布情况,以数据可获取性、地域性、系统性为依据,结合前人的岩溶区石漠化分级评价指标体系,选取植被覆盖度(VCF)、基岩裸露率(BFR)两个指标作为主要提取因子,将石漠化程度划分为5个等级:无石漠化、潜在石漠化、轻度石漠化、中度石漠化、重度石漠化(见表2)。

表2 石漠化分类等级表

单位:%

[植被覆盖度 基岩裸露率 lt;20 20~30 30~50 50~70 gt;70 gt;70 NORD NORD QZRD QZRD QZRD 50~70 NORD QZRD QZRD QZRD QDRD 30~50 QZRD QZRD QDRD QDRD QDRD 20~30 QZRD QZRD QDRD ZDRD ZDRD lt;20 QZRD QZRD QDRD ZDRD SDRD 注:NORD:无石漠化,QZRD:潜在石漠化,QDRD:轻度石漠化,ZDRD:中度石漠化,SDRD:重度石漠化。 ]

2.3 解译标志建立

支持向量机的面向对象提取需要进行样本训练,所提取的样本要通过建立解译标志对照提取,训练样本的精度对分类结果有决定性影响。因此,本研究通过查阅文献资料、野外实地调查,结合Google Earth影像、Landsat影像,建立5个等级石漠化解译标志。由于石漠化区域和裸土光谱特征相近[13],为更好地区分轻度与中度石漠化,提高训练样本的精度,对石漠化典型区域进行实地观察并与基岩裸露率做参照对比,最终建立解译标志见表3。

2.4 提取方法

决策树[14]分类是一种基于树结构的监督学习算法,用于对分类问题进行建模和预测。该算法基于一系列的决策规则,通过对数据集进行递归划分,构建一个树形结构来表示分类模型,其本质就是基于构建的分类规则将多个特征指标的影像特征进行逐层剥离,然后基于分类特征进行归类,从而达到对图层影像进行分类的目的。它具有许多传统监督分类没有的优势,比如严格而非参数的性质,以及结构明确易于解释等。

面向对象[15]是一种不仅局限于单个像元,同时考虑到邻近像元的光谱特征和空间特征的分类算法。这种算法主要由影像的分割和信息提取两个部分组成,是通过不同的尺度分割将影像分割成大小各异,且光谱及空间特征有一定规律的各个独立区域的过程。基于这种特征规律建立分割对象和划分类别之间的关系,在建立了类别的对象的基础上,结合基于统计学的机器学习方法支持向量机(SVM)[16],从分割对象中基于拟合的超平面中的多维特征分离空间中分离出最好的两类,实现最佳分离的决策曲面。其优势在于ENVI的支持向量机加入惩罚参数,允许一定程度的误分类,这使得模型在训练误差和强制刚性边界之间有了权衡。本研究技术路线见图2。

3 结果与分析

3.1 石漠化信息提取结果

根据表1中的公式,分别计算植被覆盖度和基岩裸露率因子,结果如图 3所示。

基于决策树分类原理,利用ENVI5.3 tree工具,构建分类模型,具体分类模型如图4所示,其中C为植被覆盖度,R为基岩裸露率。将提取的植被覆盖度和基岩裸露率代入分类模型,得到石漠化分级如图5(a)所示。支持向量机方法提取石漠化信息主要在ENVI5.3中处理,进行主成分分析,选取贡献值最高的波段进行逆向主成分分析,将数据利用Example Based Feature Extraction Workflow工具按分割合并尺度10-10进行处理,对结果进行训练样本采集,代入到SVM模型中,运行输出结果。利用ArcGIS平台,剔除非岩溶区域,并将水体、水浇地和建筑用地等干扰因子掩膜,得到最终研究区石漠化分布如图5(b)所示。

3.2 结果分析

基于专家经验的决策树石漠化信息提取结果中无石漠化(NORD)、潜在石漠化(QZRD)、轻度石漠化(QDRD)、中度石漠化(ZDRD)、重度石漠化(SDRD)5个等级的面积分别为217.61 km2、139.72 km2、40.06 km2、6.38 km2、4.11 km2,NORD和QZRD占石漠化总比87%,QDRD、ZDRD和SDRD占总比13%,SDRD仅占1%。研究区石漠化呈现总体较轻,局部较为严重的现象,根据野外实地调查分析可得,石漠化严重地区地势坡度大于25°,处于典型的岩溶地带,易于侵蚀且水土保持能力极差;当地矿石开采较多,虽大多数已关闭,但已形成岩石裸露的地区短期难以修复;尖锐的人地矛盾,使得当地陷入耕种-土地退化-扩大耕种-土地退化的恶性循环,大部分石漠化严重区域为坡耕地,近年来调整坡耕地耕种结构,大面积种植橘子树。基于专家经验的决策树和基于向量机的面向对象提取石漠化面积分布见表4。

从两种提取方式的结果来看,中度和重度石漠化区大多集中在辰阳镇东北部,石漠化现象易于形成和恶化的土地类型为坡地。基于专家经验的决策树和基于向量机的面向对象所提取的重度石漠化分布位置和面积较为相近,分别为4.11 km2和7.71 km2。二者无石漠化的分布位置和面积相差较大,面积分别为217.61 km2和126.67 km2,如图6所示。

3.3 精度评价

精度评价主要从野外实地验证和混淆矩阵两种不同角度进行精度验证。按照分级类型全覆盖性、样点均匀性、实际可到达性、典型性的原则,根据石漠化分布情况,以500 "m为间距,在典型区域密集布设,贯通整个研究区,共计77个样点,野外验证样点布设如图7所示。根据表3解译标志进行野外验证,其中正确样点68个,错分误分样点9个,总精度为88%。

本研究利用混淆矩阵[17]分别对两种提取方式进行精度评价。验证样本将目视解译和野外验证样本相结合,用ArcGIS随机生成142个样点,与野外验证的77个样点合并共计219个验证样点,参照同期Google Earth影像图,生成误差矩阵,计算各个类别的用户精度、生产精度、总体精度和kappa系数。基于专家经验的决策树石漠化提取精度见表5,基于向量机的面向对象石漠化提取见表6。

基于专家经验的决策树法实际验证总精度为89%,kappa系数0.852 052;基于向量机的面向对象法实际验证总精度为64%,kappa系数0.530 209。当Kappalt;0.4时,分类精度差;当0.4≤Kappa≤0.8分类精度中等时;当Kappagt;0.8分类精度高时[18],基于专家经验的决策树提取精度远高于基于向量机的面向对象法,符合数学要求。

基于专家经验的决策树较基于向量机的面向对象提取法更为稳定。基于向量机的面向对象法过于依赖训练对象样本,目视提取主观性强,且受分辨率限制,Landsat影像目视解译误差较大。从野外验证和混淆矩阵精度评价来看,采用Landsat影像提取石漠化信息的两种方法中,基于专家经验决策树提取精度高于基于向量机的面向对象提取,因此该提取方式适用性和稳定性更高,可以在南方丘陵山石漠化地区进行推广应用。

4 结论

①构建了一种基于专家经验的决策树模型。基于专家经验的20%、30%、50%、70%为阈值的模型,将石漠化分为无石漠化(NORD)、潜在石漠化(QZRD)、轻度石漠化(QDRD)、中度石漠化(ZDRD)、重度石漠化(SDRD)5个等级,构建了决策树分类规则,将传统的专家经验提取方式与决策树分类融合,构建了基于专家经验的决策树模型。

②对比两种提取方法优劣。基于专家经验的决策树石漠化信息实际验证总精度为89%,kappa系数达到0.852 052;基于向量机的面向对象石漠化信息实际验证总精度为64%,kappa系数为0.530 209。基于向量机的面向对象提取过于依赖训练对象样本,Landsat影像目视解译误差较大,基于专家经验的决策树提取方式适用性和稳定性更高。

③基于专家经验决策树信息提取结果分析。基于专家经验的决策树石漠化信息提取结果中占比最大为无石漠化(NORD),面积为217.61 km2,重度(SDRD)和中度(ZDRD)的面积分别为139.72 km2、40.06 km2,NORD和QZRD占比为87%,QDRD、ZDRD和SDRD占比为13%,研究区石漠化呈现总体较轻,局部较为严重的现象,严重区域主要分布在辰阳镇东北部。根据野外实地调查分析可知,严重地区地势坡度大于25°,处于典型的岩溶地带,易于侵蚀且水土保持能力极差;当地矿石开采较多,虽大多数已关闭,但已形成岩石裸露的地区短期难以修复。大部分石漠化严重区域为坡耕地,近年来调整坡耕地耕种结构,大面积种植橘子树,能有效缓解当地石漠化程度加重的趋势。

参考文献:

[1]徐弘祖. 徐霞客游记[ M]. 唐云校注. 成都 :成都出版社 ,1995.

[2]LI S, WEI X H, HUANG J G, et al. The causes and processes responsible for rocky desertification in karst areas of southern China[J]. Sciences in Cold and Arid Regions, 2009, 1(1): 80-90.

[3]JIANG Z, LIAN Y, QIN X. Rocky desertification in Southwest China: Impacts, causes, and restoration[J]. Earth-Science Reviews, 2014, 132: 1-12.

[4]PU J,ZHAO X, DONG P,et al. Extracting information on rocky desertification from satellite images: a comparative study[J]. Remote Sensing,2021,13(13),2497.

[5]XU E Q, ZHANG H Q, LI M X. Object‐based mapping of karst rocky desertification using a support vector machine[J]. Land Degradation amp; Development, 2015, 26(2): 158-167.

[6]CAI J, YU W, FANG Q, et al. Extraction of rocky desertification information in the karst area based on the red-nir-swir spectral feature space[J]. Remote Sensing, 2023, 15(12): 3056.

[7]TAN H, XIE X, SUN J, et al. A multi-scale classification method for rocky desertification mapping in the red-bed area of northwestern, Jiangxi, China[J]. Geocarto International, 2023, 38(1): 2190623.

[8]JIANG G Z, HAN B, GAO Y B, et al. Review of 40-year earth observation with Landsat series and prospects of LDCM[J]. Journal of Remote Sensing, 2013, 17(5): 1033-1048.

[9]黄鹏飞.辰溪县石漠化治理现状与对策[J].湖南林业科技,2006,33(4):74-75.

[10]李苗苗. 植被覆盖度的遥感估算方法研究[D].北京:中国科学院研究生院(遥感应用研究所),2003.

[11]张晓伦,甘淑. 基于NDRI像元二分模型的石漠化信息提取研究[J]. 新技术新工艺,2014(1):72-75.

[12]全国防沙治沙标准化技术委员会:喀斯特地区植被恢复技术规程:LY/T 1840-2020[S].北京:中国标准出版社,2020.

[13]王跃跃. 基于多源数据的石漠化信息提取及地质驱动因素研究[D].贵阳;贵州大学,2019.

[14]FRIEDL M A, BRODLEY C E. Decision tree classification of land cover from remotely sensed data[J]. Remote Sensing of Environment, 1997, 61(3):399-409.

[15]彭望琭,刘湘,刘慧平,等.遥感导论[M].北京:高等教育出版社,2021.5.

[16]FAUVEL M, BENEDIKTSSON A, CHANUSSOT J ,et al. Spectral and spatial classification of hyperspectral data using SVMs and morphological profiles[J]. IEEE Transaction on Geoscience and Remote Sensing,2008,46(11), 3804-3814.

[17]廖娟.基于全极化SAR数据的喀斯特地区石漠化遥感监测技术研究[D].贵阳:贵州师范大学,2016.

[18]易辉.基于SPOT5的四川省丘陵区林地遥感分类方法研究[D].雅安:四川农业大学,2013.

猜你喜欢
面向对象石漠化决策树
贵州省北盘江流域喀斯特石漠化变化特征及治理成效分析
云南省石漠化土地利用现状分析与评价
一种针对不均衡数据集的SVM决策树算法
典型岩溶区不同水土流失强度区石漠化特征分析
面向对象的计算机网络设计软件系统的开发
电子测试(2018年15期)2018-09-26 06:01:34
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
面向对象的数据交换协议研究与应用
基于决策树的出租车乘客出行目的识别
石漠化治理存在问题及对策——以广西为例
学术论坛(2016年5期)2016-05-17 05:44:46
面向对象Web开发编程语言的的评估方法