摘要:【目的】为发挥不同单分类器各自的优势进而采用集成学习方式提高土地覆盖分类精度,据此比较不同土地覆盖变化模拟模型性能从而执行最优的土地覆盖变化预测,为土地资源合理开发与利用决策制定提供参考。【方法】基于南京市江宁区2000、2010和2020年的Landsat TM/OLI影像,结合研究区实际定义了水体、建筑、林地、草地、耕地和未利用地等6种土地覆盖分类体系,在测试了最大似然法、马氏距离法、最小距离法、神经网络和支持向量机等基分类器性能基础上,采用随机森林和证据理论2种不同的集成学习方法对5种基分类器的分类结果进行集成,比较了集成性能后构建了最终的土地覆盖分类结果。然后,基于2000和2010年的最优集成土地覆盖分类图,运用CA-Markov、PLUS和ANN-CA模型分别对2020年研究区的土地覆盖格局进行模拟,并将不同的模拟结果与2020年真实集成分类结果进行了空间一致性检验,以此确定土地覆盖变化预测的最佳模型并用其预测2030年江宁区的土地覆盖模式。【结果】在单分类器分类结果中,2000年支持向量机算法取得了最佳分类效果,总体精度达到了88.75%,Kappa系数为0.77;2010年神经网络方法表现最佳,总体精度为88.75%,Kappa系数为0.83;2020年最大似然法取得了最佳分类效果,总体精度为82.75%,Kappa系数为0.74。在2种集成方法中,随机森林在2000年取得了最佳集成分类效果,总体精度和Kappa系数分别为91.25%和0.85;证据理论在2010年取得了最佳集成效果,总体精度和Kappa系数分别为90.80%和0.86;随机森林在2020年取得了最佳集成效果,总体精度和Kappa系数分别为93.75%和0.91。就土地覆盖预测而言,PLUS模型获得了98.54%的空间一致性。根据PLUS模型预测2030年土地覆盖结果可知,江宁区各土地覆盖类型变化较小,建设用地略有扩张但范围有限,耕地稍减少但在可控范围内。林地、草地和未利用地变化较小,水体面积相对减少。【结论】恰当的集成策略能明显改进土地覆盖分类精度,合适的、适应局部土地利用状态和政策调控的预测模型可有效预测区域未来土地覆盖分布模式,它们能为区域土地利用、城市管理决策等提供更可靠的方法和数据支持。
关键词:Landsat 影像;地表特征;土地覆盖分类;集成学习;土地覆盖变化模拟
中图分类号:S73;TP75"""""" 文献标志码:A开放科学(资源服务)标识码(OSID):
文章编号:1000-2006(2024)05-0255-12
Land cover classification and prediction based on multiple classifier ensemble learning
JIANG Lufan1, SU Huiyi1, ZHANG Yin1, LIU Qinqin1, ZHANG Xiaowei2, LI Mingshi1
(1. Co-Innovation Center for Sustainable Forestry in Southern China, College of Forestry and Grassland, Nanjing Forestry University, Nanjing 210037, China; 2. Zhejiang Forest Resources Monitoring Centre, Zhejiang Forestry Survey Planning and Design Company Limited, Hangzhou 310020, China)
Abstract: 【Objective】This study aims to exert the" respective advantages of individual base classifiers, different ensemble learning strategies were tested in the present study to improve the final land cover classification accuracy. On this basis, different land cover change simulation models were implemented and compared to obtain more accurate land cover projection results to provide references for formulating decisions of rational development and utilization of land resources in the future.【Method】Based on the Landsat Thematic Mapper (TM)/Operational Land Imager (OLI) images acquired in 2000, 2010" and 2020 covering Jiangning District of Nanjing City, the classification scheme, including water body, built-up land, forest land, grass land, crop land" and unused land, was defined by referring to relevant industry standards and the actual conditions of the study area. The land cover classification performances of five base classifiers, including the Maximum Likelihood Classifier, Mahalanobis Distance Classifier, Minimum Distance Classifier, Neural Network, and Support Vector Machine(SVM) Classifiers, were implemented and quantitatively evaluated, followed by an integrated combination of the five individual classification results using the" random forest algorithm and Dempster-Shafer (D-S) evidence theory. The final integrated classifications in 2000, 2010" and 2020 with higher overall accuracy were created after comparing the respective ensemble performances of the two algorithms. Based on the optimal integrated land cover classification maps in 2000 and 2010, the cellular automata (CA)-Markov model, PLUS model, and artificial neural network (ANN)-CA model were used to predict the land cover pattern of 2020 in the study area, and the prediction results of different models were compared with the real integrated classification results in 2020 to derive a spatial agreement index, determine the best model for land cover change simulation, and generate the projected land cover pattern of 2030 in Jiangning District.【Result】An independent validation showed that for a single base classifier, SVM algorithm achieved the best classification effect in 2000, with an overall accuracy at 88.75% and a Kappa coefficient of 0.77. In 2010, the neural network algorithm obtained the best classification effect, with an overall accuracy of 88.75% and a Kappa coefficient of 0.83. In 2020, the maximum likelihood algorithm had the best classification effect, with an overall accuracy of 82.75% and a Kappa coefficient of 0.74. Regarding the two ensemble methods, the random forest algorithm achieved the best integrated classification effect in 2000, with an overall accuracy of 91.25% and a Kappa coefficient of 0.85. The evidence theory process achieved the best integrated classification effect in 2010, with an overall accuracy and Kappa coefficient of 90.80% and 0.86, respectively. Moreover, the random forest algorithm achieved the best integrated classification effect in 2020, with an overall accuracy and Kappa coefficient of 93.75% and 0.91, respectively. Regarding land cover prediction, the PLUS model obtained a spatial agreement measure of 98.54%, outperforming the CA-Markov and ANN-CA models.According to the optimal prediction results in 2030 made by the PLUS model, there was a slight expansion of built-up land, but the extent was limited. The areal reduction in cropland was observed but within a controllable range. The changes in forest, grassland, and unused land were slight, while the water body was decreased.【Conclusion】Overall, the present study demonstrated that proper assemble learning strategies produce more accurate land cover classifications in contrast to a single base classifier. In addition, a suitable land cover change prediction or simulation model that adapts to local land use status and policy regulations effectively predicts the future land cover classification pattern. Thus, these strategies provide more reliable methods and data support for the development of land use and urban management decisions.
Keywords:Landsat imagery; surface features; land cover classification; assemble learning; land cover change simulation
土地覆盖变化的方向和强度对城市规划[1]、土地管理[2]、环境保护[3]和农业估产[4]等具有基础性的支撑作用,其客观体现了综合土地利用模式和一般自然特征,对人类社会的可持续发展具有重要指示意义[5]。利用精准、时效性强的土地覆盖数据,监管部门能够更清晰地认识和评估土地资源利用现状,从而制定出更有效、更有针对性的保护方案[6]。
传统的土地覆盖分类主要依赖人工实地调查,此方法费时费力且时效性差,已无法满足当今大范围土地资源的调查需求。基于计算机遥感图像分类算法进行土地覆盖分类能够显著提高大地域土地覆盖分类效率及分类结果时效性。目前主流算法包括基于经典统计理论的最小距离法[7]、最大似然法等[8],基于机器学习的支持向量机[9]、决策树[10]和神经网络[11]等。然而由于先验知识缺乏、空间信息抽取能力不足、模型复杂度及训练数据不够完善等因素[12],这些方法在一定程度上容易造成错分、漏分的现象,导致分类精度不总能满足实际应用需求[13]。近年来,随着深度学习的发展,其在遥感影像分类领域得到了一定程度的应用[14-16]。但深度学习算法具有需要大量标注训练数据、结果可解释性低、算法执行对计算机硬件要求高以及对操作者的技术挑战度高等缺陷[17],如何将之更科学合理应用于土地覆盖遥感分类领域还需进一步探索。
然而,基于多个分类器结果的集成学习已成为提高影像分类精度的一种有效解决方案[18]。集成学习通常是基于现有分类算法的分类结果,采用一定的组合策略对某一像元的类别归属做出共同的决定,从而达到最终分类效果大幅提升的目的[19]。比如,夏俊士等[20]详细说明了多分类器组合方案:集成后的分类器因结合了单分类器的优势,突破了单一分类器精度与效率方面的局限,提高了分类结果的准确性。王震[21]以Landsat OLI影像数据为基础,使用基于样本聚类的分类器筛选方法,筛选出用于集成的个体分类器,并将其与投票法、最大概率类别法和意见一致性原则3种集成策略进行组合,形成一体化分类框架。实验证明集成后分类器的分类精度要比单分类器的分类精度更高。龙飞等[22]基于高分二号遥感影像,
结合马氏距离法、最大似然法和支持向量机3种分类方法,通过Dempster Shafer工具实现多分类器集成,对夹岩水利枢纽工程项目建设核心区进行土地覆盖分类研究。Kumar等[23]研究表明,用于提取高光谱图像的分层集成方法不仅产生了更优越的分类结果,而且高度的自动化。Isaac等[24]使用Adaboosted Random Forest(ABRF)对多光谱卫星或航空影像进行土地覆盖分类研究,并通过优化某一阶段,以达到最佳性能。目前,有关多分类器集成的研究主要集中在:添加辅助信息的分类方法、改进的集成分类算法以及集成学习过程中权重选择的不同方法等方面,不同集成策略在不同区域的应用中的性能如何并未有统一的结论。
随着城市化进程的加快和居民生活水平的提升,土地资源承受了巨大的压力,并引发了一系列生态环境问题[25]。为此,对土地覆盖模式进行模拟及预测不仅可以探索土地覆盖的规律和趋势,还能为未来土地资源的合理利用、生态环境保护以及政府决策提供合理的数据支撑和科学的参考依据[26]。
因此,本研究以江苏省南京市江宁区Landsat TM/OLI影像为数据源,综合考虑光谱特征、纹理特征及地形特征等,在执行5种单分类器分类基础上,评价随机森林和证据理论2种多分类器集成算法在土地覆盖分类性能方面的差异,在此基础上,采用3种模型模拟江宁区2020年的土地覆盖分类,将其与真实的土地覆盖分类进行对比,选择最优模型预测江宁区2030年的土地覆盖模式,以期为江宁区土地利用规划、城市可持续管理等事务服务。
1 材料与方法
1.1 研究区概况
江宁区位于南京市中南部(118°31′~119°04′E,30°38′~32°13′N),南北长57 km,东西宽33" km,总面积1 561 km2(图1)。该区属于亚热带温湿气候,四季分明,雨水丰沛,光照充足。江宁区东与句容市接壤,东南与溧水区毗连,南与安徽省当涂县衔接,西南与安徽省马鞍山市相邻,西与安徽省和县及南京市浦口区隔江相望。江宁区地处长江中下游平原,境内地貌复杂,有山、有圩,丘陵和平原相间,因此被称为“六山一水三平原”。截至2020年,江宁区总面积、常住人口以及地区生产总值均列南京各区第一。
1.2 数据源及预处理
研究采用地理空间数据云(http://www.gscloud.cn)提供的Landsat TM/OLI遥感影像,轨道号为120/038。选取了3个时期(2000、2010和2020年)的图像,分类所用的波段为7个多光谱波段但不包括热红外波段,空间分辨率为30 m。3期图像的云覆盖率分别为0%、0.09%、1.81%。图像采集时间为夏秋季,该时期植被茂盛,能够降低落叶植被对土地覆盖变化监测的影响,更有利于地类解译[27]。此外,采用对应年份的Google Earth Pro的高分辨率历史影像,结合已有的先验知识进行目视解译,以此获取训练数据和验证数据集。分类前,利用软件ENVI 5.3对TM/OLI影像进行预处理,包括辐射定标、大气校正和图像裁剪等。
利用ENVI 5.3对TM/OLI影像进行特征提取,包括归一化植被指数(NDVI)、归一化水体指数(NDWI),利用灰度共生矩阵GLCM提取纹理特征,以及根据原始影像中热红外波段导出的地表温度数据(重采样为30 m分辨率)。此外,结合30 m分辨率的数字高程模型(DEM)及其导出的坡度(slope)和坡向(aspect)信息,它们共同构成了该研究区土地覆盖分类的潜在特征变量集[28]。
根据全国遥感监测土地覆盖分类体系(一级分类体系)标准,结合江宁区土地覆盖特点及研究目的,将研究区土地覆盖类型划分为水体、建设用地、林地、草地、未利用地和耕地共6种。
使用人工判读的方式,结合谷歌地球(Google Earth Pro)高分辨率影像,采用随机采样并尽量保证样本的空间分布均匀的方法对研究区内水体、建设用地、林地、草地、未利用地和耕地6种地类进行训练样本点选择,共选取1 727个样本。其中水体380个、建设用地474个、林地368个、草地79个、未利用地86个及耕地340个。另外,随机确定一套独立的验证样本集用于评价分类器的性能,随机验证点分布图见图2。
1.3 试验方法
1.3.1 单分类器的选择
在集成分类中,每个单分类器都具有不同的重要性,其表现将直接影响到集成分类的最终分类结果。因此选择适当的单分类器是影响组合分类结果的关键[29]。选择单分类器的标准并非一成不变,可以任意选取,也可以根据总体分类精度[30],在选用时应注意到每个单分类器的特性[31]。考虑到单分类器应该具有多样性、独立性及鲁棒性等特点,本研究选取如下5种基分类器:支持向量机(SVM)[32]、神经网络(NN)[33]、最小距离法(MinDC)[34]、最大似然法(MLC)[35]和马氏距离法(MahDC)[34]作为集成算法的单分类器。这些基分类器的执行均在软件ENVI5.3中实现。
1.3.2 多分类器集成
多分类器集成是通过某种方式将多个个体学习器的分类结果集成得出最终的分类决策[36]。每个单分类器都独立进行决策,从而实现并行集成。
1)随机森林。随机森林(random forests,RF)基于决策树算法与集成学习,通过自主重采样方法,对训练样本进行多个样本集分类,以构建决策树模型[37]。该方法能有效抑制过拟合,提高模型的泛化能力、预测精度与可解释性。
随机森林集成分类的实现:基于R软件平台及Weka软件中的决策树模块实现随机森林集成学习算法。在该分类算法中,当N≥400时,各分类器误差趋于稳定,因此不对其进行剪枝。
2)D-S证据理论。Dempster-Shafer(D-S)证据理论起源于20世纪60年代,由Dempster与Shafer创立,它可以有效解决各种不确定、不完全及推理问题[38]。
D-S证据理论概率的计算过程。①构建辨识框架,即确定焦元:水体、建设用地、林地、草地、未利用地和耕地。②计算证据源的信任支持度:由每个分类器的分类结果,计算每一类出现的概率,即计算每个单分类器的基本概率矢量。③证据源组合计算(计算像元概率矩阵特征值):使用Python计算出每个分类器的特征值。④选择概率最大者为像元所属类别。
算法实现。基于Python软件平台,通过gdal库读取和写入遥感影像数据,利用numpy数组进行计算,使用ds_fusion融合数组,将其转为tif格式,再分别计算像元的概率矩阵,运用ds_evident_theroy实现对像元归属类别的判断,最后将结果保存为tif格式。
1.3.3 分类精度评价
影像分类的精度评价是将分类结果与标准参考图像或参考数据分类样本进行比较,并作出定量估计的过程。为保证准确性,常采用误差矩阵(混淆矩阵)来计算各种精度统计参数。笔者从混淆矩阵中选取总体分类精度和Kappa系数,对不同分类方法的分类结果进行评价[39]。
1.3.4 土地覆盖变化预测
1)CA-Markov模型。CA模型是一种基于离散空间和离散时间的模拟方法,用于描述和分析复杂系统的动态行为。Markov模型是一个经典的定量预测模型,是建立在“无后效性”基础上的一种特殊的随机过程,具有稳健性的特点。CA-Markov模型结合元胞自动机的局部更新规则和马尔可夫链的状态转移概率,兼具灵活性和可解释性[18]。
2)PLUS模型。PLUS模型主要由用地扩张分析策略模块(LEAS)和基于多类随机斑块种子的元胞自动机模型(CARS)两部分构成。与其他模型相比,该模型具有较好的解释性和较高的模拟精度[40]。用地扩张分析策略模块(LEAS)可获取各用地类型的扩张部分和发展概率[41]。多类随机斑块种子的元胞自动机模型(CARS),考虑发展概率和各土地利用数量的限制,以时空动态模拟的方式自动生成斑块[42]。
3)ANN-CA模型。结合ANN的学习能力和CA的空间以及时间演化能力,为复杂的动态系统建模提供了一种灵活而有效的方法。具有适应性、预测能力和组合学习的优势[43]。具体参数设置:选择建筑作为城市用地;训练数据70%,验证数据30%;迭代总次数为300次;隐藏层元胞数量为10;学习速率为0.05;阿尔法值默认为1,转换阈值为0.7。
1.3.5 预测结果的精度评价
将参考的实际土地覆盖分类数据与预测的土地覆盖分类数据进行逐像元的比较,统计后计算两个数据间的空间一致性。将数据导入Arcgis软件中,运用Spatial Analyst工具箱中的“等于”工具来计算结果的一致性:如果两个栅格数据类码相同,输出结果则为1,否则为0。再使用栅格计算器计算出所有1占总像元数的比率即为空间一致性。
2 结果与分析
2.1 单分类器分类结果及分析
各年份的各单分类器的分类结果如图3—图5所示,每年份的精度评价结果如表1所示。
从土地覆盖分类结果图来看,耕地在江宁区土地覆盖分类中占主体地位,是江宁区面积占比最大的地类。在2000—2020年,耕地面积呈现下降趋势,至2020年(图5),耕地主要分布在汤山、淳化、湖熟及横溪等重点发展农业的街道。2000年(图3),林地面积占江宁区土地覆盖面积的第2位,截至2020年其面积变化不大,主要集中在汤山、牛首山、方山等地,但由于建设用地扩张,林地面积占比下降到第3位。从图4可以看出,2010年江宁区建设用地面积相比2000年有所增长,由区中心向四周扩散,但因区内山脉阻隔,分布相对较为分散。至2020年(图5),建设用地面积已经跃居江宁区土地覆盖类型的第2位,主要分布在东山、淳化、秣陵、江宁及禄口等街道。草地和未利用地是面积占比最小的2种土地覆盖类型。水体主要以长江过境水、秦淮河及其支流为主,面积变化不大。
从土地覆盖分类精度表(表1)来看,在单分类器算法中,各个年份的精度各有不同,其中在2000年和2010年,SVM和NN的分类精度最高,总体精度达到了87%以上,Kappa系数也达到了0.77及以上;在2000年,MinDC的总体精度只有68.25%,Kappa系数也只有0.53;在2010年,总体分类精度最低的是MLC,只有71.25%,Kappa系数为0.60;而在2020年,MLC和NN两种分类算法对研究区的土地覆盖分类效果比其他几种算法更好。MLC的总体分类精度最高,为82.75%,Kappa系数为0.74;NN分类精度次之,总体精度和Kappa系数分别为80.50%和0.71。不同年份分类器的分类精度有所差别,可能是因为所使用的3个年份的Landsat图像在获取月份上存在差异,这可能带来一定程度的季相节律差异所引起的地物光谱偏移,从而使得同一分类器在不同图像上应用时产生性能差别。另外,在不同年份图像分类时,分类模型的参数设定并未完全统一,这也会导致不同的分类模型在不同图像间应用时产生性能差别。
2.2 集成分类结果及分析
所有集成分类结果如图6所示,对应的独立验证精度统计数字(表2)。
由表2可知,随机森林和证据理论都在不同程度上提高了分类的精度。其中,2000年,随机森林取得了最佳的分类精度,总体精度为91.25%,Kappa系数为0.85,比单分类算法中分类精度最高的SVM提高了2.50个百分点,Kappa系数提高了0.08;在2010年,证据理论的总体精度最高,为90.80%,Kappa系数为0.86,比单分类算法中分类精度最高的NN算法提高了2.05个百分点,Kappa系数提高了0.03;在2020年,随机森林算法的总体精度最高,为93.75%,比单分类算法中分类精度最高的MLC算法提高了11.00个百分点,Kappa系数提升至0.91,提高了0.17。
从表2可以发现,不同年份的集成结果精度有所不同,可能是由于不同年份的土地覆盖数据集对不同的分类器具有不同的适应性,也有可能是因为不同的集成分类器的鲁棒性和适应性各不相同,导致不同年份集成结果的精度各不相同。比如,证据理论集成时证据冲突、证据权重计算等结果不同从而导致其精度发生变化。但是,多分类器集成能够表现出比单分类器更好的性能,多分类器集成将各单分类器的优缺点进行融合,取长补短,从而达到更高的分类精确率。
2.3 基于3种模型的土地覆盖分类预测与空间一致性分析
以研究区域的2000和2010年土地覆盖集成分类结果为基础,采用CA-Markov模型、PLUS模型和ANN-CA模型分别预测研究区2020年土地覆盖分类,将其与2020年真实分类图(最优集成分类结果)进行空间一致性分析,从而确定最优的土地覆盖变化预测模型。2020年真实的土地覆盖分类结果(图7a)及3种预测模型所生成的2020年土地覆盖分布模式见图7b—7d。
2020年3种模型预测与真实分类空间一致性对比见图8。其中图8a可见,CA-Markov模型具有69.83%的空间一致性;图8c可见ANN-CA模型的空间一致性为69.37%;图8b可见,PLUS模型的空间一致性为98.54%,是3种模型中预测精度最高的。因此,后续采用此模型对研究区未来土地覆盖分类结果进行预测。
3种模型预测的精度相差较大,PLUS模型的预测精度最高,原因可能是:①PLUS模型的统计方阵和参数估计能够更好地捕捉历史土地覆盖转移概率模式,从而实现更准确地预测;②PLUS模型的参数设置和调整可能更加准确和合理,能够更好地适应江宁区土地覆盖的特点,从而提高预测精度。
2.4 基于PLUS模型的土地覆盖预测结果分析
利用PLUS模型,预测江宁区2030年土地覆盖变化模式见图9,对应的统计结果见表3。
由图9和表3可以发现,在空间分布格局变化方面,随时间推移各土地覆盖类型并未有明显变化,其中建设用地稍有扩张,耕地面积稍有减少,从江宁区经济发展角度来看,减少的耕地量在可控范围内。林地、草地和未利用地变化相对较小,水体面积相对减小。
3 讨 论
3.1 多分类器集成算法对分类的影响
多分类器集成是提高遥感影像分类精度的方法之一。其原因主要在于多分类器集成策略综合子分类器优势,使其优势互补,从而增强了分类器对地物的识别能力[44]。由于各个分类器使用的特征、原理和方法都不相同,使各分类器的识别效果略有不同[45],分类精度也各不相同。张晓羽等[46]研究表明,结合光谱特征和DEM辅助特征构建的随机森林模型比最大似然法分类精度更高。张卫春等[47]研究表明,基于随机森林的遥感数据和地形因子的组合方法可以有效地提高分类精度。有研究表明,在多特征组合遥感影像分类中,特征数量与分类精度不成正比,不同的特征组合产生的分类精度并不相同[28]。本研究在植被指数和地形特征的基础上,加入纹理特征和地表温度两种特征,通过各单分类器的分类精度可以发现,不同分类器的分类精度各不相同,对于同一研究区域、相同分类器,不同的训练样本对分类结果也有着较大影响。研究普遍认为,选择的样本数量越多,训练区的土地覆盖类型就越有代表性[48]。对于不同研究区域的不同地物,选择相同的分类器,分类结果也是不同的[49]。而不同分类器结果的输出方式对集成结果也有着较大的影响,柏延臣等[50]通过对测量级和抽象级的结合方式做对比,发现抽象级的结合方法精度更高,可能是由于在抽象级多分类器结合方法中,对于参与结合分类器的特性没有特殊要求,但必须选择奇数个分类器来参与分类器的结合。研究发现,在多分类器集成中,子分类器的选择对分类精度有很大的影响。郑文武等[11]、张辉[29]、Liu等[51]从传统分类中选择分类性能较好的分类器作为单分类器,这些分类方法具有一定的独立性以及多样性,在遥感影像分类中具有各自的优势。考虑到单分类器本身的特性以及对组合分类精度的影响,选择传统监督分类中应用广泛且分类精度高的单分类器作为子分类器,从本研究中基于随机森林算法和证据理论实现的多组合分类精度可以看出,多分类器集成可以明显提高分类精度,证明了多组合分类器的可行性和有效性,达到了预期的效果。
当有多个单分类器参与集成时,可能因为它们之间的结合能力不强,或是因为它们之间分类性能效果比较接近,也可能是因为来自不同层的信息在分类过程中被集成分类方法“稀释”[52],导致集成分类的效果不太明显。在本研究中,单分类器SVM和NN有着较高的分类精度,但是相对于其他分类器来说,SVM受训练样本的影响较大,对组合结果造成了一定的影响,而NN受训练样本的分布影响较小,稳定性更高,两者的差异性较小。由此,选择差异大且具有多样性的分类器,可以改善最终分类器的分类性能。
3.2 土地覆盖变化预测的精度影响因素
模型预测是理解土地利用变化机制,清晰描述土地利用变化过程,确定土地利用变化驱动因素和预测未来土地利用变化格局的重要工具[53]。而且土地利用覆盖变化时空预测是一个非常复杂的过程,模型通常受到社会经济、人为因素和政府政策等多种因素的影响,其中还包含着定量以及非定量两个方面[54]。在现实中,土地覆盖类型多种多样。由于数据量、数据的可获取性和工作量等因素的制约,无法将所有的土地覆盖类型包括在内,仅能对该研究区内的主要土地覆盖类型进行研究。在实际应用中,不同的土地覆盖类型有其独特的发展模式,一旦将土地覆被类型结合起来,其局限性就在于所选驱动因子的作用。同时,在模型预测过程中,主要针对大面积土地覆盖类型开展预测研究,在一定程度上会对模型的准确性产生一定的影响,还会影响固定步长预测的转换规则和模型参数的设定[55]。
本研究使用PLUS模型对江宁区土地覆盖分类进行预测,模型预测精度较高,与其他研究人员结果一致,如Liang等[56]利用3种不同模型预测武汉市2013年土地利用格局,对比结果发现PLUS模型的预测精度排名第2,但其预测的土地利用模式与实际最为相似;谢向东等[57]利用PLUS模型模拟重庆市南川区土地利用分布,预测结果较好。本研究所使用的数据是通过对遥感影像分类后集成得到的,集成结果与土地覆盖现状存在一些差别,因此,研究区未来2030年的预测结果与实际的土地覆盖空间格局存在一定的误差。
本研究基于Landsat TM/OLI影像,采用MLC、MahDC、MinDC、SVM和NN共5种常用的监督分类器对南京市江宁区进行土地覆盖分类,对比单分类结果发现,采用随机森林算法和证据理论算法作为集成方法,能够有效提高土地覆盖分类的准确性,为精确评估土地覆盖状况提供了有力支持。
分别运用CA-Markov模型、PLUS模型和ANN-CA模型对2020年的土地覆盖分类进行预测,结果表明PLUS模型预测的精度最高。进而利用PLUS模型对2030年土地覆盖分类进行预测,以期能够科学揭示江宁区土地覆盖变化趋势,并为未来土地利用规划和环境管理提供理论依据。模型预测有助于判断土地覆盖变化的潜在趋势,帮助政府和决策者制定可持续发展的土地利用策略和保护措施,对于推动可持续城市发展、合理规划土地利用、保护生态环境等具有一定的应用价值。
现有评价体系有待完善。混淆矩阵虽可测分类精度,但较单一,后续可加入熵值、Q统计法、相关系数等指标,深化对分类器差异性的研究。本模型参数基于前人研究并经多次调试而得,具主观性易致误差,今后将深入探索模型因子选取与参数设置。
参考文献(reference):
[1]SHI H,CHEN L,BI F K,et al.Accurate urban area detection in remote sensing images[J].IEEE Geosci Remote Sens Lett,2015,12(9):1948-1952.DOI: 10.1109/LGRS.2015.2439696.
[2]骆剑承,周成虎,杨艳.遥感地学智能图解模型支持下的土地覆盖/土地利用分类[J].自然资源学报,2001,16(2):179-183.LUO J C,ZHOU C H,YANG Y.Land cover and land use classification based on remote sensing intelligent Geo interpreting model[J].J Nat Resour,2001,16(2):179-183.DOI: 10.3321/j.issn:1000-3037.2001.02.013.
[3]MATHIEU R,FREEMAN C,ARYAL J.Mapping private gardens in urban areas using object-oriented techniques and very high-resolution satellite imagery[J].Landsc Urban Plan,2007,81(3):179-192.DOI: 10.1016/j.landurbplan.2006.11.009.
[4]OZDARICI-OK A,OK A,SCHINDLER K.Mapping of agricultural crops from single high-resolution multispectral images:data-driven smoothing vs.parcel-based smoothing[J].Remote Sens,2015,7(5):5611-5638.DOI: 10.3390/rs70505611.
[5]夏玉计.基于多特征融合支持向量机的土地覆盖类型提取与分析[D].北京:中国地质大学(北京),2019.XIA Y J.Extraction and analysis of land cover types based on multi-feature fusion support vector machine[D].Beijing:China University of Geosciences(Beijing),2019.
[6]CHEN J,CHEN J,LIAO A P,et al.Global land cover mapping at 30 m resolution:a POK-based operational approach[J].ISPRS J Photogramm Remote Sens,2015,103:7-27.DOI: 10.1016/j.isprsjprs.2014.09.002.
[7]冯登超,陈刚,肖楷乐,等.基于最小距离法的遥感图像分类[J].北华航天工业学院学报,2012,22(3):1-2,5.FENG D C,CHEN G,XIAO K L,et al.Remote sensing image classification based on minimum distance method[J].J N China Inst Aerosp Eng,2012,22(3):1-2,5.DOI: 10.3969/j.issn.1673-7938.2012.03.001.
[8]刘焕军,杨昊轩,徐梦园,等.基于裸土期多时相遥感影像特征及最大似然法的土壤分类[J].农业工程学报,2018,34(14):132-139.LIU H J,YANG H X,XU M Y,et al.Soil classification based on maximum likelihood method and features of multi-temporal remote sensing images in bare soil period[J].Trans Chin Soc Agric Eng,2018,34(14):132-139.DOI: 10.11975/j.issn.1002-6819.2018.14.017.
[9]高昂,唐世浩,肖萌,等.机器学习在遥感影像分类中的应用[J].科技导报,2021,39(15):67-74.GAO A,TANG S H,XIAO M,et al.Application of machine learning in remote sensing image classification[J].Sci Technol Rev,2021,39(15):67-74.DOI: 10.3981/j.issn.1000-7857.2021.15.007.
[10]汪靖翔.决策树算法的原理研究和实际应用[J].电脑编程技巧与维护,2022(8):54-56,72.WANG J X.Principle research and practical application of decision tree algorithm[J].Comput Program Ski Maint,2022(8):54-56,72.DOI: 10.16184/j.cnki.comprg.2022.08.043.
[11]郑文武,曾永年.利用多分类器集成进行遥感影像分类[J].武汉大学学报(信息科学版),2011,36(11):1290-1293.ZHENG W W,ZENG Y N.Remote sensing imagery classification based on multiple classifiers combination algorithm[J].Geomat Inf Sci Wuhan Univ,2011,36(11):1290-1293.DOI:10.13203/j.whugis2011.11.005.
[12]罗常伟,王双双,尹峻松,等.集成学习研究现状及展望[J].指挥与控制学报,2023,9(1):1-8.LUO C W,WANG S S,YIN J S,et al.Research status and prospect of ensemble learning[J].J Command Contr,2023,9(1):1-8.DOI: 10.3969/j.issn.2096-0204.2023.01.0001.
[13]张银辉,赵庚星.土地利用/土地覆盖遥感分类方法的研究综述[J].中国农业资源与区划,2002,23(3):21-25.ZHANG Y H,ZHAO G X.Classification methods of land use/cover based on remote sensing technologies[J].Chin J Agric Resour Reg Plan,2002,23(3):21-25.DOI: 10.7621/cjarrp.1005-9121.20020338.
[14]李国清,柏永青,杨轩,等.基于深度学习的高分辨率遥感影像土地覆盖自动分类方法[J].地球信息科学学报,2021,23(9):1690-1704.LI G Q,BAI Y Q,YANG X,et al.Automatic deep learning land cover classification methods of high-resolution remotely sensed images[J].J Geo Inf Sci,2021,23(9):1690-1704.DOI: 10.12082/dqxxkx.2021.200795.
[15]崔兆韵,张承明,杨晓霞,等.基于深度学习的高分遥感影像分类方法研究[J].科技与创新,2021(3):55-57.CUI Z Y,ZHANG C M,YANG X X,et al.Research on classification method of high score remote sensing images based on deep learning[J].Sci Technol Innov,2021(3):55-57.DOI: 10.15913/j.cnki.kjycx.2021.03.018.
[16]季顺平,田思琦,张驰. 利用全空洞卷积神经元网络进行城市土地覆盖分类与变化检测[J]. 武汉大学学报(信息科学版),2020,45(2):233-241. JI S P,TIAN S Q,ZHANG C.Urban land cover classification and change detection using fully atrous convolutional neural network[J].Geomat Inf Sci Wuhan Univ,2020,45(2):233-241. DOI:10.13203/j.whugis20180481.
[17]QIN Z,ZENG Q L,ZONG Y X,et al.Image inpainting based on deep learning:a review[J].Displays,2021,69:102028.DOI: 10.1016/j.displa.2021.102028.
[18]雷浩川.多分类器集成的遥感影像分类研究[D].北京:中国地质大学(北京),2018.LEI H C.Research on remote sensing image classification based on multi-classifier integration[D].Beijing:China University of Geosciences(Beijing),2018.
[19]陈彦冰.多分类器集成的遥感影像地物分类研究[D].长春:吉林大学,2021.CHEN Y B.Research on classification of remote sensing images based on multi-classifier integration[D].Changchun:Jilin University,2021.
[20]夏俊士,杜培军,张伟.遥感影像多分类器集成的关键技术与系统实现[J].科技导报,2011,29(21):22-26.XIA J S,DU P J,ZHANG W.Key techniques and implementation of multiple classifier system for remote sensing images[J].Sci Technol Rev,2011,29(21):22-26.DOI: 10.3981/j.issn.1000-7857.2011.21.002.
[21]王震.基于OLI影像的多分类器组合方法研究[D].北京:中国地质大学(北京),2015.WANG Z.Research on multi-classifier combination method based on OLI image[D].Beijing:China University of Geosciences(Beijing),2015.
[22]龙飞,任金铜.基于多分类器集成的GF-2遥感影像分类研究[J].科学技术创新,2023(3):19-24.LONG F,REN J T.Research on GF-2 remote sensing image classification based on Multi Classifier Integration[J].Sci Technol Innov,2023(3):19-24.
[23]KUMAR S,GHOSH J,CRAWFORD M M.Hierarchical fusion of multiple classifiers for hyperspectral data analysis[J].Pattern Anal Appl,2002,5(2):210-220.DOI: 10.1007/s100440200019.
[24]ISAAC E,EASWARAKUMAR K S,ISAAC J.Urban landcover classification from multispectral image data using optimized AdaBoosted random forests[J].Remote Sens Lett,2017,8(4):350-359.DOI: 10.1080/2150704x.2016.1274443.
[25]黎云云,畅建霞,王义民,等.基于CA-Markov模型的黄河流域土地利用模拟预测研究[J].西北农林科技大学学报(自然科学版),2020,48(12):107-116.LI Y Y,CHANG J X,WANG Y M,et al.Land use simulation and prediction in the Yellow River basin based on CA-Markov model[J].J Northwest A F Univ (Nat Sci Ed),2020,48(12):107-116.DOI: 10.13207/j.cnki.jnwafu.2020.12.013.
[26]龚文峰,袁力,范文义.基于CA-Markov的哈尔滨市土地利用变化及预测[J].农业工程学报,2012,28(14):216-222.GONG W F,YUAN L,FAN W Y.Dynamic change and prediction of land use in Harbin city based on CA-Markov model[J].Trans Chin Soc Agric Eng,2012,28(14):216-222.DOI: 10.3969/j.issn.1002-6819.2012.14.033.
[27]王冬辰,杜培军,苏红军,等.近20年大同市土地利用/覆盖遥感变化分析[J].干旱区资源与环境,2015,29(7):68-75.WANG D C,DU P J,SU H J,et al.Land use/Land cover changes in Datong based on remote sensing data[J].J Arid Land Resour Environ,2015,29(7):68-75.DOI: 10.13448/j.cnki.jalre.2015.223.
[28]杜培军,柳思聪.融合多特征的遥感影像变化检测[J].遥感学报,2012,16(4):663-677.DU P J,LIU S C.Change detection from multi-temporal remote sensing images by integrating multiple features[J].Natl Remote Sens Bull,2012,16(4):663-677.DOI: 10.11834/irs.20121168.
[29]张辉.基于多分类器组合的遥感土地利用分类研究[J].安徽农业科学,2015,43(32):389-392.ZHANG H.Land use classification based on the remote sensing classification by multi-classifier combination[J].J Anhui Agric Sci,2015,43(32):389-392.DOI: 10.13989/j.cnki.0517-6611.2015.32.134.
[30]彭正林,毛先成,刘文毅,等.基于多分类器组合的遥感影像分类方法研究[J].国土资源遥感,2011,23(2):19-25.PENG Z L,MAO X C,LIU W Y,et al.Method for classification of remote sensing images based on multiple classifiers combination[J].Remote Sens Nat Resour,2011,23(2):19-25.DOI: 10.6046/gtzyyg.2011.02.04.
[31]陈洋波,窦鹏,张涛.基于Landsat的多分类器集成遥感影像分类[J].测绘科学,2018,43(8):97-103,109.CHEN Y B,DOU P,ZHANG T.Multiple classifiers integrated classification based on Landsat imagery[J].Sci Surv Mapp,2018,43(8):97-103,109.DOI: 10.16251/j.cnki.1009-2307.2018.08.016.
[32]周婷,汪炎,邹俊,等.基于PCA和SVM的遥感影像水体提取方法及验证[J].水资源保护,2023,39(2):180-189.ZHOU T,WANG Y,ZOU J,et al.PCA and SVM-based algorithm of water area extraction from remote sensing images and its verification[J].Water Resour Prot,2023,39(2):180-189.DOI: 10.3880/j.issn.1004-6933.2023.02.022.
[33]HUANG W Y,LIPPMANN R. et al.Neural net and traditional classifiers[J].Neural Information Processing Systems,1987:387-396.
[34]RICHARDS J A, JIA X P. Remote sensing digital image analysis: an introduction[M].Australia:Springer Publishing Company Incorporated,2012.
[35]SHAFRI H Z M,SUHAILI A,MANSOR S.The performance of maximum likelihood,spectral angle mapper,neural network and decision tree classifiers in hyperspectral image analysis[J].J Comput Sci,2007,3(6):419-423.DOI: 10.3844/jcssp.2007.419.423.
[36]方文,李朝奎,梁继,等.多分类器组合的遥感影像分类方法[J].测绘科学,2016,41(10):120-125.FANG W,LI (C/Z)K,LIANG J,et al.Classification of remote sensing image based on the combination of multiple classifiers[J].Sci Surv Mapp,2016,41(10):120-125.DOI: 10.16251/j.cnki.1009-2307.2016.10.025.
[37]武炜杰.随机森林算法的应用与优化方法研究[D].无锡:江南大学,2021.WU W J.Research on application and optimization method of random forest algorithm[D].Wuxi:Jiangnan University,2021.
鞠琴,吴金雨,王兴平,等.机器学习算法在降水和气温多模式集成中的应用[J].水资源保护,2024,40(3):106-115.JU Q,WU J Y,WANG X P,et al.Application of machine learning algorithms in multimodal integration of precipitation and temperature[J].Water Resour Prot,2024,40(3):106-115.DOI: 10.3880/j.issn.1004-6933.2024.03.013.
[38]BARNETT J A.Computational methods for a mathematical theory of evidence[C]//Proceedings of the 7th international joint conference on Artificial intelligence.Canada: Morgan Kaufmann Publishers Inc,1981:868-875.
[39]刘宇航.干旱绿洲区盐碱地遥感影像分类模型及时空变化格局研究[D].兰州:兰州理工大学,2022.LIU Y H.Study on classification model and temporal and spatial change pattern of saline-alkali land remote sensing images in arid oasis area[D].Lanzhou:Lanzhou University of Technology,2022.
[40]李琛,高彬嫔,吴映梅,等.基于PLUS模型的山区城镇景观生态风险动态模拟[J].浙江农林大学学报,2022,39(1):84-94.LI C,GAO B P,WU Y M,et al.Dynamic simulation of landscape ecological risk in mountain towns based on PLUS model[J].J Zhejiang A F Univ,2022,39(1):84-94.DOI: 10.11833/j.issn.2095-0756.20210237.
[41]梁德强.基于PLUS模型的齐齐哈尔市土地利用变化与情景模拟[D].哈尔滨:东北林业大学,2022.LIANG D Q.Land use change and simulation in Qiqihar based on PLUS Model[D].Harbin:Northeast Forestry University,2022.
[42]伍丹,朱康文,张晟,等.基于PLUS模型和InVEST模型的成渝经济区碳储量演化分析[J].三峡生态环境监测,2022,7(2):85-96.WU D,ZHU K W,ZHANG S,et al.Evolution analysis of carbon stock in Chengdu-Chongqing economic zone based on PLUS model and InVEST model[J].Ecol Environ Monit Three Gorges,2022,7(2):85-96.DOI: 10.19478/j.cnki.2096-2347.2022.02.10.
[43]杨文龙.基于GeoSOS的村镇建设用地扩张分析及规划模拟优化[D].广州:华南农业大学,2016.YANG W L.Analysis and planning simulation optimization of rural construction land expansion based on GeoSOS[D].Guangzhou:South China Agricultural University,2016.
[44]马婷,李崇贵,汤伏全,等.基于多分类器集成的落叶松人工林提取[J].林业科学,2021,57(11):105-118.MA T,LI C G,TANG F Q,et al.Extraction of larch plantation based on multi-classifier ensemble[J].Sci Silvae Sin,2021,57(11):105-118.DOI: 10.11707/j.1001-7488.20211111.
[45]吕岳,施鹏飞,赵宇明.多分类器组合的投票表决规则[J].上海交通大学学报,2000,34(5):680-683.LU" Y,SHI P F,ZHAO Y M.Voting principle for combination of multiple classifiers[J].J Shanghai Jiaotong Univ,2000,34(5):680-683.DOI: 10.16183/j.cnki.jstu.2000.05.036.
[46]张晓羽,李凤日,甄贞,等.基于随机森林模型的陆地卫星-8遥感影像森林植被分类[J].东北林业大学学报,2016,44(6):53-57,74.ZHANG X Y,LI F R,ZHEN Z,et al.Forest vegetation classification of Landsat 8 remote sensing image based on random forests model[J].J Northeast For Univ,2016,44(6):53-57,74.DOI: 10.13759/j.cnki.dlxb.2016.06.005.
[47]张卫春,刘洪斌,武伟.基于随机森林和Sentinel-2影像数据的低山丘陵区土地利用分类:以重庆市江津区李市镇为例[J].长江流域资源与环境,2019,28(6):1334-1343.ZHANG W C,LIU H B,WU W.Classification of land use in low mountain and hilly area based on random forest and sentinel-2 satellite data:a case study of Lishi Town,Jiangjin,Chongqing[J].Resour Environ Yangtze Basin,2019,28(6):1334-1343.DOI: 10.11870/cjlyzyyhj201906009.
[48]张少佳.多分类器组合及其遥感分类研究[D].长沙:中南大学,2010.ZHANG S J.Research on multi-classifier combination and its remote sensing classification[D].Changsha:Central South University,2010.
[49]肖胜杰.遥感图像多分类器组合方法研究[D].哈尔滨:黑龙江大学,2017.XIAO S J.Research on multi-classifier combination method for remote sensing images[D].Harbin:Helongjiang University,2017.
[50]柏延臣,王劲峰.结合多分类器的遥感数据专题分类方法研究[J].遥感学报,2005,9(5):555-563.BAI Y C,WANG J F.Combining multiple classifiers for thematic classification of remotely sensed data[J].Natl Remote Sens Bull,2005,9(5):555-563.DOI: 10.11834/irs.20050581.
[51]LIU X H,SKIDMORE A K,OOSTEN H V.Integration of classification methods for improvement of land-cover map accuracy[J].ISPRS J Photogramm Remote Sens,2002,56(4):257-268.DOI: 10.1016/s0924-2716(02)00061-8.
[52]VERBURG P H,SOEPBOER W,VELDKAMP A,et al.Modeling the spatial dynamics of regional land use:the CLUE-S model[J].Environ Manage,2002,30(3):391-405.DOI: 10.1007/S00267-002-2630-X.
[53]凌成星,鞠洪波,张怀清,等.基于CA-MARKOV模型的北京湿地资源变化预测研究[J].中国农学通报,2012,28(20):262-269.LING C X,JU H B,ZHANG H Q,et al.Study on the forecast of wetland resources changes in Beijing based on CA-MARKOV model[J].Chin Agric Sci Bull,2012,28(20):262-269.DOI: 10.3969/j.issn.1000-6850.2012.20.048.
[54]经阳.基于CA-Markov模型的佛山市生态用地演变及其模拟[D].抚州:东华理工大学,2016.JING Y.Evolution and simulation of ecological land in Foshan City based on CA-markov model[D].Fuzhou:East China Institute of Technology,2016.
[55]陈倩.城市化进程下土地覆盖、森林空间模式及属性变化分析[D].南京:南京林业大学,2018.CHEN Q.Analysis on spatial patterns and attribute changes of land cover and forest in the process of urbanization[D].Nanjing:Nanjing Forestry University,2018.
[56]LIANG X,GUAN Q F,CLARKE K C,et al.Understanding the drivers of sustainable land expansion using a patch-generating land use simulation (PLUS) model:a case study in Wuhan,China[J].Comput Environ Urban Syst,2021,85:101569.DOI: 10.1016/j.compenvurbsys.2020.101569.
[57]谢向东,林孝松,王莹,等.基于PLUS模型的重庆市南川区土地利用多情景模拟[J].长江科学院院报,2023,40(6):86-92,113.XIE X D,LIN X S,WANG Y,et al.Multi-scenario simulation of land use in Nanchuan District of Chongqing based on PLUS model[J].Journal of Changjiang River Scientific Research Institute,2023,40(6):86-92,113.DOI: 10.11988/ckyyb.20221227.
(责任编辑 吴祝华)
基金项目:国家自然科学基金项目(31971577);江苏高校优势学科建设工程资助项目(PAPD)。
第一作者:蒋路凡(lf_jiang@yeah.net)。
*通信作者:张小伟(xiaoweiz099618@gmail.com),高级工程师。
引文格式:蒋路凡,苏慧毅,张银,等.基于多分类器集成的土地覆盖分类及预测研究[J]. 南京林业大学学报(自然科学版),2024,48(5):255-266.
JIANG L F, SU H Y, ZHANG Y, et al.Land cover classification and prediction based on multiple classifier ensemble learning[J]. Journal of Nanjing Forestry University (Natural Sciences Edition),2024,48(5):255-266.