基于随机森林模型的景观格局动态研究

2018-05-30 14:31王铭恺汪天伟
工业经济论坛 2018年2期
关键词:景观格局随机森林合肥市

王铭恺 汪天伟

摘 要:以合肥市包河区作为主要研究区域,结合2011年和2016年2期Google Earth高分辨率遥感影像,采用近幾年流行的多分类器集成方案中的随机森林模型进行基于像元的监督分类,并以此为数据基础进行景观格局指数的提取,从而对合肥市包河区进行景观格局变化分析。其中,2011年和2016年2期遥感影像分类总体精度分别为81%和82%,能够满足景观格局分析的基本要求。实验结果表明,2011-2016年间绿地、裸地和水域几类均表现为减少趋势,建筑用地和农耕用地大量增加。耕地一直是合肥市包河区的优势景观类型,但是这5年间,其斑块密度、分散指数等几类指数呈现增加趋势,表明其正处于被蚕食分割的状态之下,景观破碎化严重。各类景观类型的形状均趋于复杂化,且正处于破碎化状态。有些绿地斑块的消失,使得绿地斑块逐渐呈现出整体性,这也归功于合肥市近几年绿化措施的有效执行。建筑用地逐渐由西北和中部向东南方向移动,体现出合肥市包河区近几年滨湖新区的建设和发展迅速。

关键词:高分辨率遥感影像;多分类器集成;随机森林;景观格局;合肥市

中图分类号:P237 文献标识码:A 文章编号:2095-7866 (2018) 02-083-008

工业经济论坛 URL: http//www.iereview.com.cn DOI: 10.11970/j.issn.2095-7866.2018.02.011

Abstract: Taking Baohe District of Hefei City as the main research area, combining high-resolution remote sensing images of Google Earth in 2011 and 2016, and adopting the random forest model in the multi-classifier integration scheme popular in recent years for pixel-based supervision. The use of this is as the data basis for the extraction of landscape pattern index, so as to analyze the change of landscape pattern in Baohe District of Hefei City. Among them, the overall accuracy of the classification of land use type maps in 2011 and 2016 was 81% and 82%, respectively, which can meet the basic requirements of landscape pattern analysis. The experimental results show that between 2011 and 2016, the number of green lands, bare lands, and water areas showed a decreasing trend, and construction land and farming land increased significantly. Cultivated land has always been the dominant landscape type in Baohe District of Hefei City. However, in the past 5 years, the indices such as patch density and dispersal index have shown an increasing trend, indicating that they are under the state of being divided into pieces, and the landscape fragmentation is serious. The shapes of various landscape types tend to be complicated and are in a fragmented state. The disappearance of some patches of green space has gradually made the green patches appear integral, which is also due to the effective implementation of greening measures in Hefei in recent years. The construction land gradually moved from the northwest and the middle to the southeast, reflecting the rapid construction and development of the Binhu New Area in Hefei in recent years.

Key words: High-resolution Remote Sensing Imagery; Multiple Classifier Integration; Random Forest; Landscape Pattern; Hefei City

引言

景观格局通常指景观的空间结构特征,是景观异质性的具体体现,它反映的是各种生态过程在不同尺度上的作用,包括景观组成单元的类型、数目以及空间分布与配置[1]。其中,土地利用景观格局是指不同大小和形状的土地利用型斑块在空间上的排列状况,是人为因素和自然因素共同作用的结果,具有显著的时空特征。

景观格局变化分析能够了解在一定时期内,一定地域内不同景观类型以及整体景观的变化,通过驱动力分析来了解变化发生的原因,從而为区域今后发展提供思路。随着遥感新技术的发展给景观格局分析提供了新的解决方案,目前该方面的研究内容一方面侧重于分析景观格局变化的意义及驱动力因素,如Mander等从人类社会的角度研究了欧洲中北部的遥感影像,并分析引起景观变化的主要因素[2];Thomas等基于时间和空间两个维度,分析并指出了不同的景观格局所具有的敏感性及抗干扰性存在差别[3]; Usher等通过实践其理论,论证了两个主导因素(人为因素、自然因素)如何促进景观结构功能变化[4];另一方面一些专家与学者将景观格局与其他领域相结合,侧重于对相关指数的计算与提取,从而为景观格局分析提供新的解决途径。Lee等基于GIS等技术,研究人为因素作为驱动力主要因素对Chiltern景观格局变化的影响[5];Kristensen等借助GIS技术,对1973-1995年间丹麦的Rostrup区域,受到农业活动的影响而发生的景观格局的变化进行研究[6]。

随着计算机硬件以及遥感技术的发展,遥感影像的空间分辨率和时间分辨率逐渐提高。高分辨率遥感影像因蕴含复杂的地物及空间信息被广泛应用于土地资源规划及生态环境保护等领域。但其纹理及空间信息含量丰富且细节复杂,给遥感影像的处理及分析造成了更复杂的难题。随机森林(Random Forest)是近几年较为流行一种机器学习的分类方法,该方法作为一种构造新型分类器的方法,为解决单一分类器分类特征单一、泛化性能差、选择分类器主观性强等问题,在遥感影像分类中获得广泛应用。

合肥市是安徽省的省会城市,其位于安徽省中部。21世纪初期,随着合肥市城市化进程的加快,合肥市的经济发展迅速,特别是包河区下辖滨湖新区,其景观格局发生了很大的变化,并衍生出一系列生态环境及土地需求矛盾。因此迫切需要对合肥市包河区近几年的景观格局变化特征进行研究及分析,并希望以此作为依据,为相关部门的规划建设提供有效的科学依据。

本文结合2011年和2016年合肥市包河区2期高分辨率遥感影像,采用近几年流行的多分类器集成方案中的随机森林方法进行基于像元的监督分类,并以此为数据基础进行景观格局指数的提取,从而对合肥市包河区进行景观格局变化分析,为合肥市制定土地资源管理政策和城市发展战略提供决策依据。

一、研究区概况

合肥市是安徽省省会城市,处中纬度地带北纬N31°51′,东经E117°16′。其地理位置优越,位于长江、淮河之间,以平原丘陵为主。合肥市现辖市辖区有4个,包括包河区、瑶海区、庐阳区、蜀山区。除此之外还下辖4个县(长丰县、肥东县、肥西县、庐江县)并代管1个县级市(巢湖市)。合肥市区目前全市行政辖区总面积为11445.06平方公里,其中市区建成区面积为403平方公里,巢湖水面面积770平方公里。

本文研究区域为合肥市包河区,为中国安徽省合肥市下辖的一个城区,位于合肥市东南部,因合肥旧城东南的包河得名。其滨临且位居巢湖西北,处长江与淮河之间,地理位置十分优越。包河区北面毗邻庐阳区、瑶海区,西依靠蜀山区,东邻肥东县,南邻巢湖。总面积340平方公里(其中巢湖水面面积70平方公里)。

二、数据来源与研究方法

(一)数据资料收集与处理

本文的主要研究数据为Google Earth截取的高分辨率遥感影像,包括2011年4月和2016年7月合肥市包河区全色影像数据,遥感影像为金字塔模型,其空间分辨率为1.24m。

(二)训练样本选择

根据《土地利用现状分类(GB/T 21010-2007)》,综合影像与实验地区的地理情况,并结合合肥市包河区土地资源的利用情况和特征以及遥感影像的特点,将合肥市包河区划分为绿地(Greenbelt)、裸地(Wasteland)、建筑用地(Buildings)、耕地(Farmland)和水域(Water)5种地物类型。训练样本类别间距尽可能大,样本质量尽可能高,即遵循“好而不同”的采样原则。

本文在多分类器集成实验中采用ENVI5.0作为影像预处理平台,并在遥感影像中圈划特征区域的像元训练样本。其中,每一类别训练样本个数分别为15000。训练样本与测试样本容量配比大约为1:50。五种典型地物类型训练样本如图1所示。

另外,本文在像元训练样本数据集的选取数量较大,样本容量达到75000,因此样本精度不是很大,可能会出现类间距离小,类内距离大的情况,但是在基于像元分类领域的样本选取上还是很具有代表性。

(三)随机森林模型

随机森林(Random Forest)是并行式集成学习方法中比较经典的算法,其相当于Bagging算法的一个拓展及延伸[7],即在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入了随机属性选择[8]。

随机森林的集成系统的建立方案基本与Bagging相同,同样基于不同样本的构造方式,并采用并行结构。通过对初始训练集的像元特征向量集合进行有放回的随机抽样(假设选取m个像元),然后对抽取出的训练样本集选取个体分类器(即决策树)进行分类。如此按照同样的随机抽样方法对初始的像元特征训练集抽取相同数量的子样本,并采用同种基分类器对该子样本进行分类,选取的子样本个数达到一定标准(假设为T),最后采用投票的方法对这些个体分类器的分类精度进行投票,从而筛选出最优的分类结果。特别地,传统的决策树在对测试集进行类别划分的时候采取在类别集合中寻优的基本原则,即在每一个节点均进行选择最好的类别标签进行划分。而随机森林模型中的基分类器首先对类别标签集合进行随机抽样,从中抽取样本容量为k的子集用于划分属性,随后在子集中进行寻优来划分测试集。

利用随机森林算法处理遥感影像分类流程图描述如图2所示。

(四)景观格局指数提取

景观格局研究中,景观格局指数用来反映景观各方面特征及其随时间变化所产生影响。它能够量化地表征景观格局,浓缩其信息[9]。根据研究区的实际情况,结合各指标的表征作用。本文从两个层级对景观格局进行研究,分别是类别层级(Class Level)和景观层级(Landscape Level)[10]。分别计算各种不同类型的景观指数(Landscape Metrics),然后再利用这些景观指数进行合肥市包河区土地利用情况的变化分析。各个景观指数计算公式及生态学意义在Fragstats4.1软件中均有具体说明。

分类结果用于景观格局指数提取流程如图4所示。由图3可知,分类好的结果为带有类别标签的图像矩阵,每种地物类别被赋予不同的颜色。首先将分类结果在ArcGIS10.0中进行栅格矢量化,从而提取出分类结果图中斑块的个数。然后对矢量化后的数据进行地理配准及坐标系加入,用以计算斑块的面积及周长。最后进行数据栅格化生成tif格式图像,然后导入到Fragstats4.1软件中进行景观格局指数的计算与提取。

三、结果与分析

为了解分类结果的准确度,本文建立在地面调查与查阅往年土地使用情况资料的基础上,在遥感影像上选取处于不同位置,且总面积约为研究区总面积2%的多个区域作为训练集进行监督检验,同时采取误差混淆矩阵关系表进行各地物类别及整体分类的精度评价。测试集采用重采样后分辨率为2000×2000的研究区影像。另外,为突出分类显示效果,本文遥感解译图均通过ArcGIS10.0进行地理配准后,按照行政边界进行裁剪。经过检验后显示,2011年和2016年的2期土地利用类型图的分类总体精度分别为81%和82%。

(一)斑块类别层级景观格局分析

利用Fragstats4.1软件得到软件计算所得到的类别层级的斑块类型面积(CA)与斑块数量(NP)2个景观指数,反映出合肥市2011和2016年合肥市包河区土地利用变化情况(如表1所示)。由表1可知,2011年,合肥市包河区土地利用类型以耕地、建筑用地和水域为主,占研究区总面积的72.32%。其主要是由于研究范围内有部分巢湖水域,且靠近肥西县边界,会有许多农耕用地。2011-2016年间,由于合肥市包河区政策导向和经济发展,以及近几年滨湖新区的发展建设,包河区建筑用地面积变化剧烈,增加了22.94%。变化最为剧烈的景观类型为绿地,减少了45.71%,同时水域面积也下降了8.78%。2011-2016年间,合肥市包河区在裸地、水域和绿地大量减少的趋势下,建筑用地和耕地均呈现出大量增加的趋势。至2016年,合肥市包河区的土地利用类型依旧以耕地、建筑用地和水域为主,三者的总量达到了研究区总面积的83.27%。

由斑块数量(NP)可知,2011-2016年间,所有类型的斑块数量均增加,除水域增加幅度不大,其他四类景观的斑块数量增加量均超过2011年斑块数量,这也说明整个研究区的景观破碎化严重,这也与研究区的经济发展和建设有关。

利用Fragstats4.1软件计算得到2期各景观要素斑块类别层级景观指数如表2和表3所示。结合表2和表3可以发现,2011-2016年间,耕地在面积大量增加的同时,斑块数量和斑块密度也逐渐增加,但斑块密度增加幅度较大,由15.99增加到57.71,表明农耕用地在发生破碎化。另外,总边缘长度(TE)的增加,说明人类活动对耕地影响较大,这也与这段时间内农耕用户侵占农田建造房屋的现象有一定联系。农耕地的破碎化导致系统不能同时吸引大量物种,这也使得农耕地的抵抗害虫害鸟干扰的能力加强,当发生病虫害时,农耕地破碎化反而能抑制害虫传播。

由分散指数(SPLIT)可知,裸地分散指数由305.39增加为3612.98,说明裸地破碎化严重。与此相反,绿地的分散指数由1639.90减少为706.24,说明合肥市包河区的绿化逐渐趋于规模化、体系化。2011年-2016年间,裸地和绿地的面积均有不同程度的减小,可能转化为耕地或者建筑用地。

2011-2016年间,建筑用地面积逐渐增加,其主要原因可能是其他类型斑块(如裸地和绿地)转化而来。由表2和表3对比可知,建筑用地在2011-2016年间总边缘长度(TE)变化最大,由原来的1847385.48m增加到6296763.19m,其斑块密度(PD)变化也很大,由9.90增加到67.31,说明其受人类活动影响较大。另外,由遥感解译图(图5)结果可知,建筑用地逐渐由西北区域向东南方向巢湖边移动,这也反映出近几年滨湖新区的建设效果明显。

2016年水域面积相对于2011年除面积稍有缩小,其它指数均无明显变化,说明整个包河区对水域的生态保护措施得当。另外,最大斑块指数(LPI)由2011年的23.24%减少为21.84%,说明占据水域面积最大的巢湖水域面积稍有减少,但整体生态完好。

(二)总体景观层级景观格局分析

利用Fragstats4.1软件得到合肥市2011和2016年总体景观层级上的景观指数(如表4所示)。由表4可知,2011-2016年研究區斑块密度(PD)由59.28增加到214.94,表明整个研究区的景观破碎化程度正在日益加深。聚集度指数(CONTAG)由原来的38.06%减少到33.15%,表明研究区内同种土地利用类型的空间聚集程度降低,空间分布逐渐趋向于分散,不同土地利用类型之间的共同边缘数量增加。2011-2016年间,研究区Shannon多样性指数(SHDI)减少但不明显,仅由原来的1.57减少到1.47,说明研究区内的景观异质性稍微减小,景观丰富度与多样性减少,景观受到其他斑块类型支配的作用增加。Shannon均匀度指数(SHEI)减少,表明研究区内景观分布没有以前均匀,这也与城市化程度加快,建筑用地侵蚀其他土地类型有关。景观形状指数(LSI)由2011年的67.45增加到2016年的144.49,说明整个研究区的景观格局在自然和人为因素的干扰下,形状逐渐趋于复杂。一般而言,形状指数与许多跨界的生态过程息息相关,即能量、物质及有机体穿越斑块边界的移动,同时形状越复杂,受边缘效应影响的栖息地就会增加[11]。

四、结论与讨论

随机森林是集成学习中的经典算法,其能够有效地解决传统单一分类器在自身局限性下无法进一步提高分类进度的问题。与单一分类器相比,随机森林的优势很明显,其泛化性能更好,且自由度高、稳定性强。特别地,随机森林的基分类器的多样性不仅来自样本扰动,还来自属性扰动,这使得其最终集成的分类的泛化效果可以通过个体分类器的差异进一步提升。本文基于随机森林模型的方法对高分辨率遥感影像进行基于像元的分类,2期分类总体精度均在80%以上,能够满足后续景观格局分析的基本需求。

同时本文借助RS和GIS技术,并配合量化的景观指数,针对合肥市包河区土地利用景观格局结构和变迁进行分析。

由斑块类型层级景观指数得知,2011-2016年间绿地、裸地和水域几类均表现为减少趋势,建筑用地和农耕用地大量增加。至2016年,合肥市土地利用类型以建筑用地、水域和耕地为主,其中耕地面积最大,其次为建筑用地和水域。耕地一直是合肥市包河区的优势景观类型,但是这5年间,其斑块密度、分散指数等几类指数呈现增加趋势,表明其正处于被蚕食分割的状态之下,景观破碎化严重。 各类景观类型的形状均趋于复杂化,且正处于破碎化状态。有些绿地斑块的消失,使得绿地斑块逐渐呈现出整体性,这也归功于合肥市近几年绿化措施的有效执行。2011-2016年间,建筑用地和耕地发生破碎化情形,斑块面积、斑块数量和斑块密度逐渐增加,2016年后建筑用地和耕地斑块数量的增加主要由其他斑块转化而来,且建筑用地逐渐由西北和中部,逐渐向东南方向移动,体现出合肥市近几年滨湖新区的建设和发展迅速。

由总体景观水平景观指数得知,合肥市包河区景观的破碎化程度日益加深;景观形状指数的增加,说明整个研究区的景观格局在自然和人为因素的干扰下,形状逐渐趋于复杂,且同种土地利用类型的景观空间分布趋于分散化;Shannon多样性和Shannon均匀度指数的减少,意味着整体景观在自然和人为因素的干扰下,形状趋于复杂化。

针对合肥市包河区存在的裸地、绿地面积锐减,建筑用地面积激增、景观破碎化日益加剧等问题,有关部门应根据当地的自然地理条件、社会经济状况和不同行政区的土地利用格局存在的不同问题,因地制宜制定土地利用和管理政策,合理利用土地资源,保护合肥市包河区的生态环境,促进其可持续发展。

参考文献

[1] 王耀宗. 陕北黄土高原退耕还林还草工程生态效益评价[D].西北农林科技大学,2010.

[2] Mander,Rob H.G. Jongman. Human impact on rural landscapes in central and northern Europe[J]. Landscape and Urban Planning,1998,41:149-153.

[3] Michael F. Thomas. Landscape sensitivity in time and space-an introduction[J]. Catena, 2001, 42(2), 83-98.

[4] Michael B. Usher. Landscape sensitivity: from theory to practice[J]. Catena,2001,42: 375-383.

[5] John T. Lee. The role of GIS in landscape assessment: using land-use-based criteria for an area of the Chiltern Hills Area of Outstanding Natural Beauty[J]. Land Use Policy, 1999,6(1), 23-32.

[6] S.P.Kristensen. Agricultural land use and landscape changes in Rostrup, Denmark: Processes of intensifica-tion and extensification[J]. Landscape and Urban Plan-ning, 1999,46(13):117-123.

[7] 范娜娜. 基于自適应模型和多特征融合的目标跟踪算法研究[D].哈尔滨工业大学,2016.

[8] 王超. 基于激光扫描仪的ETC系统设计与实现[D].华南理工大学,2016.

[9] 么欣欣,韩春兰,刘洪彬,钱凤魁. 基于RS与GIS的沈阳市土地利用及景观格局变化[D].水土保持研究,2014(02):1005-3409.

[10] 董晓晓. 西部生态脆弱区土地生态状况评价及预测[D].山东农业大学,2014.

[11] Carlson A,Hartman G.Tropical forest fragmentation and nest predation—an experimental study in an eastern arc montane forest, zania[J].Biodiversity & Conserva-tion,001,0(7):1077-1085.

猜你喜欢
景观格局随机森林合肥市
醒狮
送你一盆小多肉
合肥市朝霞小学
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
资源型城市转型中景规格局的优化
基于随机森林算法的飞机发动机故障诊断方法的研究
大都市边缘区土地利用规划对景观格局的影响
近十年我国城市景观生态学研究新进展