基于J48决策树算法的遥感土地利用变化分析

2014-08-01 01:11:34史泽鹏马中文马友华王强於忠祥
遥感信息 2014年1期
关键词:肥东县变化率决策树

史泽鹏,马中文,马友华,王强,於忠祥

(1.安徽农业大学 资源环境与信息技术研究所,合肥 230036;2.安徽农业大学国土资源研究所,合肥 230036)

1 引 言

土地利用变化是人类社会发展的一面镜子,它反映了人类与自然界相互影响、相互作用的一种特殊而又复杂的涉及土地资源自然属性和人类利用方式的社会自然现象[1]。早在1993年,“国际地圈与生物圈计划(IGBP)”和“全球变化人类影响和响应计划(HDP)”就共同将土地利用/土地覆盖变化(LUCC)列为全球变化研究的核心计划[2]。国际上利用遥感技术对土地利用的研究至少可以追溯至20世纪20年代。到了20世纪70年代,美国第一颗陆地球卫星(Landsat)的发射,开创了利用卫星遥感技术进行大范围土地利用调查的新纪元[3]。到了80年代后期,随着遥感技术与地理信息系统在土地研究中的广泛应用,土地利用动态变化监测得到了迅速的发展,并开始了以此为基础的土地利用优化决策的定量分析研究[4]。到90年代中期,则开始利用TM影像按州进行土地利用调查[3]。而国内这这方面的研究则起步较晚,直到20世纪70年代,才开始采用航空遥感与卫星相结合的方法进行土地资源调查。其中“中科院780工程”的“腾冲县大型综合航空遥感试验研究项目”,取得了丰硕的成果。在“七五”、“八五”及“九五”期间,国家逐渐将RS、GIS和GPS技术综合应用研究列为国家科技攻关重点项目[5-7]。

随着遥感和GIS技术的快速发展,很多学者开始利用遥感影像和GIS技术获取土地利用变化信息[8-9]。而选择合适的遥感分类方法则是遥感和GIS的土地利用变化分析领域的研究热点。因此,本文以合肥市肥东县为研究区域,在遥感和GIS的支持下,采用WEKA的J48决策树算法和监督分类中的最大似然法两种分类方法提取肥东县2000年~2011年的土地利用变化信息并进行分析,对于认识和了解肥东县甚至合肥市区域土地利用变化和社会经济、生态环境的健康、协调、可持续发展具有十分重要的意义。

2 研究区概况

肥东县地处江淮之间,居皖中腹地,位于省会合肥市东侧,北纬31°35′~北纬32°16′,东经117°19′~东经117°52′。交通便捷,区位优越,南临巢湖,北接定远县,东与全椒县、巢湖市接壤,西与长丰县、合肥市相连,史称“吴楚要冲、包公故里”。地势北高南低,县域总面积2206km2,人口109.5万,辖18个乡镇、3个开发园区、340个行政村。属北亚热带季风性气候,年均降水量960ml,蒸发量1483ml,蒸发量过大使地下水位有所降低,光照充足,无霜期较长,达235天,年平均气温在15℃。土壤类型以水稻土和黄棕壤为主。受东南太平洋季风气候影响,水、热、光资源均较为丰富,适宜多种植被生长。

3 研究材料与方法

3.1 研究数据和软件

本文的研究数据主要有涵盖研究区的2000年、2006年、2011年3期美国Landsat-7 ETM+影像和2011年德国RapidEye影像(表1);地形图(比例尺1∶50000)、肥东县行政区划图(比例尺1∶50000)。

本文运用的主要软件有WEKA 3.6(用于J48数据挖掘)、ENVI 4.7(用于遥感图像处理)、ArcGIS 10.0(用于土地利用变化分析)。

表1 遥感数据列表

3.2 研究方法

本文主要采用WEKA的J48决策树算法和监督分类中的最大似然法两种方法进行遥感图像解译,提取肥东县3期遥感影像的土地利用变化信息;并利用ArcGIS 10.0对遥感图像解译结果进行空间叠加分析,为土地利用转换矩阵的建立提供基础;通过一些土地利用变化模型来进行土地利用变化分析。本研究的技术流程图如图1所示。

4 遥感影像分类处理

4.1 遥感数据预处理

因购买的涵盖研究区的RapidEye影像已经经过辐射校正和几何校正等相关预处理,故本文主要对3期ETM+影像进行大气校正、几何精校正、图像裁剪等预处理。大气校正选择了ENVI中的Quick Atmospheric Correction功能进行快速大气校正;几何精校正的检验均方差RMS(Root Means Squared)小于0.7个像元,并选用了双线性插值法(Bilinear)对影像进行了重采样;使用了包含研究区行政界矩形框的规则裁剪方式对研究区3期ETM+影像进行切割。

图1 技术流程图

4.2 遥感图像分类

本文以全国遥感监测土地利用/覆盖分类体系为基础,并结合研究区实际和本文的研究目的建立了本研究的遥感分类体系,共为6类:耕地、林地、草地、水域、建设用地、未利用地。在分类方法上,监督分类方面,选择了监督分类中最常用、也是精度相对较高的最大似然法[10];决策树分类方面,本文主要用WEKA的J48决策树算法。WEKA的J48决策树算法实际上是对Quinlan的C4.5决策树算法的实现,并增加了很好的剪枝过程,其优点在于训练出的决策树规则易于理解且准确度较高,但对前期训练样本采集的准确性要求也较高。

本文运用WEKA的J48决策树分类算法的具体步骤是:通过在Google Earth中采集样本(保证较高的样本精确度),用采样样本在ArcGIS 10.0中提取遥感影像栅格值,将提取的栅格值进行标准化处理后,再利用WEKA软件进行数据挖掘,采用J48算法对样本进行训练,获取决策树规则,再将规则带入ENVI4.7中进行决策树分类,得到分类结果,流程图见图2。

图2 J48决策树分类流程图

4.3 分类后处理及分类精度验证

本文选用了ENVI中的Majority分析以及结合人机交互方式分别对分类结果进行了处理,并利用ENVI的精度评价功能,选取50个地面数据并结合Google Earth目视解译等方法,组成验证样本,构建混淆矩阵,对两种分类结果进行了精度验证,精度比较见表2。从表2中可以看出决策树分类的总精确度和Kappa系数均高于监督分类,且决策树分类的总精确度均在85%以上。故本文采用J48决策树分类的结果进行土地利用变化信息分析。

表2 监督分类与决策树分类精度比较

5 土地利用变化分析

土地利用变化主要体现在土地利用类型的变化、数量和质量的变化、土地利用结构和程度的变化以及土地利用区域差异的变化等方面[11]。本文主要从土地利用类型的数量、结构和程度3个方面对肥东县土地利用变化进行分析。

5.1 土地利用类型转换矩阵分析

按照本文建立的分类体系和遥感影像分类步骤,通过利用决策树分类的结果,提取了肥东县2000年、2006年、2011年的土地利用信息,并利用ArcGIS的制图功能得到肥东县2000年、2006年、2011年的土地利用分类图(图3)。

图3 2000年~2011年肥东县土地利用分类图

从3期土地利用分类图中可以明显看出,肥东县建设用地不断增加,耕地不断减少。其中,建设用地主要由肥东县城向四周扩散;2000年~2006年间,主要向西南方向扩张;2006年~2011年间,主要向西北、东南方向扩张;林地、草地、水域、未利用地均呈减少趋势。

为了量化各土地利用类型的变化情况,将3期分类结果在ArcGIS中进行空间叠加并进行处理,最后构建土地利用类型转换矩阵(见表3、表4)。

表3 2000年~2006年肥东县土地利用类型转换矩阵 单位:hm2

表4 2006年~2011年肥东县土地利用类型转换矩阵 单位:hm2

从表3、表4中可以看出,2000年~2006年和2006年~2011年间,肥东县土地利用类型转换面积最大的为均为耕地转换为建设用地,转化面积分别为26080.41hm2和31607.48hm2。同时段耕地转换为其他土地利用类型空间分布图见图4。

图4 肥东县耕地转换为其他用地类型图

5.2 土地利用类型的数量变化分析

本文主要通过分析土地利用变化幅度、单一土地利用类型变化率和综合土地利用年变化率,来了解土地利用类型的总量变化和总体态势。

5.2.1 土地利用变化幅度

土地利用变化幅度反映的是某研究区一定时间范围内土地利用类型的数量变化情况[12]。土地利用变化率更好地反映了土地利用变化幅度。结合肥东县土地利用类型转换矩阵的相关数据以及土地利用变化幅度、变化率公式(式1、式2),计算得到肥东县2个研究时段的土地利用变化幅度及变化率(图5、图6)。

ΔU=Uj-Ui

(1)

(2)

其中,ΔU表示研究时段内某一土地利用类型的变化幅度;S表示研究时段内某一土地利用类型的变化率;Ui表示研究初期某一土地利用类型的面积;Uj表示研究末期某一土地利用类型的面积。

图5 2000年~2011年肥东县土地利用类型数量变化幅度

从图5、图6中可以看出,2000年~2006年和2006年~2011年期间,建设用地面积均增加,除2000年~2006年期间水域面积略有增加外,其他土地利用类型均呈减少趋势。两个研究时段的土地利用类型变化幅度和变化率最大的均是建设用地,分别为25332.06hm2、64.00%和31632.18hm2、48.73%。

图6 2000年~2011年肥东县土地利用变化率

5.2.2 单一土地利用类型年变化率

单一土地利用类型年变化率,又叫单一土地利用类型动态度,它是以研究时段内单一土地利用类型的变化面积为基础,可以直观地反映单一土地利用类型的动态度。单一土地利用类型年变化量和年变化率计算模型(式3、式4):

(3)

(4)

式3、式4中,L表示研究区某一土地利用类型年变化量;K表示研究区某一土地利用类型年变化率;T表示研究时段年数;ΔU同式(1);S同式(2)。

通过公式(3)、公式(4)计算得到肥东县2个研究时段各土地利用类型的年变化量和变化率,如表5所示。

从表5中可以看出,2000年~2006年和2006年~2011年期间,建设用地的年变化量和年变化率最大的均为建设用地,分别为4222.01hm2、10.67%和6326.44hm2、9.75%。

表5 2000年~2011年肥东县单一土地利用类型年变化量及变化率

5.2.3 综合土地利用年变化率

综合土地利用年变化率,又叫综合土地利用动态度,它能反映研究区某一时间段土地利用总体趋势[5]。其计算模型(式5):

(5)

式5中,Z表示研究区某一时间段内综合土地利用年变化率;ΔZx-y表示研究时段内第x类土地利用类型转换为非x类土地利用类型面积的绝对值;Zx表示研究初期第x类土地利用类型面积;T表示研究时段年数。

按照土地利用年变化率可以将中国土地利用的时间动态特征划分为4种类型[13],见表6。

表6 中国土地利用时间动态特征类型

通过公式5计算得到2000年~2006年、2006年~2011年两个研究时段的综合土地利用年变化率分别为7.68和8.48,再结合表6,可以发现研究时段内,肥东县土地利用变化均处于慢速变化类型,但很明显变化速度越来越快。由此可见,在不久的将来,肥东县土地利用变化很快就会进入快速变化时期。

5.3 土地利用结构变化分析

运用遥感分类结果和ArcGIS的空间数据库等功能,得到肥东县2000年、2006年、2011年土地利用结构信息(表7)。

表7 2000年~2011年肥东县土地利用类型面积及比例

从表7中可以看出,肥东县的耕地面积占土地总面积的比例由2000年的55.41%下降达到2006年的45.75%,到2011年,耕地面积比例则下降到39.73%;建设用地占土地总面积中的比例由2000年的17.94%上升到2006年的29.43%,2011年时,建设用地则上升到43.77%;草地、林地和未利用地在2000年~2011年时间段均呈减少趋势。

5.4 土地利用程度变化分析

一个地区的土地利用程度的变化是该区域中多种土地利用类型综合变化的结果,它可以定量地反映该区域土地利用的综合水平和变化趋势[14]。在中国资源环境数据库中,刘纪远等从生态学的角度提出了土地利用程度分级标准(表8)[15]。

表8 土地利用类型分级指数表

土地利用程度及其变化可分别用土地利用程度综合指数(式6)[ 12、16]、土地利用程度变化量(式7)和变化率(式8)[12]表示。

(6)

(7)

(8)

上式中,Ma和Mb分别表示a时段和b时段土地利用程度综合指数,土地利用程度指数介于100~400之间;Ax表示第x级土地利用程度综合指数;Cx表示第x级土地利用类型面积百分比;Cxa和Cxb分别表示a时段和b时段第x级土地利用类型面积百分比;ΔMb-a表示土地利用程度变化量;R表示土地利用程度变化率。

若ΔMb-a>0,表示该区域土地利用处于发展期;若ΔMb-a<0,表示该区域土地利用处于衰退期或调整期。根据上式计算得到表9。

表9 2000年~2011年肥东县土地利用程度综合指数、变化量及变化率

从表9中可以看出,肥东县2000年、2006年、2011年的土地利用程度综合指数分别为289.64、303.57、327.53,这与土地利用程度综合指数的最大值400相比,说明研究时段内肥东县土地利用程度综合指数值都比较高且呈增加趋势,与肥东县地形地貌和经济发展水平相符合;2000年~2006年和2006年~2011年肥东县土地利用程度变化量、变化率分别为13.12、4.81%和23.96、7.89%,研究时段内变化量均大于0,说明肥东县在研究时段内土地利用处于发展期,且后一阶段变化量和变化率均大于前一阶段,说明肥东县土地利用变化越来越快。

6 结束语

在遥感图像解译方法上,采用WEKA的J48决策树算法的分类精度要高于监督分类中的最大似然法。J48决策树算法增加了很好的剪枝过程,其优点在于训练出的的决策树规则比较容易理解并且准确度较高,因此,利用其训练出的规则进行土地利用分类,可以得到较高的分类精度。但是运用该方法的前提是一定要保证前期采集的训练样本的准确性,否则就会降低最终的分类精度。

在土地利用变化分析方面,肥东县2000年~2011年的11年间土地利用类型在数量、结构和程度方面发生了较大的变化。在数量方面,建设用地在两个研究时段的土地利用变化幅度和变化率均最大;2000年~2006年和2006年~2011年肥东县的综合土地利用年变化率分别为7.68%和8.48%,尽管两个研究时段均处于土地慢速变化型的范围内,但可以预见,随着经济的快速发展,肥东县的土地利用变化速度正在逐渐加快。在结构方面,建设用地在肥东县土地总面积中所占比例从2000年的17.94%上升到2011年的43.77%,耕地在肥东县土地总面积中所占比例从2000年的55.41%下降到2011年的39.73%,草地、水域、林地和未利用地所占比例在研究时段内均呈减少趋势。在程度方面,2000年、2006年和2011年肥东县的土地利用程度综合指数分别为289.64、303.57和327.53,说明肥东县的土地利用综合水平随着经济发展在逐步提高且速度越来越快。

参考文献:

[1] 蔡运龙.土地利用/土地覆被变化研究:寻求新的综合途径[J].地理研究,2001,20(6):645-652.

[2] TURNER II B L,MASS R H,SKOLE D L.Relating land use and global land-cover chrange[R].IGBP Report No.24 and HDP Report No.5,1993.

[3] 王瑞国.遥感土地利用动态监测变化信息自动提取与实证研究[D].长春:东北农业大学,2007.

[4] 李学梅,李忠峰.土地利用/覆盖变化研究进展及其意义[J].安徽农业科学,2008,36(6):2462-2464.

[5] 刘纪远,布和敖斯尔.中国土地利用变化现代过程时空特征的研究:基于卫星遥感数据[J].第四纪研究,2000,20(3):229-239.

[6] 庄大方,刘纪远.中国土地利用程度的区域分异模型研究[J].自然资源学报,1997,12(2):105-111.

[7] 郑国强,江南,于兴修.长江下游沿线土地利用区域结构演化分析[J].自然资源学报,2003.18(5):568-572.

[8] QUARMBY N A,CUSHNLE J L.Monitoring urban land cover changes at the urban hinge from SPOT HRV iraagery south-east England[J].International Journal of Remote Sensing,1989(10):953-963.

[9] 戴声佩,张勃.利用Landsat影像构建河西绿洲土地利用信息图谱—以张掖市甘州区为例[J].遥感信息,2012,27(5):107-114.

[10] 史泽鹏,王玉佳,马友华,等.遥感影像土地利用/覆盖分类方法研究进展[J].中国农学通报,2012,28(12):273-278.

[11] 刘纪远.中国资源环境遥感宏观调查与动态研究[M].北京,中国科学技术出版社,1996:158-188.

[12] 王秀兰,包玉梅.土地利用动态变化研究方法探讨[J].地理科学进展,1999,18(1):81-86.

[13] 于思远,刘纪远,张增祥,等.中国土地利用时空特征分析[J].地理学报,2001,56(6):631-639.

[14] 刘静玉,钱乐祥,苗长虹,等.基于RS与GIS技术的豫西山地典型区域LUCC动态监测研究[J].河南大学学报(自然科学版),2005,35(2):47-51.

[15] LIU J Y.The macro investigation and dynamic research of the resource and environment[M],Beijing:Science and Technology Press,1996:158-188.

[16] 庄大方,刘纪远.中国土地利用程度的区域分异模型研究[J].自然资源学报,1997,12(2):105-111.

猜你喜欢
肥东县变化率决策树
寒假读好书 书香伴成长
下一代英才(2023年2期)2023-04-20 11:17:58
基于电流变化率的交流滤波器失谐元件在线辨识方法
湖南电力(2021年4期)2021-11-05 06:44:42
开办“包公家宴职工食堂”安徽肥东县擦亮廉政品牌
中国食品(2021年12期)2021-07-21 07:10:33
例谈中考题中的变化率问题
关于肥东县“党建+ 电商扶贫”的思考
活力(2019年17期)2019-11-26 00:41:34
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
基于决策树的出租车乘客出行目的识别
利用基波相量变化率的快速选相方法
川滇地区地壳应变能密度变化率与强震复发间隔的数值模拟
地震地质(2015年3期)2015-12-25 03:29:53