基于Markov-C5.0的CA城市用地布局模拟预测方法

2015-01-12 05:43卢新海彭明军潘琛玲
中国土地科学 2015年6期
关键词:武汉市土地利用用地

孟 成,卢新海,彭明军,潘琛玲

(1.华中科技大学公共管理学院,湖北 武汉 430074;2.武汉市国土资源和规划信息中心,湖北 武汉 430014)

基于Markov-C5.0的CA城市用地布局模拟预测方法

孟 成1,2,卢新海1,彭明军2,潘琛玲2

(1.华中科技大学公共管理学院,湖北 武汉 430074;2.武汉市国土资源和规划信息中心,湖北 武汉 430014)

研究目的:针对多用地类别的城市用地模拟预测提出一种科学合理的预测模型,为土地利用总体规划编制和土地利用结构优化调整提供依据和技术方法。研究方法:在分析了城市用地模拟预测中常用方法的优缺点和适用环境后,提出了一种综合采用Markov模型和C 5.0分类算法的城市用地布局模拟预测CA模型,该模型的思想是采用Markov方法获取各类土地之间的流向,结合各类土地规模的预测结果确定用地增长量,采用C 5.0分类算法获取各类土地之间的转换规则,最后以武汉市为例对该方法进行了论证。研究结果:通过该方法模拟的武汉市2012年各类土地的规模和分布总模拟精度达到91.2%,与实际情况高度一致,说明该方法能够很好的模拟武汉市的土地利用规模和布局。研究结论:该方法可以直观的了解各空间因子与转换规则的关系,并能够很好的对城市的未来情况进行模拟预测,还能够了解城市内部各类用地间的作用机理。

土地信息;城市用地模拟;Markov;C 5.0;元胞自动机

1 前言

土地是城市的基础,随着城市的发展,有限的土地资源与人类对土地无限的需求、社会经济的快速发展和人口不断增加之间的矛盾日益明显。科学合理地模拟预测土地规模和土地布局不仅关系到人民生活水平的稳步提高和国民经济的持续发展,也能为土地利用总体规划编制和土地利用结构优化调整提供科学的依据,为合理地解决土地资源与人口、经济、社会等之间的矛盾提供技术方法[1]。

元胞自动机模型(简称CA模型)是一种时间、空间与状态离散,时间因果关系和空间相互作用为局部的网格动力学模型。模型包括元胞空间、元胞状态、元胞邻域和转换规则4个基本要素,其核心是定义元胞的转换规则,这种转换规则使元胞自动机模型具有模拟复杂系统时空演变过程的能力[2]。目前CA模型转换规则的获取方法繁多,按照获取方式不同可分为传统的方法和智能的方法两类,传统的规则获取方法包括多准则判断法、Logistic回归法、基于“灰度”的转换规则获取方法、SLEUTH模型法、基于Markov模型的方法、基于神经网络的方法等[3-5]。这类方法较为容易理解,易于计算,但是也存在一系列问题,如模型参数确定的随意性较大,历史数据校正存在一定难度,在模拟过程中需要反复调整参数值,直至找到最佳的参数组合为止等问题[6]。智能的规则获取方法包括基于遗传算法的方法、基于Fisher判别的方法、基于非线性核学习机的方法、基于支持向量机的方法、基于粗集的方法等[6-7]。这类方法较传统的方法能够解决更加复杂的城市模拟问题,但存在模型公式不直观,计算复杂等问题,如基于数据挖掘算法的CA模型,需要通过经验判断对转换规则进行修剪,基于遗传算法的CA模型,需要人为设置交叉率、突变率等参数值,基于非线性核学习机和基于支持向量机的方法在针对多用地类别土地的预测时模型表达复杂,计算量大[6]。针对这种情况,本文将数据挖掘算法引入传统的Markov-CA模型,提出了基于C 5.0分类算法的分阶段Markov-CA模型。

马尔可夫过程是一种随机过程,由俄国的数学家Markov于1907年提出。马尔可夫分析方法是指假设随机变量处于马尔可夫过程时,通过分析其现势变化预测随机变量未来发展的预测方法。在土地利用变化中,可将土地利用变化过程视为马尔科夫过程,将某一时刻的土地类别对应于Markov过程中的状态[8]。Markov-CA模型利用土地转换概率矩阵作为土地利用变化的规则预测未来的土地发展,其优点是能够同时研究多种类别土地之间的相互作用,了解不同类别土地之间的转移关系,其缺点是在实际的土地转移过程中,因为前后两个时期的土地转移量和转移速度不同,因此将一个静态阶段的变化趋势作为土地类别转换规则与真实土地利用变化情况不符,特别是在发展变化不平稳的区域,传统的Markov-CA模型的预测结果很难符合研究需要。本文提出的分阶段Markov-C 5.0的CA模型继承了传统Markov-CA模型可客观获得多类别土地间转换方向和通过数据挖掘算法自动获得各类土地间转换规则的优点,消除了Markov模型中因为前后两个时期的土地转移量和转移速度不同导致的预测的结果失真和数据挖掘获取的转换规则修剪标准不明确的问题。

2 研究思路及方法

基于Markov-C 5.0分类算法的CA模型将整个模拟过程概括为两个阶段。第一个阶段是基于Markov模型的土地转移趋势研究,通过Markov模型获取各类土地之间的转换方向;第二阶段是基于C 5.0分类算法的CA规则获取,采用C 5.0算法计算在空间因子的作用下,各类土地间的转换规则(图1)。

2.1 基于Markov模型的土地转移趋势研究

基于Markov的CA模型可运用多标准评价法和多目标决策支持系统模型定义各类土地间的转移规则。Markov-CA模型在对未来土地利用规模和结构准确预测的基础上,通过邻域关系分析加强了空间格局的模拟能力,模型的工作原理是以预测基期土地为初始状态,以基期和之前的土地利用转移面积、适宜性图集所表述的土地利用数据为依据,对各类用地重新分配,直至达到各类土地的预测面积[9]。本文将Markov-CA模型的研究成果划分为两部分,一部分是通过马尔科夫模型计算的土地利用转移方向,另一部分是计算各类土地间的转移量。在实际的土地转移过程中,由于前后两个相同的研究时段内实际的土地转移量和转移速度并不相同,为了更合理的模拟各类土地之间的转移,本文只取Markov-CA模型对于土地流向的研究成果。通过马尔科夫模型计算土地利用转移概率矩阵的公式为:S(t + 1)= Pij× S(t)。S(t + 1),S(t)分别表示t + 1和t时刻的系统状态,Pij为土地状态转移的概率矩阵,如式1(0<Pij<1,且i,j = 1,2,…,n),n为土地利用类型:

图1 Markov-C 5.0算法的CA模型模拟城市土地变化的流程图Fig.1 The fow chart of urban growth simulation by CA based on Markov model and C 5.0

2.2 基于C5.0分类算法的CA规则获取

将土地利用数据作为离散数据集,将前一期土地利用数据和各空间因子作为输入层,将末期土地利用数据作为输出层,通过C 5.0分类算法建立决策树模型,得到各类土地在空间因子作用下的转换规则,根据2.1节中计算的各类土地之间的流向对决策树进行修剪,得到最终转换规则。C 5.0是决策树模型中用于大数据集上的分类算法,具有如下优点:(1)在数据有遗漏或者输入的字段较多的问题时表现稳健;(2)在估值中不需要很长的训练次数;(3)较其他模型更易于理解,模型规则直观;(4)能够多次进行大于两个子集的分割。C 5.0算法将信息熵的下降速度作为确定最佳分支变量以及分割阀值的依据[10]。

通常采用如下方法计算C 5.0决策树中的信息增益:设训练样本集中有m个独立类ci,i = 1,2,…,m,Ri为数据集S中属于Ci的子集,用ri表示Ri中的元组数量,则集合的S在分类中的期望值可表示如式2:式2中,pi表示任意样本属于ci的概率,pi= ri/ ︱S︱。︱S︱为训练样本集中的元组。设A表示属性,共有v个不同的值{a1,a2,…,av},则根据A把样本集划分成v个子集。令Sj为数据集S中的属性,取值为aj的子集,i = 1,2,…,v。在分类中,如果A决策属性,则可以将样本集划分到不同分枝中[11]。若用Sij表示Sj子集中属于Ci类的元组的数据,那么A对于ci,i = 1,2,…,m的熵的计算式如式3—式4:

式4中,Wj为Sj在S中的比重,可以作为Sj的权重。

A的每个取值对Ci的期望表示如式5:

式5中,Pij= Sij/ | Sj|,表示Sj中属于Ci的比重。

通过以上计算得到A作为决策分类属性的度量值,也称信息增益:

由于信息增益在把样本集划分为更小的子集时,对变量的取值存在着一定偏差。为了减少偏差,计算得到:

从而可以得到增益率(GrainRatio):

2.3 城市用地模拟预测结果评价

Kappa系数是一种用来计算分类精度的算法,其计算公式如下:它通过把所有真实分类的像元总数乘以混淆矩阵对角线的和,减去某一类真实的像元总数与被误分为该类像元的总数之积对所有类别求和的结果,再除以总像元数的平方差减去某一类真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的。Kappa计算结果通常是落在 0—1之间,可分为5组表示不同级别的一致性:当在0.00—0.20间时为极低的一致性,当在0.21—0.40时为一般的一致性,当在0.41—0.60时为中等的一致性,当在0.61—0.80时为高度的一致性,当在0.81—1.00之间时则几乎为完全一致。

3 数据分析及预测

随着武汉市近年来经济社会快速发展,城市各类用地每年的发展趋势和变化速度并非简单的线性变化,因此,本文提出分阶段的Markov-C 5.0的CA模型很好的解决了这个问题。

3.1 研究区域分析

武汉市地处江汉平原的东部,位于长江中下游地带与汉水交汇处,总面积为8569.36 km2,截至2012年底城市建成区面积约为520.3 km2,共13个行政区。至2012年,武汉市共有常住人口1012×104人,国民生产总值8003.82×108元(数据来源于《武汉市统计年鉴(2013)》)。

依据2007年版《土地利用现状分类》对土地进行分类,并将耕地、园地、林地和草地归并为一类,交通运输用地除街巷用地外作为一类,水域及水利设施用地作为一类, 其他土地中除空闲地以外的部分作为一类,一级地类中的公共管理与公共服务用地、住宅用地、商服用地、工矿仓储用地、特殊用地及二级地类中的街巷用地、空闲地归并作为一类称为城镇村及工矿用地,同时对该类地进行二级划分,分为城市用地、建制镇用地、村庄用地、采矿和风景名胜用地及特殊用地5类。最终得到武汉市2002—2012年的各类土地数量(表1)。另外,选取武汉市道路框架数据、环线数据、城市中心点、各行政区中心点、轨道交通线、机场火车站等对外交通站点、水系水域边界等作为空间因子。武汉市2002—2012年土地利用数据及各空间因子来源于武汉市国土资源和规划信息中心。

表1 武汉市2002—2012年各类土地数据表 单位:km2Tab.1 Land use data of Wuhan from 2002 to 2012 unit: km2

图2 武汉市2002—2012年各类土地之间转换图Fig.2 The transition chart of various types of land from 2002 to 2012 in Wuhan

3.2 土地转移趋势分析

通过马尔科夫模型计算相邻年份土地利用转移矩阵,通过转移矩阵获得相邻年份各类土地间转移关系(图2)。

通过分析历年各类土地间的转换图可知,2008—2009年土地转移较为复杂,主要因为2008—2009年为新旧土地利用分类标准更替的时间线。因此,为了能够达到通过转移概率矩阵获得土地流向的目的,必须将转移矩阵分为两部分进行研究,即第一部分为2002—2008年,第二部分为2009—2012年。根据这两部分土地利用转移概率矩阵可知武汉市各类土地的流向,即农林地转移方向为水域及水利设施用地、建制镇用地、村庄用地和采矿用地,交通运输用地转移为采矿用地,水域水利设施用地转移为采矿用地、建制镇用地,其他土地转移为农林地、城市用地、建制镇用地、交通运输用地和采矿用地,城市用地转移为其他类型土地、交通运输用地,建制镇用地转移为城市用地、采矿用地和交通运输用地,村庄用地转移为农林地、建制镇用地、采矿用地,采矿用地可转移为农林地、交通运输用地、城市用地、建制镇用地,风景名胜及特殊用地转移为农林地、采矿用地。结合研究成果,可知自2009年后水域及水利设施用地、采矿用地、风景名胜及特殊用地三类用地的变化较为稳定,且建设用地一般不可逆转为农林地,因此可初步判定未来土地的流向为农林地转移为建制镇用地和村庄用地,其他土地转移为城市用地和建制镇用地,城市用地转移为交通运输用地,建制镇用地转移为交通运输用地和城市用地,村庄用地转移为建制镇用地,水域及水利设施用地、交通运输用地、采矿用地、风景名胜及特殊用地不发生转移(图3)。

图3 武汉市各类土地之间转移图Fig.3 The transition chart of various types of land in Wuhan

图4 获取的土地转换规则Fig.4 The land conversion rules

3.3 土地转移规则获取

由于经过2008年土地利用分类标准调整以及采矿用地向其他各类型土地换换后,各土地类型的转移方向逐渐趋于稳定,因此本文中设计的实验数据主要以2009、2010年土地利用数据作为首末期数据,将形成的规则预测2012年土地利用数据,再与2012年土地利用的真实数据进行比较验证转换规则的可靠性。由于研究中数据量较为庞大,因此在进行数据挖掘之前要对样本数据进行抽样,缩小数据集以提高数据的挖掘效率,本文采用随机抽样的方法进行,随机率设为50%。最后选择C 5.0算法进行数据挖掘,形成决策树如下,共有8级菜单(图4为C 5.0模型输出的4级展开菜单)。

根据决策树结果以及Markov模型计算出的各类土地流向,对土地转换规则进行修剪,最终确定了农林地、其他土地、村庄用地以及建制镇用地转移到相应用地类型的转换规则。

3.4预测结果评价

根据本文提出的Markov-C 5.0分类算法的CA模型得到2012年武汉市各类土地分布的模拟结果图如图5,封三(其中1表示水域水利设施用地,2表示其他用地,3表示风景名胜用地,4表示采矿用地,5表示村庄用地,6表示建制镇用地,7表示交通运输用地,8表示城市用地,9表示农林地)。分别计算各类用地模拟结果的Kappa系数,并转化为百分制形式以表示各类用地的模拟精度。农林地模拟精度为98.7%,交通运输用地模拟精度为60.1%,水域水利设施用地模拟精度为91.4%,其他用地模拟精度为66.7%,城市用地模拟精度为95.7%,建制镇用地模拟精度为88.6%,村庄用地模拟精度为52.1%,采矿用地模拟精度为72.5%,风景名胜用地模拟精度为76.2%,总模拟精度为91.2%。根据模拟精度可知,除村庄用地的模拟精度属于中度一致外,其他各类用地的模拟精度均属于高度一致,且总模拟精度也为高度一致,由此可知,通过基于马尔科夫方法获取各类土地流向并通过C 5.0算法进行数据挖掘获得的用地类型转换规则的模型能够很好的模拟武汉市的土地利用规模和布局。

4 结论

本文提出了一种基于Markov-C 5.0分类算法的分阶段城市用地布局模拟预测CA模型,该方法将城市用地布局模拟预测分为用地增长量计算和土地转换规则获取两个阶段。经过实例论证,可以证明这种分阶段的城市用地布局模拟预测CA模型的模拟结果精度较高,也与研究区域的实际情况更加接近。下一步,可在此基础上对模型进一步扩展,如对城市以内的行政区、街道、社区和城市以外的城市群、卫星城并进行研究。如武汉市与鄂州市、黄石市、咸宁市、汉江市、孝感市和黄冈市组成的“1+6”城市圈,向下可以将研究区域进一步细分,如按照两江四岸、中心城区远城区、各街道社区等尺度设计不同的预测模型,根据各研究区域的特点选用不同的驱动因子和空间因子作为模型参数进行模拟研究。

):

[1] 李宗华,汪如民,童秋英. 基于优化组合模型的建设用地增长趋势预测[A] . 2009年中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C] . 2009:1 - 10.

[2] 周成虎,孙战利,谢一春,等. 地理元胞自动机研究[M] .北京:科学出版社,1999:26 - 41.

[3] 冯科,吴次芳,韩昊英. 国内外城市蔓延的研究进展及思考——定量测度、内在机理及调控策略[J] .城市规划学刊,2009,180(2):38 - 43.

[4] 刘红萍,张安录. 国外城市用地扩张控制研究进展[J] . 中国土地科学,2008,22(5):72 - 76.

[5] 冯徽徽,刘慧平,周彬学,等. SLEUTH模型的参数行为研究[J] . 地理与地理信息科学,2012,28(6):39 - 43.

[6] 孟成,周鹏. 地理元胞自动机转换规则获取方法综述[J] .城市规划信息化,2014,41(2):63 - 65.

[7] 王良健,师迎春,林目轩. BP神经网络结合小波处理在城市扩张预测中的应用——以长沙市区为例[J] .中国土地科学,2008,22(1):39 - 47.

[8] 刘县明. CA-Markov复合模型及其在城市土地利用中的应用研究[D] .南昌:南昌大学,2007:24 - 40.

[9] Liu S,Yu X,Li Q,et al. Land use change in loess hilly region based on CA-Markov model[J] . Transactions of the Chinese Society of Agricultural Engineering,2010,26(11):297 - 303.

[10] 柯新利,边馥苓.基于C5.0决策树算法的元胞自动机土地利用变化模拟模型[J] . 长江流域资源与环境,2010,19(4):403 - 409.

[11] J.R. Quinlan. Data mining tools See5 and C5.0[EB/OL] . http://www.rulequest.com/see5-info.html.

(本文责编:陈美景)

A Land Layout Simulation Model based on CA and Markov-C 5.0 Classifcation

MENG Cheng1,2, LU Xin-hai1, PENG Ming-jun2, PAN Chen-ling2
(1. College of Public Administration, Huazhong University of Science and Technology, Wuhan 430074, China; 2. Wuhan Land Reserous and Urban Planing Infomation Center, Wuhan 430014, China)

The purpose of this paper is to devise a scientific and reasonable land use layout simulation model,which aims to provide a scientific reference and method for land use overall planning and adjustment. The research analyses the advantages and disadvantages of the common land area forecasting and land layout simulation methods, and devises a CA model which combines the synthesis of Markov model and C 5.0 classification algorithm. The Markov-C 5.0 model obtains land-circulating direction by Markov model,calculates the land area growth by hybrid predictive model, and gets the coversion rules of different land types by C 5.0 algorithm. The method is applied to simulate the land area and layout of Wuhan in 2012, and the simulation accuracy is 91.2%. It concludes that the Markov-C 5.0 model is advanced and availability, and simulate land use structure and distribution efficiently.

land information; land use forecasting and land layout simulation; Markov model; C 5.0; CA model

F301.2

A

1001-8158(2015)06-0082-07

10.13708/j.cnki.cn11-2640.2015.06.011

2014-10-21

2015-04-08

国家“十二五”科技支撑计划(2013BAJ05B02)。

孟成(1985-),男,湖北武汉人,博士。主要研究方向为土地资源管理、地理信息。E-mail: meng_cheng@foxmail.com

卢新海(1965-),男,湖北洪湖人,教授。主要研究方向为土地管理、城市管理。E-mail: xinhailu@163.com

猜你喜欢
武汉市土地利用用地
土地利用变化与大气污染物的相关性研究
武汉市勘察设计有限公司
武汉市中小学优秀自制教具评选活动成功举办
Synaptic aging disrupts synaptic morphology and function in cerebellar Purkinje cells
土地利用规划的环境影响评价
土地利用生态系统服务研究进展及启示
济宁市城乡建设用地增减挂钩政策实施评价
第十届中国足球协会第三次会员大会在湖北省武汉市召开
城乡建设用地增减挂钩政策的演变
国土资源部启动全国土地变更调查临时用地审核