快速城市化的空间过程检测与动态机制分析

2018-10-16 08:22刘嘉勋周桢津李满春
地理信息世界 2018年3期
关键词:建成区用地分类

张 戈,刘嘉勋,马 磊,周桢津,李满春

(南京大学 地理与海洋科学学院,江苏 南京 210023)

0 引 言

改革开放以来我国城市化发展规模空前,长三角尤为突出.准确描绘城市建成区扩张,进一步剖析其空间扩张与动态机制已成为管理城市发展与城市规划的重要内容与任务.

以往各城市相关部门往往使用人口普查区块界定建成区边界,然而由于统计数据不完备,且各地在具体操作中标准不一致,使长时间序列研究与城市间比较研究存在困难.而使用长时间范围的中、高分辨率影像对城市扩张监测,可获得建成区准确面积和动态空间信息.但以往基于像素的方法,由于纹理、形状和空间关系等特征的缺失和城市具有的高度复杂性,在高精度提取方面遇到挑战.因此,应用面向对象影像分析(OBIA)较为合适[1-2].OBIA和随机森林(RF)的结合,可自动探索构建规则集,为解决高复杂异质性LUCC分类提供了新的途径[3-4].为监测建成区扩张,应定义"建成区"一词.通过文献调研,本研究定义建成区为包含局部空间集聚的城市建设用地、且面积大于等于1 km2的区域,其中可能包含一些零星的植被和水体.

城市扩张受到诸多因素影响,对其驱动力的研究,方法从定性描述发展为各种定量统计模型[5-8].但以行政区为研究单元,可能会遇到分析单元一致性问题.若模型能使用建成区扩张过程的可靠地理信息数据,并将所有驱动因子空间化至格网,将更合理.此外,城市是不断发展的有机体,城市建成区扩张也表现出明显的阶段性特征.因此,假设建成区扩张的驱动力随着时间的推移而动态变化是合理的.

为实现建成区的高精度提取及其空间扩张驱动力的动态分析,本研究提出集建成区提取与分析于一体的技术框架,结合RF与OBIA为建成区提取提供高质量的矢量数据源,并应用RF回归的变量重要性度量探索城市扩张的动态机制.

1 研究区与数据集

1.1 研究区概况

研究区位于我国东部,是长三角城市群的重要组成部分.长三角作为我国"一带一路"战略中海陆双向开放的重要节点,是服务"一带一路"建设的枢纽平台和辐射中心,区位优势明显.本研究的研究区属于北亚热带气候,地势平坦,交通便利,面积为1865.48 km2,区位图如图1所示.

图1 研究区区位图Fig.1 Location of study area

1.2 数据源及预处理

考虑到Landsat系列影像的较长时间序列和开放易获取性,以及对于一个城市尺度中分辨率影像的适用性,本研究选择Landsat系列影像,具体时间为9/10/1991、8/3/1995、7/7/2000、5/24/2005、9/17/2010与9/27/2015,所有影像均为无云且高质量,使用UTM WGS84投影系统为地理参考,并使用ENVI 5.2进行辐射定标与大气校正.

在驱动力分析中,本研究还使用了1995、2000、2005、2010、2015年研究区相关时空数据,包括数字高程模型(DEM,30 mX30 m)、交通数据和水系数据.本研究还使用了中科院资源与环境科学数据中心(RESDC)提供的GDP密度和人口密度数据(http://www.resdc.cn).

2 研究方法

本研究采用4个模块组成的分析框架.第1个模块结合RF与OBIA以获得高质量分类结果;第2个模块是根据定义,从分类结果提取建成区;第3、第4个模块为更好地理解建成区扩张,分析了建成区扩张强度与扩张驱动力.

2.1 基于RF的面向对象影像分类

基于RF的面向对象影像分类主要包含影像分割、采样与样本分类、特征选择、使用RF训练、使用已训练好的RF分类与分类精度验证等阶段.

首先通过分割创建对象.本研究采用多尺度分割,为了使分割结果具有最佳同质性,分割尺度参数尤为关键[9],本研究使用Estimation_Scale_Parameter2(ESP2)工具来获得最佳分割尺度参数.具体参数设置为:自下而上层次结构,对3个层级采用默认的1、10、100尺度增量和步长为1,循环次数为100,形状因子为0.1,紧凑度因子为0.5,所有波段采用相同权重.

本研究定义了2种土地利用类型,即建设用地与非建设用地.前者包含了城市建设用地、农村居民点和其他建设用地,后者包含了研究区土地利用类型中存在的所有非建设用地.由于研究区为北亚热带气候,夏秋季裸地被草覆盖.为便于分类,将非建设用地类分为两个子类:水域和植被.每幅图像共选取2 100个对象(700个建设用地、700个植被、700个水域)作为RF训练样本,专门用于RF的生成.样本特征选择了最具代表性光谱、几何、纹理特征[10],见表1.

表1 本研究中所选对象特征概览Tab.1 Overview of selected object attributes in this study

表中,NDBI1、NDBI2具体使用波段如公式(1)、公式(2)所示:

基于RF的面向对象影像分类过程包括训练和分类过程.训练过程旨在基于训练样本和决策树理论生成RF,而分类过程旨在根据生成的RF将对象分类[5].经过多次尝试考虑到训练时间成本与精度,本研究设定RF训练参数最大树数量为100,活跃变量个数设置为 变量个数,深度设置为0,训练精度设置为0.01,终止条件设置为精度达到标准和决策树的数量达到上限[11].RF分类过程将所有对象使用森林中的每棵树分类,并输出获得众数结果的类别标签.在易康9.0环境中,对象根据RF训练结果分类并生成专题图作为最终结果.

本研究采用基于完全独立的矢量样本点集对分类结果进行精度验证.采用基于矢量点的精度评价可对整个分类过程进行评价,由于没有已分类的专题图参考,未采用基于对象个数和基于对象面积的验证方法.为了生成独立的样本集,考虑到样本大小每幅影像随机生成约10 000个样本(点)分布于整个区域,通过目视解译分类.分类质量通过混淆矩阵计算的总体精度和Kappa系数来量化评估.

2.2 建成区提取

根据建成区的定义,本研究从分类好的建设用地矢量结果中分4步提取建成区.首先,根据城市建设用地的相对集中性,使用ArcGIS 10.2的优化热点分析工具来计算建设用地的Getis-Ord Gi*统计量,创建建成区冷热点专题图,并提取置信度大于等于90%的热点(局部空间集聚区),这些区域很大程度上是建成区.由于大多数农村居民点和其他建设用地是零散的,这一步可同时去除大部分农村居民点与其他建设用地.第二,借鉴建筑物综合的方法,将临近的建设用地热点连接起来.本研究使用ArcGIS 10.2中合并多边形工具合并视觉临近.考虑到建成区的定义,为以最大精度进行聚合,设置参数合并距离为500 m、最小面积为1 km2、最小孔大小为1km2.第三,由于先前的步骤可能会形成相对破碎复杂的多边形,且仍保留了一些孤立突出的其他建设用地(如公路和铁路),为平滑建成区轮廓和去除剩余的其他建设用地,采用形态学方法使建成区范围更合理.本研究定义结构元素为3X3矩阵(0,1,0;1,1,1; 0,1,0),使用ENVI 5.2进行先开后闭运算.第四,由于上述步骤的结果可能还会包含小面积多边形,且形态学处理可能会带来一些无意义的弯曲,故最后一步执行简化和筛选.本研究使用ArcGIS 10.2中简化多边形工具简化和筛选多边形,使用内部弯曲简化算法,考虑到建成区定义,设置参数参考基线为500 m、最小面积为1km2.即面积大于等于1 km2的多边形同时被保留和简化,上述步骤的结果即为建成区.

2.3 理解建成区扩张

2.3.1 建成区扩张空间分析

为更好理解建成区扩张的动态过程,本研究应用扩张强度指数(EII)分析建成区扩张速度.

EII由刘盛和提出,是建成区扩张数量特征的常见指标,其本质是标准化后建成区的年均增长率[12].EII用于描述建成区扩张的范围和速度,可用来分析和比较不同方向和时期建成区扩张的速度、强度和趋势,公式如下:

式中,EII是扩张强度指数,Ut是t时刻的建成区面积,Ut+1是t+1时刻的建成区面积,T是t+1和t时刻的时间间隔.

2.3.2 建成区扩张驱动力分析

回顾已有研究的驱动因子选择[5,7,8],选取了3类10种建成区扩张驱动因子作为自变量通过RF回归计算变量重要性.包括①自然因素:DEM,坡度和起伏度;②邻域因素:到河流、高速公路、铁路、原建成区距离;③社会经济因素:GDP密度,人口密度,原建成区密度.因变量是1991~2015年城市建成区扩张情况(即0或1二值,其中1表示从t时刻到t+1时刻非建成区转化为建成区,0表示不变的情况).

将所有自变量和因变量空间化至500 mX500 m格网.坡度和起伏度由DEM算得.邻域因素由ArcGIS 10.2中欧氏距离工具算得.GDP密度和人口密度由RESDC提供.原建成区密度由邻域统计工具算得3X3格网密度.在研究区范围内创建500X500 m格网,将自变量和因变量值赋给相应格网,使用SPSS标准化,最后应用Python 2.7进行RF回归分析.RF回归中袋外误差是RF回归训练误差的无偏估计[13],可验证训练精度.RF回归可通过对整个森林中所有回归树的误差函数进行追踪,来度量特征重要性,通过调用feature_importances()函数获得变量重要性结果.

3 结果与讨论

3.1 基于RF的面向对象影像分类结果

图2为研究区分类结果专题图,通过RF面向对象影像分类,每个地理对象被分类为建设用地、植被或水域.然后将植被和水域2个子类合并,即非建设用地类.使用目视解译分为两类参考点计算混淆矩阵.表2显示,总体精度和Kappa系数分别超过了94.04%和0.90,表明所生成的专题图质量很好.

图2 RF面向对象影像分类生成的专题图Fig. 2 Thematic map generated by RF object-based image classif i cation

表2 RF面向对象影像的分类精度评价结果Tab.2 Classif i cation accuracy assessment results of the RF objectbased image

3.2 建成区提取结果

图3为1991~2015年建成区提取结果.图4以2000年为例,展示了如何通过2.2中描述的方法从图2中获得图3.图4也展示了的建成区提取结果的合理性和必要性.根据本研究对建成区的定义,建成区提取结果展示了包含局部空间集聚的建设用地,且面积大于等于1km2的区域范围.提取过程可去除零散的农村居民点和其他建设用地,保留一定规模的连片城市建设用地,同时宏观描绘了城市空间形态,有助于研究者和城市管理者快速把握城市空间发展状态.

图3 1991~2015年研究区城市建成区提取结果Fig.3 Extraction results of urban built-up areas in the study area during 1991~2015

图4 城市建成区提取过程示例(以2000年为例)Fig.4 Example of extraction process of urban built-up areas (in 2000)

3.3 建成区扩张分析

图3 与表3显示,研究区在近25年建成区扩张明显.建成区面积从1991年的125.43 km2增加到2015年的597.2 km2,增长近5倍.1991年建成区仅占研究区总面积6.72%,而2015年约占1/3.但其扩张速度并不一致.建成区经历了高速扩张(1991~1995),中速扩张(1995~2000),第二次高速扩张(2000~2005)和低速扩张(2005年以后).1995年至2000年的城市扩张速度放缓可能是受土地政策的影响,这也与1997年对建设用地审批的新规定和1998年《土地管理法》修订时间点相符[5].2005年后,研究区进入城市化后期阶段,城市建成区扩张空间受限,建成区增长趋于稳定并饱和.

表3 研究区城市建成区扩张的动态过程Tab.3 Dynamic process of urban built-up areas expansion in the study area

3.4 建成区扩张驱动力

在Python 2.7中对6个时间段(1991~1995、1995~2000、2000~2005、2005~2010、2010~2015和1991~2015)的建成区扩张及其驱动因素进行了RF回归分析.袋外误差为0.032 5~0.068 5,表示精度在93.15%~96.75%之间,表明RF回归分析结果可靠有效.

图5a显示1991~2015年研究区城市建成区扩张影响主要因素是GDP密度、人口密度、至铁路、至公路、至河流以及至1991年建成区的距离.影响较小的因素是1991年建成区密度、起伏度、坡度和DEM.

通过比较这3类因素的相对重要性,发现邻域因素对建成区扩张的影响最大,占总影响力的51.44%,表明建成区扩张主要取决于邻域因素.这可能因为铁路公路等交通要素作为现代城市人流、物流的载体,能有效促进周边地区的发展,因此加快了铁路、公路、河流沿线的城市化进程.对于社会经济因素,GDP密度和人口密度对城市扩张有重大影响,而1991年的建成区密度对后期建成区扩张的影响较小.由于人类活动塑造城市发展,人口的空间分布及其经济活动在很大程度上决定了建成区扩张的方向和速度,这也与前人研究结论相一致[5,14].对于自然因素,由于研究区地形以平原和圩区为主,故起伏度、坡度和DEM对建成区扩张没有显著影响.该结果与前人研究相一致,即自然环境条件对长期的城市扩张具有重要影响,但社会经济因素往往在短期内发挥重要作用[15].

结果与假设一致,证实了主导驱动力随着时间的推移而变化(图5b).虽然图5显示,在整个研究期内,人口密度、GDP密度,至公路、铁路、河流和原建成区的距离一直是推动研究区城市建成区扩张的重要因素,但这些驱动因子的相对影响从1991到2015年有所变化.图5b显示,公路对城市扩张的影响在研究期内逐渐加大,而铁路的影响在2005~2010年达到顶峰.这也符合1990年以来公路网络不断完善和2005年起高速铁路建设的事实.因为人和物的高效运输依赖于公路和铁路,导致了公路和铁路周边的快速扩张.图5b显示,河流对建成区扩张的影响在研究期内逐渐减弱.这可能是因为研究区水系发达,在早期(1991~2000)河流也作为交通的主要载体.但随着2000年后公路和铁路路网的完善,河流的相对影响急剧下降并被铁路和公路超越.图5b也显示,距原建成区距离对研究区城市建成区扩张的影响逐渐增加,反映出城市扩张由离散走向集聚.

图5 研究区城市建成区扩张各驱动因素的相对重要性Fig.5 Relative importance of various driving factors in urban built-up area expansion in the study area

4 结束语

检测与分析建成区有助于城市管理者了解其时空过程和动态机制,进一步辅助规划、调控和指导城市可持续发展.本研究提出了建成区提取与分析框架,以探究城市扩张的时空过程和动态机制,并以案例形式展示了其有效性.本研究利用面向对象分类技术提取建成区,采用扩张指标分析城市扩张过程,使用随机森林回归分析城市扩张驱动因素.结果表明,研究区经历了1991~1995年高速扩张,1995~2000年中速集聚扩张,2000~2005年高速较松散扩张和2005年后低速平缓的扩张.研究期内城市扩张主要受社会经济因素和邻域因素驱动,自然因素无显著影响,但其主导驱动力随时间的推移而演变.

本研究对现有城市化研究的贡献主要包括:本研究旨在通过建立基于开源中分辨率遥感影像提取城市建成区的框架,解决高精度建成区提取与扩张动态驱动力分析中的困难,且本方法具备普适性;本研究创造性地将RF算法的分类和回归功能充分应用于城市化研究;研究发现社会经济因素在长三角代表性城市建成区的扩张中扮演重要角色,这同样是我国其他快速城市化平原城市扩张的重要动力机制.

猜你喜欢
建成区用地分类
近30年南宁市建成区时空扩张特征分析
分类算一算
2013—2018年金普新区建成区空间形态扩张规律
分类讨论求坐标
城乡建设用地增减挂钩研究进展综述
基于Landsat的南通市建成区扩展研究
数据分析中的分类讨论
长沙市望城区建成区公园绿地现状结构分析与评价
教你一招:数的分类
城乡建设用地增减挂钩政策的演变