哈凯 门明新 王志涛
摘要:通过遥感解译得到2013年怀来县土地利用数据,探究山地丘陵地区土地利用演变规律和驱动机制。选取自然、经济社会、空间距离及随机因子等12个驱动因子,运用Logistic回归方法对引起该地区土地利用变化的驱动因素进行了空间定量化分析,并对各地类回归模型的拟合度进行了检验,计算得到了研究区土地利用类型空间分布概率图。研究结果表明,各地类分布受地均纯收入和人口密度影响较大,通过ROC检验得到各种土地类型的拟合度分别为:耕地0.844,园地0.780,林地0.904,建设用地0.882,水域0.983,其他用地0.650,各土地类型的拟和度均在0.600以上,拟和结果较满意。社会经济、地形、城乡建设用地、道路交通等因素对研究地区土地利用格局形成与演变有着重要的影响。
关键词:山地丘陵;Logistic回归模型;驱动力;河北省
中图分类号:F301.24 文献标识码:A 文章编号:0439-8114(2016)08-1957-07
DOI:10.14088/j.cnki.issn0439-8114.2016.08.013
Abstract:In order to investigate the evolution and driving mechanism of land use in hilly areas, to obtain land use data of Huailai county in 2013 was obtained through the interpretation of remote sensing. With the Logistic regression model, the driving factors of land use change were quantitatively analyzed from 12 factors such as nature, economic, social, spatial distance and random factors. The fitting degree of the regression model of all kinds of land was tested through ROC method. The probability map of the spatial distribution of land use type was calculated. The obtained fitting degree of different land type through the ROC test is 0.844 for cultivated land, 0.780 for garden, 0.904 for forest land, 0.882 for construction land, 0.983 for waters and 0.650 for other type of land. Fitting degree of each land type was more than 0.600, which is satisfying The results revealed that the factors such as development of social and economy, urban and rural construction land, roads, terrain distribution have important influence on the formation and evolution of land use pattern in the studied area.
Key words: mountain and hill;logistic regression model;driving force;Hebei province
土地利用/覆被變化(Land use/Land cover change,LUCC)是引起全球环境变化的重要作用因素,对地表生物、气候、水文等过程都有着直接或间接的影响[1-3],通过定量化分析土地利用的空间演变机制,进一步预测未来土地变化的方向,一直是学术界探讨的热点和难点问题,也是政府进行科学土地利用调控面临的现实问题。针对复杂的土地利用覆被状态,对其进行研究的重要方法与途径一般是建立定量化模型,分析土地利用的变化过程、驱动机制及变化趋势[4,5]。近年来国内外学者通过从不同角度构建的多种模型对典型地区土地利用变化及驱动机制进行了研究,分析和预测土地利用演化格局,如余新晓等[6]、潮洛濛等[7]、徐广才等[8]基于多年的遥感影像,运用土地利用变化模型,对流域、快速城镇化地区及草原的土地利用/覆被的演变及驱动机制进行了研究;谭永忠[9]对县级尺度土地利用变化驱动机制及空间格局变化进行了研究;谢花林[10]、姜广辉等[11]、李强等[12]、徐嘉兴等[13]均运用Logistic回归模型对相应的典型区域土地利用变化的驱动力进行了分析,该模型考虑了引起土地利用变化的自然和社会经济因素,通过选择相关因素因子定量分析土地利用格局变化的过程,较好地揭示了引起LUCC的可能原因。在进行土地利用变化空间模拟的研究中,Logistic空间回归分析得到了较为广泛的应用,通过该模型可以定量化分析一个因变量(土地利用类型)与多个自变量变化(驱动因子)的关系,并能够解释因变量的概率发生值[14-18],从而在空间上模拟预测土地利用变化的方向。但针对县域范围内较为典型的山地丘陵地区,此方面的研究较少。
本研究选择典型的山地丘陵地区怀来县作为研究区,通过遥感解译获得研究区土地利用数据,然后对研究地区的土地利用格局进行定量化的驱动力分析。通过构建研究地区的土地利用格局在空间上的Logistic回归模型,揭示典型山地丘陵地区土地利用变化过程的可能原因及与其影响因素之间的定量化关系,将对研究山地丘陵地区土地利用变化的发展趋势及生态环境的影响,调整产业结构及土地的可持续利用有着重要意义。
1 材料与方法
1.1 研究区概况
怀来县位于河北省张家口市东南,地处冀北山地,燕山山脉西南端,东经115°16′-115°58′,北纬 40°04′-40°35′。地貌形态主要有河川平原、丘陵和山地等类型,受地形地貌影响,怀来县土地利用形成较为明显的区域分布特征。地势由中间“V”型盆地分别向南北崛起,西北高而东南低。2013年全县地区生产总值实现119.4亿元,人均GDP达到20 172元。2013年全县总人口35.7万人,其中农业人口24.1万人,非农业人口11.6万人,分别占总人口的67.5%和32.5%,冀西北间山盆地区生态脆弱,位于该区的怀来县土地资源相对缺乏,加之人们对土地资源的合理利用不够重视,导致土地资源利用出现了许多问题。
1.2 数据收集与处理
本研究所需要的数据包括怀来县2013年土地利用遥感解译数据,2012怀来县土地利用变更调查数据,DEM数据以及怀来县社会经济数据。参照全国土地利用现状分类将怀来县土地利用类型分为耕地、园地、林地、建设用地、水域及其他土地6大类。以研究区2013年7月的Landsat TM影像为数据源,将1∶50 000地形图作为地理坐标参考基准,利用 ENVI 4.8软件对2013年的遥感影像进行几何校正,并保证校正后误差小于0.5个像元。以行政区作为掩膜完成遥感图像的裁剪,采用监督分类并结合人机交互的方法完成遥感影像的分类,并进行分类后的处理,分别用代码1,2,3…,6表示各土地利用类型,借助于地面实测数据(GPS野外调查)来检验解译精度,随机选取若干样点,利用混淆矩阵法进行评价分析,结果表明,遥感影像分类结果的总体精度达到85.69%,解译精度较好。在ArcMap中利用空间分析工具,将怀来县2013年土地利用现状图各地类生成单独的栅格文件,分辨率为100 m×100 m,如果属于该地类,则属性赋值为1,其他区域属性赋值为0,最后将这些栅格图通过Raster to ASCⅡ模块转换成ASCⅡ格式。
影响土地利用变化的因素复杂多样,依据科学性和可获取性原则,本研究选取了自然因素、社会经济因素和空间距离因素。其中,自然因素包括高程、坡度和坡向,社会经济因素包括地均GDP、总人口密度,空间距离因素包括到公路的距离、到铁路的距离、到城镇的距离、到农村居民点的距离、到工矿的距离和到河流水面的距离。自然因素的数据主要来源于中国科学院国际数据平台下载的DEM高程图;社会经济因素主要来源于2013年怀来统计年鉴;空间距离因素在ArcGIS里的Spatial Analyst模块通过Straight line计算得到的。数据最后都统一到西安1980坐标系下,分辨率為100 m×100 m。
1.3 研究方法
1.3.1 二元Logistic回归模型 Logistic回归模型一般是以栅格为最小单元,通过将研究区分为许多栅格单元,每一个栅格都有一个值,模型的目标变量(土地利用格局)用二分类变量表示,1表示某种土地利用类型出现,0表示不出现,模型的解释变量(驱动因子)通过一系列的自然和社会经济等因素因子来描述。二元Logistic回归模型是一种非线性分类统计方法,适用于对二分因变量(0或1)进行回归分析。回归模型表达式如下:
式中,Pi表示每个栅格单元可能出现某一土地利用类型i的发生概率;Xi表示影响土地利用变化的i类驱动因子;?茁是各驱动因子的回归系数,表示变量Xi对Pi的影响大小。
1.3.2 空间分布概率模拟 根据Logistic回归模型可以得出土地利用类型的空间分布概率Pi,然后运用ArcGIS的Raster Calculator计算得到研究地区土地利用格局空间分布的经验统计概率图。
式中,Pi表示每个栅格可能出现某个土地利用类型i的概率,X表示与土地类型相关的各驱动因子,?茁0为常量,?茁1-?茁n分别对应于X1,i-Xn,i等各种驱动因子与土地利用类型i之间的相关度,?茁值越大表示其相关度越高。
2 结果与分析
将矢量的土地利用现状图转换成栅格格式以后,再通过ArcGIS将各栅格格式的土地利用类型图和驱动因素转换成ASCⅡ格式,然后应用CLUE-S模拟软件里的Accessorial Tools将数据继续生成单列记录文件,最后将数据导入到SPSS软件中进行Binary Logistic逐步回归分析。
2.1 回归结果
Logistic回归分析中,驱动因素beta值为负值的,则表示与相应的地类变化的概率为负相关,beta值为正值的,则表示与相应的地类变化的概率为正相关,数值越大,则相关度越大。由表1可知,与耕地变化概率呈负相关的因素包括:到工矿的距离、到公路的距离、到居民点的距离、地均纯收入等,表明相应的距离因素越远或地均纯收入越高,耕地发生变化的概率越小;相应的与耕地变化呈正相关的因素,如到城镇的距离和坡度等因素,在其他因素不变的情况下,随着耕地到城镇的距离的增加或坡度的升高,耕地转换为其他地类的概率增加。其他5种地类与相应因素之间的关系亦是如此。
通过Logistic逐步回归分析可以筛选出对各地类变化影响较为显著的因素,同时剔除不显著影响因素,并确定各因素之间的定量关系和作用相对大小[19-21]。对于每一种地类,其回归方程的影响因子是不一样的,但是研究中考虑的随机因素对每个地类都不发生影响,说明各地类的形成与分布是有规律可循的。根据以上回归结果,得到各地类的回归模型如下:
式中,P1-P6表示耕地、园地、林地、建设用地、水域和其他用地的发生概率;X1-X11表示影响各地类变化的影响因子,分别为到城镇的距离、到工矿的距离、到公路的距离、到河流水面的距离、到居民点的距离、到铁路的距离、地均纯收入、高程、坡度、坡向、人口密度。
由表2可知,怀来县耕地分布受到城镇的距离、到公路的距离、到乡村居民点的距离、到铁路的距离、地均纯收入、高程、坡度、坡向和人口密度的影响,其中受地均纯收入影响最大,发生比率为0.972 5,说明收入越高,耕地发生的概率越低。怀来县园地分布主要受到城镇的距离、到公路的距离、到河流水面的距离、到乡村居民点的距离、到铁路的距离、地均纯收入、高程、坡度、坡向和人口密度的影响,其中受地均纯收入和人口密度影响最大,发生比率分别为1.013 1和0.989 5,说明园地倾向于分布在地均纯收入较高、人口密度小的地方。怀来县林地分布主要受到工矿的距离、到公路的距离、到河流水面的距离、到乡村居民点的距离、地均纯收入、高程、坡度、坡向和人口密度的影响,其中受地均纯收入影响最大,发生比率为0.983 3,说明地均纯收入的地区林地较少。其次人口密度也对林地分布有较大的影响,其发生比率为0.999 1,说明林地主要分布在离人口居住区较远的山地地区。怀来县建设用地分布主要受到城镇的距离、到工矿的距离、到公路的距离、到乡村居民点的距离、到铁路的距离、地均纯收入、坡向和人口密度的影响,其中受人口密度影响最大,说明人口聚集在建设用地区,建设用地发生比率与人口密度有较大相关性,发生比率为1.010 3。上述各个因素对怀来县水域用地分布均有影响,到河流水面的距离、到乡村居民点的距离、地均纯收入、高程、坡度、坡向和人口密度都有较显著的影响,其中受地均纯收入和人口密度影响最大,其发生比率分别为1.053 9和0.959 6,这说明河流水域分布也受地均纯收入、人口密度影响较大,此处的河流水域用地是合并了河流、滩涂和水库用地,说明人类在生产过程中较多利用水域资源。怀来县其他用地分布主要受到城镇的距离、到工矿的距离、到河流水面的距离、到乡村居民点的距离、到铁路的距离、地均纯收入、高程、坡度、坡向和人口密度的影响,其中影响因素最大的是地均纯收入,发生比率为1.009 6。
2.2 模型检验
真实的地类分布格局与应用二元Logistic回归分析得到的地类概率分布格局是否具有较高的一致性,这需要通过相应的检验方法来检验。由于Logistic回归分析不像其他线性回归方法可以用R2对回归效果进行检验,所以在此应用Pontius等[22]提出的ROC(Relative Operating Characteristics)方法对Logistic回归结果进行拟合度检验。
该方法来源于二值可能性表,每个可能性的内容是实际变化和实际保持稳定的栅格对模拟变化和没有变化的比值。一个完整的随机模型所确定的ROC值为0.5,而令人满意的最适ROC值为1.0。运用SPSS进行ROC的验证,选取实际的土地利用类型作为状态变量,预测的土地利用类型的可能性作为检测变量,如果其ROC曲线大于0.5,则说明模型拟合度达到合格。
通过上述方法,本研究得到的各土地利用类型的ROC曲线见图2。由图2及表3可以看出,各地类ROC值分别为0.844(耕地)、0.780(园地)、0.904(林地)、0.882(建设用地)、0.983(水域用地)、0.650(其他用地)。林地和水域用地的拟合度最好,超过了0.900,充分说明了选取因素的解释性较强,但是对于其他用地的ROC值则低于0.700,拟合度解释力相对较弱。
2.3 不同土地利用类型的空间概率分布模拟
在驱动因子分析的基础上,运用Logistic逐步回归的结果对研究区的每个一栅格单元可能出现的某一种土地利用类型的概率进行判别,利用Arc GIS中的Raster Calculator功能,根据公式(2)计算得到各土地利用类型的空间分布概率图[12]。其中2013年各地类概率分布见图3。
在分析现状图的基础上,通过对比各土地利用类型的空間分布概率模拟图,发现模拟结果与实际情况吻合度较好,由此可见,耕地出现的高概率值区分布在官厅水库周围及左上和中间部分的平原丘陵地区;出现园地的概率较高的区域较耕地更加分散,且与耕地部分重合,高值区域出现在区域中部和部分山地地区;林地的出现概率则集中于西北部和南部山地地区;出现建设用地的高值概率区则呈散点状态分布在平原和丘陵地带,且呈现平原-丘陵-山地概率依次降低的趋势;水域的概率分布则以官厅水库为中心,集中分布于中部河谷地区;其他土地的概率分布高低差异较其他5类小,且高概率出现在北部和南部山地地区。同时可以看出,模拟的吻合程度与ROC值密切相关。当ROC值越大时,吻合程度越高,其中水域、林地、建设用地、耕地和园地ROC值较高,分别为0.983、0.904、0.882、0.844和0.780,说明这5种地类的模拟吻合度较高。其他土地的ROC相对较低,为0.650,模拟吻合程度较低。造成这种偏差的原因可能是其他土地利用类型的构成较为复杂,同时选取的影响土地利用空间分布格局的驱动因素除了本研究选取的12个驱动因子以外,还有其他比较复杂且难以空间量化的因素,这些数据的缺失可能是造成模拟结果偏差的主要原因。
3 小结与讨论
本研究通过建立针对土地利用变化的二元Logistic回归模型,揭示了典型山地丘陵地区引起土地利用变化的可量化的驱动因素。在空间上对土地利用变化的方向进行了概率诊断,能为研究山地丘陵地区的土地利用变化的方向提供借鉴,在此基础上可以指导未来的土地利用方式和方向。
研究区六种地类的分布受到地均纯收入和人口密度的影响较大,说明社会经济因素是各地类分布的主要影响因素。除此之外,耕地和园地的分布受到乡村居民点的距离、高程、坡度的影响较大,说明受距离和地形因素的影响较大;林地分布受高程、坡度、坡向等自然因素影响较大,社会经济和距离因素影响较小,这也充分证明了主要分布在山地地区的林地受到空间距离因素干扰较小;怀来县建设用地分布受距乡村居民点的距离影响较大,这也从侧面验证了广泛分布于地势平缓的丘陵和平原地带的居民点,其向外扩张的趋势在空间上受到距离和地形的约束;水域用地分布受距河流水面、距乡村居民点空间因素和高程、坡度、坡向自然因素影响较大;其他土地分布受高程和坡度影响较大。
通过对比怀来县土地利用现状图,发现模拟结果基本吻合实际情况,并且模拟的吻合程度与ROC值密切相关,当ROC值越大时,吻合程度越高。其中水域用地、林地的ROC值达到0.900以上,这两种地类的模拟吻合度也最高;建设用地和耕地的ROC值在0.800以上,吻合度也较好;园地和其他土地的ROC值都在0.800以下,吻合度相对较低。
土地利用变化是一个相当复杂的过程,与当地乃至整个区域的自然因素、经济、社会、人口、政治等都有着密切的联系,难免有些因素没有考虑到或者难以量化纳入模型,同时本研究选取总人口密度变量只细化到了乡镇范围,精度不高。作为北京市重要水源地的官厅水库,其难以量化的政策限制因素较多,在一定程度上也影响了模型的精度。另外,如何将模型用于对未来一段时间内土地利用变化的预测分析,也值得进一步深入研究。
参考文献:
[1] 李秀彬.全球环境变化研究的核心领域-土地利用/土地覆被变化的国际研究动向[J].地理学报,1996,51(6):5532-5571.
[2] 刘纪远,张增祥,庄大方,等.20世纪90年代中国土地利用变化时空特征及其成因分析[J].地理研究,2003,22(1):1-12.
[3] TURNER B L,LAMBIN E F,REENBERG A.The emergence of land change science for global environmental change and sustainability[J].Proceedings of the National Academy of Sciences of the United States of America,2007,104(52):20666-20671.
[4] 摆万奇,赵士洞.土地利用和土地覆盖变化研究模型综述[J].自然资源学报,1997,12(2):169-175.
[5] 陈佑启,VERBURG P H,徐 斌.中国土地利用变化及其影响的空间建模分析[J].地理科学进展,2000,19(2):116-127.
[6] 余新晓,张晓明,牛丽丽,等.黄土高原流域土地利用/覆被动态演变及驱动力分析[J].农业工程学报,2009,25(7):219-225.
[7] 潮洛濛,翟继武,韩倩倩.西部快速城市化地区近20年土地利用变化及驱动因素分析—以呼和浩特市为例[J].经济地理,2010,30(2):239-243.
[8] 徐广才,康慕谊,李亚飞.锡林郭勒盟土地利用变化及驱动力分析[J].资源科学,2011,33(4):690-697.
[9] 谭永忠.县级尺度土地利用变化驱动机制及空间格局变化模拟研究[D].杭州:浙江大学,2004.
[10] 谢花林.基于Logistic回归模型的区域生态用地演变影响因素分析—以京津冀地区为例[J].资源科学,2011,33(11):2063-2070.
[11] 姜广辉,张凤荣,陈军伟,等.基于Logistic回归模型的北京山区农村居民点变化的驱动力分析[J].农业工程学报,2007,23(5):81-87.
[12] 李 强,任志远.基于logistic回归分析的土地利用变化空间统计与模拟[J].统计与信息论坛,2012,27(3):98-103.
[13] 徐嘉兴,李 钢,陈国良.基于logistic回归模型的矿区土地利用演变驱动力分析[J].农业工程学报,2012,28(20):247-255.
[14] 杨云龙,周小成,吴 波.基于时空Logistic回归模型的漳州城市扩展预测分析[J].地球信息科学学报,2011,13(3):374-382.
[15] 段增強,张凤荣.苗利梅.基于邻域因子的土地利用空间格局分析—以北京市海淀区为例[J].农业工程学报,2006,22(6):71-76.
[16] VERBURG P H,SOEPBOER W,VELDKAMP A,et a1.Modeling the spatial dynamics of regional land use the CLUE-S Model[J]. Environmental Management,2002,30(3):391-405.
[17] BUI D T,LOFMAN O,REVHAUG I,et al. Land slide susceptibility analysis in the Hoa Binh province of Vietnam using statistical index and logistic regression[J]. Natural Hazards,2011,59(3):1413-1444.
[18] 戴声佩,张 勃.基于CLUE-S模型的黑河中游土地利用情景模拟研究—以张掖市甘州区为例[J].自然资源学报,2013,28(2):336-348.
[19] 段增强,VERBURG P H,张凤荣,等.土地利用动态模拟模型的构建及其应用—以北京市海淀区为例[J].地理学报,2004,59(6):1037-1047
[20] 冯仕超,高小红,顾 娟,等.基于CLUE-S模型的湟水流域土地利用空间分布模拟[J].生态学报,2013,33(3):985-997.
[21] 吴健生,冯 喆,黄 力,等.基于CLUE-S模型框架的土地可持续利用情景预测—以阳泉市郊区为例[J].资源科学,2011,33(9):1699-1707.
[22] PONTIUS R,GIL J R,LAURA C S. Land-cover change model validation by an ROC method for the Ipswich watershed, Massa-chuset,USA[J]. Agriculture Ecosystems and Environment,2001,85(5):239-248.