杨 勇,任志远
(1河南财经政法大学 资源与环境学院,河南 郑州450002;2陕西师范大学 旅游与环境学院,陕西 西安710062)
国际地圈生物圈计划以及国际全球环境变化人类行为计划先后开展的LUCC(Land Use and Land Cover Change) 与GLP(Global Land Project)项目,促进了土地利用变化研究方法和技术的进步[1].在众多相关研究中,对土地利用格局影响因素的定量分析也是重要的组成部分.目前,国内外已经有大量关于驱动力分析的案例,在研究方法上,有定性和定量分析两大类[2].定性分析主要采用逻辑描述,定量分析通常采用多元统计分析、典型相关分析和马尔可夫等统计模型.统计模型在一定程度上能解释土地利用变化的影响因素,但不足之处是对统计数据依赖较大,空间表达性差;而土地利用的空间分布具有较强的空间自相关,如果采用传统的回归模型,容易忽视空间自相关产生的解释偏差.2003年,Overmars等提出由于土地利用中可能存在空间自相关性,有必要引入空间自回归分析模型进行研究[3],随后,有学者基于该模型对一些典型区域进行了实证研究[4-7].结果显示,该方法可以有效地研究土地利用的影响因素,能够从微观尺度上揭示土地利用与影响因子之间相互关系,深入了解变化规律和解释其内部机理.本文以陕西省关中地区为研究区域,采用空间回归分析方法对土地利用格局形成的内在机理进行研究.
关中地区位于陕西省中部,介于33°35′~35°50′N,106°18′~110°37′E之间,西起宝鸡,东到潼关,南依秦岭,北至黄龙山、子午岭,东部与河南省、山西省相邻,西部与甘肃省接壤,南部是陕西省汉中、安康、商洛3地市,北部是陕西省延安市;行政区域包括西安、铜川、宝鸡、咸阳、渭南5个地级市和杨凌农业高新技术产业示范区,共54个县(市、区),其东西长约400km,南北宽30~80km,总面积约5.53万km2.区域地貌类型复杂,地貌类型包括平原、高原和山地,自然环境条件和社会经济发展存在较大差异,土地利用特征各异.
空间自回归模型的一般形式[8]为
式中:y为被解释变量,x为解释变量,β为与解释变量x相关的参数向量,ρ为空间滞后项w1y的系数,ε为空间误差,μ为残差,λ为空间误差项的回归系数,w1、w2为与被解释变量和残差的空间自回归过程相关的权重矩阵,In为残差的空间自相关系数.
通常情况下,0≤ρ<1,0≤λ<1.根据未知参数取值的不同可以分为4种常见空间模型结构[9],本研究只讨论其中的两种:λ=ρ=0时,即经典回归模型;λ=0、ρ≠0、β≠0时为混合回归—空间自回归模型,即空间滞后模型,该模型反映了被解释变量不仅受到本区域解释变量的影响,还受到邻近区域被解释变量的影响.
在经典回归模型中,常使用决定系数R2进行检验,但在有空间自相关存在的情况下,经典回归模型中的R2不再适用于空间自回归,采用伪R2代替.伪R2是回归平方和与因变量观测值的离均差平方和比值,在经典回归模型中,等于R2.检验回归模型的参数还有最大似然对数值(LIK)、Akaike信息标准(AIC)、Schwartz指标(SC)等.LIK值高(或AIC、SC值低)的空间自回归模型解释能力较强[10],但LIK不像经典决定系数R2,不能作为模型拟合优度的绝对指标.
土地利用数据来源于2005年TM遥感影像,空间分辨率为30m,覆盖整个研究区域的影像共为9景,时相为6—10月.其中土地分类参照《全国土地分类》,并结合研究区域土地覆被特点和遥感信息的可判性而建立,分为耕地、林地、草地、水域、建设用地、滩地、沙地和未利用地8种类型.对遥感图像进行精确的几何校正和地理校正与配准、镶嵌和裁切,并进行适当增强处理,采用计算机自动监督分类与目视解译相结合的方式进行图像解译,分类精度采用随机抽样的方法,将分类数据与原始图像、实地考察数据对比,总分类精度为87.68%,Kappa系数为0.87.
结合综合性、代表性、科学性、数据的可获得性等原则,选取与土地利用密切相关的因子,主要包括地形、水文、可达性、气象、土壤和社会经济等,每一个因子采用多个指标进行分析(表1).
为了能使多源数据应用于研究,需要进行数据的尺度转换,首先定义一个基础研究单元,采用覆盖研究区域的矢量格网层,考虑计算机的运行能力和研究尺度,设定单元网格大小为1km×1km,每个格网具有唯一ID.人口因素采用面域加权(Area Weighting)进行空间化[11],人均GDP数据则采用Kriging表面插值的方法[12];与地形地貌相关的指标通过DEM获取;气象因子通过对气象站点的观测数据空间插值获得;土壤因子则通过土壤类型和土壤质地专题图数字化,并参考土壤普查中各土壤类型的有机质和N、P、K等获取属性值;关中地区城镇密度较高,道路、水系发达,对土地利用的格局都会产生较大影响,以可达性对土地利用结构的影响进行分析.可达性因子包括区域内各点到最近的河流、主要道路、居民点等源单元的最近距离,采用GIS的空间分析功能生成“距离渐变图”,其中道路因子为乡镇以上的道路,面状水域包括天然和人工湖泊、水面较宽的主干河流;水文因子中所选取的定量指标为河网密度,采用分析格网对河流长度进行叠加和统计,以获取每个格网内线状河流的长度.
表1 关中地区土地利用影响因子Tab.1 Influencing factors of land use in Guanzhong region
对变量数据的处理:将解译获取的土地利用矢量数据与分析格网进行叠置分析,并统计每个格网的ID、土地利用类型及面积属性.对自变量数据中的栅格数据处理采用分类区统计,得出每一个格网中各因子的均值,对矢量数据则采用叠加分析的方法,计算每个格网中矢量数据的值,最终每一个单元格网都包含变量和自变量的数据,建立土地利用格局空间相关性分析的数据库.
在对土地利用与各影响因素关系的定量研究中,经常采用经典线性回归和空间滞后回归模型相对比的方法进行分析.空间滞后回归是在经典线性回归的基础上,考虑空间自相关对土地类型分布的影响,增加空间权重矩阵,空间权重矩阵采用Geoda 095i软件生成,使用阈值距离(Threshold Distance)权重矩阵,通过两种方法的对比研究,可为空间滞后回归分析的准确度提供依据.对回归模型的比较,主要从相关系数对影响因素进行分析,另外从模型拟合度的参数进行比较,以确定在经典回归模型和空间滞后模型中,各个影响因素对于变量的解释程度.限于篇幅,本研究只对林地、耕地和建设用地等大面积分布、受人类活动干扰剧烈的地类进行分析.
林地与各影响因子的回归分析结果如表2所示,表中列出了经典回归模型和空间自回归模型的拟合度、回归系数、标准误差、t(z)检验值和显著水平.
表2 林地的自回归模型分析结果Tab.2 Analysis results of two different models for forest
可以看出,由于空间滞后模型考虑了土地利 用空间自相关因素的存在,空间滞后模型部分因子的回归系数要小于经典回归模型.在经典回归模型中,与林地分布相关的指标有12个,在空间滞后模型中,相关指标有9个,距面状水域距离、年均降水、有机质含量指标在空间滞后回归模型中变的不显著(P>0.05),降水量是影响其分布的一个重要因素,大面积林地一般分布在年均降水量大于400mm的区域[13].关中地区年均降雨量>550mm,因此降水量因子变的不显著,不显著的影响因子在空间滞后回归模型中将被剔除,空间滞后回归模型的LIK值为24 926.3,要大于经典回归模型的-82.916 9,AIC和SC值则相对较低.林地的空间分布与自然要素的分布密切相关,关中地区的林地主要分布在因地形条件、土壤侵蚀、土壤质地不适合种植业的发展,但是比较适合树木生长的地区,因此坡度、地形起伏度的回归系数最大.
耕地和各个影响因子的回归分析结果如表3所示.在经典回归模型中,与耕地空间分布有关的因素有12个,而在空间滞后回归模型的结果中,与耕地空间分布有关的因素有10个,人均GDP和距面状水域距离两个因素在空间滞后模型中则变的不显著.影响关中地区耕地分布的主要因素是自然条件,地形起伏度、坡度和有机质含量对耕地的分布影响最大,坡度与耕地的分布具有较强的负相关,坡度≥25°的地区一般不适宜进行耕作,大面积的耕地分布在地形平坦、水热资源充足、土壤肥力适度、灌溉条件良好等适合农作物生长并且方便经营管理的区域.耕地与距道路距离因素的相关性较强,呈负相关,距道路越近,耕地数量越多,适宜于耕作的区域,对道路交通的建设通常也是比较适宜的,也是通达条件较好的地区,因此道路交通与耕地的分布具有较强的相关性,在经典回归模型中,相关系数为-0.000 028,在考虑空间相关性因素的空间滞后模型中,相关系数为-0.000 018.
表3 耕地的自回归模型分析结果Tab.3 Analysis results of two different models for cultivated land
通过对关中地区建设用地和各个主要影响因素的回归分析(表4)可以看出,与建设用地有关的影响因素主要包括距道路距离、地形起伏度、坡度、海拔、有机质、河网密度和人口密度等,其中影响最大的因素为地形起伏度和河网密度.地形因素制约着建设用地的分布,而河网密度越高,地表被切割的破碎程度越高,增加了建设成本和生态约束.相比较其他土地类型,建设用地的空间分布除了自然条件以外,社会经济因素的影响程度较高,距水源远近、交通通达性等都会对建设用地的分布产生影响.建设用地比较密集的区域,通常也是交通通达度较好的区域,而交通网络的节点也一般都是城镇,因此,对于建设用地的发展,交通道路两侧对建设用地的扩展起着吸引作用[14].人口密度和人均GDP反映了社会经济发展水平和潜力,人口密度和人均GDP较高的城镇地区,适合于建设用地的发展,而在人口稀少或者人均生产值低的地方,生产力发展水平低,不适合城镇建设用地的发展.距城镇距离因素对建设用地的分布具有一定的影响,城镇向周边相邻地区的扩张以及所具有的优质社会经济资源,导致距离城镇较近范围内的土地向建设用地的转变.
表4 建设用地的自回归模型分析结果Tab.4 Analysis results of two different models for built-up land
残差是观测值与预测值之差,通过对残差进行分析可以进一步确定模型的拟合程度,研究采用经典和空间滞后两种回归模型对土地利用空间格局与影响因素进行分析,从而得出两种回归分析的残差的空间分布.
研究以林地的空间回归分析所得出的残差为例,对比两种回归分析残差分布图可以看出(图1),空间滞后回归模型的残差要小于经典线性回归模型,表明经典回归模型在一定程度上具有解释能力,但是由于没有考虑自相关的影响,解释的还是不够全面;而空间滞后回归模型的拟合效果更好,显示出空间滞后回归模型的解释能力相对较强.
图1 2005年林地的经典线性回归模型(a)与空间滞后回归模型残差(b)Fig.1 Residuals of the standard model(a)and the spatial autoregressive model(b)
通过对土地利用格局的影响因子进行空间化处理,基于矢量格网单元对不同分辨率和不同来源的数据进行融合处理,运用经典回归和空间滞后回归模型对土地利用与影响因子之间的定量关系进行微观研究.结果表明,考虑空间自相关的空间滞后回归模型对土地利用格局的解释程度要高于经典回归模型,一些影响作用不甚明显的因子在空间滞后回归模型中被剔除,对于各种土地利用类型的空间分布的主导因子也不尽相同.
土地利用格局处在动态变化之中,影响因素也是动态的,本研究只对一个年份的土地利用格局与自然和社会经济因素之间的关系进行了相关性分析,变量与自变量都是静态的,而对于社会经济动态发展背景下的土地利用格局变化的相关性分析,还有待进一步研究.此外,多种来源的空间数据由于获取尺度和数据处理存在误差,对研究结果的影响还有待探讨.
[1]陈百明,张凤荣.我国土地利用研究的发展态势与重点领域[J].地理研究,2011,30(1):1-9.
[2]朱利凯,蒙吉军.国际LUCC模型研究进展及趋势[J].地理科学进展,2009,28(5):782-790.
[3]Overmars K P,De Koning G H J,Veldkamp A.Spatial autocorrelation in multi-scale land use models[J].Ecological Modelling,2003(164):257-270.
[4]谢花林,刘黎明,李波,等.土地利用变化的多尺度空间自相关分析:以内蒙古翁牛特旗为例[J].地理学报,2006,61(4):389-400.
[5]邱炳文.福建省耕地多尺度空间分布特征分析[J].农业工程学报,2008,24(11):63-68.
[6]马燕飞,沙占江,牛志宁,等.环青海湖区沙漠化土地景观格局自相关分析 [J].干旱区研究,2010,27(6):954-961.
[7]刘敏,赵翠薇,施明辉.贵州山区土地利用变化多尺度空间自相关分析 [J].农工程学报,2012,28(20):239-246.
[8]霍霄妮,李红,孙丹峰,等.北京耕地土壤重金属空间自回归模型及影响因素[J].农业工程学报,2010,26(5):78-82.
[9]李艳玲,张云鹏.新疆地区气温与降水量的空间自回归分析[J].人民黄河,2011,3(7):51-53.
[10]Anselin L.Under the hood:Issues in the specification and interpretation of spatial regression models[J].Agricultural Economics,2002,27:247-267.
[11]王劲峰.空间分析[M].北京:科学出版社,2006:38.
[12]曹志冬,王劲峰,高一鸽,等.广州SARS流行的空间风险因子与空间相关性特征[J].地理学报,2008,63(9):981-993.
[13]杨存建,冯凉,徐育建,等.基于ARCGIS的四川省分级退耕还林还草空间决策分析[J].自然资源学报,2007,22(6):986-993.
[14]李双成,许月卿.中国道路网与生态系统破碎化关系统计分析[J].地理科学进展,2004,23(5):78-85.