李吉江 赵 荣 王 勇
(1.山东农业大学,山东 泰安 271018; 2.中国测绘科学研究院,北京 100830)
·房地产开发·
北京市城市住宅价格空间自相关分析
李吉江1,2赵 荣2王 勇2
(1.山东农业大学,山东 泰安 271018; 2.中国测绘科学研究院,北京 100830)
以北京市城六区1980年—2015年的1 961个住宅小区特征价格数据为例,利用探索式空间数据分析方法,分析了房价数据的空间自相关性,并探讨了其时空演变特征,建立了房价影响因子的多元线性回归模型和空间误差模型,结果表明:北京市城六区的房价具有明显的空间自相关性;由于空间误差模型顾及了数据的空间自相关性,相对于多元线性回归模型,可以更好地表达出地理对象之间的内在关系。
住宅价格,莫兰指数,散点图,空间误差模型
空间自相关是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖关系,Tobler的地理学第一定律指出:任何事物与别的事物之间都是相关的,但近处的事物比远处的事物相关性更强[1],这是对空间自相关性的最经典的解释。而在此之前,Moran从生物学角度定义了莫兰(Moran)指数[2],并用来探究空间对象的全局自相关性,在此基础上,研究者将全局Moran指数分解到每个区域中,从而提出空间局部自相关分析方法[3,4],这使得空间自相关理论更加完善。张鸿辉等运用全局和局部Moran’s I系数分析了南京市各用途地价的空间自相关特征及其演变规律[5],黄萌和梅志雄分别研究了中山市住宅地价和东莞市住宅价格的全局和局部自相关特征[6,7]。对于空间自回归的研究,Cliff和Ord于1981年提出了空间自回归模型[8],而后在1988年,Anselin[9]对空间自回归模型进行了深入研究,提出了广义空间自回归模型。李序颖对空间自回归的模型和估计进行了研究[10],马骊等研究了城镇居民消费与收入的关系[11],李春红利用空间自回归模型,进行了中部地区经济增长的分析[12]。本文首先通过全局Moran’s I值来验证房价数据的空间自相关性,并依据局部Moran’s I的结果,探究房价数据的空间分布规律。在此基础上,建立住宅价格数据的多元线性回归模型和空间误差模型,并对这两种模型的结果进行了对比分析。
1.1 空间自相关
空间自相关是空间对象的重要性质,反映了不同位置的地理对象的某一属性值之间的相关关系。本文主要以北京市住宅价格数据为例,并通过全局和局部自相关指数来探究价格数据的空间分布模式。
1.1.1 全局Moran’s I
全局Moran’s I 统计衡量相邻的空间分布对象属性取值之间的关系,取值范围为[-1,1],正值表示该空间对象的属性具有正的相关性,负值表示该地理对象的属性具有负相关性,越接近±1其空间相关性就越强,0表示该属性值不存在空间相关。其计算公式如下:
(1)
(2)
1.1.2 局域Moran’sI
局部自相关计算每一个空间单元与邻近单元就某一属性的聚集离散程度,由于全局空间自相关假定空间是同质的,得到的是一种整体趋势,但是空间异质性的存在导致同质的假设不再成立,针对这一问题,须将全局的空间自相关分解到局部空间上,即针对空间中的每一个分布对象,有:
(3)
1.2 空间自回归模型
空间自回归模型有多种表达方式,主要有一阶空间自回归模型、空间误差模型、空间滞后模型和广义空间自回归模型,本文给出的空间自回归模型的一般形式如下:
y=ρw1y+xβ+μ,u=λw2μ+ε
(4)
其中,y为n×1变量;x为n×k自变量;β为k×1回归系数向量;μ为n×1误差向量;ρ为空间相关系数;λ为残差空间相关系数;ε为n×1随机误差向量;w1,w2均为空间权重矩阵。本文采取的是空间误差模型,即y=xβ+λwμ+ε。
2.1 研究区域与数据
本实验以北京市住宅价格数据为例,主要包括西城区、东城区、海淀区、丰台区、石景山区、朝阳区等六区。在充分分析城市住宅价格的全局和局部相关性的基础上,采用多元线性回归模型和空间误差模型对数据进行拟合。研究结果表明,北京市住宅价格具有明显的空间相关性,空间误差模型的拟合优度要远高于普通的多元线性回归模型。
2.2 全局自相关分析
利用Arcgis软件计算北京市房价数据的全局空间自相关指数 (Global Moran’s I),并分析房价数据空间分布的集聚性,计算结果如表1所示。
表1 全局Moran’I值
从表1中我们可以看出,北京市住宅价格的Global Moran’s I 指数为0.073 9,其检验的标准化Z统计量为23.030 4,远大于99%置信区间的检验阈值,说明北京市城区房价具有空间正相关性,具有空间集聚特征,即房价较高的地区与房价较高的地区相邻接,房价较低的地区与房价较低的地区相邻接。
2.3 局部自相关分析
采用LISA聚类图来分析地价的局部空间自相关性,从而揭示北京市住宅价格空间分布的异质性。对于实验的结果,我们通过样本统计得到HH分布的样本点有567个,LL分布的样本点有373个,落入HH和LL象限的样本点占总数的47.93%,表明北京市住宅价格在这些局域范围内具有强烈的空间正相关,局部集聚显著。约有17.13%的样本点位于LH和HL象限,其中LH分布的样本点有298个,HL分布的样本点38个,表明局域范围内具有强烈的负相关,即具有空间异质性。不相关的样本点有685个,“高—高”相关的房价样点主要分布在城市中心区域,如东城区、西城区和朝阳区,聚集类型为“低—低”的房价样点则主要分布在丰台区和石景山区以及海淀区五环外的部分,“高—低”聚集的房价样点主要分布在城市中心区域的高值聚集区,而“低—高”聚集的房价样点零星的分布在低值聚集区。
表2 多元线性回归模型系数估计汇总表
表3 空间误差模型系数估计汇总表
2.4 空间自回归分析
本文以北京市城六区的住宅价格为因变量,以影响房价的因子为自变量,构建多元线性回归模型和空间误差模型,房价影响因子选取的是房屋容积率、绿化率、面积、物业费、与小学距离、与超市距离。
从表2,表3实验结果中我们可以看出,住宅面积和容积率与住宅价格呈正的相关性,空间误差模型相对于多元线性回归模型,其拟合精度提高了0.298 2,因此对于住宅价格拟合时,应当充分考虑空间自相关性对实验结果产生的影响。
北京市城市住宅价格的空间自相关分析结果表明:住宅价格具有空间正相关性与空间集聚特征,高值集聚主要发生在城市中心区域,低值聚集则发生在丰台区和石景山区;空间误差模型由于考虑到价格数据的空间自相关性,其拟合精度要大大高于多元线性回归模型。
[1] Tobler,W.R.A computer movie simulating urban growth in the Detroit region.Econ.Geogr,1970(46):234-240.
[2] Moran PAP.Notes on continuous stochastic phenomena.Biometrika,1950(37):17-33.
[3] Anselin L.Local indicators of spatial association-LISA.Geographical Analysis,1995,27(2):93-115.
[4] Anselin L.The Moran scatterplot as an ESDA tool to assess local instability in spatial association.In:Fischer M,Scholten H J,Unwin D.(eds.).Spatial Analytical Perspectives on GIS.London:Taylor & Francis,1996:111-125.
[5] 张鸿辉,曾永年,金晓斌.南京市城市地价空间自相关分析[J].南京大学学报(自然科学版),2009(6):821-830.
[6] 黄 萌,方志民.城镇地价的空间相关性研究[J].测绘科学,2008(4):197-198.
[7] 梅志雄,黄 亮.房地产价格分布的空间自相关分析——以东莞市为例[J].中国土地科学,2008(2):49-54.
[8] Cliff A D,ord J K.Spatial processes:Models and applications.London:Pion,1981:55-57.
[9] Anselin L.Spatial Econometrics:Medels and Applications[M].Dordrecht:Kluwer Academic,1988.
[10] 李序颖,顾 岚.空间自回归模型及其估计[J].统计研究,2004(6):48-51.
[11] 马 骊,孙敬水.我国居民消费与收入关系的空间自回归模型研究[J].管理世界,2008(1):167-168.
[12] 李春红,张可娟,文利霞.基于空间自回归模型的中部经济增长分析[J].西南大学学报(自然科学版),2012(11):22-26.
The spatial autocorrelation analysis on urban housing price in Beijing
Li Jijiang1,2Zhao Rong2Wang Yong2
(1.ShandongAgriculturalUniversity,Tai’an271018,China; 2.ChinaSurveyingandMappingInstitute,Beijing100830,China)
Taking 1 961 housing hedonic price data of six city area 1980-2015 in Beijing for example, using exploratory spatial data analysis method, this paper analyzed the spatial autocorrelation of housing price data, and discussed its temporal and spatial evolution characteristics, established the multi line regression model and spatial error model of housing price influence factors, the results showed: the housing price of six city area in Beijing had obvious spatial autocorrelation, due to the spatial error model considering spatial autocorrelation of data, compared with the multiple linear regression model, could better expression of the intrinsic relationship between the geographical objects.
housing price, Moran index, scatter plot, spatial error model
1009-6825(2017)03-0215-02
2016-11-12
李吉江(1990- ),男,在读硕士
F293.3
A