任晨阳
基于克里金插值、核密度分析、最小二乘法,利用ArcGIS分析上海市中心城区房价的空间分布特征以及基础设施数据、遥感影像数据、DEM数据对其的影响。研究表明:上海市中心城区房价整体趋势为由中间向外围递减的趋势,其中房价峰值区域主要存在于南京路、淮海路、陆家嘴、徐家汇等著名商圈,并向周围递减。自然因素对房价的影响不大,但受到餐饮、金融、医疗、交通、教育的影响较大。
城市的房价在空间上存在一定的规律,与所处的空间位置有着一定的关系,即为房价的空间分布特征。了解区域房价的分布特征及影响因素,对我国经济的发展具有重要的意义。POI数据简称兴趣点数据,越来越多的人利用POI数据分析城市空间状况,戢晓峰基于POI数据探讨了交通设施空间分布的特征;况伟大探讨了地铁布局与城市房价空间分布的关系。城市房价受外部环境的影响因素较大,基于POI数据对房价的分布进行的探索的學者也越来越多,如张煊宜、薛冰、彭思危等人探索了不同地区基础设施对房价的影响。
因此本研究收集了在售房屋的数据、POI数据,上海市中心城区的DEM数据,并基于遥感数据获取上海市中心城区的绿化情况,分析上海市中心城区房价的空间分布特征及其影响因素。
研究区域与材料
研究区域(图1)。上海市(东经120°52′至122°12′,北纬30°40′~31°53′)简称沪,位于太平洋西岸,东部为东海,南部为杭州湾,是中国重要的经济、科技、交通、会展和航运中心。上海市除西南部有少数丘陵山地外,全市基本为平原,相对高差不大。上海市中心城区为外环线以内部分,集聚了南京路、金融城等商圈。
数据获取与预处理。POI数据:2019年9月上海市在售房屋数据在链家、贝壳等网站爬取,获取数据后对其进行清洗删除重复多余数据,经过裁剪获取到最终的上海市中心城区房价数据。结合实际情况进行筛选:交通POI数据主要包括地铁站、火车站、汽车站等;教育POI数据主要幼儿园、小学、中学、高等院校等;医疗POI数据各类医院、诊所、药房等;餐饮POI数据主要包括路边美食店及各类餐厅等;金融POI数据主要包括各类银行、ATM、理财中心、保险公司等。
Landsat遥感影像数据:使用Landsat 8 OLI来获取上海市的植被覆盖状况,数据下载地址为(https://earthexplorer.usgs.gov/)。本研究使用的遥感影像日期是2019年7月29日,轨道号为118/038。影像的预处理包括辐射定标、大气校正、影像拼接,最后经过裁剪获取到中心城区的遥感影像图。
DEM数据:上海市中心城区的高程数据来源于地理空间数据云(http://www.gscloud.cn/),经过获取到中心城区的高程图。
研究方法:克里金插值(Kriging插值)又称空间局部插值法,是一种求最优、线性、无偏的空间内插方法。本研究利用克里金插值中的普通克里金插值分析上海市中心城区房价的基本特征。表达式如下:
其中:Z(x0)代表位置样本点的值,Z(xi)代表未知样本点的周围已知样本的值,λi是第i各一直样本点对于未知样本点的权重,n为一直样本点的个数。
克里金法要求数据服从正态分布,因此先对房价数据进行检验。直方图显示房价数据并不符合正态分布(图2);因此对数据进行对数变换,变换后的房价达到正态分布特征要求(图3)。
通过QQpolt分布图对变换后的数据进行检验(图4),表明基本符合要求,因此在对房价进行克里金插值前要对数据进行处理。
密度估计是通过输入的样点数据计算整个区域的数据聚集情况,从而产生一个连续的密度表面,用于分析各个空间要素的集聚程度,可直观反映空间要素对房价的影响。公式为:
其中:k()为和函数;h是核密度估计的半径(又称为带宽);n为带宽范围内样点的个数;(x-xi)表示估计点倒样本xi处的距离;d为数据的维数。
③最小二乘法的基本原理是通过多次曲线拟合寻找到具有最小化偏差平方和的函数作为拟合数据的最佳函数,即一个一变量与多个自变量的关系(又称为多重回归)。因变量y与变量x1,x2,x3···xn之间的关系为:
④归一化植被指数又称为归一化差分植被指数,大多数研究表明NDVI可以很好地表明地表的植被覆盖情况,并用于植被监测,表达式如下:
研究结果
上海市中心城区房价空间分布特征。对上海市中心城区房价进行趋势面分析(图5),上海市中心城区房价分布趋势呈现明显的倒U型,在东西和南北方向均呈现中间高两边低的趋势:
利用ArcGIS软件中的普通克里金功能生成上海市中心城区的Kriging房价空间插值,分辨率为500 m,并以20 000元为等差值绘制房价等值线图,如图6所示:
从图中可以看出,上海市中心城区房价呈现多中心聚集的特征。首先,上海市中心城区房价分布的区域差异明显,呈现由内向外递减的现象,且房价高的区域等值线也较为密集。
高值聚集处主要是外滩街道、南京路街道、瑞金二路街道、江苏路、豫园街道、小东门街道。结合上海市中心城区遥感影像图(图1)可知,这些区域建筑高度较低,因此在影像上显示区域的绿度较高但房价却相对较高,结合实际可知,这里主要是上海市的市中心,也是老洋房的分布区域,也有很多的名人故居,例如:三毛故居、张爱玲故居、巴金故居等,文化氛围浓厚,加之居住环境优良,所以这里房价较高。除此高值聚集区外,另外的高值聚集区主要是西郊宾馆和浦东新区的花木镇,这里是上海市新型的区域商圈,也是重要的交通枢纽,因此房价也比较高。
单因子空间分布分析。根据插值结果可知,上海市中心城区房价在空间上具有一定的分布特征,本文选择DEM数据和植被2个自然因素指标,金融、交通、医疗、教育、餐饮5个社会经济因素指标,探索其对上海市中心城区房价空间分布的影响。
自然因素:从图中7可以看出,上海市中心城区地势相对平坦。有研究表明城市绿地对房价具有一定的影响。基于ENVI 软件获取中心城区NDVI,并利用ArcGIS波段集统计工具获取三者之间的相关性,可以得到房价与NDVI的相关性为0.21,与DEM的相关性为-1.23,相关性不强,因此可以推测高程和NDVI对房价的影响不大。
社会经济因素:基于ArcGIS中的核密度分析工具获取各类POI数据的核密度分析图(图8),进而分析各类型POI的集聚模式与房价的内在联系。
可知,金融、餐饮的聚集处主要集中在南京路、淮海路、新天地、外滩、人民广场、静安寺、豫园、徐家汇、豫园等著名商圈。和中心城区房价的高值分布具有一致性。医疗设施除了上述商圈外,在潍坊新村街道、五角场附近也出现了高值。从区域上看,教育设施的集聚中心与其他类型设施空间分布存在差异,教育对房价的影响在某些区域可能是相反的,由于高校的分布在康健新村街道、五角场也出现了高值。而交通则因为地铁站的带状分布呈现带状的聚集,但存在多个高值点。
总体上,餐饮、金融、医疗的上海市房价分布特征总体上相似,聚集中心整体上来说市上海市的以上商圈,经济繁荣,基础设施也较为齐全。高校的分布是导致教育POI与其他类型POI有差别的原因,聚集点与餐饮、医疗、金融有所差别。上海市中心城区的地铁站带状分布模式,使交通POI出现了与其他POI不同的核密度分布特征,聚集出现多个高值点,但分布范围小。
房价空间分布的影响因素多因素分析。为了探讨影响房价的主要因素,运用最小二乘法将各类POI与房价進行回归分析。各因素的VIF均小于7.5,因此模型不存在冗余,几大经济因素与房价相关性显著。对五大经济因素进行分析,得到OLS:
根据最小二乘法结果可知,各类型POI的影响系数均为正值,表明对房价的分布均具有正面的影响,与实际相符。除交通略高一点外,其余各类型POI的概率值均小于0.05,其系数在95%置信度上具有统计显著性。Koenker(BP )统计量明显大于95%置信度,p值远小于5%,表明模型具有统计学上的显著性特征;联合卡方统计量p值明显小于5%,因此模型具有统计显著性。
基于ArcGIS,分析了上海市中心城区房价的空间分布特征以及基础设施数据、遥感影像数据、DEM数据对其的影响。中心城区房价整体趋势为由中间向外围递减的趋势,其中房价峰值区域主要位于南京路、淮海路、新天地、外滩、人民广场、静安寺、豫园、徐家汇、豫园等商圈。中心城区DEM和NDVI对房价的影响不大,但区域内的教育、医疗、餐饮、交通、金融对区域房价均有影响。将各类型POI的核密度分析结果与房价分布对比后发现,房价高值区域的基础设施配套齐全,较为密集,单一类型基础设施不会对房价造成过多的影响。
本文基于最小二乘回归分析法分析了所获取POI类型对房价的综合影响作用,并未定量分析某一种类型对房价的影响,如不同的设施类型在不同的区域可能会对房价产生不同的影响。在今后的而研究中,可更为全面地探讨各设施类型与房价之间的关系。
作者单位:上海师范大学环境与地理科学学院