基于POI和交易数据的住宅特征价格分析

2021-06-30 15:44张寅骆忠祥何蕙华恒祺袁庆锋陈晖
中国房地产·学术版 2021年4期

张寅 骆忠祥 何蕙 华恒祺 袁庆锋 陈晖

摘要:以无锡市为例,选取2019年7月至2020年6月的商品住宅交易数据和备案楼盘信息。通过房屋代码匹配交易数据形成监测格网,并定位楼盘点。结合POI数据,选取3类特征因素,21个特征因子,分区域构建楼盘住宅的特征价格线性模型。在邻里特征因子的计算中引入特征统计距离,使用增量空间自相关工具测算。回归分析中,在OLS和GWR回归基础上使用探索性回归工具,分析各区域有效因子的所有组合,得到变量显著性汇总数据。研究可有效支持“一区一策”政策的制定。

关键词:住宅特征价格;POI;网签数据;探索性回归;一区一策

中图分类号:F293.35 文献标识码:A

文章编号:1001-9138-(2021)04-0035-43 收稿日期:2021-03-17

作者简介:张寅,工程师,注册测绘师,无锡市曦晨测绘有限公司。

骆忠祥,经济师,无锡市房屋交易管理中心。

何蕙,工程师,无锡市曦晨测绘有限公司。

华恒祺,无锡市房屋交易管理中心。

袁庆锋,高级工程师,注册测绘师,无锡市曦晨测绘有限公司。

陈晖,经济师,无锡市房屋交易管理中心。

基金项目:无锡市科协软科学研究重点课题“时空大数据支持下深化无锡市房产市场监测分析问题研究”(KX-20-C010)。

1 引言

2017年以来,中央多次强调,要坚持“房子是用来住的、不是用来炒的”定位,综合运用金融、土地等手段,加快建立促进房地产市场平稳健康发展的长效机制。随着各地相继落实“一城一策、因地制宜”,监管部门迫切需要通过大数据应用,实时获取各城市市场交易情况、价格走势、风险预警等相关数据信息。

利用商品房合同网上备案制度,对房地产市场的交易进行全面管理,能够同时监测所有交易数据。然而,这样的市场监测系统仅是对数据进行简单的整合与对比,对供求进行科学研判的深度分析不够。

在无锡市房屋交易管理中心(以下简称“交易中心”)的支持下,我们进行了相关尝试。首先,以新增住宅面积数据为例,利用房产测绘数据结合房地产市场数据,以1:500房产分幅格网为基准,在空间上定位了房地产市场运行的数据指标,构建了分辨率适宜的空间统计框架;其次,在Mann-Kendall方法的支持下,对新增住宅面积的分布状况、时空变化趋势作了分析,验证空间统计框架的有效性。借此,交易中心希望能够深化空间统计框架的应用,将监测数据在空间和时间维度上进行分析,为房产市场的调控监管提供决策支持。

城市住宅价格除了受经济、社会等因素影响外,与空间地理位置的关系也越来越密切。符合距离城市中心区域近、周边公共交通条件良好、所处学区内学校质量高、周边医疗卫生条件好、环境质量条件好等条件的住宅小区价格较高。由于住宅空间位置不同,价格出现明显差异的现象称为住宅价格空间分异。

研究认为,城市住宅价格空间分异的核心影响因素是小区建设档次与水平,不同类型住宅子市场的价格影响因素各不相同;其主要驱动力是特定住宅类型与档次建设的区位指向、特定收入阶层的空间集聚、公共物品投资的空间差异、城市居住用地扩展与城市更新的区位指向。

目前,学术界对房地产价格空间分布规律的研究可归结为两类:一类是利用GIS的空间分析和地统计分析,对价格的空间分布格局进行研究;另一类是通过建立特征价格模型量化分析影响房价的各因素。

对房地产价格空间分异模式的研究方法主要分为计量经济学方法和GIS空间分析方法,其中前者主要为一些多元线性回归和聚类分析,后者则采用K氏估计法、克里金插值法和探索性空间分析(ESDA)技术等方法,并结合相关的地理信息系统软件对价格的空间分异模式进行分析。近年来,对房地产价格空间分异的研究在空间尺度上出现多样化的趋势,分析的尺度从全国和省级,向区域和市县级发展。

在全国和省级层面上,有利用2002-2015年期间我国31个省、市、自治区的面板数据,并按区域划分东部、中部和西部三类,通过构建空间面板模型分析3大区域的房地产价格空间相关关系和影响因素。有基于不同省份2000-2015年的动态面板空间数据,运用二阶段空间自回归模型方法分析人均国内生产总值、地区人口数、人均受教育程度、人均收入等因素对房地产价格的影响。

在区域和市县级层面上,有以长三角135个区县为研究对象,在通过分异度指数测度發现2014-2016年各区县商品房价差异增大的基础上,以商品房单位面积成交均价为因变量,提取16项房价影响因素为自变量,通过逐步回归和地理加权回归进行定量分析。有基于我国国土勘测规划院中国城市地价动态监测系统中35个大中城市2010-2017年住宅地价房价比的监测数据,运用描述性分析、探索性空间数据分析和面板空间杜宾模型进行研究。此外,也不乏在单个城市的尺度上,利用城市住宅价格数据,使用空间自相关、变异函数、克里金空间插值等方法,分析城市住宅价格空间特征,并选取适宜的影响因子构建一般特征价格模型或基于地理加权回归(GWR)方法的特征价格模型。

Lancaster和Rosen被普遍认为是特征价格模型的奠基人,有效地推动了特征价格模型的发展。特征价格理论认为,地价综合反映了土地具备的如面积、区位、容积率、规划条件等不同的品质或特征,土地价格是随着其中的某个品质或特征改变而改变的。针对住宅价格,研究将影响因素分为四类:区位因素、邻里因素、建筑因素、时间因素,并具体划分为11个变量因子。

住宅价格影响因素数据的获取能够以POI为来源。POI是指一些与人们生活密切相关的地标建筑和地理实体的点数据,描述了这些地理实体的空间位置和属性信息。利用POI数据结合特征价格模型研究城市房价也成为可能。在老工业区的可持续发展决策支持研究中,基于POI大数据并结合GWR模型,筛选可能影响房价变化的因素,探索不同因素对房价产生影响的空间差异性。以重庆、成都、武汉3个城市的主城区为例,收集其房价、夜间灯光、POI数据和其他数据,探索各城市房价空间分布特征,探讨影响房价空间分布的因素。以住宅和零售业兴趣点为数据源,基于空间核密度分析提取住宅和各类零售业的空间聚类形态,量化表达商住空间布局的相关性,并在此基础上运用地统计方法测算房价的空间异质性及其与零售业态空间布局的差异特征。结合成都市住宅小区成交均价和相关POI数据,分析诊断住宅价格,解析空间分布特征,构建HPM与GWR模型。以乌鲁木齐市为研究区域,基于绿地周边POI数据,从区位、建筑结构、邻里关系三个维度选取解释变量,构建住宅市场特征价格模型并结合弹性与边际价格分析,量化了乌鲁木齐市公园绿地对住宅价格的影响。可见,POI数据能够很好地支持住宅特征价格的研究,为房产市场监测分析的深化和改进提供数据支持。

研究尝试利用分幅格网将商品住宅交易数据定位到空间,并结合价格特征因素和POI数据,以无锡市为例构建住宅特征价格模型,分析商品房住宅价格与相关因素的关系。希望借助研究,支持相关调控政策的制定和实施。

2 数据来源与处理

无锡市辖梁溪区、锡山区、惠山区、滨湖区、新吴区5个区及江阴、宜兴2个县级市。研究以无锡市的5个行政区为对象。

交易数据来自交易中心,包括商品房成交数据、商品房核准楼盘数据等。研究选取2019年7月至2020年6月的商品房住宅交易数据,并提取交易涉及的备案楼盘信息。通过房屋代码将交易数据匹配到图幅格网形成监测格网,利用监测格网定位楼盘位置得到楼盘点。随后,将交易数据按楼盘汇总至楼盘点,并匹配楼盘信息。

POI数据来自北京大学开放研究数据平台,源自高德地图,地域覆盖全国。研究中,对无锡市范围内的POI数据,使用位置的经纬度坐标进行展点。再通过投影、坐标变换、空间校准等操作将POI与监测格网的坐标系相匹配。特征因素数据采用处理后的POI数据。数据的处理和整个分析流程,如图1所示。过程中使用的分析工具来自ArcGIS的空间统计工具箱。

3 特征价格模型

特征价格模型以价格为因变量,影响价格的特征因素为自变量,通过回归分析得出价格与特征因素之间的关系。这种关系以回归系数的形式表示,系数的数值表示自变量与因变量之间关系的强度和类型。当关系为正时,系数的符号为正;当关系为负时,符号为负。如果关系很强,则系数也相对较大;如果关系较弱,则趋于零。

常用特征价格模型有3种,线性模型、对数模型和半对数模型,如表1所示。

式中,P为价格,α为截距,ε为残差,Xi为特征因素,βi为特征因素对应的系数。研究直接使用最为通用的线性模型。

4 特征因素

参考已有研究对特征因素的选择,结合现有研究和数据的情况,选取3类特征因素,21个特征因子。特征因子及其量化,如表2所示。

文献中一般使用建筑特征因素,此处使用楼盘特征是因为,研究以监测格网统计数据,并将交易数据汇总至所属的备案楼盘。模型中,以楼盘平均成交价格作为因变量。楼盘特征是对该楼盘的住宅规模、销售时间、住宅成交情况的描述,共计5个特征因子。

区位特征描述楼盘的地理位置,包括自然、经济和交通等方面,主要以POI与楼盘点的欧氏距离度量。选取的POI包括交通、民生、商业、政府等设施,共计7个特征因子。

邻里特征是对楼盘周边情况的描述,研究从出行、邻里、购物、教育、就业等角度选取楼盘周边特定范围内POI的数量,共计9个特征因子。其中,教育和就业使用固定距离为分析范围,地铁站使用相邻地铁站平均距离的1/2为阈值。在周边楼盘、超市便利店、公交站台等因子的计量上引入特征统计距离。

5 特征统计距离

所谓特征统计距离是指,在目标对象周边统计某一特征因子使用的距离。引入特征统计距离,一方面是空间关系建模的需要,另一方面是建模分析工具的要求。空间关系模型需要将对象所处的空间和对象间的空间关系整合到模型中,并且建模需要对应不同对象空间关系的尺度。此外,软件提供的空间统计工具需要输入空间关系概念化的方法,或者提供空间约束的参数。这些方法和参数的确定离不开对空间关系尺度的测定。研究中使用增量空间自相关(Incremental Spatial Autocorrelation)工具测算特征统计距离。

增量空间自相关工具能够对一系列逐渐增大的距离做空间自相关测算,评价各距离空间聚集的程度,其程度由返回的z得分确定。随着距离的增大,z得分会出现多个峰值。通常选择第一个统计显著性峰值对应的距离作为空间关系尺度,也就是研究中使用的特征统计距离。

测定空间关系尺度前,对全市楼盘点数据均价字段做了初步的全局空间自相關分析,得到全局Moran's I值为0.6938,z得分为11.6844和p值为0.00。结果显示数据呈现空间集聚。

随后,对全市数据做增量空间自相关分析发现,z得分随着距离增大而持续增加,不存在峰值。结合工具说明和数据分析,研究认为全市范围内存在多个尺度的楼盘空间集聚过程。故而,需要在更小的空间尺度上进行分析。

在综合考虑楼盘的分布、调控政策的实施、交易数据的敏感性等方面后,研究在行政区尺度上继续进行分析。并且,由于马山街道在地形上明显不同于滨湖区的其他地区,将马山街道单独列出分析。行政区尺度的增量空间自相关结果,如表3所示。

在行政区尺度上,马山街道的空间关系尺度最大,梁溪区的最小,其他区域都在300至400米左右。马山街道的地形以丘陵为主,楼盘分布受地形影响严重。梁溪区是无锡的主城区,街道规划尺寸与其它后开发的区域相比明显较小,故而特征统计距离最小。

6 楼盘特征值计算

楼盘特征值的计算以楼盘点和POI等数据为输入数据,特征因子、特征统计距离、地铁站间距均值等为计算参数,使用Python调用ArcPy扩展包,编写脚本程序实现。计算完成后,输出表示楼盘位置、包含楼盘特征因子计算结果的特征楼盘点数据。

7 回归分析

7.1 OLS和GWR回归

对特征楼盘点数据的回归分析调用普通最小二乘法(OLS)工具,使用特征价格线性模型。在回归分析前,首先去除研究区域内不存在对象的特征变量。在回归分析中,去除线性冗余部分,即方差膨胀因子(VIF) >7.5的变量。最后得到OLS回归分析的结果,如表4所示。

在OLS回归结果中,观察到存在个别地区残差稍微偏离正态分布的情况,且所有区域的残差都观察到空间自相关。随后,对每个区域进行了地理加权回归(GWR)分析,发现GWR回归结果(表4)没有明显提升。研究认为,这是本次采用的数据和地理加权回归分析工具造成的。

地理加权回归分析工具需要设定核函数搜索带宽,并且要求每个对象周边的搜索结果数大于30,否则计算结果不可信。用于GWR分析的数据为楼盘点数据,在满足搜索结果要求时,带宽的计算结果几乎等同于分析区域楼盘分布的半径,远大于区域的特征统计距离。在以后的研究中,需要延长分析时段,增加楼盘数目。

研究中发现,利用回归分析工具得出的特征价格模型公式不能很直观地支持相关决策的制定,并且直接给出价格拟合的模型参数信息过于敏感。我们希望能够更好地评价各非共线因子的显著程度、影响关系正负等情况,所以研究中进一步引入了探索性回归工具。

7.2 探索性回归

探索性回归工具能够根据用户指定的指标,对输入变量的所有可能组合进行评估,以寻找解释因变量的最佳OLS模型。探索性回归工具能够给出变量显著性的汇总数据,包括在所有组合中变量具有统计显著性的比例(%显著性),具有统计显著性时呈正关系(%正数)和负关系(%负数)的比例。通过对比%负数和%正数的数值,可以检查变量关系的稳定性。较强的预测因子始终具有较高的显著性,且变量关系比较稳定。研究对每个区域的非共线因子作探索性回归,变量显著性结果,如表5所示。

8 因素评价分析

楼盘特征因素中,核准年数因子的显著性最高,且变量关系最稳定,与价格呈负相关。住宅套数因子的显著性在不同区域存在高低浮动,但与价格的关系是稳定的负相关。说明住宅价格高的楼盘住宅规模小,楼盘销售周期越长售价越低。住宅平均成交面积因子仅在马山和惠山区,存在比较强的稳定负相关。楼盘成交套数因子在每个区域都与价格呈现较强的正相关,说明交易量高的楼盘价格也高。

区位特征因素中,火车站距离因子在参与测算的区域都有一定的显著性,但与价格的关系有变化。在梁溪区、新吴区、惠山区离火车站越远,楼盘住宅价格越高。在锡山区却存在显著而稳定的负相关。景点距离因子在滨湖区、锡山区、新吴区与价格存在负相关,价格高的住宅靠景区更近,但在惠山区相反,梁溪区不明显。从商业综合体距离因子可以发现,高住宅价格的楼盘在滨湖区、梁溪区离商业综合体更远,但在锡山区、新吴区、惠山区靠近商业综合体。三甲医院所在区域,楼盘距离医院越近房价越高。新吴区机场周围,距离越远楼盘房价越高。通过集市菜场距离因子发现,在滨湖区、新吴区高房价的楼盘靠近集市菜场,但在梁溪区、锡山区、惠山区则相反。在梁溪区、新吴区、惠山区均能发现高价格楼盘靠近人民政府所在地。

邻里特征因素中,楼盘因子的统计显著性在多数区域呈现稳定的正相关,说明周边楼盘越多,楼盘的住宅价格越高。超市便利店因子和公交站台数因子与楼盘价格的关系大多数呈现负相关,这似乎与常识相违背。需要考虑到的是,所用的商品住宅交易数据记录的几乎都是期房交易,少量尾盘现房交易。超市便利店、公交等在价格较高的期房楼盘周围,楼盘周边在建和已建地铁线路的站台个数因子对各个区域的影响各不相同。在显著性较高的区域里,滨湖区和惠山区靠近已建线路的房价高,在建线路的房价较低。梁溪区高价格楼盘远离地铁线路,锡山区在地铁线路周围的楼盘都价格较高,新吴区靠近在建线路的房价较高。各个区域,在写字楼、工业园区办公楼周围的楼盘价格较高,关系显著而稳定。在幼儿园个数因子中,除锡山区外,高房价楼盘都远离幼儿园。在小学个数因子中,除滨湖区外,高房价楼盘都靠近小学。在中学个数因子中,除锡山区外,高房价楼盘都靠近中学。

9 结论

利用POI和商品房住宅交易数据,结合特征统计距离能够较好地构建住宅特征价格模型。模型对价格的解释程度还有提高的可能,需要在后期研究中丰富楼盘特征的因子,包括楼盘容积率、绿化率、建筑密度等规划信息。探索性回归工具提供的变量显著性汇总数据能够很好地展示各区域价格受特征因子影响的程度,并给出影响的正负和稳定性。

研究使用了一个时间段跨度12个月的交易数据,分区域分析时楼盘个数偏少,不利于地理加权回归分析工具的使用。研究也缺乏利用多时间段的交易和POI数据作对比分析,探索随时间变化各特征因子对房价影响的改变。

从因素评价分析中发现,各区域高显著性的特征因子互不相同,同一特征因子在不同区域显著性和正负关系也不尽相同,说明各个区域楼盘的价格变化有其各自的原因和逻辑存在。这为细化调控政策的制定指出了方向,也就是“一区一策”。固然,在细化调控政策之前,需要结合研究结果进行实地调研,理解和认识各影响因子的作用机理,支持“一区一策”政策的制定。

参考文献:

1.卢为民.建设促进上海房地产市场平稳健康发展的长效机制.科学发展.2018.07

2.李妍.数据分析在房屋交易中的应用.中国房地产.2019.31

3.崔光灿.促进上海房地产市场平稳健康发展长效机制研究.科学发展.2018.08

4.南宁市社会科学院课题组 王水莲.供给侧改革背景下房地产市场长效机制研究——以广西南宁市为例.经济研究参考.2018.59

5.张寅 何蕙 袁庆锋.基于GIS和Mann-Kendall

方法的新增住宅面积趋势分析.中国房地产.2017.36

6.邵琪.武汉市三环线内商品住宅价格空间特征及其趋势研究.湖北工业大学.2018

7.朱传广 唐焱 吴群.基于Hedonic模型的城市住宅地价影响因素研究——以南京市为例.地域研究与开发.2014.33 (03)

8.陈真.福州市住宅价格空间分布特征及其影响因素研究.福州大学.2015

9.王洋 李强 王少剑 秦静.扬州市住宅价格空间分异的影响因素与驱动机制.地理科学进展.2014.33 (03)

10.李文慧.兰州市商品住宅价格空间分异及影响因素研究.兰州交通大学.2017

11.李佳蔚.北京市住宅地价空间分异特点及影响因素研究.首都经济贸易大学.2018

12.刘玲妙 刘建华 乔红芳.我国房地产价格影响因素的区域差异——基于空间计量分析.闽南师范大学学报(哲学社会科学版).2018.32 (04)

13.袁建林 赵春兰.基于动态面板数据的房地产价格空间自回归估算.辽宁工业大学学报(自然科学版) .2019.39 (02)

14.宋伟轩 刘春卉.长三角一体化区域城市商品住宅价格分异机理研究.地理研究.2018.37 (01)

15.周小平 秦振扬 赵松 柴铎.中国住宅地价房价比的空间格局、演变特征及影响因素——基于35个大中城市的空间计量分析.中国土地科学.

2019.33 (01)

16.張明.基于ArcGIS的西安市住宅价格空间分布特征及影响因素研究.西安建筑科技大学.2018

17.张羽鹤.基于GWR模型的北京市二手房价格空间分异及影响因素研究.中国地质大学(北京).2018

18.葛丹华.大连市商品住宅价格空间分异及其影响因素研究.辽宁师范大学.2017

19.尤修成.空间Hedonic模型二手房住宅价格研究.江西财经大学.2019

20.张景奇 史文宝 修春亮.POI数据在中国城市研究中的应用.地理科学.2021.41 (01)

21.薛冰 肖骁 李京忠 谢潇 任婉侠 逯承鹏 姜璐.基于POI大数据的老工业区房价影响因素空间分异与实证.人文地理.2019.34 (04)

22.刘亚男.基于多源数据的城市房价空间分布特征及影响因素研究.西南大学.2019

23.薛冰 肖骁 李京忠 谢潇 逯承鹏 任婉侠.基于POI大数据的沈阳市住宅与零售业空间关联分析.地理科学.2019.39 (03)

24.彭涛.成都市住宅价格空间分异及其影响因素研究.四川师范大学.2020

25.刘雅轩 陈彤.基于POI数据的乌鲁木齐市城市公园绿地对周边住宅价格的影响研究.干旱区资源与环境.2020.34(11)