基于网络搜索数据的河北省房地产价格预测研究

2017-09-02 06:25张娟
合作经济与科技 2017年18期
关键词:房地产价格数据分析

张娟

[提要] 为科学分析网络搜索数据与房地产价格之间的变动关系,本文以百度搜索指数为基础,选取与房地产价格相关度较高的7个关键词构建全新的综合网络搜索指数,并运用自回归分布滞后模型对房地产价格指数进行拟合与预测,得到房地产价格指数预测模型。最后把该模型用于河北省石家庄市、唐山市和秦皇岛市房地产市场的验证和预测,结果表明:本文构建的综合网络搜索指数与新建商品住宅价格指数之间的ADL模型能够及时、客观、准确地预测房地产价格变动趋势,具有明显的可操作性。

关键词:网络搜索;数据分析;房地产价格;ADL模型

基金项目:河北省统计科学研究计划项目:“基于网络搜索数据的河北省房地产价格预测研究”(2014HY27);河北省科技厅软科学研究计划项目:“基于互联网征信数据的中小微企业信用评估体系研究”(154576271)

中图分类号:C812 文献标识码:A

收录日期:2017年7月19日

近年來,伴随着各地限购、限贷或其他抑制房价政策的出台,房地产市场的价格走势已经成为各类购房者、房地产商以及房产信息网站共同关注的关键问题。国家统计局每月中旬发布的房地产价格指数明显具有时效性的欠缺,难以作为房地产价格走势的即时性参考,而本文提出的网络搜索关键词综合指数法则可以有效地预测未来房地产价格的走势。

一、网络搜索数据测度

在互联网信息化时代人们使用各种搜索引擎获取各类信息,搜索引擎的搜索数据逐渐在社会科学研究中得到应用。利用网络算法技术搜索与输入性关键词和索引相匹配的网页和数据已经成为经济预测的重要手段之一,可以这样说,分析网络搜索数据不仅能够找到经济主体预期行为的基本规律和变化趋势,而且还会发现比经济主体实际行为更具时效性的资料和数据。在国内三大主流搜索引擎百度、Google和搜狗的筛选中,Google存在着对中文支持不足的缺点、搜狗具有数据库信息不对称的特征,唯有百度搜索引擎最具说服力和代表性,为此本文选用百度搜索引擎作为数据分析的基础。为了对百度搜索栏中出现的关键词进行热度分析,本文借用了百度网站经常使用的百度搜索指数来构建全新的网络搜索指数。百度搜索指数是指百度官方计算的各个关键词在百度网页中出现频率的加权和、网络搜索数据的测度以百度关键词的指数数据为基础。尽管目前的网络搜索技术已经非常成熟,但国内外真正利用百度搜索数据来预测房价走势的研究成果相对较少,零星的研究仍处于起步阶段。为此,本文首先构建了综合网络搜索指数并借此研究该指数与房地产价格的相关性。

(一)关键词的选定。首先,筛选与房地产价格有关的关键词,关键词指数数据选取百度中整体趋势的搜索指数。初始关键词依据人们关注房地产价格时考虑的主要因素,具体包含房地产市场的总体状况、房地产的相关政策、房地产市场的交易信息等,据此得到相关联的关键词75个。由于百度搜索引擎会推荐一些与我们搜索内容有关的其他关键词,因此综合起来所有的关键词达到了90个;其次,依据百度指数中的需求图谱及相关词分类的相关度,将相关度低的或类似的关键词删掉,剩余的关键词再进行进一步的关联度对比,最终保留相关度较高的7个关键词:房价(k1)、房源(k2)、房产网(k3)、新楼盘(k4)、房贷利率(k5)、公积金(k6)、装修(k7)。

(二)综合网络搜索指数的构建。为科学的分析河北省的情况,选取最具代表性的三个城市:石家庄市、唐山市和秦皇岛市。以三个城市为例,依据2011年1月1日至2016年12月31日的关键词周平均指数,利用移动平均法计算得到2011年1月至2016年12月的月平均指数,为将所选关键词的百度搜索指数合成一个综合网络搜索指数WI,构建合成指数计算公式:WI=■Iiwi。其中,Ii为第i个关键词的百度搜索指数,wi为第i个指数的权重,权重的确定利用主成分分析进行。由此根据所选三个城市7个关键词的百度搜索指数数据,利用SAS软件进行主成分分析,得到第一主成分的特征向量如表1所示。将各系数进行归一化处理后作为各个关键词指数的权重。根据表1得到的权重分别计算得到石家庄市、唐山市、秦皇岛市的综合网络搜索指数,记为WIS、WIT、WIQ,如图1所示。(表1、图1)

二、网络搜索指数与房地产价格之间的相关性

购房者借助网络搜索技术找到所需相关信息,实现了购买房产时的较高参与度。这说明网络搜索数据能够显示出房地产参与主体的预期,也展示了房地产业各参与主体的购买习惯和行为走向,进而对房地产的价格产生影响。

(一)理论分析。供求因素是影响房地产价格的重要因素,互联网的搜索引擎为房地产参与主体提供了便利的信息供应。通常情况下,消费者在购房的时候会抱有谨慎的态度,并且由于房地产的位置固定性、价值量大、流动性差等特点,使房地产市场的供求信息处于一种不对称状态。消费者在购房需求产生之后通常都会花费大量时间搜集相关信息,消费者对这些信息的关注程度展示了消费者对房地产市场供需状况的反应,进而影响到预期的购买行为。就房地产市场的参与各方而言,面对宏观经济政策的变化都存在一个心理预期的形成过程。政策变动时,其投资行为或购买行为会考虑新政策下的预期收益和成本变动等问题。也就是说,房地产价格的变化并不会随着宏观经济政策的变化立即产生,而是存在明显的时滞性。这说明购房者及房地产商的行为都可以在互联网上和实际市场中反映出来,互联网络搜索关键词的变化成为各参与主体预期行为的表现,而各参与方的实际行为则反映在房地产价格的滞后变化上。

(二)网络搜索指数与房地产价格互相关分析。房地产价格选取新建商品住宅价格环比指数(FI)作为研究变量,三个城市的新建商品住宅价格指数分别记为FIS、FIT、FIQ,选取国家统计局公布的2011年1月到2016年12月数据,如图2所示。(图2)

由图1和图2可以看出,网络搜索指数与新建商品住宅价格指数之间存在较明显的共同变化趋势,为进一步研究二者之间的关系,采用时间序列互相关函数进一步分析。

1、平稳性检验。首先对各变量进行平稳性检验,检验结果如表2所示。可以看出:FIS、FIT、FIQ、WIS、WIT、WIQ的ADF统计量在10%的显著水平下都是平稳的。(表2)

2、互相关函数分析。互相关函数能够测度两变量之间的相关强度和方向,利用Eviews8.0作互相关函数图,分别对石家庄市、唐山市、秦皇岛市的网络搜索指数与新建商品住宅价格指数进行互相关分析。(表3、表4、表5)

表3显示石家庄市的网络搜索指数与新建商品住宅价格指数存在明显滞后的正相关关系。FIS与WIS(-i)之间的关系中可以看出,滞后的WIS与FIS相关性较显著,相关关系一直持续到滞后第9期,滞后第10期开始逐渐减弱,尤其是WIS(-6)、WIS(-7)、WIS(-8)与FIS的正相关性较强,说明人们进行网络搜索的变化与半年以后的房价相关联;在FIS与WIS(+i)之间的关系中,显示出FIS与未来的WIS也存在一定的相关性,尤其是未来4期的负相关关系明显,说明房价变化与未来网络搜索量的反向变动关系明显,人们对石家庄市房价的反应较敏感。

表4显示唐山市的网络搜索指数与新建商品住宅价格指数的正相关关系滞后作用期更长一些,WIT与FIT的相关关系稍弱于石家庄市。FIT与WIT(-i)之间的关系中,从滞后第6期,WIT与FIT的相关性才开始增强,WIT(-9)与FIT的相关性最显著,一直持续到滞后11期,然后逐渐减弱;在FIT与WIT(+i)的关系中,FIT与未来WIT的负相关性显现的较缓慢,未来的8期之后负相关关系才逐渐增强,说明唐山市房价发生变化后,网络搜索的反应较慢,人们对唐山市房价的反应不够敏感。

表5显示秦皇岛市的网络搜索指数与新建商品住宅价格指数之间的滞后相关也较明显,与唐山市相似,但正相关关系更强一点。FIQ与WIQ(-i)之间的关系中,WIQ与FIQ的滞后相关关系不断增强,WIQ(-9)与FIQ的相关关系最强,滞后相关持续到滞后11期,第12期开始逐渐减弱;在FIQ与WIQ(+i)之间的关系中,FIT与未来WIT的负相关性显现的也较缓慢,负相关程度显现的比唐山市的稍强一些,说明人们对秦皇岛市房价的反应比唐山市敏感一些。

三、基于ADL模型的预测分析

(一)模型的构建与估计。通过互相关函数的分析可以看出,网络搜索指数(WI)与新建商品住宅价格指数(FI)存在明显的滞后关系,而且滞后期较长,因此构建能够反映滞后影响关系的自回归分布滞后模型ADL(1,n)模型:

FIt=c+?琢FIt-1+?茁0WIt+?茁1WIt-1+?茁2WIt-2+…+ut

模型中,下标t表示第t月,u为随机扰动项。由于FI与WI互相关函数分析的滞后期较长,因此模型的构建中加入了FIt-1,并且对WI的滞后期没有加以限制,但WI的滞后期长度需要在模型的估计中进行验证。根据AIC、SC信息准则,从滞后11阶开始验证模型,以此得到最显著的滞后阶数。运用Eviews8.0對三个城市分别进行模型的验证与估计,估计方法采用阿尔蒙多项式法,最终验证的模型及结果如表6所示。(表6)

模型估计结果表明,网络搜索指数对房地产价格确实存在滞后影响,石家庄市的滞后影响在第4~8个月比较显著,唐山市的为第7~11个月,秦皇岛的为第6~9个月,说明对河北省房价感兴趣的购房者通常会提前半年左右甚至提前更长时间搜索相关信息,换言之,根据当前用户的网络搜索数据可以预测半年以后的房地产价格。

(二)基于ADL模型的预测。根据2017年1月和2月的百度搜索数据计算得到网络搜索指数的WI,利用表6的验证模型分别对石家庄市、唐山市和秦皇岛市的新建商品住宅价格指数进行预测,预测结果如表7所示。三个模型进行预测的平均相对预测误差MAPE分别是0.21%、0.21%、0.29%。(表7)

预测结果显示,2017年1月和2月河北省石家庄市、唐山市和秦皇岛市的新建商品住宅价格指数均大于1,说明房价均有所上涨,与实际国家统计局公布的实际数据相比,三个模型的预测误差很小,预测结果与实际相符,模型的预测效果很好。

四、结论

通过理论分析网络搜索数据与房地产价格之间的关系,利用互相关函数分析进一步证实网络搜索指数与新建商品住宅价格指数之间的滞后相关,据此建立的自回归分布滞后模型更具体展现了二者之间的滞后影响关系。石家庄市、唐山市、秦皇岛市的数据经过模型的验证都充分说明房地产参与主体的网络搜索行为与房地产价格之间存在的滞后关系。综合来看,滞后影响在滞后第4~11个月之间较显著。这一结果表明购房者一般会提前半年至一年的时间搜索相关信息,而当前搜索行为的数据为以后房地产价格的预测提供了信息基础。本文构建的综合网络搜索指数与新建商品住宅价格指数之间的ADL模型,能够比较及时、客观、准确地预测房地产价格的变动,相对于其他方法来说,消除了主观因素的影响,预测的时效性更强,体现出网络搜索数据对房地产价格具有较好的预测效果。

主要参考文献:

[1]孟彩云,王聪.房地产价格、泰勒规则与宏观经济调控——基于2000~2010年我国宏观经济数据的检验[J].当代财经,2012.2.

[2]董纪昌,李秀婷.基于网络关键词搜索的房地产价格影响因素研究[J].新疆财经大学学报,2013.3.

[3]刘枬,刘小娟.房地产大数据的研究现状和趋势分析[J].建筑经济,2015.6.

猜你喜欢
房地产价格数据分析
北京、上海、深圳房地产价格的影响因素比较研究
房地产价格影响因素研究
浅析大数据时代对企业营销模式的影响