基于回归模型与BP神经网络的我国房价与泡沫预测

2018-09-25 01:31朱佳琦卢紫馨漆俊伟李刘皓金升平武汉理工大学理学院湖北武汉430070
中国房地产业 2018年18期
关键词:残差泡沫房价

文/朱佳琦、卢紫馨、漆俊伟、李刘皓、金升平 武汉理工大学理学院 湖北武汉 430070

引言

房地产泡沫现象主要指的是土地价格和房产价格上升到极端的高位,与房产的使用价值不符。近年来,房价不断上涨。国家为控制房价,先后在2010年与2015年出台了限购令与“去库存”政策,然而并未取得很好的效果。在三四线城市供远大于需,在一二线城市市场火爆一房难求。在此背景下,房地产市场可能形成泡沫,存在较高的金融风险。[1][2]因此,对房价的发展趋势与房地产泡沫的评估具有重要的现实意义。

以往学者如张玉双[3]、骆永民[4]等对房价泡沫的预测研究通常使用回归模型或者时间序列模型。基于所获得的经济数据,所建模型一般会存在异方差、自相关等违反经典假设的问题。且大多数情况下使用普通手段难以消除。针对此问题,本文提出一种新方法,即将原始时间序列数据进行分解,综合采用多元回归模型与BP神经网络算法分别对趋势和残差序列进行预测。从而弥补了传统回归模型过于依赖经典假设的缺点。

1、数据收集与处理

本文根据数据的可获得性与连续性,选取了房地产投资额累计同比增速/GDP累计同比增速(X1)、房地产销售总额/GDP(X2)、房地产开发贷款/房地产开发资金(X3)、房价上涨率(X4)与房价收入比(X5)这五个宏观经济指标作为影响房价与泡沫的因素,并以全国平均房价为因变量(Y),如图1所示。

图1 房价与泡沫影响因素示意图

本文选取2002年1月至2017年9月总共189个月的月度数据作为分析样本。数据来源为中经网数据库。由于部分数据不以月度为统计节点,例如GDP数据以季度为统计节点,故本文采用二次匹配平均法(Quadratic Match Average)进行处理,将其转化为月度数据。同时提高分析与预测的精度。对于指标缺失数据,取上下期平均作为该期数据。

2、预测模型

类似残差自回归模型的思想,对各指标时间序列数据进行分解:

2.1 趋势拟合模型

在189个月的数据中抽取大概前65%的样本作为训练测试样本,即2002年1月至2013年12月的数据作为训练测试样本。2014年1月至2017年9月的样本作为预测对照样本。采用多元线性回归模型拟合训练测试样本。利用Eviews 8.0进行回归操作,得到模型为:

利用该模型对预测对照样本进行预测。可得2014年1月至2017年9月房价的趋势预测值。

2.2 残差序列拟合模型

由多元线性回归模型的拟合结果可得训练测试样本的残差序列。将残差序列作为因变量,序列作为自变量,用BP神经网络进行拟合。

2.2.1 BP神经网络算法原理

BP神经网络算法的基本思想为输入信号的正向传播与误差的反向传播。正向传播过程中,输入样本由输入层进入,经隐含层处理,由输出层输出。隐含层的各个神经元包含一个激活函数,通常使用Sigmoid函数或双曲正切函数作为激活函数。计算输出层的误差,即实际输出与期望输出的偏差,若偏差过大,不符合要求,则进行误差的反向传播。在误差反向传播过程中,可以计算出各隐含层造成的误差,并由梯度下降法等方法进行权值修正。经过多次迭代,可以将误差减少到足够小,从而完成神经网络的训练。[5]

以只含一个隐含层的BP神经网络为例为例,其拓扑结构如图2所示。

图2 单隐层BP神经网络拓扑结构

BP神经网络算法的步骤为:[6][7]

Step 1.以随机数初始化权值

Step 2. 输入学习样本;

Step 3. 依次计算各层的输出

Step 4. 求各层的反向传播误差:

Step 5. 用梯度下降法等方法修正各层的权值和阈值;

Step 6. 计算新一轮输出与误差,若达到指定精度或达到最大学习次数,则终止学习。否则转到第二步继续新一轮的学习。

算法流程图如图3所示:

图3 BP神经网络算法流程图

2.2.2 模型建立

同趋势拟合模型,选取2002年1月至2013年12月的数据作为训练测试样本。使用BP神经网络进行建模。

本文采用MATLAB R2015b作为软件平台,进行BP网络的训练与测试。BP神经网络在进行训练之前,需要进行参数预设定。选择合适的参数能使BP神经网络的性能得到最大的发挥。本文采取反复试验的方法,根据训练结果不断调整参数以达到最优效果。最终参数设定为:隐含层为2层,隐含层节点数分别为10、11个,各层激活函数均为双曲正切函数。采用动量梯度下降法进行训练。设置最大训练次数为1000,学习率为0.1,目标精度为 。其中,训练样本占2002年1月至2013年12月样本的70%,测试样本占30%,均为随机选取。

图4 误差随迭代次数变化图

如图4所示,BP神经网络在进行了16次迭代时,测试误差最小,性能达到最优。

3、结果分析

使用训练好的BP神经网络对2014年1月至2017年9月的预测对照样本进行预测分析。将各因素输入模型,输出预测残差序列,并由公式

将趋势拟合值与残差预测值相加得到房价预测结果,进而得出房地产市场泡沫率。本文定义房地产市场泡沫率为:[3]

以2017年1月至2017年9月为例,全国实际平均房价()、预测房价()以及泡沫率变化如表1所示。

表1 预测结果与泡沫率

2014年1月至2017年9月泡沫率变化如图5所示。

图5 泡沫率变化图

同时,综合考虑回归模型对长期趋势的预测与BP神经网络对残差的预测,还可以获得各个影响因素的贡献率,由此可得到各因素的重要性,如表2所示。

表2 各因素重要性

综上所述,得出以下分析结论与政策建议:

2017年全年的房价泡沫率均在30%左右波动,且呈上升趋势。同时结合2014年1月至2017年9月的泡沫率变化可知,自2017年1月以来,我国房地产市场泡沫率有显著下降,但仍在缓慢增长。政府需要采取措施遏制房地产市场泡沫。

由重要性分析可知,因素X3(即房地产开发贷款/房地产开发资金)占据第一位,房地产开发贷款对房价以及泡沫的影响最大。其他四个因素也产生了一定的影响。所以政府部门尤其要加强对房地产开发贷款的监管程度,从而控制泡沫增长。

结论:

本文针对传统回归模型过于依赖经典假设的问题,提出了一种新的预测分析模型,即把回归模型与BP神经网络相结合,将时间序列分解为长期趋势与残差,分别进行预测。实验结果表明,该预测分析模型取得了较理想的结果。该模型对房地产市场泡沫的监测控制具有重要意义。根据预测、分析的结果可以为政府相关部门提供有建设性的建议。

猜你喜欢
残差泡沫房价
基于双向GRU与残差拟合的车辆跟驰建模
废弃的泡沫盒
盛松成:什么才是中国房价持续上涨的真正原因?
“搞死”国家的泡沫
两大手段!深圳土地“扩权”定了,房价还会再涨?
基于残差学习的自适应无人机目标跟踪算法
有趣的泡沫小实验
防范未然 “稳房价”更要“稳房租”
基于递归残差网络的图像超分辨率重建
2016房价“涨”声响起