基于回归模型与BP神经网络的我国房价与泡沫预测

2018-05-14 11:10朱佳琦
中国房地产业·下旬 2018年9期
关键词:多元线性回归BP神经网络房价

【摘要】对于我国房地产市场日益火热的现象以及潜在的泡沫威胁,建立了一种新的预测分析模型。将回归模型与BP神经网络算法相结合,将时间序列分解为长期趋势与残差,分别进行预测。选取了我国2002年1月至2017年9月的平均房价以及主要影响因素作为实验数据,对房价进行预测,并对泡沫进行量化研究。研究结论给出了房地产价格与泡沫的发展趋势,并提出了监测与抑制泡沫的有效手段。对我国房地产市场健康稳定发展具有一定意义。

【关键词】房价;房地产泡沫;多元线性回归;BP神经网络;预测分析

引言

房地产泡沫现象主要指的是土地价格和房产价格上升到极端的高位,与房产的使用价值不符。近年来,房价不断上涨。国家为控制房价,先后在2010年与2015年出台了限购令与“去库存”政策,然而并未取得很好的效果。在三四线城市供远大于需,在一二线城市市场火爆一房难求。在此背景下,房地产市场可能形成泡沫,存在较高的金融风险。[1][2]因此,对房价的發展趋势与房地产泡沫的评估具有重要的现实意义。

以往学者如张玉双[3]、骆永民[4]等对房价泡沫的预测研究通常使用回归模型或者时间序列模型。基于所获得的经济数据,所建模型一般会存在异方差、自相关等违反经典假设的问题。且大多数情况下使用普通手段难以消除。针对此问题,本文提出一种新方法,即将原始时间序列数据进行分解,综合采用多元回归模型与BP神经网络算法分别对趋势和残差序列进行预测。从而弥补了传统回归模型过于依赖经典假设的缺点。

1、数据收集与处理

本文根据数据的可获得性与连续性,选取了房地产投资额累计同比增速/GDP累计同比增速(X1)、房地产销售总额/GDP(X2)、房地产开发贷款/房地产开发资金(X3)、房价上涨率(X4)与房价收入比(X5)这五个宏观经济指标作为影响房价与泡沫的因素,并以全国平均房价为因变量(Y),如图1所示。

本文选取2002年1月至2017年9月总共189个月的月度数据作为分析样本。数据来源为中经网数据库。由于部分数据不以月度为统计节点,例如GDP数据以季度为统计节点,故本文采用二次匹配平均法(Quadratic Match Average)进行处理,将其转化为月度数据。同时提高分析与预测的精度。对于指标缺失数据,取上下期平均作为该期数据。

2、预测模型

类似残差自回归模型的思想,对各指标时间序列数据进行分解:

即分解为长期趋势 与残差序列 的叠加。采用回归模型拟合长期趋势 ;对于残差序列 ,对其进行检验,若 为非白噪声序列,则说明可以从中进一步提取信息,采用BP神经网络对 进行拟合与预测。最终的拟合预测结果由两部分相加得到。

2.1 趋势拟合模型

在189个月的数据中抽取大概前65%的样本作为训练测试样本,即2002年1月至2013年12月的数据作为训练测试样本。2014年1月至2017年9月的样本作为预测对照样本。采用多元线性回归模型拟合训练测试样本。利用Eviews 8.0进行回归操作,得到模型为:

利用该模型对预测对照样本进行预测。可得2014年1月至2017年9月房价的趋势预测值。

2.2 残差序列拟合模型

由多元线性回归模型的拟合结果可得训练测试样本的残差序列。将残差序列作为因变量,序列 作为自变量,用BP神经网络进行拟合。

2.2.1 BP神经网络算法原理

BP神经网络算法的基本思想为输入信号的正向传播与误差的反向传播。正向传播过程中,输入样本由输入层进入,经隐含层处理,由输出层输出。隐含层的各个神经元包含一个激活函数,通常使用Sigmoid函数或双曲正切函数作为激活函数。计算输出层的误差,即实际输出与期望输出的偏差,若偏差过大,不符合要求,则进行误差的反向传播。在误差反向传播过程中,可以计算出各隐含层造成的误差,并由梯度下降法等方法进行权值修正。经过多次迭代,可以将误差减少到足够小,从而完成神经网络的训练。[5]

以只含一个隐含层的BP神经网络为例为例,其拓扑结构如图2所示。

BP神经网络算法的步骤为:[6][7]

Step 1.以随机数初始化权值

Step 2. 输入学习样本;

Step 3. 依次计算各层的输出

Step 4. 求各层的反向传播误差:

Step 5. 用梯度下降法等方法修正各层的权值和阈值;

Step 6. 计算新一轮输出与误差,若达到指定精度或达到最大学习次数,则终止学习。否则转到第二步继续新一轮的学习。

算法流程图如图3所示:

2.2.2 模型建立

同趋势拟合模型,选取2002年1月至2013年12月的数据作为训练测试样本。使用BP神经网络进行建模。

本文采用MATLAB R2015b作为软件平台,进行BP网络的训练与测试。BP神经网络在进行训练之前,需要进行参数预设定。选择合适的参数能使BP神经网络的性能得到最大的发挥。本文采取反复试验的方法,根据训练结果不断调整参数以达到最优效果。最终参数设定为:隐含层为2层,隐含层节点数分别为10、11个,各层激活函数均为双曲正切函数。采用动量梯度下降法进行训练。设置最大训练次数为1000,学习率为0.1,目标精度为 。其中,训练样本占2002年1月至2013年12月样本的70%,测试样本占30%,均为随机选取。

3、结果分析

使用训练好的BP神经网络对2014年1月至2017年9月的预测对照样本进行预测分析。将各因素输入模型,输出预测残差序列,并由公式

同时,综合考虑回归模型对长期趋势的预测与BP神经网络对残差的预测,还可以获得各个影响因素的贡献率,由此可得到各因素的重要性,如表2所示。

综上所述,得出以下分析结论与政策建议:

2017年全年的房价泡沫率均在30%左右波动,且呈上升趋势。同时结合2014年1月至2017年9月的泡沫率变化可知,自2017年1月以来,我国房地产市场泡沫率有显著下降,但仍在缓慢增长。政府需要采取措施遏制房地产市场泡沫。

由重要性分析可知,因素X3(即房地产开发贷款/房地产开发资金)占据第一位,房地产开发贷款对房价以及泡沫的影响最大。其他四个因素也产生了一定的影响。所以政府部门尤其要加强对房地产开发贷款的监管程度,从而控制泡沫增长。

结论:

本文针对传统回归模型过于依赖经典假设的问题,提出了一种新的预测分析模型,即把回归模型与BP神经网络相结合,将时间序列分解为长期趋势与残差,分别进行预测。实验结果表明,该预测分析模型取得了较理想的结果。该模型对房地产市场泡沫的监测控制具有重要意义。根据预测、分析的结果可以为政府相关部门提供有建设性的建议。

参考文献:

[1]王小广.房地产库存问题与去库存对策[J].理论探索,2017(02):16-21+27.

[2]曾五一,孙蕾.中国房地产价格指数的模拟和预测[J].统计研究,2006(09):27-30.

[3]张玉双.我国地区房地产价格泡沫的测度[J].统计与决策,2016(05):129-132.

[4]駱永民.城市化对房价的影响:线性还是非线性?——基于四种面板数据回归模型的实证分析[J].财经研究,2011,37(04):135-144.

[5] Sun Ye.RMB Exchange Rate Forecast Approach Based on BP Neural Network[J]. Physics Procedia,2012,(33):287-293.

[6]黄丽.BP神经网络算法改进及应用研究[D].重庆师范大学,2008.

[7]许兴军,颜钢锋.基于BP神经网络的股价趋势分析[J].浙江金融,2011(11):57-59+64.

作者简介:

朱佳琦,男,武汉理工大学理学院本科生;

卢紫馨,女,武汉理工大学经济学院本科生;

漆俊伟,男,武汉理工大学理学院本科生;

李刘皓,男,武汉理工大学理学院本科生;

通讯作者:金升平,男,教授,硕士生导师,研究方向:金融统计计算与随机模拟。

基金项目:

武汉理工大学自主创新研究基金本科生项目(2017-LX-B1-13)

猜你喜欢
多元线性回归BP神经网络房价
房价上涨对居民消费的影响研究
房价上涨抑制英国出生率:每年少生7000多名婴儿
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
我国上市商业银行信贷资产证券化效应实证研究
云学习平台大学生学业成绩预测与干预研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
BP神经网络算法在数值预报产品释用中的应用
2016房价“涨”声响起