基于主成分分析的BP神经网络对房价的预测研究

2011-05-10 07:09邱启荣
关键词:房价神经网络预测

邱启荣, 于 婷



基于主成分分析的BP神经网络对房价的预测研究

邱启荣, 于 婷

(华北电力大学 数理学院, 北京, 102206)

为了提高房价预测精度, 采用基于主成分分析的BP神经网络预测模型. 首先运用主成分分析对影响房价指标重新组合生成新的综合指标, 然后采用非线性预测能力非常强的BP神经网络对其进行建模, 并对房价进行预测. 仿真结果表明, 基于主成分分析的BP神经网络的房价仿真值与历史值的系统总误差只有0.52%, 可作为房价预测的一种行之有效的方法.

BP神经网络; 主成分分析; 房价; 预测

自1998年以来, 我国房价就逐渐开始增长. 房价的增长是非常复杂的经济问题, 使得房价与影响其变化的变量之间无法定量计算. 常用的房价预测方法有灰色模型、时间序列、BP神经网络、回归方法等. 杜道渊利用BP神经网络对自贡的房地产价格走势预测取得了较好地结果[1], 章伟用粗糙集与BP神经网络结合的方法取得了更为精确地结果[2]. 本文通过主成分分析及BP神经网络建模的方法对我国近几年的平均房价进行科学的定量预测.

1 房价影响因素及符号说明

房价问题一直都是近几年的热点话题, 自从1998年以来, 我国房价就逐渐的开始了增长的步伐, 为了抑制房价以保证社会持续稳定的发展, 政府出台了各项政策, 对房地产市场进行调控. 但是由于种种原因, 房价依然只升不降, 房价的不断攀升给人民尤其是中低收入者生活带来了很大的不便, 成为社会矛盾的焦点.

我们根据国内外的文献, 选取8个影响房屋销售价格()的影响因素[3]: 人均国民生产总值(1), 居民消费价格指数(2)、土地交易价格指数(3)、房屋租赁价格指数(4)、全国完成购置土地面积(5)、全国房地产开发完成额(6)、城镇人均可支配(7)、竣工房屋造价(8). 通过1999-2009年的《中国统计年鉴》查出全国平均数据, 具体数据见表1.

表1 房屋销售价格相关数据

2 建立房价预测的BP神经网络模型

2.1 BP神经网络概述

人工神经网络(ANN)具有很强的自学习能力, 可以以任意精度逼近非线性函数, 因此特别适合模拟现实中复杂的非线性问题. 在人工神经网络的应用中, 绝大部分的神经网络都是采用BP神经网络及其改进模型. 它体现了人工神经网络中最精华的部分[4].

典型的BP神经网络(Back Propagation)包括3层: 输入层、隐含层和输出层. 各层之间实行全连接, 同层之间无连接. 它的学习规则是使用最速下降法, 通过反向传播来不断调整神经网络的权值和阈值, 使网络的误差平方和最小.

图1 3层BP网络

2.2 数据预处理

2.2.1 主成分分析

由于可供参考的影响因子有8个, 我们采用主成分分析的降维方法减少因子数量.

主成分分析是将原来众多具有一定相关性的指标重新组合成一组新的线性无关的综合指标[5]. 通常数学上的处理就是将原来的多个指标作线性组合. 第1个成分具有最大的方差, 后面的成分对方差解释的比例逐渐变小, 它们相互之间均不相关. 假设原来有个指标, 重组后第个成分为:

在此我们将关于房价的8个影响指标做主成分分析, 结果如表2所示.

表2 方差分解主成分提取分析

由表2可见, 当包含3项成分时, 总的成分累计贡献率已达到86%以上. 在此将原来的8项指标转化为线性无关的3个成分, 并且各不相关(表3).

表3 成分相关系数

2.2.2 归一化处理

归一化就是把指标数值映射到[0, 1]内. 主要的归一化方法有线性函数转换、对数函数转换和反正切函数转换. 在此我们采用第1种方式, 即:

表4 归一化后的数据

2.3 房价BP神经网络训练及仿真

2.3.1 神经网络各层构建

大多数通用的神经网络都预先设定网络的层数, 而BP网络可以包含不同的隐含层. 在样本不是很多的情况下,我们选择常规3层BP网络(只有1个隐含层)就可以了.

2.3.2 参数设置

BP网络的输入数据为3个归一化后的成分, 输出数据为房价. 输入层有3个节点, 输出层有1个节点, 最大训练循环次数为5 000, 系统每100步显示一次训练误差, 训练目标误差为0.000 1, 学习系数为0.05.

隐含层和输出层传递函数分别为正切S形函数和纯线性函数, 网络训练函数为梯度下降自适应学习率训练函数, 学习函数为带动量的最速下降法.

2.4 结果分析

网络训练经过318次迭代后, 误差达到允许范围, 符合函数逼近的需要, 结果如图2.

图2 训练误差曲线

最后, 我们根据已有数据进行仿真, 把得到的结果做反归一化处理, 得到预测房价. 通过对比实际房价发现, 利用神经网络模型得出的预测非常准确, 对最后5年房价预测的平均误差率为0.52%, 具有很高的精度.

表5 5年房价误差率分析

图3 仿真结果与历史数据对比图

3 小结

BP神经网络具有很强的非线性映射能力, 对于非线性的样本数据, 能够很好的找到其内部关系. 在本文的数据预处理中采用主成分分析的方法把房价因素组合为线性无关的3类成分, 简化了输入成本, 提高了程序的运行速度.

通过前面的结果分析可知, 基于主成分分析的BP神经网络预测的房价非常接近原始房价, 模型训练次数少, 拟合精度高, 可以作为房价预测的一种可靠的方法. 这种方法不仅在房价预测中起到了很好的作用, 也可以尝试作为其它的非线性数据预测方法.

[1] 杜道渊, 杜宏斌, 周锋. 基于BP神经网络自贡房地产价格走势预测[J]. 四川理工学院学报: 自然科学版, 2011, 24(3): 366-310.

[2] 章伟. 粗糙集BP神经网络在房地产价格预测中的应用[J]. 计算机仿真, 2011, 28(7): 365-368.

[3] 刘双. 房屋销售价格的统计预测[D]. 华北电力大学, 2011.

[4] 闻新, 周露, 王丹力, 等. MATLAB神经网络应用设计[M]. 北京: 科学出版社, 2000.

[5] 薛薇. SPSS统计分析方法与应用[M]. 北京: 电子工业出版社, 2009.

[6] 苏变萍, 王一平. 基于BP神经网络的信息商品价格预测模型[J]. 统计与信息论坛, 2007, 22(1): 93-95.

[7] 陈基纯, 王枫. 房地产价格时间序列预测的BP神经网络方法[J]. 理论新探, 2008, 14: 42-43.

[8] 冯琨, 张永丽. 基于因子分析的BP神经网络对成都市需水量预测研究[J]. 水资源研究, 2011, 32(2): 8-11.

[9] 胡六星, 吴结飞. 基于灰色系统理论的两种房价预测方法比较[J]. 统计与决策, 2010, 7: 22-24.

[10] 武秀丽, 张锋. 时间序列分析法在房价预测中的应用—以广州市的数据为例[J]. 科学技术与工程, 2007, 7(21): 5631-5635.

[11] 王海军, 白玫, 贾兆立, 等. 基于二次优化BP神经网络的期货价格预测[J]. 数学的实践与认识, 2008, 38(5): 36-40.

BP neural network forecast model based on principal component analysis for the real estate price of prediction

QIU Qi-rong, YU Ting

(College of Mathematics and Physics, North China Electric Power University, Beijing 102206, China)

The BP neural network forecast model based on principal component analysis is used to improve the prediction accuracy. Factors affecting real estate prices is combined by principal component analysis, then it comes out some new fewer indicators. After that, BP neural network model is built which can well do non-linear prediction. Finally, the real estate price can be calculated. The total error between the simulation value through BP neural network based on principal component analysis and the real house price is only 0.52 percent. So it is an effective method for house price forecast.

BP neural network; principal component analysis; the real estate; prediction

10.3969/j.issn.1672-6146.2011.03.008

O 212.1

1672-6146(2011)03-0024-03

2011-08-29

邱启荣(1966-), 男, 教授, 研究方向为优化理论及其应用. E-mail: yutw520@163.com

(责任编校: 刘晓霞)

猜你喜欢
房价神经网络预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
两大手段!深圳土地“扩权”定了,房价还会再涨?
神经网络抑制无线通信干扰探究
防范未然 “稳房价”更要“稳房租”
不必预测未来,只需把握现在
去库存的根本途径还在于降房价
2016房价“涨”声响起
基于神经网络的拉矫机控制模型建立