王骏飞
(武汉理工大学 理学院,湖北 武汉 430070)
第一步,利用SPSS对已知的商品住宅价格、工资收入以及GDP的十年数据进行相关性分析,得出数据间的相关系数,根据这些相关系数的大小来判断数据间是否有强联系,为下面进行预测模型的建立的合理性提供依据。
第二步,本文运用多元线性回归算法进行数据预估。首先把与商品住宅有强联系的数据类作为自变量,把商品住宅价格作为因变量,分别对强联系的数据类和商品住宅价格进行曲线多项式拟合,大致确定商品住宅与其强联系数据类之间的影响关系,通过分析它们之间的关系进行多元回归数学模型的建立。
第三步,通过历史数据对模型进行检验,并评价预测模型。
回归分析(Regression)是一种应用广泛的统计分析方法,在金融、经济、医学等领域都已成功应用。他应用于分析数据间的统计关系,侧重观察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系。回归分析一般解决以下问题:确定自变量与若干因变量之间关系的定量表达式,即回归方程式,并且确定它们关系的密切程度;运用控制可控变量的数值,借助于所求出的方程式来预测或控制自变量的取值;运行因素分析,从影响变量变化的因变量中,寻找出哪些因素对因变量产生了影响[5]。
相关分析用于描述两个变量之间关系密切程度,它反映的是当控制了其中一个变量的取值后,另一个变量的变异的程度。根据所得数据,本文应用Pearson相关系数来对数据见联系强度进行判断。
Pearson相关系数计算公式为:
其中,n为样本个数,xi和yi为要分析相关性的两变量,r即为两变量的相关系数。当0≤|r|≤0.3时两变量为弱相关,当0.3<|r|≤0.5时为低度相关,当0.5<|r|≤0.8时为显著相关,当0.8<|r|≤0.1时为高度相关。
回归算法的基本步骤:首先把与所要预测的因变量相关度最高的自变量引入到线性方程中去,再把相关性次高的自变量带入方程,在带入次高变量后,如果模型中的变量的F检验小于0.10,则后带入的变量将不会被模型所接纳。如此不断带入自变量进行循环,不断排除模型不需要的变量,直到所有变量都已经被筛选过,就得出最优回归模型。模型形式为:
其中,F作为多元线性回归显著性检验统计量,其定义公式为:
p为多元线性回归方程中的解释变量的个数。F服从(p,n-p-1)个自由度的F分布。
首先分析GDP、市民收入与商品住宅价格之间的相关性。目的是观察GDP、市民收入与商品住宅之间相关性强度。
通过相关性分析得出商品住宅价格与GDP以及市民收入的相关系数分别为03.976、0.996,皆为高度相关,所以GDP与市民收入为影响商品住宅价格的主要影响因子。
下面开始建立模型。根据已知数据,用Matlab分别做出GDP、市民收入与商品住宅价格的关系拟合图,并求得拟合曲线方程。
图1 GDP、市民收入与商品住宅价格的关系拟合图
经过以上曲线拟合我们得出:商品住宅价格与GDP为二次函数关系,与市民收入为一次函数关系。通过房价与GDP、市民收入之间的函数关系,我们开始建立多元回归模型方程如下。
设商品住宅价格y与GDP为x1、市民收入x2满足如下关系:
输入数据,利用 SPSS 计算出回归模型方程中的参数 β0、β1、β2、β3得出方程为:
根据已知武汉商品住宅数据对模型进行检测,检测结果如下表:
表1 模型检测结果
通过上表可以看出检验结果误差较小,最大误差值为286.6150,最小误差值为6.6280,平均误差值为142.1266。所求得模型可以应用于实际预测之中去。
本文所得多元线性回归模型基本能够在误差要求范围内预测3年内商品住宅价格。模型稳定性较好。对房地产市场有影响的因子很多,本文只寻找出两种相关性较高的因子,但房地产市场会受到一些突发性事件影响世界经济危机、国家政策调控等,而次模型还不具备对突发性影响的应对机制,这有待进一步研究。
[1]张红,李文诞.北京商品住宅价格变动实证分析[J].中国房地产金融,2001(3).
[2]周京奎.房地产价格波动与投机行为[J].当代经济科学,2005(7).
[3]Geoffrey Meen,Mark Andrew.Modeling Regional House Prices:A Review of the Literature by The Centre for Spatial and Real Estate Economics[D].Department of Economics,The University of Reading,1998.
[4]Stuart A Gabriel,Joe P.Mattey'William L.Wascher.House Price Differentials and Dynamics Evidence from the Los Angeles and San Francisco Metropolitan Areas[J].Real Estate Economic,2000.
[5]刘大海,李宁,晁阳.SPSS15.0统计分析从入门到精通[M].清华大学出版社,2008:151-211.