中国房价影响因素的实证研究
——基于77城截面数据的多元回归分析

2021-05-05 08:10张新怡江南大学商学院
消费导刊 2021年11期
关键词:共线性方差房价

张新怡 江南大学商学院

一、引言

在当前国人的观念中,房产的保值、增值作用甚至超过了储蓄,也因此滋生了“炒房”等投资行为,并且受到传统伦理道德的影响,房产购置成为了国民的基本需求,房价的变动深刻地影响着国计民生以及其他相关产业的良性健康发展,研究房价的影响因素对于调控房地产行业非常必要。本文基于此,选取了近80城的截面数据,建立多元线性回归模型进行相关因素的探究与检验,旨在挖掘出影响房价的重点因素,并预测未来房地产发展趋势,由此推出对应的政策建议以期实现房地产行业的健康发展。

二、影响因素

影响房价的因素选取主要基于基本市场供需理论以及城市发展实例进行猜想假设,从经济、社会及环境各方面和进行抓取,最终主要选取了城市GDP、人口密度等十个因素作为模型的基本解释变量。

GDP:一国地区或城市的GDP代表了该地区在一定时期内生产活动的综合性结果,被公认为是衡量经济状况的最佳指标。通常认为GDP越高,代表城市在相同时期内能获得较高的产出,经济发展的效率和效能都优于其他城市。而GDP的背后的代表了优质的劳动力数量的流入和结构的优化以及基础设施如交通、环境等的投入,这些因素也深刻影响着地区房价的高低。

职工平均工资水平:平均工资水平决定了人均可支配收入,在其他条件不变的情况下,收入越高,需求越多。一个地区的职工平均工资水平越高,意味着有更多的人能够负担3000元/m2的房价,需求增多,当房价增长至5000元/m2时,供求达到平衡。

外商实际投资额:外商对外投资对于营商环境的选择也代表了购房者的消费倾向,往往基于一个地区基础设施的完善程度,交通的便利性、潜在消费市场的大小和劳动力人口数量,这些因素也是影响房价的直接因素,一个地区营商环境越好,上述因素愈有优势,房价也相对较高。

城乡人均储蓄年末余额:一个地区人均储蓄越高,意味着有相对较高的人均可支配收入,相应的购房需求也会增多。但也存在一定的负相关性,储蓄额越高也就意味着实际消费相对受限,保守的消费倾向将影响购房需求,从而抑制房价的上涨。

第三产业占比:一个地区的产业结构侧面反映了该地区的劳动力人口结构、环境状况和政府政策,也深刻影响着城市未来的发展前景。因此,一个城市产业结构约合理,则房价也相对较高。我国北方部分以重工业为发展导向的城市近些年来出现了后工业化环境污染、资源枯竭、人口流失和产业空心化现象,需求减少,房价不断下跌;而深圳等以信息技术和战略性新兴产业为主要导向的城市则不断吸引人才和资金流入,基础设施不断完善,房价攀升。

医院个数:医疗教育等关系着国民生计和基本权益保障,一个地区医疗条件的完善程度也影响该地区的房价。但由于目前医疗技术和发展水平的普遍提高,以及交通通信技术和线上医疗的发展,医疗条件对于房价影响的重要程度将有所下降。

人口密度:从理论上来看,一个地区的人口密度越大,就意味着人们对住房的需求越大,住房资源也越发稀缺,对住房的需求增加,进一步带来住房价格的上涨。受经济发展水平和社会观念等因素的影响,现代家庭呈现出分散化和小型化的趋势,因而高人口密度的地区对住房刚性需求和改善需求都很大,推动地区房价的上涨。

年均AQI指数:AQI指数是一个地区空气质量的定量描述,AQI指数越高,该地区空气质量越差,宜居程度越低,也从侧面反映出该地区的产业结构的不合理性和环境污染治理的不完善,缺乏科学有效的城市发展战略规划和治理技术。通常认为,在其他因素相同的情况下,一个地区污染越少,环境质量越高,房价也相对较高。

房地产开发投资额:从经济理论的角度出发,房地产开发投资额既有需求侧的正效应带动也有供给侧的下拉。一方面从“量”地角度看,房地产开发商不断增加房地产地投资,开发更多商品房以供销售,在需求相对稳定的情况下,供应量增加,价格下降;另一方面,从“质”的角度,房地产开发投资额上升,意味着开发商投入成本增加,出于市场定位等因素,在社区规划、房屋建筑材料等方面增加投入,追求质量从而吸引高品质的消费需求,从这个角度看,将带动房价的上涨。

供应土地面积:通常认为,在其他因素相同的情况下,一个地区房地产投资开发额和供应土地面积越多,则房产供应越多,在人口数量相对稳定的情况下,房价也会出现下降。但也是基于排除“炒房”等破坏正常市场运行规律等因素的影响。

三、实证分析

(一)截面数据——基于77城数据

1.数据来源及模型建立

出于样本选取的随机性,首先抓取了2014~2016年中国77个城市的房价和影响因素数据。本文所有数据均来自国家统计年鉴和国泰安(CSMAR)数据库。由此构建多元线性回归模型:

其中,i代表了77个不同城市,Yi代表了房价水平,X1为GDP(单位:亿元),X2为人口密度(单位:人/平方公里),X3为工资水平(单位:元),X4为医院个数(单位:个),X5为外商投资额(单位:元),X6为第三产业占比(单位:%),X7为房地产开发投资额(单位:万美元),X8为AQI指数,X9为城乡居民年末人均储蓄余额(单位:万元/人),X10为供应土地面积(单位:万平方米),ui为随机扰动项。

2.OLS估计参数

假设此多元线性回归模型满足基本假设,基于Eviews对2014年的数据进行初步的多元线性回归,回归结果如下:

图1 14年参数估计结果

通过14年各解释变量与房价的回归可得到

由结果可知,外商实际投资额X7的符号与实际经济意义不符;其次是进行统计性检验,在给定显著性水平为0.05的基础上,只有X2、X3、X10的回归系数估计值通过了t检验,而F检验是显著的,所以总体回归方程可能存在多重共线性。但各解释变量的符号均通过了经济意义检验。

同理,对2015年和2016年进行相应的回归分析可得到:

图2 15年参数估计结果

图3 16年参数估计结果

通过2015年和2016年的回归可以得到相似的结论,首先在经济检验中,有部分解释变量的符号与实际经济意义不符;在统计检验层面,F检验通过的情况下仍存在部分解释变量的t检验不通过,且2014~2016年问题数据都较为相似,例如人口密度X2均为通过三年的统计性检验,因此并不存在一年数据异常而导致的偶发误差,因此认为模型存在多重共线性。

3.多重共线性检验及修正

基于OLS估计结果的初步分析可以判断模型存在多重共线性,下面将通过相关系数和方差膨胀银子进行进一步检验。

(1)相关系数检验

图4 2014年变量相关系数结果

图5 2015年变量相关系数结果

图6 2016年变量相关系数结果

由相关系数表可得,除了16年城乡人均年末储蓄余额与医院个数与14、16年有明显差异外。14-16年的各解释变量的相关系数均无明显差异,因此可以排除由于异常数据造成的误差,说明三年的数据均较为稳定。

综合三年数据得出,部分解释变量存在较强的相关性(0.8附近):

①16年:r13=0.80、r15=0.79、r17=0.81、r4 10=0.63、r37=0.72

②15年:r13=0.78、r15=0.86、r17=0.80、r4 10=0.77、r37=0.71

③14年:r13=0.72、r15=0.83、r17=0.78、r4 10=0.73、r37=0.73

基于此,可以得出解释变量X1、X4、X7,即GDP、医院个数以及房地产投资开发额造成了模型的多重共线性。

(2)方差膨胀因子检验

引入方差膨胀因子,在Eviews中计算可以得到:

①2014年可以得到VIFX1=118264>5、VIFX7=4.562672,认为解释变量X1、X7会引起严重共线性,即GDP和房地产投资开发额,并且GDP是造成多重共线性的首要解释变量。

②2015年可以得到VIFX1=11.15699>5、VIFX7=4.941414≈5,认为解释变量X1、X7会引起严重共线性,即GDP和房地产投资开发额,并且GDP是造成多重共线性的首要解释变量。

③2016年可以得到VIFX1=11.63783、VIFX7=5.797016>5,认为解释变量X1、X7会引起严重共线性,即GDP和房地产投资开发额,并且GDP是造成多重共线性的首要解释变量。

(3)多重共线性的修正

由于14-16年数据无明显波动差异,因此采用16年的截面数据进行多重共线新的修正,从而得出进一步的结论。本文采用逐步回归法进行修正。

表1 多重共线性修正

最终修正后的回归结果如下:

由结果可知,变量的经济意义全部符合理论,说明模型拟合程度较好,各解释变量和常数项的 t 检验值均通过,多重共线性对模型估计结果影响较小。

4.异方差检验及修正

基于修正多重共线性后的模型Y=0.458X1+0.179X3+0.00022X7-88.570X8+999.681进行异方差检验。通过Y-e2中可以看出,随着房价Y的增加,残差平方呈现扩大趋势,散点呈现出发散趋势变化,但由于趋势不明显,所以猜测可能存在异方差。

基于此,进一步采用White检验来确认异方差的存在,通过异方差检验表我们可以判断,在显著性水平α=0.05的情况下,Prob<0.05,拒绝“模型不存在异方差的原假设”,认为回归模型有明显的异方差性。

图8 怀特检验结果

通过WLS法进行修正,权数为1/abs(e),得到如下图所示结果:

图9 WLS修正

可以发现加权后的模型,可决系数检验效果比没有加权时要更理想。再次使用怀特检验,发现P=0.2264 >α=0.05,可以判断在显著性水平α=0.05的情况下,接受“模型不存在异方差性的原假设,认为模型不再具有异方差性。

图10 怀特检验结果(修正后)

四、结论及建议

最终,可以得到修正后的模型为:

综合77城截面数据回归结果来看,GDP、职工平均工资水平、年均AQI指数和房地产开发投资是影响房价的主要因素。其经济意义可表述为GDP 每增加 1 亿元,房价就会增加 0.250元/m2;职工平均工资水平每增加1元,房价就会增加 元/m2;房地产投资开发额每增加1万美元,房价会增加0.00029元/m2;年均AQI指数每增加1单位,房价会降低73元/m2。

探究影响房价的主要因素对于调房价,维护房地产市场的良性健康发展具有深远意义。根据以上数据分析回归研究,未来各地应着重引导高质量的经济发展,缩小经济发展差距;加大租购房补贴和各项贷款普惠力度,落实“去库存”;加强房地产市场的准入门槛,提高住房质量;加强城市生态文明建设,发展宜居城市。

猜你喜欢
共线性方差房价
方差怎么算
概率与统计(2)——离散型随机变量的期望与方差
银行不良贷款额影响因素分析
两大手段!深圳土地“扩权”定了,房价还会再涨?
防范未然 “稳房价”更要“稳房租”
文氏图在计量统计类课程教学中的应用
——以多重共线性内容为例
计算方差用哪个公式
不完全多重共线性定义存在的问题及其修正建议
方差生活秀
去库存的根本途径还在于降房价