【摘要】房价是社会发展的热点问题,同时牵动着国民经济发展。伴随着“一带一路”的发展机遇,西安成为内陆与欧亚大陆桥的重要节点城市,西安房地产也在2017年全面进入品质时代,与之对应的房价也进入一个全新的水平。其中二手房以其交易简单、方便快捷、地理位置、即买即住等特点呈现着多元化的价格。本文利用西安市二手房市场相关数据建立数学模型,对二手房价变动趋势以及二手房房价的影响因素进行数理分析,为广大购房者提供了一定的指导意见。
【关键词】灰度预测 主成分分析 多元线性回归 房价影响因素模型
一、模型假设
①二手房销售数据即为二手房成交数据,用在售数据代替成交数据。②假定宏观环境保持稳定,即西安保持2017年一季度GDP增速7.6%不改变。③假定不考虑宏观经济变动和政策变动的影响。④价格变动不考虑供需方议价能力等随机因素的影响。
二、模型的建立与检验修正
根据2849条西安在售二手房的相关数据,建立数学模型,解释影响西安二手房价格的因素,为有意购买二手房的家庭提供建议。根据经济学理论,选择合适的影响因素作为变量,建立多元线性回归模型,在对OLS模型进行检验和修正之后,来反映和预测具体一间二手房屋的价格决定机理。对选取的二手房房价显著影响因素数据进行预处理。采用主成分分析法PCA,结合MATLAB软件,使得原来的多个变量线性组合成较少新变量,降低分析难度。进而,我们运用Eviews软件进行多元线性回归,建立OLS模型,并进行相关检验,以验证模型的准确性。
(一)模型准备
(1)变量选取。根据日常生活与经济学原理,得出以下9个对西安市二手房价格有影响的因素,并对各变量进行量化、标准化、同向化处理。各变量代号如下:
X1-中介公司规模,取值范围Z∈[1,331];X2-房屋总面积,取值范围Z∈[24,1133];X3-卧室数,取值范围R∈[1,8];X4-厅数,取值范围R∈[1,6];X5-建造时间,取值范围Z∈[1,7];X6-所在城区,取值范围R∈[0.02,0.265];X7-小区区位, 取值范围Z∈[20,100];X8-楼盘总层数,取值范围Z[∈4,34];X9-所在楼层,取值范围Z∈[1,3];Y-二手房单价。
(2)量化处理数据。X1-中介公司规模量化处理,按照中介公司在二手房市场所销售的房屋数进行量化,对中介公司进行编号(2846组数据中共销售房屋数即为编号),编号越大显示中介公司规模越大,将没有中介公司和仅销售一套二手房中介公司数据变量编号记为1。
X5-建造时间量化处理,将建造时间进行非等间隔间隔划分,划分标准及量化标准如下:
X6-所在城区量化处理,按照该城区同期二手房成交比重(X6=■)进行量化,以此衡量该城区二手房市场活跃程度及二手房供求状况。
X7-小区区位量化处理,小区地址按道路(例如科技路)和区域(泾渭开发区、浐灞半岛等)进行整理划分,根据西安市发布的《西安城市总体规划(2008~2020)修改》中心城区用地规划图集和生活经验,将小区地址划分为五类:一类制造开发区域、二类生态文化区域、三类商业商务区域、四类教育区域、五类居住区域。对2849项数据进行五类划分,按百分制评价,并以此应对将数据量化为20、40、60、80、100。
X9-所在楼层量化处理,楼层变量共三种,为低层、中层和高层,分别量化为数值1、2、3代入模型。
(二)主成分分析法进行变量降维
根据数据分析和对模型的变量假设可知,为了全面系统地分析房价问题,我们必须考虑众多影响因素,此处影响二手房价的因素较多(共九个),因此引入主成分分析法,旨在利用降维的思想,把九个指标(X1-X9)转化为五个主成分综合指标(Z1-Z5),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。因而,将众多复杂因素归结为几个主成分,使二手房价问题简单化,同时得到的结果更加科学有效的数据信息。
(1)主成分分析(PCA分析)。运用MATLAB软件中的printcomp函数进行主成分分析,结果如下:
贡献度及累计贡献度比重如下所示:
(2)贡献度结果分析。由表6可知,前5个变量的的累计贡献度之和 79.15%>75%,我们选用前五个成分(Z1、Z2、Z3、Z4、Z5作为主成分。因此,PCA选取结果为五个主成分Z1、Z2、Z3、Z4、Z5。
(三)多元线性拟合回归,求得二手房价影响因素模型
(1)利用Eviews进行OLS回归
回归过程:
利用Eviews软件代入量化标准化后的数据,对二手房价X10与五个主成分Z1、Z2、Z3、Z4、Z5进行OLS回归,回归结果如下:
回归结果:Y=7297.50+732.67Z1+112.75Z2-899.59Z3
-365.93Z4+972.25Z5
R2=0.779 F=1999.658(P=0) D.W.=1.997
回歸分析:
拟合优度达0.7786,拟合效果较好。从p值可以看出,除第二个变量Z2之外,其他变量的系数均通过0.05的显著性水平。D.W.接近于2,表示序列不相关。
(2)利用MATLAB进行OLS回归。利用MATLAB中的regress函数,对二手房价y与经过PCA选用的5个成分Z1、Z2、Z3、Z4、Z5进行OLS回归,结果如下:
系数矩阵B=cb1b2b3b4b5=1037.29510.73310.1163-0.9004-0.37070.9791=7295.1733.1116.3-900.4-370.7979.1endprint
系数矩阵B各项均位于置信区间内,由系数矩阵可得到关于主因素的回归模型如下:
Y=7295.1+733.1Z1+116.3Z2-900.4Z3-370.7Z4+979.1Z5
(四)模型求解,求得二手房价格影响因素模型
将原始变量代入,得最终的拟合方程:
y=7295.11+2.14x1-25.5x2+1033.95x3-518.63x4+107.26x5+
332.99x6+20.79x7
模型分析与家庭建议:
(1)全面考量小区区位因素,降低不必要成本。建议购房者在适当考虑预算的前提下,全面考量自己对于区位的需求。小区区位对于房价影响较为显著,家庭应综合考量适合自己的小区区位,例如对于教育、医疗或者生态区域的喜好程度,排除家庭不需要的区位特征,尽可能避免不必要的区位选择所带来的购房成本的提高。
(2)选择小户型小面积住宅,有效降低住房价格。户型越大总面积越大,房屋单价越高。市场对于大户型较为偏爱,需求旺盛。因此对购房预算较为吃紧的购房者建议,可选择房屋总面积较小、卧室数和厅数较少的二手住宅,这样可以有效地降低所购二手房的单价。
(3)侧重楼盘质量本身,关注中高层住宅。建造时间并没有对二手房价格产生较大影响,购房者应更多关注住宅建筑质量本身,同时选择建造时间较短的住宅并不会提高购房成本。同时建议对于楼层无特殊偏好的家庭购房者,在适当考虑预算前提下,购买高层楼盘中的高层房屋,会有效降低二手房的单价。
三、模型评价
(1)数据处理的科学性。本文对模型中涉及到的众多影响因素进行了量化、标准化和同向化,同时对附件1中难以量化且相关性较小数据进行了剔除,使数据口径相当,便于之后多元线性回归的分析。
(2)模型设计的完备性。 对于二手房价格影响因素的问题探讨,我们同时从横向和纵向考察了影响二手房价格的因素,试图从多角度解释二手房价格运行机制,模型的完备性较高。
(3)模型运行的可靠性。运用不同年份和区域的数据对模型进行预测检验,检验结果显示模型的预测精度高,在西安市二手房的价格预测工作中具有实际价值。
参考文献:
[1]姜启源,谢金星,叶俊.数学模型[M].北京:高等教育出版社,2003.
[2]朱旭,李换琴,籍万新.Matlab 軟件与基础数学实验[M].西安:西 安交通大学出版社,2008.
[3]邹高璐,渠文晋,二手房价格对于住房特征和区位变化敏感性性分析[J],西南师范大学学报,2005.
作者简介:杨晓玮(1995-),男,汉族,青海西宁人,西安交通大学 经济与金融学院 2014级本科生 专业:统计学。endprint