基于主成分分析的杭州市二手房住宅特征价格研究

2018-07-08 14:16王钶茗
商情 2018年25期
关键词:赋值人口数量回归方程

王钶茗

【摘要】主成分分析是研究住宅属性与价格关系的有效手段。本文将主成分分析模型用于杭州市二手房市场研究,分析2930个杭州市二手房的详细情况,进行多重回归分析,并用SPSS软件模拟特征价格模型。

【关键词】住宅属性 二手房

一、引言

特征价格法是目前国际上研究影响住宅价格微观决定因素的最主流方法。自1974年Rosen提出完整的技术框架后,经历30余年的发展,业己十分成熟,在我国及很多发达国家的政府部门和产业界得到越来越广泛的应用。

二、研究区概况

杭州市房地产市场是我国最为发达的房地产市场之一,自2016年G20之后,杭州市的国际知名度大增,二手房交易流动速度远高于我国房产交易平均水平。在二手房交易中,卖方和买方的信息对称和知情权是目前制约二手房市场发展的主要原因之一。对卖方而言,由于复杂多变的政策、“一房一价”模式以及个人偏好问题,导致售出过程受阻;而对买方而言,从浩瀚如烟的房产数据里搜寻出心仪的房产,更是难事一桩。因此,快速准确地为业主的房产估值或为购房者提供置业建议成为房产经济行业非常有意义的研究问题。

三、样本量的确定

本文从实际样本量的可获取量出发,参考各个城区人口数量间的比例关系,其中西湖区编号为1,人口数量80.85万人,样本数量510;上城区编号为2,人口数量35.30万人,样本数量412;下城区编号为3,人口数量53.50万人,样本数量330;江干区编号为4,人口数量71.09万人,样本数量456;拱墅区编号为5,人口数量57.10万人,样本数量640;滨江区编号为6,人口数量33.08万人,样本数量582。

四、特征价格模型的构建

(一)数据来源

变量数据的获取主要依靠网络。内容包括:装修程度、建筑类型、朝向、附近生活便利情况、附近教育配套、附近医疗情况、附近交通情况、面积、户型、楼层、建造年代等。以及区位特征和邻里特征;对于特征不详尽的住房,以实地调查的方式补充资料。

(二)样本变量的选择和量化

分等级赋值变量:有些特征变量需要通过主观识别进行评价,为了便于赋值,所以进行了等级的赋值的方法,这类变量主要有:装修程度、建筑类型、朝向三个变量。赋值越高,对住宅价格的附加值就越高。装修中毛坯、简装、精装分别赋值为3、6、9;楼层低中高分别对应楼层2、7、10;给朝向排序综合指标变量。由于过多变量的共线性问题不容忽视,故需对过多变量进行概括与浓缩,形成一个综合指标,包括15min步行范围内公交站数;5公里内医院数;1公里内学校数;15min步行范围内超市数。还对定量数据进行量化,包括:几室几厅、面积、建造年代、电梯有无。

(三)杭州二手房房产估值模型的建立

建立多元线性回归模型,再用逐步回归法对影响房价不大的因素移去,再利用线性最小二乘法对其他主要因素进行拟合。

1.多元线性回归模型的建立与求解:

由y=β0+β1x1+…+βkxk确定模型为:

Y=Xβ+ε

E(ε)=0,COV(ε,ε)=σ2In

为k元线性回归模型,k=12,简记为(Y,Xβ,σ2In)

Y=-185.5261+3.0877*x3+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1o+10.6264*x11+1.3616*x12

其中β0,βD,…,β12是13个带估计参数。y为房价,单位万元;x1为室数,单位室;x2为厅数,单位厅;x3为面积;x4为朝向;x5为装修;x6为电梯有无;x7为建造年代;x8为楼层高低;x9为周边交通;x10为周边医疗;x11为周边教育;x12为周边超市。

用最小二乘法求β0,…,βk的估计量做离差平方和:

选择β0,…,βk使得Q达到最小。解得估计值:

此为经验回歸平面方程,βi为经验回归系数。

进行逐步回归分析,从一个自变量开始,视自变量y作用的显著程度,从大到小地依次逐个引入回归方程。当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。对于每一步都要进行y值检验,以确保每次引入新的显著性变量前回归方程中只包含对y作用显著的变量。这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。最终得到回归平面方程为:

y=-185.5261+3.0877x3*+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1*+10.6264*x11+1.3616*x12

2.线性模型和回归系数的检验:

利用R检验法,解得R2=0.79802;修正后:,模型具有比较强的解释能力。

与显著性相关的P值=0<0.05,表示回归方程显著性强,说明住宅价格和各特征变量之间的线性关系能够成立。

五、研究结果分果

根据本文得出的杭州市二手房特征价格模型,在其他变量不变的情况下,住房所处的地区分别为西湖区、上城区、下城区、江干区、拱墅区和滨江区,其中西湖区房价最高,江干区房价最低;同时,住房附近公交站点数增加,会使住房价格上升,住房价格增加可用公式△y=0.7181*x9表示,其中△y为住房价格增量,y为住房原价,x9为公交站点数。影响特征中的电梯有无,周边学校个数,装修程度,周边医院个数,房屋朝向,房屋面积,周边超市个数,周边公交站个数这8个特征对二手房价格影响依次减少。其他影响特征不变的情况下,建筑面积越大的住房,住宅总价越高。

猜你喜欢
赋值人口数量回归方程
采用直线回归方程预测桑瘿蚊防治适期
浅谈回归方程在煤质检验中应用时应注意问题
我国60岁以上人口数量首超15岁以下人口
算法框图问题中的易错点
新疆人口发展趋势预测分析
2020年前俄人口数量将增至1.475亿
抽象函数难度降 巧用赋值来帮忙
利用赋值法解决抽象函数相关问题オ
5统计案例(回归分析及独立性检验)
学生为什么“懂而不会”