基于因子分析法对长春市住宅小区的评级方法解析

2020-10-21 04:08李泽付伟翔
文存阅刊 2020年6期
关键词:因子分析

李泽 付伟翔

摘要:本文基于因子分析法对长春市的住宅小区进行水平评级。从房天下、安居客等网站采集到关于房子、小区的具体信息。再将信息导入excel中,使用excel相关函数对数据进行删除(删除缺失60%以上的指标,删除重要指标缺失三个及三个以上的小区)、合并,得到关于小区及其参数的信息。经过手动查找填补缺失的参数数据,再使用spss中的线性插补填补剩余空缺。将小区各指标数据标准化使之在同一量纲下。应用因子分析法对小区的参数指标进行降维,得到因子及因子得分,将因子与因子得分相乘再相加可得到小区分数。应用k-均值聚类法对小区进行分类,小区的分类结果,即小区的级别。

关键词:小区评级;因子分析;k-means聚类

本项目拟使用客观的科学方法对长春市与吉林市各区的住宅小区进行评级,收集居民住宅小区的房价、户型、绿化率、容积率、物业费用等小区本身信息,使用线性插补法填补缺失数据,运用因子分析等方法对影响居民住宅小区分级的各种因素进行分析,给出各个住宅小区的综合评价指数,使用k均值聚类法对住宅小区进行聚类,得到住宅小区的评级结果,对购房租房者提供科学客观的参考指导。

1指标体系的构建

1.1数据的采集

从房天下、安居客、五八同城、诸葛找房、房产超市、赶集网等网站收集数据。

1.2数据的预处理

1.2.1剔除指标。剔除缺失率在60%以上的指标。

1.2.2指标的转化。由于存在房屋指标而本文是对小区进行评级所以需要将房屋指标转化为小区指标。将同一小区的房屋指标的平均值作为该小区的指标。再与小区的指标合并,得到了指标齐全的数据。

1.2.3小区的删除。存在着一些小区缺失过多重要指标,将缺失指标三个及以上的小区删除。

1.2.4数据的填补。运用线性插补方法对缺失数据进行填补。将以有数据进行拟合处理找到线性函数,计算对应缺失值。部分如下图。

1.2.5数据的标准化。由于价格、面积、室、厅在不同维度上的特征尺度不一致,所以需要对上面四分数据进行标准化处理,使得不同类型的指标在同一量纲下。套用公式:。

1.3指标构建

2因子分析

2.1检验是否适用因子分析法

在运用因子分析法进行统计分析前,需要对标准化后的指标进行检验,其目的是判断该研究对象是否适合运用因子分析法进行研究。本文采用 KMO 及 Bartlett 球度检验。

通过 SPSS 软件分析发现,KMO 的值为 0.672>0.5,Bartlett球度检验的近似卡方值是2187.109,自由度是 55,显著性是0.000。表明各变量间存在着相关性,所选指标适合进行因子分析。

2.2因子提取

使用主成分分析法对数据降维。在累计方差贡献率在80%左右情况下提取因子。通过主成分分析法提取主因子,计算出提取因子的总方差解释分析,由表可以得出,模型从11个因子中提取七个因子,特征值分别为2.998、1.387、1.118、1.035、0.991、0.923、0.859,提取的七个主因子的累计贡献率达到84.653%,覆盖了大部分信息,能够反映出小区的综合素质水平。

2.3解释因子

因子1解释为小区的结构。因子2解释为小区的规模。因子3解释为小区的价格。因子4解释为小区的密度。因子5解释为小区的服务。因子6解释为小区的装修情况。因子7解释为小区的自然环境。

2.4计算因子得分

对于每个因子,把系数和对应的指标名称相乘后再求和,可以得到最终的因子得分公式,利用它就能够对所有样本进行因子评分。得到公因子得分矩阵,再与对取得的7个公因子的得分进行加权求和就可以对学生进行综合评分。这7个因子的权数可取方差贡献值。

设各指標为X1、X2…Xm,

成分得分系数矩阵为,方差贡献值矩阵为,各因子得分为,n为因子数,m为指标数

小区分数为

设总价为X1、均价为X2、面积为X3、室为X4、厅为X5、总楼层为X6、装修状态为X7、房子数量为X8、绿化率为X9、容积率为X10、物业费为X11。

由上两表可知第一类的聚类中心是86.96949428,有36个小区;第二类的聚类中心是20.49633943,有284个小区;第三类的聚类中心是-19.25131403,有785个小区;

结论

通过因子分析及聚类,我们得出结论——长春市在售一级小区有36个、二级小区有284个、三级小区有465个。

参考文献:

[1]王杰,闫军,徐旦.基于因子分析法的“一带一路”沿线省市物流能力比较研究*[J].科技与创新,2019(04):26-30.

[2]张少杰,林红.“金砖五国”服务业国际竞争力评价与比较研究[J].中国软科学,2016(01):154-164.

[3]王湃,南玉范.SPSS在区域科技综合实力评价中的应用[J].中国管理信息化,2006,9(11):86-87.

作者简介:

李泽(1990— ),男,汉族,吉林省通化市辉南县人,本科,研究方向:计算数学。

猜你喜欢
因子分析
基于GPS数据的旅游时空行为评价研究
中国创业板生物制药类上市公司成长性评价体系实证研究
中国各地区主要空气污染物结构的因子分析
我国31省城镇居民消费水平(2007)
基于因子分析法的二胎概念股投资价值分析
基于主导产业视角的战略性新兴产业识别以及实证研究
基于省会城市经济发展程度的实证分析
山东省县域经济发展评价研究
实证分析会计信息对股价的影响
京津冀一体化下物流网络节点城市选址规划