摘要:本文从知识粒度的角度提出了相似度的概念,并利用相似度作为属性重要度的度量。先求出属性集的核,并以此为起点,根据属性的重要性,逐步把属性添加到核属性集,从而得到约简属性集。
关键词:知识粒度;相似度;属性约简
中图分类号:F299.23 文献识别码:A 文章编号:1001-828X(2016)003-000-01
引言
粗糙集理论[1]是Pawlak教授于1982提出的一种以等价关系为基础,并具有很强定性分析能力的数学工具。
近年来,房地产市场的发展非常迅速,房价也成为人们关注的焦点。许多学者也对房价进行了大量的研究,取得了丰硕的成果。
丽江在云南的西北部,是著名的旅游城市。近几年,随着旅游热度的持续升温,旅游人数的快速增长,居民收入增长迅速等原因丽江的房价增长得很快。由于影响丽江市房价的因素多样并且复杂,而且因素之间也相互影响。所以,考虑所有因素是不现实的。本文从需求、供应和宏观层面出发,选取了人均可支配收入,常住人口,房地产开发投资额,GDP,贷款余额五个指标。其中,人均可支配收入选取了城镇人均可支配收入;实际房价=商品房销售额/销售面积。
通过丽江市统计局网站获得的数据,利用粗糙集的理论分析影响房价的5个因素的重要程度,为相关部门的一些决策提供一定的参考。
一、相关概念
二、基于粗糙集的丽江房价研究
本文从需求、供应和宏观层面出发,选取了人均可支配收入,常住人口,房地产开发投资额,GDP,贷款余额五个指标,原始数据如表一,数据来源是丽江市统计局网站的统计公报。
计算各项指标的增长率,并对各项指标进行等距离散化,可得表二,其中为条件属性,为决策属性(即房价)。
所以,在五个指标中人均可支配收入,常住人口和贷款余额比较重要。
三、结论
影响房价的因素非常多,并且非常复杂,利用粗糙集理论可以较为快速地计算出条件属性的一个约简。找到了影响房价的主要因素,为科学研究房价提供了方便。另外,粗糙集也可以跟神经网络,灰色理论,遗传算法等结合。
参考文献:
[1]Pawlak Z.Rough sets-Theoretical Aspects of reasoning about data[M]. Kluwer Academic Publishers, Boston,1991.
[2]李敏,王洋.基于灰色系统理论对成都市房价预测分析[J].云南民族大学学报(自然科学版),2013,22(6):441-443.
[3]申瑞娜,曹昶,樊重俊.基于主成分分析的支持向量机模型对上海房价的预测研究[J].数学的实践与认识,2013,43(23):11-16.
[4]韦光兰,邓晓盈,张琼.基于马尔可夫链预测模型的昆明市房价预测分析[J].中国市场,2013,21:86-87.
[5]王雅楠,孟晓景.基于动量BP算法的神经网络房价预测研究[J].软件导刊,2015,14(2):59-61.
[6]张文修,吴伟志,梁吉业,李德玉.粗糙集理论与方法[M].北京:科学出版社,2001.
作者简介:汪际和(1986-),男,江西都昌人,讲师,主要研究方向:粗糙集、概念格及关联规则。
基金项目:云南大学旅游文化学院科学研究基金项目:2013XY15。