基于模糊聚类分析的房地产市场区域划分——以八大经济区域为研究对象

2014-02-18 07:33孙东雪宋荣荣
当代经济 2014年20期
关键词:余弦经济区夹角

○孙东雪 宋荣荣

(西南民族大学计算机科学与技术学院 四川 成都 610041)

一、引言

目前正是中国房地产市场迅速发展的时期。对于2014年初杭州部分楼盘的“降价风波”,社会各界人士提出了房地产行业是否出现“拐点”的疑问;城镇化发展对房地产业有一定的影响,两会期间,民建向中央提案:优化城镇化空间布局,继续推进新型城镇化建设。诸如上述种种讨论,使房地产行业又一次成为了新一轮的社会热点。为房地产市场进行系统的地理区域划分,对于消费者而言,可以使消费者从宏观了解市场差异,综合考虑地理位置、周围情况及房价等因素,从而合理购房;对于商家来说,有利于其进行正确的市场定位,明确以自己的综合实力适宜在何处进行地产开发。

在现有的研究中:张奕河等人以省为研究对象,利用聚类分析对房地产市场进行区域划分,但是在其采用的指标体系中所涉及的仅仅只有直接指标,间接指标没有被考虑进去,因此指标体系不全面。张勇等人使用传统的系统聚类分析方法,聚类标准采用的是“硬隶属度”,这种非1即0的标准无法像模糊聚类分析那样充分地刻画隶属程度。多数学者对于该问题的研究都是以省或大中城市为对象,采用的是11年之前的数据,不是最新房地产数据。

本文首先构建房地产市场的指标体系(分为直接指标与间接指标),并通过中国统计年鉴查找了12年最新的数据。在模糊聚类建模中,依次采用了夹角余弦法、欧氏距离法和算术平均最小法求模糊相似矩阵,最后通过计算F统计量得出最优分类。该方法对现有的模型进行了补充与改进,采用多种方法求相似矩阵,使结果更加真实可靠。且解决了传统聚类分析不能具体刻画隶属程度的缺陷,值得一提的是,本文首次采用经济区这一概念对市场分类,让商家和消费者先从大区域上对市场有个划分,然后可以采用其他学者的模型从省市的层面上对市场进行细化分析。

二、房地产市场分类指标体系的建立

对于指标体系的建立,目前此类文章多选用直接指标,即与房地产有直接关系的指标,这类指标可由房地产市场的供求状况来确定,是房地产市场的内在指标。本着具体、客观的原则,本文另选取了一些间接指标(外在指标)来对房地产市场进行更详尽的刻画。由于房地产业具有很强的地域性,使得不同地域带来了不同特性的指标,如一些特色省市(旅游地区,金融中心等)的自身特点是影响其房地产市场的重要因素,因此在指标选取时,要考虑到如何处理这些指标。通过关联度分析,本文确定了关联度较大、具有代表性的间接指标。

按照指标体系的科学性、全面性及典型代表性等基本原则,并借鉴相关文献,本文选取了5个一级指标,16个二级指标见表1。

三、实例:中国八大经济区房地产市场模糊聚类分析

1、数据标准化

国务院发展研究中心发表报告指出,中国所沿袭的东、中、西区域划分方法已经不合时宜。为此,报告提出“十一五”期间内地划分为东部、中部、西部、东北四大板块,并可将四个板块划分为八大综合经济区。本文中,八个经济区域简记为:东北地区、北部沿海、东部沿海、南部沿海、黄河中游、长江中游、西南地区、大西北地区,如图1所示。

在本问题中,设论域 U=(x1,…,x8)为被分类对象,每个对象由16个指标(10个直接指标与6个间接指标)表示其性状,即xi=(xi1,…,xi16),通过中国统计年鉴,本文查找了 2012年16个指标的数据(每个经济区域的数据为内部各省数据的平均值)。各符号依次表示为:x1东北地区、x2北部沿海、x3东部沿海、x4南部沿海、x5黄河中游、x6长江中游、x7西南地区、x8大西北地区。具体见表2。

利用matlab,依据下列公式:

表1 中国房地产市场分类指标体系

图1 中国八大经济区域

表2 八大经济区域房地产指标统计数据

表3 聚类指标数据标准化后的结果

对原始数据进行平移·标准差变换。经过变换后,每个变量的均值为0,标准差为1,且消除了量纲的影响。标准化后的数据如表3所示。

2、建立房地产市场数据的模糊相似矩阵

在这一步,本文分别采用夹角余弦法、欧氏距离法以及算术平均最小法求相似矩阵[11],使处理的结果具有可比性。

(1)采用夹角余弦法,建立模糊相似矩阵R1=(rij)n×m

其中rij为各指标间的相似系数,xik为i经济区k指标标准化值,xjk为j经济区k指标标准化值,m为指标个数,n为经济区个数。

(2)采用欧氏距离法,建立模糊相似矩阵R2=(rij)n×m。

其中d(xi,xj)为各指标间的距离,rij为各指标间的相似系数,xik为i经济区k指标标准化值,xjk为j经济区k指标标准化值,m为指标个数,n为经济区个数,c取1/(d+1),这样处理后的数据,就与“相似”这个概念具有同向性,并且收缩在[0,1]区间里,得到的相似矩阵为R2。

(3)在此之前,先对标准化后的矩阵进行变换x=(x+3)/4,然后利用算术平均最小法建立模糊相似矩阵R3=(rij)n×m。

其中 rij,xik,xjk,m,n所代表的含义与夹角余弦法中一致,得到的相似矩阵为 。

3、对房地产市场进行模糊聚类分析

表4 三种方法得到的分类情况

由上一步得到的矩阵rij是相似矩阵,具有自反性和对称性,但是不具有传递性。我们的思路是通过传递闭包运算,即r与 r合成(r οr),这样进行下去,依次求 r2οr2,r4οr4,…,直到求得rnοrn=r2n,此时的rn是具有传递性的等价矩阵,即t(r)。然后分别取不同的λ水平,对研究对象进行聚类。本文采用F统计量法,取不同分类中(F-F0.05)/F0.05最大者所对应的λ为最佳的阀值。确定F统计量的方法如下:

对夹角余弦法、欧氏距离法和算术平均最小法得到的相似矩阵,分别利用传递闭包法得到等价矩阵并做动态聚类图以及计算F统计量,如图2和表4所示。

以夹角余弦法为例,对每个分类方案算出其F值,并在给定信度α=0.05时,查出各个方案的临界值F0.05,从表中可以看出,只有 λ=0.772,分类数为 6时,(F-F0.05)/F 0.05值最大,因此λ=0.772为夹角余弦法中的最佳阀值。用同样的方法可以算出,在欧氏距离法和算术平均最小法中的最佳阀值依次为λ=0.8697,λ=0.9411。

图2 三种方法得到的房地产市场动态聚类图

四、结语

通过F统计量法,以及综合三种方法的分类情况。在房地产市场中,八大经济区域大致可分为五类。第一类:北部沿海、南部沿海。第二类:东部沿海。第三类:东北地区。第四类:黄河中游,长江中游、西南地区。第五类:大西北地区。

第一类经济区中,北京是我国的政治、经济和文化中心。自成功举办2008年奥运会以来,北京市一直加强城市基础设施建设,开始变为国际大都市。住宅物业,工业物业以及写字楼物业得到了强劲的发展,房地产产业的素质得到大幅度提高。山东作为GDP增长大省,仅次于广东,位居全国第二,高居北方之首。并且据2012年国家统计局对城市的综合实力评估,山东百强县有十余个,促使山东房地产市场活跃。南部沿海的代表为广东省,地理位置临近香港,以深圳、珠海等形成了珠三角经济圈,房地产市场热度很高。

第二类经济区中,上海市是我国的贸易、金融和经济中心,再加上自贸区的开放,房地产市场的发展有着先天的地理区位、需求和人才优势。在统计的数据上,上海的各指标数据均具有较高水平。

对于第五类大西北地区,相对其他经济区域,无论是在房地产市场,还是其他产业经济上发展都比较晚。交通,文化以及地理位置没有明显的优势,所以自成一类。

对于房地产商家和消费者而言,应首先着眼于宏观经济的发展。并且对于房地产市场,不管是商家还是消费者,都需要持理性的态度。

[1]焦永利、叶裕民:中国新型城镇化的改革战略和发展路径[J].公共管理与政策评论,2014(1).

[2]许远明、欧阳鹭霞:城镇化对房地产市场需求的影响——基于我国省际面板数据的实证分析[J].建筑经济,2013(11).

[3]罗佳坤、孟田、司增绰:房地产业的产业关联状态实证分析[J].建筑经济,2014(5).

[4]张奕河、郑大川:对中国房地产区域分类的深入探索——基于聚类分析的实证研究[J].商业现代化,2008(6).

[5]张勇、包婷婷:基于系统聚类分析的房地产市场区域划分——以安徽省为例[J].池州学院学报,2013(2).

[6]居祥、张燕、黄贤金:聚类分析在长江流域地区房地产价格研究中的应用[J].经济地理,2013,(3).

[7]黄贤凤、武博、王建华:中国八大经济区工业企业技术创新效率及其影响因素研究[J].中国科技论坛,2013(8).

[8]李崇明、丁烈云:基于系统核与核度理论的房地产预警系统指标体系选取方法[J].数学的实践与认识,2005(11).

[9]师应来、王平:房地产预警指标体系及综合预警方法研究[J].统计研究,2012(11).

[10]高梅:中国区域划分[J].地理教育,2006(4).

[11]谢季坚、刘承平:模糊数学方法及其应用[M].武汉:华中理工大学出版社,2000.

猜你喜欢
余弦经济区夹角
探究钟表上的夹角
求解异面直线夹角问题的两个路径
任意夹角交叉封闭边界内平面流线计算及应用
两个含余弦函数的三角母不等式及其推论
实施正、余弦函数代换破解一类代数问题
直线转角塔L形绝缘子串夹角取值分析
分数阶余弦变换的卷积定理
图像压缩感知在分数阶Fourier域、分数阶余弦域的性能比较
甘肃省主要经济区联动发展战略探讨
图解北部湾经济区同城化