房地产学科1998-2018年研究结构分析
——基于CSSCI文献共被引分析

2020-07-01 11:38虞晓芬萧文龙
科学经济社会 2020年2期
关键词:命名房价聚类

虞晓芬,萧文龙

(浙江工业大学 管理学院,浙江 杭州 310023)

引言

房地产作为我国国民经济的重要产业之一,一直是研究的热点领域,发表的论文数量大,研究的主题多[1]。本文运用情报学学科中的文献共被引分析方法,结合R语言辅助工具和因素分析、聚类分析和多维尺度分析,旨在厘清房地产学科的研究结构和研究现状,对于帮助学者准确把握研究方向、更好地开展进一步研究具有一定的现实意义(1)感谢硕士研究生陈潇腾在论文数据处理、分析时的协助。。

一、相关研究基础与文献综述

Kessler研究发现,当两篇文章同时被其他文章引用的频次越高,则代表两篇文献之间的相关性越高,同时也代表其可能具有高价值[2]。在此基础上,Small等人在1973年提出共被引分析概念后,引起了情报学界尤其是文献计量学领域研究人员的极大兴趣,许多学者纷纷从共引关系入手,利用SCI、SSCI等检索工具,对文献进行分析研究。他们的研究结果表明:一个专业是由在其发展中出现的为数不多且极其重要的论文所定义的[3]。Small[4]、I.V.Marshakova[5]、陈超美[6]等一直采用共被引方法对各个学科的研究结构进行分析,并描绘其发展历程。另有White通过构建共被引矩阵,并进行因素分析、多维尺度分析与聚类分析来探讨资讯科学领域的知识结构,进而找出该领域知识结构的变化情况[7]。

赵丹群[8]、Shiau[9]、开滨[10]等国内学者也通过构建共被引矩阵,并结合因子分析、多维尺度分析、聚类分析等统计分析方法,确定对应领域的核心知识和研究方法。陈悦[11]、赵党志[12]、侯剑华[13]、赵蓉英[14]、康全礼和丁飞己[15]等运用文献共被引研究方法,进行了管理学、计量学等学科可视化的研究。

二、研究方法

通过对共被引分析相关的研究进行整理发现,Web of Science和中国社会科学引文索引(CSSCI)这两个在线数据库是研究人员研究国内外文献所采用的数据库,共被引分析结合SPSS统计分析软件中的因素分析、聚类分析和多维尺度分析等三种方法,是诸多学者用于寻找文献之间关系程度的研究方法[16]。本文选用的是因素分析、聚类分析和多维尺度分析组合的分析方法,进而分类及选出房地产学科的研究结构。通过引文分析,从CSSCI数据库取得文献后利用R语言进行解析,分别取出高引用文献后通过高被引分析计算出共被引矩阵,借助SPSS统计软件进行因素分析、聚类分析和多维尺度分析。

三、数据来源与处理

本文研究数据来源于中国社会科学引文索引(CSSCI)数据库,数据检索时间是2018年10月1日。检索条件为“所有字段=房地产,文献类型=论文,学科类型=管理学,年=1998-2018”和“所有字段=房地产,文献类型=论文,学科类型=经济学,年=1998-2018”,分别检索到327篇和3791篇结果,共计4118篇。通过去重77篇后,得到有效文献4041篇,36370条参考文献记录。本文主要研究的是文献之间的共引情况,故通过关键词“出版社”和“产业报告”去除参考文献中的图书和专业报告,以及标题缺失无法确定具体文献的记录和参考文献空缺的记录,共得到有效参考文献28252篇。

将原始文献依照年份依次排序,整理出1998年至2018年间原始文献在CSSCI核心数据库所含期刊中的发表年份趋势,如图1。

图1 原始文献发表年份趋势

由图所示,1998年-2003年文献年发表数量稳定在79-103篇,从2004年开始逐年上升,至2008年达到顶峰314篇,这与中央政府从2003年开始的各类房地产调控有关,使得对房地产问题的关注度持续走高,学界的研究热情不断攀升。2008年至2011年,房地产相关文献的年发表量维持在相对较高的状态,期间也是房地产市场快速发展的阶段。从2012年开始,年发表量逐年走低并降低至169篇(2017年),研究产出有所下降。

通过原始文献的期刊分布分析,可以观察到来源文献资料的分布情况和重点期刊。本研究将原始文献在CSSCI所含期刊分布做统一整理,如表1。发表量前5名的期刊分别为:(1)统计与决策;(2)价格理论与实践;(3)税务研究;(4)城市发展研究;(5)经济体制改革。

表1 原始文献期刊分布(前20)

四、结果分析

(一)初步分析

被引用文献的初步整理主要目的在于引文分析萃取出具有高价值的高被引用文献。将28252篇被引用文献的期刊分布展开讨论,如图2,然后计算被引用文献并将其由高至低排序,依此排序构建共被引矩阵,再以压力值0.2为筛选条件,选择合适的共被引矩阵。但是本研究中,当压力系数小于0.2时,高被引用文献数量太少,依此得出的分析结果可能较不具可靠性与准确性,因此采用逐步测试法,最后到54篇时,聚类分析结果与多维尺度分析结果两个图上能分群且不交叉重叠,因此,采用54篇高被引用文献所构建的共被引矩阵,其中引用次数均≥15。

将54篇高被引用文献的期刊分布做统一整理,得出房地产学科引用文献上最具有影响力的前五大期刊为:(1)经济研究;(2)财贸经济;(3)数量经济技术经济研究;(4)管理世界;(5)世界经济。

本研究运用引文分析的54篇高被引用文献,构建出54*54的共被引矩阵,此矩阵为一对称矩阵,经过数据资料量化后得到表示各文献之间相关性的数值,分别代表两篇文章之间的共被引次数,以便做进一步分析。其中,原对角线数值为0,因为文献本身不存在共同被引用的情况,为了符合矩阵的相似性,将对角线的数值以该文献与其他文献共被引次数的最大值替换[17]。

图2 被引用文献期刊分布图

(二)因素分析

本研究通过因素分析法进行分析,用主成分分析法提取因子并结合最大方差法,对共被引矩阵进行成分提取。根据特征值大于1的标准提取出14个成分因子,总方差解释量85.242%,高于建议值的70%,如表2所示。通过仔细阅读各因素所含文献,依照文中出现的高频词和核心知识将14个因素依次命名。

表2 因素分析结果

因素一命名为“信贷”,此因素所含文献主要探讨房地产与住房按揭贷款、借贷热潮等信贷问题之间的关系。因素二命名为“货币”,该因素所含文献主要探讨房地产与货币因素、货币传导机制和货币政策之间的关系。因素三命名为“消费”,该因素所含文献主要探讨了住房财富和居民消费、家庭消费、社会总消费之间的关系。因素四命名为“经济基本面”,该因素所含文献主要探讨房地产价格和人均GDP、物价之间的关系。因素五命名为“房地产经济”,该因素所含文献主要探讨房地产市场发展及经济增长等相关问题。因素六命名为“通货膨胀”,该因素所含文献主要探讨房地产价格与货币供应量、通货膨胀之间的关系。因素七命名为“市场竞争”,该因素所含文献主要探讨了房价与土地价格、房地产市场垄断之间的关系。因素八命名为“供需结构”,该因素所含文献主要探讨房价波动与土地供应结构、市场需求结构和人口结构之间的影响。因素九命名为“价格波动”,该因素所含文献主要探讨了房地产价格波动、周期波动的相关问题。因素十命名为“宏观经济”,该因素所含文献主要探讨了房地产市场发展与金融稳定、经济增长之间的关系。因素十一命名为“泡沫”,该因素所含文献主要探讨房地产市场的泡沫水平及泡沫破灭等相关问题。因素十二命名为“住房权益及成本”,该因素所含文献主要探讨住房权益和住房成本的相关问题。因素十三命名为“汇率”,该因素所含文献主要探讨了房价与人民币汇率之间的关系。因素十四命名为“房地产税”,该因素所含文献主要探讨了房屋价值和财产税、物业税等房地产税的关系。

(三)聚类分析

使用聚类分析,用Z分数进行标准化,再利用平方欧式距离与Word’s方法对高被引矩阵进行聚类,其结果分为七大聚类,如图3所示。

图3 聚类分析结果

聚类一命名为“房地产税与汇率”,此聚类所含文献主要是讨论房地产价格和财产税、物业税等房地产税及人民币汇率之间的关系。聚类二命名为“价格波动”,此聚类所含文献主要是探讨房价泡沫、房价升值、房价变动等房地产价格波动问题。聚类三命名为“市场竞争”,此聚类所含文献主要探讨了房价和土地价格、开发商市场垄断、土地空间竞争等因素之间的关系。聚类四命名为“宏观经济”,此聚类所含文献主要探讨房地产与金融稳定、经济增长等的相互关系。聚类五命名为“消费”,此聚类所含文献主要探讨房地产消费和人口、居民消费支出、市场预期之间的关系。聚类六命名为“信贷”,此聚类所含文献主要探讨房地产与银行贷款、贷款风险之间的联系。聚类七命名为“货币”,此聚类所含文献主要探讨房地产与货币政策、利率、通货膨胀等货币因素的关系。

(四)多维尺度分析

通过多维尺度分析,将54篇高被引用文献之间的关系以二维平面图的形式展示,并对照聚类分析结果以视觉化方式展示。在多维尺度分析中,使用与聚类分析相同的平方欧式距离,以及利用Z分数来标准化矩阵,将文献之间的关系按距离在图上展示,最后对照聚类分析结果如图4所示。

图4 多维尺度分析结果

五、讨论

(一)房地产学科文献分析

本研究将文献分成两大类进行处理:(1)原始文献;(2)被引用文献。根据文献发表的年份趋势来看,房地产相关文献在2008年发表量突破300篇,直到2011年一直处于相当稳定的状态,从2012年起,相关文献年发表量逐年走低,至2017年降至169篇,房地产学科的研究热度和产出下降。从文献在CSSCI中的期刊分布来看,主要发表于(1)统计与决策:247篇;(2)价格理论与实践:119篇;(3)税务研究:107篇。《统计与决策》(半月刊)研究统计前沿理论,探究统计新方法,以统计视角解决经济社会中的热点难点问题。《价格理论与实践》(月刊)研究价格理论、价格政策。《税务研究》(月刊)主要研究税收理论。根据以上结果,可以发现大部分文献集中在房地产价格、房产税、金融、消费等经济问题。

被引用文献分析中,主要整理了被引用文献的来源期刊分布、高被引用文献来源期刊分布等。由被引用文献的来源期刊分布可知,前三名的期刊分别为:(1)经济研究;(2)金融研究;(3)American Economic Review(AER),均属于经济学领域。与原始文献中的来源期刊排名比较来看:在原始文献的来源期刊排名中,《经济研究》(复合影响因子11.232)排名67,《金融研究》(复合影响因子7.130)排名30,American Economic Review(经济学领域最具有学术声望的重要期刊)不在CSSCI所含期刊中;反观原始文献来源期刊在被引文献来源期刊中的排名,统计与决策(复合影响因子1.134)排名19,《价格理论与实践》(复合影响因子1.503)排名17,税务研究(复合影响因子1.979)排名21。可见被引用文献中来源期刊排名高者在原始文献来源期刊排名中较后,原始文献来源期刊排名前三者在被引用文献来源期刊排名中也相对较后。原因主要是以下四点:(1)被引用文献来源期刊排名靠前者,影响因子较高,文章发表难度大;(2)原始文献来源期刊排名靠前者,影响因子相对较低,文章发表较易,且统计与决策为半月刊故数量更多,文章数量基数大;(3)被引用文献来源期刊排名前三均为经济类综合期刊,故房地产相关的文章发表数量不多;(4)房地产领域缺少核心且高影响力的期刊,相关文献分布零散。

(二)房地产学科研究结构探讨

本研究透过文献共被引分析对照聚类分析结果,共找出7个议题,分别为:(1)房地产税与汇率;(2)价格波动;(3)市场竞争;(4)宏观经济;(5)消费;(6)信贷;(7)货币。

议题一,房地产税与汇率。房地产税是地方财政收入重要的来源,也是调控房地产市场和财富再分配的重要工具,因此,房地产税如何合理设置以及对市场运行效率与公平的影响,是研究的重要主题。随着房地产投资投机热,上海、重庆等地开征房地产税改革试点以期调控房价(吴旭庆,2018)。在经典的房地产税收观点中,投资者不承担任何的税负,全转稼给消费者承担,最终导致了房价高涨,但经典观点均忽略了住房市场不完全竞争的特性,况伟大(2012)研究认为开征房地产税能够抑制房地产价格上涨。此外也有不少学者反对通过开征物业税来控制房价(刘明慧,2009;罗东秋2010)。从利率影响来看,本国货币的升值会吸引外来资本的涌入,作为投资收益较高的房地产对资本极具吸引力,超额需求以至房价上涨(王爱俭,2007;)。除此之外汇率波动也会通过财富效应、巴拉萨-萨缪尔森效应等结构性变化角度影响房价(谭小芬,2013;林木材,2013)。

议题二,价格波动。房地产价格的过度波动会给经济带来负面影响,进而影响社会方方面面。供给和需求是造成房地产价格波动的根本原因(卢驰文,2011;李勇,2012)。学者们更为关注的是房地产价格剧烈波动带来的泡沫破裂对经济金融的负面影响(谭晓红 2010)。也有部分学者研究了在经济常态下,房地产价格波动对经济社会的影响(原鹏飞 2010;杨俊杰 2012)。泡沫经济的研究始于上世纪末,经济学家推导了泡沫存在的可能性,后来有学者对泡沫进行了分类(李雅珍2001;严跃进 2016),探讨泡沫产生和破灭的原因(曹振良,1999;才元,2007)。

议题三,市场竞争。2017年作为各地地王频出的年头,各路开发商高价拿地的消息层出不穷,恶性的市场竞争使得房地产成为了政府重点调控的行业。上世纪90年代,学者开始研究土地供给和地价、房价的关系(谢若锋,1992;光杨,1998),发现土地供应量对房地产价格起着决定作用(宗华包,2004;刘民权,2009),房价和地价长期呈正相关,房价的波动是导致地价波动的主要原因(杨慎,2003),也有学者认为地价和房价没有绝对关系(张小武,2005),降低地价对抑制房价没有影响(刘琳,2003;况伟大,2005)。随着研究的不断发展,开发商竞争等市场因素开始受到学者的重视,政企博弈推动了开发商抬高地价,导致政府抬高房价(毛丰付,2011;任国良,2011)。而更多的研究还是关注于房价和地价,究竟是谁决定了谁。

议题四,宏观经济。房地产在2014年被定义为我国国民经济的支柱产业,房地产发展与宏观经济环境存在密切联系。宏观经济对房价的影响研究主要集中在对房地产供需、房地产周期等方面。对房地产供需的冲击研究,主要从居民消费预期影响(吴文斌,2011)、房地产投资收益率影响(王义群,2016)和投资风险程度影响(谭刚,2002)等角度。除了供需之外,宏观经济的周期性波动对房地产波动的影响也受到了越来越多学者的关注(杨俊杰,2012;丛颖,2014)。

议题五,消费。房地产具有商品属性,从概念上来讲其属于实物财富,是消费者消费的对象。大部分学者认为房价上涨对消费有促进作用(张红2005;赵晓刚,2009),也有学者通过实证分析发现房价上涨不会刺激消费增加(洪涛,2006;刘丽,2008)。国内学者的研究主要是偏重于宏观总量的数据研究(李振明,2001;李学峰,2003),近年来开始有学者关注住房财富效应(姚琳珍,2008;黄静,2009;高波,2011)。

议题六,信贷。2017年末人民币房地产贷款余额32.2万亿元,同比增长20.9%,增速比上年末低6.1个百分点;全年增加5.6万亿元,同比少增1,087亿元,信贷成为房地产融资的重要来源。银行信贷是刺激房地产价格攀升的主要原因(李宏瑾,2005;李健飞,2005;张涛,2006),同时房价不断攀升对房地产信贷扩张有明显的促进作用(李健飞,2005;江彤,2007;向宇,2010)。多种研究表明两者之间互为因果且具有长期相关性(段忠东,2007;孔煜,2009;王晓明,2010),且影响作用存在区域差异(郭琨,2011)。

议题七,货币。货币因素和房地产业密切相关,房地产行业的稳定直接影响到金融货币的稳定,对于房地产业和金融货币的交叉研究受到了研究人员的极大青睐。房地产具有金融属性(刘洪玉,2006;应红,2007;易宪容,2008),大量的研究集中在金融健康和房地产风险上,包括住房消费贷款(易宪容,2009)、房地产金融风险、房地产资产泡沫(李懿,2008;王文春,2014)等。也有学者分析房地产行业和通货膨胀之间的关系(董纪昌,2012),发现房地产行业会导致通货膨胀。

因素分析与聚类分析不同的因素有“货币”“房地产经济”“通货膨胀”“供需结构”“宏观经济”“泡沫”“住房权益及成本”“汇率”“税”。货币政策、信贷政策、房地产经济、通货膨胀、宏观经济等均与货币政策相关,故采用“货币”命名。房地产供需结构、房地产泡沫、住房权益等问题会导致房价波动或由房价波动所导致,故以“价格波动”命名。“汇率”和“税”合并成了新的聚类“税与汇率”。

六、结论

本研究的目的为利用文献共被引分析、因素分析、聚类分析与多维尺度分析,探讨房地产学科的研究结构和特征。以CSSCI数据库中1998年至2018年间的经济类和管理类文章为数据源,经整理后得到房地产相关的原始文献4041篇和被引用文献28252篇,利用共被引用方法提取出54篇高被引用文献组成共被引矩阵,再搭配统计分析,建构出房地产学科的研究结构。

房地产学科在现今的学术研究中正处于稳定发展的阶段,研究结构主要分为七大类,分别是:(1)房地产税与汇率;(2)价格波动;(3)市场竞争;(4)宏观经济;(5)消费;(6)信贷;(7)货币。透过这些结构与学者们的研究发现,房地产价格被学者们广泛研究,几乎每一个研究分支均在讨论房地产价格和相关因素之间的关系,这和房地产业是我国国民经济的支柱产业这一定位密不可分。此外,房地产相关文章发表量较高的期刊,高影响力(高被引用)文章反而较少,这样的倒挂现象也值得引起业界的注意,房地产学科发文量较高的期刊均是经济类、管理类等综合性期刊,本学科领域缺少公认的高质量专属期刊。本研究厘清了房地产学科领域的研究结构和高价值文献分布,便于相关学者开展进一步研究,以期能更好地推动房地产学科的发展和促进其学科体系的提升。

猜你喜欢
命名房价聚类
盛松成:什么才是中国房价持续上涨的真正原因?
梧州市房价运行和减少金融杠杆的思考
命名——助力有机化学的学习
两大手段!深圳土地“扩权”定了,房价还会再涨?
面向WSN的聚类头选举与维护协议的研究综述
有一种男人以“暖”命名
为一条河命名——在白河源
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
2016房价“涨”声响起