潘亚琴
在展开一项学术研究时,对历年研究文献的分析是必不可少的。文献分析的方法分为定性分析与定量分析,其中定性分析使用得较为普遍,但这种分析方法往往受到经验及专业能力的限制而导致以偏概全、管中窥豹的情况。目前,随着文献定量分析手段的不断革新,知识图谱通过抽取海量历年研究文献作为数据样本,以文献中作者、机构、关键词等出现的频次、占比等信息来挖掘优秀发文作者、鉴别发文机构,判断研究热点及其趋势变化,已经在相关学者的研究中证实可获得更加客观、全面的分析结果。本次采用文献定量分析软件CiteSpace生成知识图谱,以住宅价格研究的历年研究文献为样本,从发文作者分析、发文机构分析、研究热点归纳、热点趋势变化几个方面进行了分析,为住宅价格研究梳理出较为清晰的思路。
本次通过检索筛选,剔除了文献综述、新闻报道、统计报告等无关的文献,摘取了收录在知网中的2010—2020年间共计743篇国内住宅价格研究文献作为研究数据。
对CiteSpace软件生成的发文作者共现网络图谱的分析,从中可寻找研究领域内发文活跃的发文作者,再重点对发文量居于前十的发文作者进行分析。前十位作者具体为:周豫、兰峰、张洪、温海珍、沈悦、张学峰、吴振华、王洋、古恒宇、宋伟轩。通过对作者及其研究课题的了解,发现这十位作者在住宅价格研究领域均为翘楚,其中,兰峰、张洪、沈悦为教授及博士生导师,周豫、温海珍、吴振华为副教授,研究课题主要在宏观及微观层面因素对住宅价格的影响研究,同时也进行住宅价格波动的分析预测研究。从时间上看,这几位作者发表成果的时间较早,古恒宇是中美大学联合培养博士,与就职于专业研究所的王洋、宋伟轩重点进行了基于空间计量经济学理论的住宅价格空间效应研究。
对发文机构共现网络图谱的分析,可找出较为活跃的专业发文机构。首先,住宅价格研究的发文机构超80%为高等院校,因此应该重点关注高等院校的研究成果。其次,从发文量占比及中心性指标的分析,可快速锁定专业发文机构。在发文量上,排名第一的西安建筑科技大学管理学院,占比4%,并列第二的中国人民大学公共管理学院、西安交通大学经济与金融学院、中山大学地理科学与规划学院,各占比2%,其余机构占比各在0.2%~1%之间,类梯度的占比明确了对发文机构研究文献关注的优先次序。而具有中心性的中山大学地理科学与规划学院、中国科学院大学、华南师范大学地理科学学院,则具有0.01的弱中心性,表明这些机构是连接合作桥梁的角色,对其研究文献亦优先关注;最后从时间上分析,中山大学地理科学与规划学院发表文献的时间最新,因此可对其优先进行了解。
关键词是从论文内容中选取出来体现论文核心内容的实质意义的词汇,因此对关键词量化分析得出的关键词网络图谱(图1)及关键词突现图谱(图2)可捕捉研究热点,获取热点趋势变化。
图1 关键词网络图谱
图2 关键词突现图谱
住宅价格研究的关键词多数体现的是课题方向、研究对象、影响因素、研究方法等方面的词汇。本次集中对关键词网络图谱(图1)及其统计的频次≥5次的关键词进行总结归纳,从中全面了解近十年来的研究热点。
结合本次摘取的文献及其关键词词义,其中“空间分异”(19次)、“空间分布”(18次)、“空间自相关”(14次)、“时空分异”(6次)属于空间效应研究,而“房价上涨”(22次)、“价格泡沫”(15次)、“价格预测”(22次)、价格波动(21次)更多涉及非空间效应研究。
在研究对象上,主要围绕“住宅价格”(518次)本身进行,同时“住宅租金”(7次)作为住宅的收益价格也是学者研究的焦点,而“住宅价格指数”(15次)、“房价收入比”(13次)、“租售比”(7次)反映了住宅价格水平及变动,亦是重要的研究对象。
“影响因素”(101次)是住宅价格形成与变动的成因,因此是备受重视的研究。在微观层面上,以“轨道交通”(49次)、“教育设施”(12次)最受关注;在宏观层面上,以“土地价格”(11次)、“货币政策”(8次)、“调控政策”(7次)、“城镇化”(6次)、“人口结构”(5次)、“房产税”(5次)、“供求关系”(5次)更受研究者关注。
不同的课题会确定相应的研究方法。与非空间效应研究相关的方法主要有:
(1)“特征价格模型”(146次)是住宅价格研究中极受认可的研究方法,在近十年的研究文献中使用频次最高。与“多元回归分析”(47次)一样是基于OLS回归分析的方法。
(2)“灰色关联分析”(16次)、“主成分分析”(11次)、“主因子分析”(8次)多用在住宅价格影响因素筛选、降维、权重的设定。
(3)“灰色预测”(14次)、“向量自回归模型(VAR)”(13次)、“ARIMA模型”(7次)、“面板数据模型”(6次)主要用于时间序列数据的研究,其中“面板数据模型”(6次)同时将横截面数据纳入分析,属于完善的方法。值得注意的是,时间序列数据需要先行平稳性检验,“Granger因果检验”(12次)、“Johansen协整检验”(8次)、“脉冲响应分析”(5次)是平稳性检验方法缺一不可的步骤,关联出现在关键词中可说明相关文献涉及了这几类或类似的研究方法。
(4)“神经网络模型”(7次)是住宅价格研究在互联网信息时代背景下的与时俱进,较常用到的是BP神经网络模型。
(5)“系统动力学模型”(13次)是通过分析价格影响因素内在运行结构来研究住宅价格成因的方法。
(6)“双重差分模型(DID)”(7次)是用在住宅调控政策成效评估、轨道交通开通前后的价格对比等方面的研究。
而“地理加权回归模型(GWR)”(19次)、“空间计量模型”(13次)属于空间效应研究的方法。关键词中“ArcGIS地理信息系统”(15次)、“Kriging空间插值法”(16次)、“地统计分析”(8次)、“探索性空间数据分析(ESDA)”(7次)反映的是作为空间效应研究重要辅助工具的可视化地理信息系统ArcGIS进行分析的研究。
关键词的中心性越大,在网络节点中的中枢纽带作用越大,可认为是研究学者普遍使用的基础词汇。本次分析的关键词中除ARIAM模型、双重差分模型(DID)、城镇化不具有中心性外,其余关键词中心度均≥0.01,在开展课题研究时应该予以借鉴。
从生成的关键词突现图谱(图2)可了解热点的趋势变化。通过对本次突现的19个关键词及其突现时间的分析,发现国内住宅价格研究与其当时房地产市场、社会经济状况密切相关,因此结合相关文献研究背景及其关键词词义的分析,探究到了近十年的热点趋势变化。
首先,从住宅价格的研究对象来看。2014—2015年,防止价格泡沫而监控住宅价格走向的住宅价格指数研究受到众多学者关注。而2018年以后,有助于判断住宅投机以遏制房价过快上涨的租售比研究成为焦点。
然后,宏观层面的影响因素突现。2013年以前,找到居民收入、住房支付能力与上涨房价之间矛盾的解决对策被研究学者重视,同时就2010年在全国陆续铺开的以限购限贷为主的住宅调控政策成效研究成为另一关注点;而新型城镇化为住宅市场的健康发展所能带来的正外部性从2018年起成为众多学者研究的选择。
最后从研究方法来看:
非空间效应研究方法:①2014年以前,向量自回归模型(VAR)、面板数据模型在住宅价格时间序列数据研究方法的选择中受到欢迎。而时间序列数据平稳性检验方法Granger因果检验、脉冲响应分析、Johansen协整检验虽然突现的时间有前后差异,但考虑其均为时间序列数据平稳性检验中的步骤,说明住宅价格研究领域在2016年以前就已经非常注重对住宅价格时间序列数据的研究。②“价格弹性”在2014—2015年突现,主要出现在采用对数函数形式的特征价格模型作为方法进行研究的文献中,被认为能产生更具解释性的研究结果。③“分位数回归”在2016—2018年突现,反映的是对OLS回归分析只能反映全局性指标而采用分位数回归进行局部分析的一类改良优化研究。④“双重差分模型(DID)”在2016年开始成为对比评估研究项目的优选。⑤诸多研究学者是自2018年开始热衷应用“神经网络模型”这一与人工智能相关的方法进行研究的。
在空间效应研究中,关键词“空间格局”“时空分异”“空间分异”主要出现于针对空间异质性现象研究的文献中,这些关键词的先后出现说明空间异质性研究在近十年受到极大重视。模型的选择上,地理加权回归模型(GWR)自2018年被此类研究作为优选的方法。从图谱中还能看到,伴随ArcGIS软件的发展完善,这一软件自2012年以后被研究学者更多选择。
本次运用文献定量分析软件CiteSpace生成的知识图谱,对在知网筛选摘取的近十年国内住宅价格研究文献进行了可视化定量分析,从发文作者、发文机构共现网络图谱中获知了活跃的发文作者及发文机构;从关键词网络图谱中总结了近十年以来住宅价格研究领域的研究热点;对关键词突现图谱的分析掌握了热点趋势变化,为住宅价格研究明确研究思路提供了重要帮助。
然而国内住宅价格研究文献的关键词选取没有明确的规范,在确定关键词时往往受到作者的主观意识影响而产生诸多不同表达方式的同义词,因此在采用关键词进行的定量分析中会导致一定的计量缺失。随着人工智能技术的发展,未来相关研究可以借助智能提取技术对关键词汇进行智能分类处理,或可获得更为精准的分析结果。