基于CiteSpace的智慧城市建设研究文献可视化分析

2021-05-29 03:06刘亦欣王娟张鹏赵文浦
智能建筑与智慧城市 2021年5期
关键词:聚类领域智慧

刘亦欣,王娟,张鹏,赵文浦

(中国人民警察大学)

1 引言

20世纪世界人口急剧城市化,带来了人口增长、住房紧张、交通拥堵、就业困难、环境恶化等诸多问题。“城市病”的解决需要有新的技术和模式来支撑城市的发展,在城市化与信息化的结合发展进程中,形成了城市发展新模式,也就是“智慧城市”理念[1]。

近年来,我国在总结国外先进经验的同时,也在不断探索适合我国的智慧城市发展道路。我国住建部在2012年11月下发了《关于开展国家智慧城市试点工作的通知》,在2013年1月正式启动了智慧城市试点项目。之后,相关政策陆续出台、基础设施不断完善、应用体系不断拓展[2]。在此基础上,科技水平的不断提升使得社会资源易被整合,让城市本身具备智能化的管理模式。但是,我国对智慧城市的研究仍存在发展战略目标不明确、缺乏总体规划的问题。鉴于此,本文利用知识图谱可视化软件,通过关键词共现、作者共现、聚类分析等方法对智慧城市领域部分文献进行分析,以了解关键词分布、核心作者、研究机构并梳理智慧城市领域的研究热点和发展方向,总结现阶段的研究并为以后的发展提供参考。

2 数据来源及研究方法

为了对海量的文献资料进行客观、准确、全面的分析,研究其热点问题及前沿、弥补其存在的缺陷、缺失的空白,本文基于引文分析理论,采用陈超美参与研发的科技文本挖掘及信息可视化软件CiteSpaceⅤ(5.7.R1),通过观察分析关键词共现图谱、作者共现图谱以及使用聚类分析等方法对智慧城市的发表文献进行计量分析,从而了解文献之间的联系、核心期刊中的权威作者、期刊的分布情况并发现智慧城市研究热点与研究前沿[3],对智慧城市现阶段的已有成果进行总结,并为该领域以后的发展方向提供参考。

为保证文献分析质量,本文收集的文献均来自中国知网(CNKI)。

在高级检索下,选取“智慧城市”为主题词,以获取关于智慧城市领域研究的主题文献。检索式为:主题=“智慧城市”,时间限定:2010年10月27日~2020年10月27日。无其他限定,进行高级数据检索。对检索出的文献进行筛选,并剔除英文文献,最终共得到25615条该方面的文献信息。数据检索和下载的日期为2020年10月27日。本研究主要采用文献计量分析作为主要分析方法,将25615条文献作为样本,利用中国知网平台数据统计进行基础可视化分析。在“导出与分析”选项下选择“可视化分析”,再选择“全部检索结果分析”。其次,由于知网平台只显示相关度靠前的6000条核心文献,所以在选定该6000条文献后,在“导出与分析”选项中选择“导出文献”并将其导出为Refworks格式。运行CiteSpace软件,选择data一栏下的Import/Export,并在CNKI中将导出的原始数据导入,将其转换成Web of Science格式。

参数的设置对数据分析具有直接的影响,启动CiteSpace软件,设置以下参数:Time Slicing------From 2010 JAN To 2020 DEC#Years Per Slice 1;Text Source中选中Title、Abstract、Author、Keywords(DE)、Keywords Plus(ID);Node Type中分别 选 中“Keywords”“Author”“Institution”。

3 结果与分析

3.1 发文量分析

图1为2010--2020年间中国知网收录的关于智慧城市的论文数量统计,是基于中国知网数据库自2010年10月27日至2020年10月27日所得到的25615条该领域的文献数据。图中实曲线代表随着时间的推进,论文数量的演变趋势。从图1中可以看出,总体上随着年份的推进,论文数量呈上升趋势。可以将对智慧城市的研究分成三个阶段。

从2009年开始,“智慧城市”的概念被提出,虽然这阶段收录的论文数量较少,但已实现从无到有的蜕变。这两年的发文量总数为144篇,约占发文总量的0.6%。

从2011年开始,对智慧城市的研究论文数量成井喷式增长,以2013年为典型,并于2014年达到峰值。此时间段内发文总量达7848篇,约占发文总量的33%。

从2015年至现今,在这一方面收录的论文数量比较稳定,平均每年都保持在3000以上。从2015年至2019年间共收录15724篇,约占发文总量的66%。

图1 2010-2020年间智慧城市研究论文的数量分布

随着时代和科技的发展,智慧城市一直是社会研究的重点方向与热点话题,建设智慧城市在引领信息技术应用、提升城市综合竞争力以及实现城市可持续发展等方面有着极其重要的意义。在信息技术日益突出,全球信息技术加速发展的趋势下,智慧城市的建设正与信息技术的发展相适应,借助此平台,实现对城市资源的统筹利用。

3.2 关键词共现分析

关键词往往是对一篇文献的高度概括,是对研究内容的提取与浓缩,是研究主题的精髓与核心[4]。所以,当视角转向关键词时,往往能够统计并分析出这个领域的热点问题及其发展动向。本文将采用关键词共现的方法,可视化、多维化的展现出我国在智慧城市领域研究的关键词共现图谱,以便客观对其进行观察与分析。

启动CiteSpace软件,将与“智慧城市”相关度最高的6000篇文献作为样本,Node Types栏下选定Keyword,其余默认。在图像里选择Timeline模式,得到智慧城市关键词时间线图(见图2),本文将首先在关键词进行聚类的基础上进行时间线图分析。

图2代表了每个聚类里关键词的发展情况,并按时间线平铺开。由图2可知,智慧城市领域的高频关键词被聚类分成了16个类别,分别为:大华股份、新型城镇化、应用、城乡规划、办公自动化、CIM(城市信息模型)、网络安全、智慧医疗、中国联通、智慧城市、精细化、智慧城市建设、居住区、信息系统集成、南宁市、楼宇自控。这16个类别代表了智慧城市这一领域的热点关键词聚类结果。很明显,绝大多数类别中的关键词数量在2017年中旬开始呈现出井喷式增长,而不同聚类中关键词之间的连接也开始变得密集。

从图2“#9智慧城市”聚类线图上可以看出,人工智能、云计算与智慧城市领域大多数聚类类别都有密切的联系,也是最早出现的关键词。自1956年麦卡锡首次提出“人工智能”这一术语后,人工智能开始在全球范围蓬勃兴起,在为经济社会发展注入新动能的同时,也深刻改变着人们的生产生活方式[5]。在智慧城市不断智能化的同时,人工智能为新型城镇化、网络安全、智慧医疗等多个聚类类别提供了支撑。自2008年云计算概念在国内被提出后,社会各界纷纷给予高度关注,推动了云计算向各行各业的延伸[6]。智慧城市作为一个复杂的综合体,其构建和运行涉及多种行业与应用,因此也高度依赖信息的集聚和资源的整合。

图2 智慧城市关键词时间线图

图3 VOSviewer智慧城市关键词共现图

另外,结合智慧城市领域研究前沿关键词表(见表1)以及智慧城市关键词共现网络聚类表(见表2)进行分析。在关键词聚类图谱的基础上,在“ClusterExplorer”中选取Log-likelihood rate(LLR算法—聚类标签词提取算法之一),得到关键词共现网络聚类表,见表2[7]。

由表1可见,“智慧城市”“智慧城市建 设”“物 联 网”“大 数 据”“人 工 智 能”“新型智慧城市”“智慧社区”“云计算”“应用”“智慧交通”等关键词以高频次位居统计榜首。结合智慧城市研究前沿关键词表、智慧城市关键词共现网络聚类表和ⅤOSviewer智慧城市关键词共现图可推测,在智慧城市研究主题中,“大数据”“人工智能”“智慧社区”“云计算”等成为热点关键词,并在一定程度上代表了智慧城市领域研究的热点主题。但在高频关键词中存在一些缺少代表性意义,指向不明确的词,如“作用”“应用”“建设”“发展”等。其本身不具备实质性内容,在ⅤOSviewer关键词共现中也较为边缘化,不具备中心性,可以在CiteSpace操作过程中予以删除。从聚类表2中也可以看出,部分关键词在不同的聚类标签词中均有出现,如“智慧城市”“建设”“大数据”“信息技术”等,除却少量本身不具备实质性内容的词外,仍可以看出大数据等新兴技术在智慧城市发展过程中已然是不可代替的存在。

表1 智慧城市研究前沿关键词表(前20名)

由于用CiteSpace软件制作出来的关键词共现图节点过于密集,并且关键词过于密集集中,所以在本文中将以ⅤOSviewer作为辅助软件,辅助分析在智慧城市领域的研究热点(见图3)。

通过ⅤOSviewer软件可以直观看出在智慧城市领域的关键词分布以及它们之间关联的紧密度。其中,中心性能够展现出节点的影响力,在关键词共现图中的关键词之间的链接效应与其本身数值呈正比例关系。由此,节点中心度越高,其关联词越多,在该领域内的影响也就越大。除“智慧城市”外,图3显示中度排名前三的关键词分别为“智慧社区”“大数据”“人工智能”,表明该部分关键词是智慧城市领域中的主要中介节点。

3.3 作者共现分析

启动CiteSpace,同样的操作可以得到节点数为261,连线数为137,密度为0.004的作者共现网络图谱,如图4所示。对于智慧城市领域的作者分析可分为两个方面,一是在该领域的活跃作者或者高产作者及其团队,二是在该领域内高被引作者,也就是具有一定影响力的作者及其团队。在CiteSpace作者共现图中,节点越大代表其发文量越多,连线代表两者存在引用关系。由图4可见智慧城市领域的高产作者或者团队有:陈宇(45篇论文)、单志广(37)、赛迪智库信息化形式分析课题组(30)、王博文(30)、黄岩(28)等。作者之间的交流合作会在图谱中形成子网络结构,在图4中较为突出的是杨斌等4人以及以俞富俊为中心的9人网络结构。整体分析来看:合作团队的分布比较分散,有大量的小团队以及孤立的研究人员[8],形成关联网的作者团队较少,没有形成联系紧密的合作团队。这表明我国在智慧城市领域的研究学者交流与合作的意识亟待加强。

3.4 机构共现分析

运行CiteSpace,节点类型为机构,TOPN=50,阈值设置中设定3个time slices的值,第一个的c,cc,ccv分别为2,2,20;另两个均设为4,3,20。其他参数为默认设置,得到节点数为199,连线数为45,密度为0.0023的机构共现网络图谱(见图5)。

表2 智慧城市关键词共现网络聚类表

图4 智慧城市作者共现图

图5 智慧城市机构共现图

由图5可见,智慧城市领域出现频次前十的机构分别是:中国工程院(55次)、深圳特区报(44)、中通服咨询设计研究院有限公司(42)、全国智标委(33)、天地伟业技术有限公司(27)、佳都新太科技股份有限公司(27)、吉林吉大通讯设计院股份有限公司(27)、华中科技大学公共管理学院(22)、广州市城市规划勘测设计研究院(18)、浙江大华技术股份有限公司(18)。其中,出现频次不足10次的机构占比超过80%,可见机构与机构之间研究能力差异显著、产出能力不均匀[9]。节点之间的连线较少,仅出现以中国工程院为核心的研究合作机构团体、包括重庆大学图书馆、重庆医科大学图书馆、四川美术学院图书馆、中国空气动力研究与发展中心科技信息中心在内的机构合作研究群,可以看出中国的智慧城市领域还未出现大范围的合作研究群体,也有相当一部分研究机构游离于主要合作机构之外,虽有一定的发文量,但没有形成稳定的合作群体[10]。

发文量较高的单位中不乏全国性综合重点高校,另外也包括各种研究会及工程院。表明社会各界都对智慧城市有着很高的重视度。

4 结语

从2008年“智慧地球”概念的提出,到2011年我国起步探索,再到如今智慧城市的飞速发展,以移动技术为代表的物联网技术和云计算技术、地理空间基础设施、射频传感技术等在内的新一代信息技术功不可没,另外通过维基、社交网络、Fab Lab、Living Lab、综合集成法、网动全媒体融合通信终端等工具和方法的应用实现科技社会背景下的可持续创新,使得社会资源更容易被整合,让城市本身具备智能化的管理模式,不仅能有效化解“城市病”的危机,更实现了城市的可持续发展、提高了我国的核心竞争力。

在这样的背景下,智慧城市的研究聚集了社会上大量优质研究力量。回望国内智慧城市领域的研究历程,研究团队主要集中在武汉大学、同济大学、中国城市科学研究会等高校和研究机构,其中又包含了陈宇、单志广等智慧城市领域的代表人物。研究热点主要集中在大数据、人工智能、智慧社区等方向。

上述发现是以中国知网文献库里的数据为样本,采用CiteSpace、ⅤOSviewer等知识图谱可视化软件进行分析得出的。本文对智慧城市领域的发文量、关键词、高产作者、机构做了详细阐释,也展示出国内智慧城市领域的热点主题及发展态势。正是这些逐步的积累,为智慧城市在城市建设、政府及商业领域的应用提供了思路。

在今后的研究中将逐步综合考虑多类数据资源,深入挖掘国内外智慧城市领域的研究现状及趋势。

可以预见的是,在未来几年内,国内对于智慧城市的研究热潮仍会持续。另外,在技术不断创新驱动下,智慧城市的建设也将迈入更高层级。

猜你喜欢
聚类领域智慧
2020 IT领域大事记
基于K-means聚类的车-地无线通信场强研究
领域·对峙
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
新常态下推动多层次多领域依法治理初探
一种层次初始的聚类个数自适应的聚类方法研究
有智慧的羊
肯定与质疑:“慕课”在基础教育领域的应用
智慧派