基于CNKI的CiteSpace应用可视化分析

2023-06-25 12:03:50丁士宁张克旺
现代信息科技 2023年6期
关键词:可视化

丁士宁 张克旺

摘  要:为了解CiteSpace软件的应用现状,基于CNKI数据库中检索的核心期刊文献,从年度文献数量、作者、研究机构、关键词等多方面进行分析,并使用CiteSpace 6.1.R3进行可视化。结果显示,2007年至2021年期间,相关论文数量呈增长趋势,超过70%的文献在2016年至2021年间发表;参与发表文章数量在10篇及以上的作者仅有7位,超过80%的作者发文量仅为1篇;相关成果较多的研究机构均是大学;CiteSpace软件应用于探测信息技术、医疗健康、农业、人工智能等多学科领域的研究热点和研究趋势。

关键词:知网数据库;核心期刊;可视化;CiteSpace软件

中图分类号:TP391    文献标识码:A  文章编号:2096-4706(2023)06-0124-05

Visualization Analysis of CiteSpace Application Based on CNKI

DING Shining, ZHANG Kewang

(Xinyang Agriculture and Forestry University, Xinyang  464000, China)

Abstract: In order to understand the application status of CiteSpace software, based on the core journal literature retrieved in the CNKI database, the paper analyzes the number of annual literature, authors, research institutions, keywords and other aspects, and uses CiteSpace 6.1.R3 for visualization. The results show that, the number of relevant papers showed an increasing trend from 2007 to 2021, and more than 70% of the papers were published from 2016 to 2021. Only seven authors participated in the publication of ten or more papers, and more than 80% of the authors published only one paper. The research institutions with more relevant achievements are universities. The CiteSpace software is applied to detect research hotspots and trends in information technology, medical health, agriculture, Artificial Intelligence and other multidisciplinary fields.

Keywords: CNKI database; core journal; visualization; CiteSpace software

0  引  言

CiteSpace软件是美国德雷赛尔大学陈超美教授研发的可视化分析软件,可以绘制学科知识领域的知识图谱,广泛应用于分析和探究特定领域研究成果的整体状况以及该领域研究的热点和前沿[1-3]。陈超美教授最早于2004年阐述了该软件[4];大连理工大学刘则渊教授是国内最早关注科学知识图谱的先驱者[5,6];候剑华等于2007年发表国内第一篇以CiteSpace为分析工具的核心期刊论文,这篇文章描述了用CiteSpace可视化分析战略管理学领域的前沿和演化[7];姜春林等将CiteSpace软件应用于分析CSSCI中文数据库上的期刊论文[8];刘则渊等将CiteSpace软件用于分析CNKI数据库上的论文[9]。CiteSpace已广泛应用到医学[10]、图书馆学[11]、教育学[12]、信息技术[13]。

目前也存在作者对CiteSpace应用进行统计分析。侯剑华等对知识图谱的应用领域和使用功能进行分析,并对CiteSpace的应用前景和趋势进行了分析和展望(2013年)[14];陈悦等从CiteSpace工具的设计理念、理论基础、使用流程、新进技术介绍等方面阐释CiteSpace知识图谱的方法论功能(2015年)[15];宋秀芳等基于Web of Science数据库上、以生物燃料为主题的期刊文献数据比较Vosviewer和CiteSpace软件的分析结果(2016年)[16];吕俊杰探究学者如何利用CiteSpace软件进行学术研究,并简要说了应用软件进行研究时存在的问题(2022年)[17]。本文基于CNKI数据库,通过对CiteSpace相关文献的作者、研究机构和关键词图谱网络,分析CiteSpace应用的热点和趋势。

1  数据来源与研究方法

以中国知网(China National Knowledge Infrastructure, CNKI)為检索平台,主题设置为“CiteSpace”或“Cite Space”,仅检索期刊文献。同时为保证检索文献的质量,期刊来源选择为“SCI来源期刊”“EI来源期刊”“北大核心”“CSSCI”“CSCD”,检索时间范围不限。检索得到2 700篇文献,将文献以Refworks格式导出并转换为CiteSpace可用的格式。其后按照如下规则筛选数据:

(1)根据题目、关键词、摘要信息剔除明显与主题无关的文献。

(2)利用CiteSpace自带功能去除重复的文献。

(3)剔除Refworks格式中不含年份信息的文献。筛选后得到文献2 607篇。

本文使用CiteSpace软件对相关文献的作者、研究机构和关键词进行可视化分析,软件版本为6.1.R3。

2  结果与分析

2.1  年度发文量统计与分析

年度发文量数量是该研究领域是否为热点研究的重要体现[18]。如图1所示,是主题CiteSpace的年度发文量曲线。关于CiteSpace的应用研究主要出现在2007年及之后,2007年至2021年,年度发文量整体呈现上升的趋势。2007年至2010年年度发文量较少,均在15篇以内;2011年至2014年发文量基本维持在50篇上下;在2016年年度发文量首次突破100篇,并在之后维持在较高的水平;2016年至2021年发文量占整体文献数量的74.53%。认为CiteSpace应用研究受到了越来越多人的关注与使用,并在最近6年维持在较高的热度,具有广阔的研究前景。

2.2  文献作者情况分析

文献作者的统计可以分析该研究领域核心作者及合作强度[19]。本研究中的2 607篇文献中包含6 819名作者,出现频次在10及以上的仅有7人,发文量在1篇的作者占比达86.02%。参与发文量在10篇以上的作者及首发年份展示如表1所示。其中出现频次最多的是侯剑华,发文量在20篇,而且侯剑华是国内以CiteSpace为分析工具发表文章的第一人[7],该篇文章对战略管理学进行了可视化分析研究。金荣疆(13篇)、李涓(12篇)、李杰(12篇)三人的首发年份在2017年及之后。

CiteSpace分析得到N(网络节点数量)=538,S(连线数量)=467,Density(网络密度)=0.003 2的作者合作网络图,时间设置为2007年至2022年,时间切片为1年,‘Selection Criteria设置为‘g-index,未对网络进行剪切。作者合作网络如图2所示。在图中,每个节点代表一个作者,节点之间的连线代表作者之间的合作。不难看出,许多研究者应用CiteSpace软件发表文章,但合作研究者比较分散,仅分别形成了以侯剑华、刘则渊、金荣疆&李涓等为核心的研究团队。

2.3  研究机构情况分析

对研究机构进行统计分析可以看出该领域科研力量的分布[20]。表2和表3在所有文献上统计了参与发文量靠前的一级机构和二级机构。如表2所示,发文量排名前9的一级机构均是大学。其中武汉大学发文量最大,达到76篇;大连理工大学的研究时间最早,首次发文在2007年;成都中医药大学相关文章发表起于2019年,并在不到4年的时间内发文量达到31篇。如表3所示,二级发文机构排名靠前的是大学内的学院。因相当部分文章未列二级机构,表3中发文量和首发年份均是根据列明了自身二级机构的文章统计而来。

使用CiteSpace绘图,时间设置为2007年至2022年,时间切片为1年,‘Selection Criteria设置为‘g-index,未对网络进行剪切。绘制的发文机构合作网络图如图3所示,N=445,S=189,Density=0.001 9。值得注意的是,图3并未将二级机构归并到一级机构中,且部分文章不列二级机构这一事实客观存在。从图3整体来看,研究机构之间的合作分散,但也形成了以中国科学院大学、中国中医科学院为核心的研究团队。

2.4  关键词分析

关键词是一篇文章的凝练概括,关键词的频次和中心性可以反映本领域内的研究热点[21,22]。合并同义词后,运用CiteSpace软件对关键词进行分析。如表4所示,记录了高频词的关键词及其中心性。在表4中,中心性大于0.1的关键词是“知识图像”“研究热点”“文献计量”“可视化”和“CiteSpace”。CiteSpace是知识图谱绘制工具,可以可视化作者共现图谱、机构共现图谱、国家分布图谱、关键词共现与聚类图谱等,主要用来探测学科知识领域的发展及其研究热点和研究趋势。表4的数据与这一事实相符。

如图4所示,是CNKI数据库中的CiteSpace研究的关键词聚类分析结果,聚类算法选择LLR(Log-Likelihood Ratio)算法。经过聚类分析,聚类模块值Q=0.466 5>0.3,聚类结构显著;聚类平均模块值S=0.810 8>0.7,聚类是高效率令人信服的[15]。图4展示了9个聚类模块,其中多个模块之间存在大量重叠,表明模块之间联系紧密,如#1(研究热点)、#5(研究进展)是CiteSpace研究的目的,#0(知识图谱)、#3(可视化)是CiteSpace研究的方法手段,#6(乡村振兴)、#8(人工智能)是CiteSpace关注应用的领域。

如图5所示,是关键词的时间线图。聚类0(知识图谱)的关键词涉及医学(肠道菌群、医学情报、雷公藤)、信息技术(信息技术、信息检索、文献流)、教育(教师权利、青少年)等;聚类1(研究热点)的关键词涉及农业(农业保险、植物修复)、信息技术(信息行为、信息服务、互联网+,虚拟现实、网络分析)、健康(健康、健康管理、健康促进、食品检测)等;聚类2(文獻计量)的关键词涉及环境(园艺学、生态修复、森林)、安全(危机管理、公共危机、健康风险)等;聚类3(可视化)的关键词涉及医学健康(医学、中药、中医、干细胞、软骨、中医流派、健康传播)、信息技术(4d打印、数据挖掘、信息生态)等;聚类4(演化路径)的关键词涉及教育(教师离职、慕课)、环境(碳排放、低碳经济)。聚类0-4中频次最高的词仍然是知识图谱、研究热点、研究趋势、可视化、CiteSpace这些词。

应用于CiteSpace可视化分析的数据主要有两大来源:CNKI和Web of Science。其中,CNKI是中文数据库,Web of Science是英文数据库。从聚类7看出,在英文数据库Web of Science上主要进行医学(针灸、临床研究、军事医学)、教育(教育扶贫)、环境(水土保持)方面的研究。

聚类6和聚类8是CiteSpace应用的具体领域方向。对乡村振兴的研究涉及了乡村旅游(2017年)、乡村振兴(2020年)、三权分置(2022年)等。应用CiteSpace对人工智能的研究涉及了大数据(2015年)、区块链(2017年)、机器学习(2020年)、深度学习(2020年)等方面。

关键词图像分析结果如图6所示,图中展示了关键词突现的起止年份及突现强度。“情报学”突现的时间起于2010年,止于2015年;“图书馆学”突现的时间起于2012年,止于2014年;“电子政务”突现的时间起于2012年,止于2015年;“专利分析”突现的时间起于2014年,止于2017年;“乡村振兴”突现的时间起于2020年,至今未止。

根据关键词分析的结果,可视化软件CiteSpace用来分析探测教育学、信息技术、医疗健康、环境科学、农业、人工智能等学科领域的研究热点和研究趋势,对于乡村振兴的研究可能是当下及未来的研究热点。

3  结  论

本文在CNKI数据库上导出与主题CiteSpace相关的核心期刊文献,对导出的2607篇文献的作者、研究机构和关键词进行可视化分析,分析結果表明:

(1)使用CiteSpace发表文章的数量随年份增长呈现增加趋势,且74.53%的文献发布于2016年至2021年;

(2)从作者分析结果来看,侯剑华是国内以CiteSpace为分析工具发表文章的第一人,且发文量最多;86.02%的作者发文量仅为1篇;作者之间的合作网络比较松散,但也形成了分别以侯剑华、刘则渊、金荣疆&李涓等为核心的研究网络。

(3)从研究机构分析结果来看,该主题的研究机构主要集中在大学;各个大学之间的合作松散,但也形成了以中国科学院大学、中国中医科学院为核心的研究团队。

(4)通过对关键词进行分析,认为CiteSpace广泛应用在教育学、信息技术、医疗健康、环境科学、农业、人工智能等学科领域的研究热点分析中;乡村振兴是当下及未来的研究热点。

参考文献:

[1] CHEN C M. A Glimpse of the First Eight Months of the COVID-19 Literature on Microsoft Academic Graph:Themes,Citation Contexts,and Uncertainties [J].Frontiers in Research Metrics and Analytics,2020,5:607286.

[2] CHEN C M,SONG M. Visualizing a Field of Research:A Methodology of Systematic Scientometric Reviews [J].PLoS ONE,2019,14(10):e0223994.

[3] CHEN C M. Science Mapping:A Systematic Review of the Literature [J].Journal of Data and Information Science,2017,2(2):1-40.

[4] CHEN C M. Searching for Intellectual Turning Points:Progressive Knowledge Domain Visualization [J].Proceedings of the National Academy of Sciences,2004,101(Supplement1):5303-5310.

[5] 陈悦,刘则渊.悄然兴起的科学知识图谱 [J].科学学研究,2005(2):149-154.

[6] 刘光阳.CiteSpace国内应用的传播轨迹——基于2006—2015年跨库数据的统计与可视化分析 [J].图书情报知识,2017(2):60-74.

[7] 侯剑华,陈悦.战略管理学前沿演进可视化研究 [J].科学学研究,2007(S1):15-21.

[8] 姜春林,刘盛博,丁堃.《中国科技期刊研究》研究热点及其演进知识图谱 [J].中国科技期刊研究,2008,19(6):954-958.

[9] 刘则渊,胡志刚,王贤文.30年中国科学学历程的知识图谱展现——为《科学学与科学技术管理》杂志创刊30周年而作 [J].科学学与科学技术管理,2010,31(5):17-23.

[10] 张惠玲,李涓,刘丹阳,等.基于CiteSpace软件探讨生物反馈技术在康复医学中的研究现状 [J].中华物理医学与康复杂志,2022,44(3):264-268.

[11] 丁明春,任恒.国内外智慧图书馆研究之概念脉络、热点主题及未来展望——基于CiteSpace的信息可视化分析 [J].图书馆理论与实践,2022(1):99-107.

[12] 苗小燕,张冲.大中小学德育一体化研究的热点与发展趋势——基于CNKI数据库的CITESPACE分析 [J].中国特殊教育,2018(8):85-90.

[13] 谢志明,粟小颖,易玄.基于Citespace的区块链审计热点及研究趋势比较 [J].财会通讯,2022(3):23-29.

[14] 侯剑华,胡志刚.CiteSpace软件应用研究的回顾与展望 [J].现代情报,2013,33(4):99-103.

[15] 陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能 [J].科学学研究,2015,33(2):242-253.

[16] 宋秀芳,迟培娟.Vosviewer与Citespace应用比较研究 [J].情报科学,2016,34(7):108-112+146.

[17] 吕俊杰.CiteSpace应用现状研究 [J].现代信息科技,2022,6(7):105-111.

[18] SUN Y Q,WU S M,GONG G Y. Trends of Research on Polycyclic Aromatic Hydrocarbons in Food:A 20-Year Perspective from 1997 to 2017 [J].Trends in Food Science & Technology,2019,83:86-98.

[19] LI W S,ZHAO Y X,WANG Q,et al. Twenty Years of Entropy Research:A Bibliometric Overview [J].Entropy,2019,21(7):694.

[20] SUN W J,HUANG P X,SONG H L,et al. Bibliometric Analysis of Acute Pancreatitis in Web of Science Database Based on CiteSpace software [J].Medicine,2020,99(49):e23208.

[21] 林德明,陳超美,刘则渊.共被引网络中介中心性的Zipf—Pareto分布研究 [J].情报学报,2011,30(1):76-82.

[22] CHEN C M. CiteSpace II:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature [J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.

作者简介:丁士宁(1993—),男,汉族,河南淮滨人,助教,硕士研究生,研究方向:模式识别;张克旺(1982—),男,汉族,河南信阳人,讲师,硕士研究生,研究方向:物联网技术。

收稿日期:2022-10-31

基金项目:信阳农林学院青年教师科研基金项目(QN2021057)

猜你喜欢
可视化
无锡市“三项举措”探索执法可视化新路径
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
北京测绘(2022年6期)2022-08-01 09:19:06
三维可视化信息管理系统在选煤生产中的应用
选煤技术(2022年2期)2022-06-06 09:13:12
思维可视化
师道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水运行动态分析与可视化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然资源可视化决策系统
北京测绘(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三维可视化
可视化阅读:新媒体语境下信息可视化新趋势
“融评”:党媒评论的可视化创新
传媒评论(2019年4期)2019-07-13 05:49:14