兰鹰 肖诗伯 杨玉梅
摘 要:随着大数据时代的到来,通过数据分析来引导图书馆的工作改进与创新是当前图书馆工作中的一个趋势。资源共享作为本次研究研究工作的重点,通过检索中国知网(CNKI)2003-2017年间,以文献分类为“图书情报与数字图书馆”,主题词为“资源共享”,刊发在“核心期刊”上的文献为研究数据,利用CiteSpace软件对数据的国内的研究现状和发展轨迹进行可视化分析,通过产生的知识图谱来揭示该研究方向的内涵与延伸,为了解研究现状提供非常直观的参考。
关键词:图书馆;资源共享;可视化;CiteSpace;知识图谱
中图分类号:G250.73 文献标识码:A 文章编号:2096-4706(2019)07-0008-04
Abstract:With the arrival of the era of big data,it is a trend in library work to guide the improvement and innovation of library work through data analysis. As the focus of this research,resource sharing is searched by CNKI from 2003 to 2017,and taking the literature classified as “library information and digital library”,the subject word is “resource sharing”,and the literature published in “core journals” as the research data,this paper uses CiteSpace software to visualize the research status and development trajectory of the data in China,reveals the connotation and extension of the research direction through the knowledge map generated,in order to understand the current situation of research and provide a very intuitive reference..
Keywords:library;resource sharing;visualization;CiteSpace;knowledge graph
1 研究方法与数据来源
1.1 研究方法
知识图谱应用数学、图形学、信息可视化技术等理论和方法,与传统科学(文献)计量学的共词、引文分析方法相结合,用可视化图谱形象展示学科的结构与发展[1]。本文选择了数据可视化分析中的常用软件CiteSpace(5.3.R11)为研究工具,CiteSpace是由德雷克塞尔大学陈超美团队开发的一种用于文献数据识别与可视化其演化动态和研究热点的Java应用软件[2],其基本原理是对分析单位(文献、关键词、作者等)的相似性进行分析和度量,本质上是一种宏观知识测量的信息可视化技术,因此有其独特的计量指标及含义[3]。使用CiteSpace工具对资源共享领域的研究成果进行关键词频分析和关键词聚类分析,并进行知识图谱的可视化展示。
1.2 数据来源
数据来源选取中国知网(CNKI)期刊库,时间范围设定为2003年-2017年,限定文献分类为“图书情报与数字图书馆”,检索关键词为“资源共享”的核心期刊论文,通过检索并剔除与本次研究无关的数据,共获取数据774条记录,选择文献导出为Refworks格式,并通过CiteSpace软件对导出数据进行转换。
2 基本数据分析
2.1 发文量分析
利用Excel对检索到的论文数量按照年度进行发文量分析。在过去的一段年份中,发文数量的多少一定程度上代表了学术界对该领域研究的冷热程度,通过对年代分布进行分析可以了解该学科领域的发展规模和研究速度,并且从折线图中可以分析出该领域的发展趋势[4]。通过图1所示趋势能够看出图书情报领域对资源共享的研究热度从2003年一直持续到2013年,2010年到达顶峰后开始出现下降的趋势,说明资源共享的相关研究已经不再是学术界关注的热点问题了,2016-2017两年发文量维持在较低的水平。
发文量持续减少的主要原因应该表现在两个方面,第一,资源共享的基础理论研究已相对成熟,在支持资源共享创新的现代技术应用之前,再难有新的成果出现。第二,在研究资源共享的过程中发现了更具有创新性的技术或模式,例如数字图书馆、图书馆合作、总分馆制、云计算等。由于对新领域的关注和研究,将影响资源共享为整体研究对象的文献出现。
2.2 期刊文献分布分析
文献的期刊分布能直观反映出该研究领域被关注的程度,图2列出了发文量排名前十的核心期刊和发文量,《图书情报工作》以103篇的发文量排名第一,《图书馆工作与研究》和《图书馆学研究》分别以64篇、61篇的发文量排在第二和第三位。排名前十期刊合计发文量为547篇,占到发文总数的70.6%。
3 关键词知识图谱分析
3.1 关键词知识图谱
关键词是对一篇文章研究内容最直接的体现,它一定程度上代表了一篇论文的学术思想内容,是文献计量研究十分重要的指标[5]。通过对关键词频率的统计,可以很快把握该领域目前的研究热点和发展趋势。利用CiteSpace加载转换后的数据,Time Slicing选择为2003-2017,Term Type选择Burst Terms,Years Per Slice設定为1,Node Types选择Keyword,设置阈值为每个时间切片的前50个高频关键词,使用Pathfinder算法,运行生成资源共享关键词知识图谱,结果中结点99个,连线149条,网络密度为0.03。隐藏关键词“资源共享”所代表的十字节点,如图3所示,词频的多少决定了十字节点的大小,十字节点外圈的颜色厚度表示该关键词的中心性的高低(如图所示“图书馆”“高校图书馆”“数字图书馆”等节点),关键词节点整体形成以“图书馆”“图书馆联盟”“信息资源”为核心的三个聚类圈结构,整体联系较为紧密,研究的主题也比较集中。
根据资源共享研究领域文献中出现频率前十的关键词(大于等于10)和中心性数据见表1,通过表中数据能清晰看到“资源共享”和“图书馆联盟”的词频非常高,但是“图书馆”“高校图书馆”作为词频第三、第四的关键词,中心性达到0.53和0.32,这也能表明高校图书馆作为国内图书馆领域研究的主力并且时刻把握相关研究领域的前沿。
3.2 突变词的研究分析
CiteSpace利用膨脹词探测算法,将一定时间内频次变化高的突变词(Burst iterms)从大量的主题词中提取出来,据此可以确定某一研究领域的前沿发展趋势[6]。图4为通过数据分析探测出的6个国内资源共享领域研究的突变词。
词频变化最高的是数字图书馆(2003-2005年),紧随其后的是图书馆合作(2005-2008年),馆际合作、总分馆制也逐渐突显,2010-2012年公共图书馆的出现,说明资源共享开始从高校图书馆之间逐渐向校地合作、校地共建转变。云计算作为目前研究的热点也从侧面说明了这些突变词是具有明显的时代特征的,它们所表现出来的研究前沿反映出资源共建的研究需要紧跟时代,只有不断更新理念和掌握新技术,才能适应社会发展的趋势。
3.3 聚类关键词分析
CiteSpace设置节点类型为“Keyword”,网络剪切选择“Minimum Spanning Tree”,运行软件,选择“Find Clusters”,利用关键词进行聚类,使用LLR算法生成资源共享关键词聚类图谱,聚类参数Modularity Q=0.5643,Mean Silhouette=0.3451表明本次聚类较为合理,如图5所示。
2003-2017年国内阅读推广研究主题大致归纳为8个方面,各聚类的Top Terms见表2,基于图5和表2所列内容,同时对图书馆资源共享研究文献的梳理,以及对当前领域研究热点的分析,所有的工作都围绕在“图书馆”这个核心下,建立“图书馆联盟”和“共享机制”,注重“资源建设”“资源整合”“共建共享”,借助多样化的技术手段通过“网络环境”和“服务平台”进行“图书馆服务”的延伸与创新。
4 结 论
本研究利用CiteSpace软件,采用知识图谱与文献计量相结合的分析方法,以中国知网为数据源,收集和整理了2003-2017年图书馆领域研究资源共享的相关文献,从文献数量、文献分布、研究关键词等几个方面分析了国内资源共享的研究现状。分析表明,经过图书馆界学者多年的研究,资源共享领域的研究已较为成熟,理论研究和共享机制的建立趋于完善,但是随着新技术的不断发展与推广,数字图书馆、云计算等研究热点的出现也为研究资源共享提出了新的方向[7-9]。本次研究仍存在元数据挖掘深度不够,分析角度任存在不足,需在今后的研究中不断完善与优化。
参考文献:
[1] 宗乾进,袁勤俭,沈洪洲.基于VOSviewer的2010年中国图书馆学研究热点分析 [J].图书馆,2012(4):88-90.
[2] Chen C.CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientific literature [J].Journal of the Association for Information Science & Technology,2014,57(3):359-377.
[3] 陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能 [J].科学学研究,2015,33(2):242-253.
[4] 王富祥.基于知识图谱的大数据研究可视化分析 [J].华北理工大学学报(社会科学版),2017,17(1):56-62.
[5] 王菲菲.数字文献资源计量语义化研究 [M].北京:北京工业大学出版社.2016.
[6] 钟雨祺.基于CiteSpace的中国图书馆知识服务研究可视化分析 [J].农业图书情报学刊,2018,30(4):79-85.
[7] 兰鹰.大数据环境下图书馆读者服务转变初探 [J].电脑迷,2018(11):49.
[8] 李雪莹.新型智慧图书馆的管理信息系统架构探析 [J].现代信息科技,2019,3(4):25-26+29.
[9] 肖诗伯,郭秀英.基于用户特征的文献个性化推荐系统研究 [J].网络新媒体技术,2018,7(4):24-33.
作者简介:兰鹰(1977-),男,汉族,四川南充人,就职于图书馆,科长,馆员,硕士,研究方向:大数据分析;肖诗伯(1983-),男,汉族,四川南充人,图书馆员工,馆员,硕士,研究方向:图书情报分析;杨玉梅(1978-),女,汉族,四川眉山,图书馆员工,副教授,硕士,研究方向:图书馆信息系统建设。