摘 要 在知识图谱理论的基础之上,本文选择Citespace V可视化软件,对CNKI中1992~2016年间我国内存数据库研究的文献进行了分析,绘制内存数据库研究的关键词、作者等知识图谱,来分析我国内存数据库研究的熱点。
关键词 内存数据库 Citespace V 知识图谱
一、引言
知识图谱应用数学、图形学、信息可视化技术等理论和方法,与传统的科学计量学引文分析方法结合,用可视化的图谱形象地展示学科的结构与发展,[1,2]知识图谱理论与方法近年来成为科学计量学研究的最前沿。
在当前情况下我国对内存数据库的研究还处在一个逐步发展的状态,需要我们从比较全面的角度去研究其发展现状,以便在未来更好、更深入地进行关于这方面的研究。
二、数据来源与方法
(一)数据来源
首先,在中国知网CNKI总库中,选择“期刊”“高级检索”,以“内存数据库”为主题,对1992~2016年之间所发表出来的文章进行检索,一共得到的记录有933条。然后从中以ref格式下载这933篇论文,以备之后分析所用。
(二)研究方法
Citespace是美国费城德雷塞尔大学陈超美教授研制并开发的信息可视化应用软件,在本文中使用Citespace工具然后将ref的文件格式转换为txt格式,再将转换后的格式导进Citespace V软件中实行可视化分析,主要对关键词、作者等分析,运行绘制我国内存数据库的知识图谱。
三、统计与分析
(一)文献时间分布分析
以5年为间隔的论文年篇数分布统计结果见图1。从图1可以看出,我国学者对内存数据库方面研究所发表的论文数增长趋势较为平缓,内存数据库的研究渐渐地引起我国研究学者的关注;尤其是最近的5年里,关于内存数据库的研究越来越热门。
(二)文献关键词分析
关键词是对研究主题的高度归纳,对有关文章的关键词使用共现分析,可以发掘出该领域的研究热点。因此,对933篇论文进行关键词共被引分析。第一步,将1992~2016年间每一年为划分的单位,选择“Keywords(关键词)”为节点,再选取各个时间区中被引用频次高的前50个关键词,来生成关键词共被引的图谱。
第一,关键词共现分析。在生成图谱后,在右方选出“聚类视角”选项,并点击“自动聚类”标签。可以得到清楚的关键词共被引聚类知识图谱(见图2),图中的每个圆点都表示一个节点,圆点越大即该词汇出现的频率越高;两者中间的连接表示这两个节点共同在一篇文献中出现,线段越粗代表着联系越紧密,反之亦然。共有738个节点,1594个连接,网络密度为 0.0059。从图谱中可以知道,“内存数据库”这一词的出现频率最高,其次是“实时数据库”“大数据”“数据库”等。
取词频(7次以上)排序统计,得33个频率高的关键词,结合关键词知识图谱,可以看出在内存数据库研究领域,实时数据库、大数据、并发控制、物联网等都是其研究的热点。内存数据库也属于实时数据库的一种,其特点就是在内存的数据库中,数据库的所有或者需要存取的数据放于内存中,这样本来需要对磁盘进行的访问就取消了,保证了存取速度的快速性。
(三)发文作者分析
对933篇文章进行发文作者共被引的分析,在这中间发表文章次数较高的作者在可视化图谱中所显示为的节点比较大。共有776个节点,525个连接,网络密度为0.0017。从中可以看出,刘云生出现的次数最高,之后是李国徽、廖国琼等,他们之间共同合作的文章比较多。再者,其他我国内存数据库研究领域的学者很多都在独自研究。好多的研究团队会由导师及学生这样的组合组成。例如华中科技大学教授李国徽教授与其学生,武汉工商学院卢炎生教授与其学生。
四、结语
本文使用了可视化的技术对我国内存数据库的研究进行了一些分析,展示我国内存数据库研究领域的研究热点、重要的学者等,揭示我国内存数据库研究的状况。通过对1992~2016 年间我国内存数据库研究文献的知识图谱分析,可知我国内存数据库研究发文数量稳步增加,国内学者也不断加大了对内存数据库的探究。实时数据库、分布式数据库、大数据、物联网、云计算等为我国内存数据库研究的主要方向。刘云生教授是我国内存数据库研究范畴内产出最多的学者,然后是李国徽教授、廖国琼教授、吴绍春教授等。
(作者单位为上海大学)
参考文献
[1] 沈建通,姚乐野.多元统计与社会网络分析法在知识图谱应用的实证研究[J].情报杂志,2009,28(8):33-36.
[2] 王璟,夏培玲,夏培英.基于知识图谱的体育科学研究前沿和热点[J].体育成人教育学刊,2011,27(3):32-35.