大数据背景下党史研究的可视化分析

2019-11-11 13:14张国伟
电脑知识与技术 2019年27期
关键词:可视化分析知识图谱大数据

张国伟

摘要:该文对CNKI收录的1998年至今的1200余篇山东党史研究的CSSCI期刊文献为大数据样本,运用可视化知识图谱分析软件对山东党史研究的文献成果数量、核心学者、中坚机构和主要期刊等进行统计分析,并在此基础上提出相关建议,以更好地推动党史研究发展。

关键词:大数据;可视化分析;党史研究;知识图谱

中图分类号:TP311        文献标识码:A

文章编号:1009-3044(2019)27-0285-03

1 引言

作为一部波澜壮阔、英勇奋斗的伟大历史,中国共产党近百年的发展历史是中华民族的宝贵精神财富。一直以来,以史为鉴、立党治国是我们党的优良传统之一。十八大以来,习近平总书记先后对党史的学习和研究工作做出多次重要指示并发表了大量相关论述。加强对党史学习研究,不但是提高我们党的执政能力,建设学习型政党的首要要求;更能够帮助每一位中华儿女充分了解国情,坚定社会主义信念,为“中国梦”的实现注入无限活力。

近年来,党史研究工作取得了丰硕的成果,但在对现有大量成果的系统分析方面还相对缺乏。新时代党史工作需要对前期的研究成果进行梳理总结,以更加有效开展研究并为党的建设发展和中国特色社会主义的建设提供更为有力的历史借鉴。为此,本文采用大数据分析可视化软件对近二十余年来党史研究的研究成果,从文献数量、核心学者、中坚机构、主要期刊等研究主体方面进行了系统梳理探析,以期为新时代党史研究工作提供参考借鉴。

2 研究设计

本研究采用定量与定性相结合的分析方法,并通过相关的大数据可视化工具来实现具体的研究。其中,定量分析法主要用于对相关研究如文章数量、作者发文量、各类期刊数量等量化指标的规模分析;定性分析法则主要用于对相关研究内容的分析,如作者、机构之间的合作关系等知识图谱分析。

知识图谱分析是一种借助量化模型,对某一研究领域的相关知识进行分析挖掘,并以图论作为基础,将该领域相关知识点之间的深层次关系以及发展趋势以一种可视化形式展现的研究方法。[1]当前,主流的以科学知识图谱为基础的大数据分析可视化软件包括Citespace、VOSviewer、Bibexcel等。[2]其中,Citespace又称为引文空间,是基于科学计量学、图论、大数据及可视化等学科发展背景下的一款开源大数据可视化分析工具[3]。它综合运用共词词频分析法、共词中心性分析法和突现词检测法等分析方法实现对热点、聚类、前沿等的分析和预测,受到了众多研究者的喜爱,本文采用Citespace5.3版本。[4,5]

本文選取当前规模宏大的中文文献数据库---中国知网CNKI进行文献检索,以确保最大范围掌握党史研究领域所发表的文献。将检索条件设为“全文含党史与山东”,重点围绕山东党史研究的相关研究,来源期刊库设定为CSSCI期刊库,确保研究层次的聚集。共搜索得到1071篇文献(检索日期为2019年3月1日)。为进一步确保文献的精确性,对其中的书目、论文目录索引以及会议公告、征文通知等数据进行筛选、删除等处理,并利用CiteSpace内置模块进行数据格式转换,共得到山东党史研究紧密相关的1026篇文献数据库。

3 党史研究大数据分析

3.1文献数量分析

文献发表数量在很大程度上反映出某一研究领域受到关注的程度以及其发展趋势。同时,文献各年度发表的数量的变化,可以作为测量某领域研究发生变化的尺度。[6]图1给出了1026篇山东党史研究文献按年度分布情况,需要注意的是2019年的数据仅包含截至2月份收录的文章。

总体而言,党史研究工作的发展过程可分为以下三个阶段:1998-2004年的平稳期。在该时期内,党史研究年均发文数量在20左右,发展较为平稳。2005-2010年的增长期。该时期内,党史研究的年均文献数量从20左右增长到50左右,学术界对党史研究产生了持续热情,越来越多的党史研究成果涌现。2011年至今的飞跃期。自党的十八大以来党史研究开始跨越式的飞速发展,学术界对党史研究的热情激增,党史研究文献数量出现爆发式增长。特别是十九大后,2018年党史研究达到文献数量的高峰105篇。这也充分表明,新时代以来习近平总书记关于党史工作的指示得到了很好落实,党史研究成为学术界重点关注领域。

3.2 学术期刊概况

作为发表和记录科研成果的首要平台载体,学术期刊在推动学术交流、提高大众科学素养、激发学科创新发展等方面发挥着重要功能,更是创新驱动发展战略中不可替代的要素。通过对原始文献数据的统计1206篇党史研究文献来自208种期刊,期刊的平均发文量为5.8篇。表1给出了山东党史研究领域刊文数量排名前10%的期刊名称及相应的发文情况。刊文数量最多的为由中共中央党史研究室主办的全国性党史权威学术期刊《中共党史研究》,高达192篇,占文献总量的15.9%,从一定程度上反映出山东党史研究所取得高质量成果占比较为显著。

然而,在208种期刊中仅发表1篇山东党史研究相关文章的期刊数量高达94种,占期刊总数的45.2%,发表文献占相应文献总量的9.2%;发文量不超过2篇的期刊数量为136种。这反映出在党史研究方面存在着较为突出国内相关期刊刊载论文量瓶颈突破问题,即侧重山东党史研究的高质量期刊数量并不可观。

作为山东党史研究的主阵地,发文量前10%的期刊中山东省期刊仅有《理论学刊》《山东社会科学》《东岳论丛》《当代世界社会主义问题》等4种,占21种期刊的19%,总发文量为92篇,占比相对较低。此外,《文史哲》《齐鲁学刊》《山东大学学报》等省内核心期刊的党史研究发文数量也较少,分别为6篇、5篇、4篇、2篇、1篇。从整体上看,侧重党史研究领域的山东期刊数量不多也导致发文数量较低。进而反映今后在山东党史研究方面,需要加大高水平期刊的培育和支持力度,通过期刊数量与质量的发展,带动山东党史研究更进一层次。

3.3 研究学者分析

对CiteSpace的后台数据进行导出并结合原始文献信息,经过进一步的分析,文献数据中共有第一作者716位,发表1篇论文的第一作者共有576位,占全部发文作者的80.5%,其发表文献占总文献的56.1%。普赖斯定律指撰写全部论文一半的高产学者的数量约等于全部作者总数的平方根,其中的高产学者即该领域的核心学者。定义核心学者的最低发文量为N,最高产学者的发文量nmax,普赖斯定律给出了两者之间的计算公式:N=0.79 sqrt(nmax)。[6]根据普赖斯定律,计算出该研究领域核心作者的最低发表论文量应为3篇。进一步分析CiteSpace的后台数据,可以得到核心学者共有51位,共计发文265篇,占文献总量的25.8%。综合而言,该领域学者研究各有特色,分别就党史某一方面开展深入持续的研究,但研究力量相对分散,尚未形成较为突出的研究团队。

图3为采用时区视图的作者知识图谱。可以看出,1998-2007年期间,该研究领域的主要学者数量较少,整体规模稳定,早期主要的核心学者有汪朝光、罗平汉等;自2008年开始每年都有新的核心学者开始进入该研究领域,如李里峰、林学启、李若建、韩延明、徐畅、徐建国等,该领域的研究成果开始快速增长,有力推动了党史研究的蓬勃发展。进一步分析发现,这些学者在不同的时期分别占据了主导地位且形成了各自的研究特色优势,如林学启的研究集中在2011-2013年,重点面向早期党内干部的选拔、任用及管理。韩延明的研究主要集中在2014-2018年,期间,重点针对毛泽东、抗日根据地等展开研究;徐畅则在2016-2017年重点关注了抗战时期鲁西南根据地。

3.4 研究机构分析

为更全面了解该研究领域内主要研究机构的分布情况,利用CiteSpace生成了具有162个网络节点、74條连线、密度为0.0057的研究机构分布及合作图谱,如图4所示。图中节点的大小与该机构所发表的文献数量成正比例关系,即节点的大小反映了相应的机构在该研究领域的研究实力和理论水平。可以看出中共中央党校、中国社会科学院、中共山东省委党校、山东省委党史研究室、山东大学等机构是该领域发文数量靠前的机构。网络中各节点之间有着一定数量的连线,进而反映各研究机构之间具有一定的合作。

在分析与汇总研究数据时发现部分文献的所属机构标注时存在一级机构和二级机构并存现象。为了准确反映各研究机构的情况,对CiteSpace后台数据进行导出修正,将文献机构全部按照一级机构统计,发现共有240余家研究机构,其中10%的研究机构发文量超过5篇,这24家主要机构的发文数量如表2所示。发文数量最多的是山东大学,以79篇高居榜首。山东大学作为一所以文史见长的综合型大学,其在史学、政治学以及马克思主义理论等学科方面拥有较为突出的研究力量,特别是其拥有全国重点马克思主义学院,被誉为“马克思主义理论教学与研究的高地”,理论渊源深厚。此外,在发文排名前10%的研究机构中有14所高校,占总数的一半以上,且多属于“985”高校,其中山东省内高校占5所。这表明当前高校对山东党史研究的关注度颇高,且其科研实力较为强劲,发展潜力巨大,是深入探索山东党史研究的前沿阵地。此外,作为党史教育和研究工作的重地,中国山东省委党校及山东省委党史研究室在党史研究领域的发文数量也较为突出,均达到二十篇以上。

通过对研究机构的进一步分析发现,早期党史研究的机构数量较少,主要为山东省委党史研究室、中国社科院、中国人民大学、山东大学等传统的党史研究机构,且机构之间研究合作并不多。2008年之后大批从事党史研究的新机构开始涌现,一方面山东师范大学、曲阜师范大学、临沂大学以及山东财政学院(山东财经大学)等省内高校发表了众多成果,在党史研究方面做出了重要贡献。另一方面,各个研究机构之间的合作开始加强,特别是传统党史研究优势机构与新加入高校之间的合作交流,如山东省委党史研究与临沂大学、山东大学与曲阜师范大学、中国社科院与北京大学等纷纷开展党史研究的合作。

4 总结与展望

通过对山东党史研究领域的1026篇核心期刊文献进行大数据分析,本文发现:在成果数量方面,山东党史研究文献数量逐年上升,特别是在十八大后开始飞速增长。在研究核心力量方面,以杨奎松、韩延明、李里峰、罗平汉、李若建、林学启等学者为主要代表,且在不同的时期分别占据了主导地位,为推动山东党史研究的持续深入研究做出了重要贡献。研究机构方面既有山东大学、中共山东省委党校、山东省委党史研究室等传统党史研究优势机构,也有一批如山东师范大学、曲阜师范大学、临沂大学等省内高校,在党史研究领域有所建树。

需要注意的是,一方面,该研究领域内研究学者以及机构之间的合作较为偏少,暂未形成核心的学术团队或机构联盟;另一方面该研究领域的期刊数量规模还有待提高,特别是山东省内高质量期刊的培育和提升。今后可从这两个方面着手,如成立相关协同研究中心、组建跨单位的研究团体等方式组建核心团队,提高合作意识,提升影响力。同时,增加现有核心期刊的党史研究版块、培育省内专业的党史研究高质量期刊,通过财政支持、政策引导等多种措施促进党史研究取得更加优异的成果。

参考文献:

[1] Shiffrin, R.M., Borner, K.Mapping Knowledge Domains[J].Proceedings of the National Academy of Sciences of the United States of America,2004(1).

[2] 周超峰.文献计量常用软件比较研究[D].武汉:华中师范大学,2017:12-13.

[3] CHAOMEI CHEN.CitespaceII: detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of American Society for Information Science and Technology, 2006,57(3).

[4] 冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006(2):88-92.

[5] 钟伟金,李佳.共词分析法研究(一)共词分析的过程与方式[J].情报杂志,2008(5):70-72.

[6] 邱均平.信息计量学[M].武汉:武汉大学出版社,2007:44.

【通联编辑:朱宝贵】

猜你喜欢
可视化分析知识图谱大数据
我国职业教育师资研究热点可视化分析
声波吹灰技术在SCR中的应用研究
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展