近十年我国图情领域研究的回顾与总结

2018-12-10 09:01袁润李莹王婧怡
中国集体经济 2018年34期
关键词:词频发文期刊

袁润 李莹 王婧怡

摘要:核心期刊刊载的论文是具有重要的理论与指导意义的学术研究成果,通常代表学术的研究方向和热点。文章以我国图情领域近十年核心期刊的学术论文为研究对象,对发文量、作者、机构进行分析,以此对图请领域十年来的研究趋势进行分析。利用了R语言函数包,对关键词频次排序和网络系数计算,通过关键词词频分析、共现网络分析,对研究内容进行分析,以期望探究图情领域的发展特征和研究热点,为后续的深入研究提供参考。

关键词:文献计量;R语言;词频分析;社会网络分析

一、引言

本文选取 “图书情报与档案管理”学科的18种学术期刊2007~2016年这10年间的论文作为数据源。原因如下:第一、选取的样本是核心期刊,具有较高的学术参考价值,较为权威且相对客观。第二、选取2007~2016年数据,该数据集时间跨度较长、数据量较大,能比较全面地反映这段时间图书情报领域的研究成果。通过系统且连续地收集学科期刊的载文信息,就能够从一个视角比较全面地反映学科的发展特征和演变过程。本文用计量分析对载文量、核心作者、机构进行分析,以此了解我国图情领域研究的发展脉络。使用词频分析和网络分析揭示了该学科10年来学者关注和研究的热点,以期探索我国图情领研究十年来的整体情况。

二、数据收集及研究工具

(一)数据来源

除了《情报学报》的载文数据来源于CSSCI,其他17种期刊的载文数据全部来源于CNKI。数据采集的过程大致需要以下步骤:1.检索,按照刊名和时间检索;2.导出检索结果,用自定义文献导出格式,选择Title-题名、Author-作者、Organ-单位、Source-文献来源、Keyword-关键词、Year-年等6个字段数据;3.清洗数据,删除“会议”、“投稿须知”等数据,最终得到53134条记录。也就是说,在这10年内,这18种期刊共计发表论文53134篇。

(二)研究工具

本文的研究工具选取开源的数据统计分析R语言和可视化软件citespace。利用了R语言的readxl贡献包(package)来实现文献计量的统计,包括数据导入和进行频次排序等工作。然后用citespace绘制关键词共现网络图,并用R语言igraph函数对关键词网络节点的中介中心度进行相关计算。

三、研究现状分析

(一)总体研究趋势分析

从图1来看,论文数量虽然在2007~2010年间和2014~2015年间有所上升,但总体呈现下降的趋势。2016和2007年相比发文量减少了732篇。在期刊版面不变的条件下,发文量减小,说明每篇论文的篇幅有所增加。也可以间接地表明本学科学者的研究不断深入,每篇文章的信息量和研究水平在不断提升,论文质量不断提高。

观察18种期刊的载文量可以看出《图书情报工作》改版为半月刊之后载文数量最大,10年中发表了7596篇论文。在本学科中具有较大的影响力。而《中国图书馆学报》的载文量是最小的,10年中仅仅发表了905篇论文,但该期刊仍然是图情学科最具影响力的期刊,因此期刊的载文量大小并不能说明什么问题。

(二)作者及机构发文量统计

图情领域的研究主体是研究者和机构。通过对作者和机构分析,我们可以发掘图情领域科研精英及核心研究力量。

1. 论文核心作者情况分析

由表2可以清晰的看出作者发文量和作者数量的关系。18种期刊在10年中刊发的论文中总共有31277位作者。发文量在1~10篇之间的这部分作者占据了总作者数的94.8%。而发文量11篇以上的作者有1621人,只占总作者数的5.2%。

核心作者是指发文较多,并且对学术界有一定影响力和竞争力的精英作者。因涉及到学科研究者的评价问题,目前对核心作者的选择尚未有统一的方法。本文用普赖斯公式来界定核心作者,普赖斯公式:M=0.749,该公式在具体应用时,需做适当修改,将Nmax定义为论文发表篇数的最高值。这样该公式得出的结果才更符合“核心作者”的特征。本例中Nmax為230,得到发文量在12篇以上的即是核心作者。经统计,发文量在12篇以上的作者达到一千余人,核心作者群大约占总作者人数的5%,可以看出本学科研究领域中有一群高产的核心作者群,并且因发文量大已具有一定影响力。由于核心作者数量较大,本文展示发文量最高的前10位作者,很巧合发现发文量高于100篇的也是这10位作者。

这些高产的核心作者可以认为是本学科的领军人物,因其丰富的科研成果奠定了在本学科重要的学术地位。发文量最多是武汉大学的邱均平教授,10年发文量高达230篇。排名第二是南京大学的朱庆华教授,10年发文量146篇。这些高产作者对推动图情领域的发展做出了重要的贡献。

2. 论文机构分布情况分析

发文量较高的机构主要集中在国内图书情报学术力量雄厚的高校。例如老牌图情机构武汉大学在十年间的发文量高达3310余篇,作者发文数量和关键词数量也是最多。南京大学、吉林大学、北京大学这三个机构发文高达1400篇以上,这四个机构不仅发文量占总发文量的相当大的比重,作者数量也较高,这一点也表明了其科研队伍实力雄厚。

综合核心作者的所在机构,发现发文量较多的学者主要集中在这些学术实力雄厚高校中。发文量前三的作者所在机构和发文量前三的机构不谋而合。这一点似乎表明,一流学者往往在一流的重视相关学科建设的学术机构,或者说,科研力量雄厚的一流学术机构一定拥有数量较多的知名专家学者。

四、主要研究内容分析

(一)高频关键词分析和主题词分析

词频分析法利用某一学科领域中相关文献的关键词或核心词的词频高低来确定领域的研究热点与发展趋势。词频分析是一种具有客观性、准确性、系统性的方法,在一定程度上摆脱了定性方法的个人主观性。

本文用高低频词界定公式计算高频词阈值,公式如下,公式中I1是指只出现过1次的关键词数量。18种核心期刊10年间的只出现过1次关键词有43888个,因此词频高于为259.7的关键词是高频关键词,共得到45个高频关键词。

表4是按照词频的排序得到了高频关键词表,观察发现这些词语都是我们所熟悉的常在文献中出现的关键词,均与本学科研究主题关联密切。频次出现500次以上的关键词共有12个,可以看出10年来图书馆学的研究热点和最主要内容集中在“信息服务”、“知识服务”、“知识管理”等方面。虽然图书馆学的研究内容是多元化,但研究也存在侧重性。出现频次最高的是“图书馆”,在10年中共出现4693次,出现次数远远超过其他的关键词。图书情报学主要以图书馆为基础,因此大部分论文是围绕“图书馆”相关内容进行研究。在上表中包含“服务”的关键词出现次数也较多,“信息服务、知识服务、图书馆服务、学科服务”这些高频词都验证了图书馆的职能以信息、知识服务为主。

另外值得注意的是,“微博”这个词在十年间一共出现316次,是目前图书情报领域的一个研究热点。微博是普及率非常高的社交工具,人们可以通过微博进行分享和交流,现在微博已经成为中国网民网络社交的主要工具。结合微博的背景,可以发现图情领域领域学者较关注热门事物,并且会结合本学科领域的内容对这些社会热点进行研究。相类似的词语还如“云计算”、“数据挖掘”、“本体”、“web2.0”等。图情学科的研究内容会受到社会的发展和当下的话题热点的影响,社会热点展示了当今的社会讨论的焦点。表面图情学科的研究是关注时事、不断发展、与时俱进的。

(二)年度高频词和突显词分析

高频关键词一般来说是作者研究内容的重要概括。将每年的关键词频次统计出来倒排序,可以很清楚地发现当年的高频词,这些词可以反映出本年的研究重点。有些词语的频次变化并非平滑,而是在某个时间段有出现数量发生较大程度的变化,这样的词就被称为是突显词,突显词可以有效地揭示一段时间学科领域的热点问题。

通过突显值探测2008年“知识管理”和“信息服务”频次合计达到400次。此后每年高频词中都出现“信息服务”,说明2008年开始“信息服务”开始成为图情领域新的研究热点。2011年的突显词“社会网络分析”出现了62次,而在之前出现的次数却很少,意味2011年开始 “社会网络分析”被本学科高度关注。随着微信产品的市场占有率和用户普及率逐步扩大,研究者对此的关注点也不断地增加,“微信”这个词在2016年也出现了40次。另外通过研究发现,每年的高频关键词之间重复率很高,可以侧面地说明研究热点存在一定的继承性和延续性,研究者对于原本就是学科研究热点的内容似乎更有研究兴趣。很多研究者会在热门研究点的基础上再进行深入挖掘,在对研究热点进行持续探究的过程中也会发现新的研究点。

(三)共现网络分析

关键词是论文中主要内容的浓缩,是作者精炼出来的概括论文主题的词汇。关键词体现学术文献的灵魂,同时能反映论文的研究方向和研究主题。18种核心期刊10年学术论文中的关键词一共有62515个。本文的样本量一共有62515个关键词,样本数量比较大,因此取词频在大于等于200个的关键词,共现网络可以直观地展示关键词与关键词之间的隐性关系本文。用citespace进行可视化绘图,得到图2的关键词共现网络图。

从上图可以看出研究热点除了“图书馆”之外,主要集中在“公共图书馆、数字图书馆、本体、关联数据、信息服务”等。这些关键词在网络中地位很高,证明这些都是该学科十年来研究的重点内容。

linton freeman认为,中介中心度的含义是“中介中心度较高的点可以通过控制或者曲解信息的传递而影响群体”。在关键词网络中,中介中心度越高证明该节点在网络中占据重要地位并对网络中别的节点衔接能力较强。在共现网络中,通过对全部关键词中介中心度进行排序比较,就能了解该关键词是否处于核心地位。为避免忽略中低频关键词,导致分析结果的整体性欠佳,故本文结合中介中心度较高的关键词進行进一步分析。

结合关键词网络和中介中心度较高的关键词,可知目前图书馆学研究主要分为两项:

1. 新兴主题——新兴主题是随着新的科研成果和新兴技术产生的具有时代特征的主题。在科学技术的不断发展下,新兴主题处于一种不断变化的过程。通过对新事物、新技术、新方法的研究能够促进图情领域的发展和创新。

21世纪是大数据的时代,大数据不断地渗透到工作和生活的各个方面,图书馆也运用这类新技术和新方法完善和提高其服务。因此图书馆学目前研究的重点也涉及到“开放数据、大数据、关联数据、科研数据、数据管理、数据共享、数据馆员、数据获取、数据加值服务” 等方面。 “数字图书馆”也是目前研究者研究的重要兴趣点,数字图书馆是能够处理和存储文献的图书馆。随着信息科技的发展,需要存储和传播的信息量越来越大,信息种类和形式越来越丰富,传统的图书馆机制已经不能满足这些需求,因此目前需要这些的电子化信息仓储,方便存储大量的信息。

2. 传统主题——这些研究包括图书馆管理、信息资源建设、图书馆服务以及学科基础理论和图书馆学基本研究方法。这些都是图情领域一直以来的研究点,研究者仍然在这些传统研究点上持续深入挖掘,以夯实图情领域的理论基础。

五、总结

核心期刊最能代表图书情报领域的研究内容和研究成果。通过对2007~2016年我国图情领域的分析,首先可以看出我国图情该领域的科研人员能力在不断提升,研究的问题也不断深入。纵观核心作者和发文量较高的机构,发现本学科研究领域中研究者群体有一定稳定性,已经拥有了一定影响力的核心作者群。图情领域的老牌高校目前仍然在本领域发挥主要的科研力量,另外该领域发文量最高的机构一定拥有发文量较高的作者,一流学者往往在一流的学术机构。

其次,我国图情领域学科发展是与时俱进的,随着社会和科学的不断发展,大众对于信息的需求与日俱增。图情领域顺应时代的发展,学者将新事物、新技术结合本学科进行研究,这些新技术和新方法在推动图情学科的发展的同时也催生新了研究热点,能够丰富图书情报学科内容。

最后,目前图情领域研究主题是多元化的,但研究主题仍然以图书馆为基础。研究热点仍集中于图书馆的理论研究和研究方法,包括图书馆的职能如信息、服务、知识等方面。这些研究可以类比于图情领域的“土壤”,研究者必须重视这方面研究。

参考文献:

[1]朱亚丽.《现代图书情报技术》核心著者测评[J].现代图书情报技术,2004(12).

[2]储节旺,钱倩.基于词频分析的近10年知识管理的研究热点及研究方法[J].情报科学,2014(10).

[3]田丹,刘奕杉,王玉琳.热点分析类文章的文献计量分析——以词频分析方法为例[J].情报科学,2017(08).

[4]赵爽.基于共词分析的我国电子商务领域研究热点探析[D].吉林大学,2017.

[5]马妍春,黄可心.科技论文摘要、关键词及参考文献的规范化[J].情报科学,1999(06).

[6]王燕玲.2000~2011年WOS科学学期刊关键词分析——以共词和SNA为方法[J].现代情报,2012(08).

[7]朱庆华,李亮.社会网络分析法及其在情报学中的应用[J].情报理论与实践,2008(02).

[8]杨秀秀.管理科学与工程学科共词网络整体特性、生长性及热点研究[D].浙江大学,2014.

(作者单位:江苏大学科技信息研究所)

猜你喜欢
词频发文期刊
期刊审稿进度表
校园拾趣
爷孙趣事
以牙还牙
毛泽东话语的词语特征
期刊审稿进度表
期刊审稿进度表
词频,一部隐秘的历史
联合发文算不算协办机关发文
期待您的加入