《中国图书馆学报》科学知识图谱分析*

2012-10-23 05:32杨九龙
图书馆学刊 2012年2期
关键词:图书馆学图谱学报

杨九龙 林 强

(西北大学公共管理学院,陕西 西安 710127)

以往对学术期刊的研究大多采用传统文献计量法,但其最大缺陷是易使读者困惑于大量统计数据中,不便形成直观形象的认知。在信息技术的推动下,科学知识图谱逐渐发展为研究的新领域,当前已成为科学计量学的一个新热点。笔者借助科学知识图谱,对《中国图书馆学报》(以下简称《学报》)近10年的文献进行作者合作分析、机构合作分析、关键词共词分析、文献共被引分析,以展示《学报》的研究力量分布、学术代表人物以及相关的重要学术文献,分析其热点领域、前沿主题以及所依赖的知识基础。

1 数据来源与研究方法

进入CSSCI检索界面,选择“来源文献”按钮,并在刊名处输入“中国图书馆学报”,得到所有被收录的1625条文献条目。下载从2001~2010年间共10年的题录数据,存储文件格式为文本文件。选择美国Drexel大学信息科学与技术学院教授陈超美博士基于Java平台开发的软件CitespaceⅡ为可视化分析工具,该软件是一种适于多元、分时、动态的复杂网络分析的新一代信息可视化技术,其独特之处在于绘制的科学引文网络知识图谱,可展示学科最新前沿领域及其演化的进程[1]。

2 分析与结果

2.1 研究机构分析

在CitespaceⅡ软件界面,网络节点选择机构(Institution),主题词来源选择文献标题(title)、摘要(abstract)、关键词(descriptor)和标识符(identifiers),算法选择路径搜索(pathfinder)算法,数据抽取对象为top30,设置“Time Slicing”的值为l,即将2001~2010年分成10个时段进行处理。运行CitespaceⅡ得到有关《学报》研究机构的聚类图谱。其中,圆形节点代表研究机构,节点的大小代表该机构的发文量,节点越大,则该机构的发文量越多。节点间的连线代表机构间的合作关系,连线的粗细代表机构间合作的次数,连线越粗,代表机构间合作越密切。

图1 《学报》研究机构聚类图谱

图1显示,《学报》的论文主要来自武汉大学信息管理学院、北京大学信息管理系和南京大学信息管理系为中心的3个聚类簇。结合表1,从各个节点的发文频次看,武汉大学信息管理学院的文献贡献率最大,远高于其他机构,其次是北京大学信息管理系和南京大学信息管理系,三者成为《学报》的核心研究力量;从研究机构的属性看,《学报》的研究力量主要集中在高校相应的信息管理院系,而图书馆的研究力量相对薄弱。

表1 《学报》研究机构的相关信息统计

由图1也可以发现,《学报》的研究机构分布比较分散,很多机构为孤立的点,仅部分机构与其他机构有合作关系,但多是与本区域间机构的合作。可见《学报》中的研究机构相对封闭,交流较少。表2显示的是发文突增率居于前6位的研究机构,说明这6个研究机构发文量具有较大的突破,成为《学报》新兴研究力量。

表2 《学报》研究机构发文量突增率(前6位)

2.2 作者分析

表3列举了近10年《学报》发文量在15篇以上的作者,通过对高产作者的分析可以看出,这些学者都是图书情报领域的核心研究学者,足见《学报》的权威性。在CitespaceⅡ软件界面,网络节点选择Author,其他选择策略不变,运行CitespaceⅡ得到有关《学报》作者的聚类图谱。图2显示,网络主要由许多孤立的节点组成,节点间的连线非常少,没有形成以某个节点为中心的聚类簇。可见,《学报》虽然有着高影响力的作者,但是这些作者之间合作很少,并没有形成核心作者群。

表3 《学报》作者发文量统计

2.3 关键词共现分析

图2 《学报》作者共现图谱

词共现网络分析也叫共词分析,是一种文本内容分析技术,它通过分析在同一个文本主题中的款目对(单词或名词短语对)共同出现的形式,确认文本所代表的学科领域中相关主题的关系,进而探索学科的发展。关键词是学术论文的一个重要组成部分,虽然往往只是几个词,在论文中所占篇幅比较少,但却是论文的精髓,不仅可以利用关键词检索到文献,还可以通过关键词了解到文献涉及的领域和内容。通过对高频关键词的分析,可以发现一种期刊的关注领域和研究热点[2]。在CitespaceⅡ中,网络节点选择Keyword,设定阈值为4、4、21,表示图3中的关键词满足出现次数大于4次,共现次数大于4次,词间相似系数大于0.21这3个条件。

图3 《学报》关键词共现图谱

图3中各个圆圈的大小表示关键词出现频次的多少,圆圈越大说明相应关键词出现次数越多。值得注意的是,图3也可以清晰地表现出关键词共词程度的高低即关键词的中心性,关键词在共现网络中的中心性越强,该关键词与其他关键词共同出现的几率越多,该关键词在共现网络中的影响力自然就越大。从知识理论的角度来看,频次和中心性高的关键词一般都是一段时间内众多研究者共同关注的问题,也就是研究的热点[3]。可以看出,《学报》最为关注的主题是“数字图书馆”,在整个网络中共现频次达221次。“数字图书馆”概念一经提出,就得到了各国图书馆界的广泛关注,纷纷组织力量进行探讨、研究和开发。20世纪90年代,数字图书馆开始进入筹备建立阶段,90年代末至今迅速发展,已经成为图书馆学普遍关注的热点。位居第二位的主题是“图书馆”,共现频次达212次,可见,《学报》一直紧密围绕自己的研究领域,与办刊宗旨十分吻合。“信息服务”作为图书馆学的传统、重点研究领域,也是《学报》的一个研究热点,同时“信息服务”是整个网络中心性最高的节点,它是连接开放存取、高校图书馆、服务理念、读者工作、信息管理、信息资源共享、信息资源建设、知识创新等领域的中心节点。此外,“图书馆学”这一关键词表征图书馆学的理论研究,理论研究作为一个学科的基石,一直以来都是一个学科的研究核心,《学报》作为图书馆学领域的权威期刊自然是十分关注。

根据陈超美博士的研究,研究前沿是指“一组突现的动态概念和潜在的研究问题”。这里定义的研究前沿,是强调新趋势和突现(Burst)的特征,而突现测度的是文献被引频次或关键词出现次数等的变化率。这样研究前沿就可以看作在某一时段内,以突现词(burst terms)为知识基础的一组文献所探讨的科学问题或专题[4]。CitespaceⅡ可以在识别突现词的基础上,给出这些突现词所在文献,为我们准确快速地辨识和探测研究前沿提供了重要的分析工具。因此,通过近10年《学报》文献关键词的突现情况可以探测其关注的研究前沿主题。结合表4、表5可以看出,“知识管理”、“公共图书馆”、“网络环境”是突现率最高的3个关键词,其中“知识管理”属于趋弱型前沿主题,在2005年到达顶峰后,共现频次逐年降低,受关注程度逐渐降低。“公共图书馆”与网络环境属于渐增性主题,近年来,公共图书馆的发展呈现出良好势头,这也使得越来越多的学者把关注焦点转移到了公共图书馆的发展上来,而网络环境与当前信息技术的变革和信息社会的发展紧密相连。可见,《学报》对学科领域的主旋律把握得十分准确。

2.4 文献共被引分析

利用CitespaceⅡ绘制文献共被引网络图谱是展示学术期刊所依赖的知识基础的重要方法。《学报》的知识基础分析可以分为两类:一是由研究领域的早期奠基性文献组成;二是由一组共被引频次和中心性都比较高的核心文献组成。通过对这些节点的分析,可以对《学报》的知识脉络进行很好的梳理。为此,网络节点选择Cited Reference,阀值选择为(3,3,16)、(3,3,18)、(3,2,20),分别在前、中、后3个时间分区中设定引文数量、共被引频次和共被引系数3个层次的阀值,其他策略不变。运行CitespaceⅡ,获取时间序列图谱(timeline)和聚类图谱(cluster view)。

表4 《学报》高频词和高中心性关键词

表5 《学报》关键词突现率

2.4.1 《学报》奠基性节点分析

从图4中可以看出,第一篇奠基性文献是吴慰慈于1985年出版的专著《图书馆学概论》。该书对图书馆学的学科体系、图书馆社会职能、类型、图书馆事业、图书馆网、图书馆工作、图书馆科学管理、图书馆现代化等内容进行系统阐述,首次印刷便达5万册。其后又出了修订版,评论者[5]认为这本书博众家之说,采名家之长,尊重图书馆学规律,理论联系实际,是中国图书馆学术史上的世纪经典和里程碑。

第二篇奠基性文献是周文俊于1986年出版的专著《文献交流引论》。该书论述了文献交流的性质、交流的系统结构、交流渠道和交流层次,关于文献交流中专业人员、机构、读者需求及整个文献交流工作的分析研究,关于文献交流标准化和文献交流障碍的产生及疏通的分析阐述。刘兹恒[6]认为该书是20世纪80年代我国重要的图书馆学基础理论著作,创立的文献交流学是中国图书馆学家对世界图书馆学理论做出的一大贡献。

图4 《学报》奠基性文献的时间序列图谱

另外一篇文献是宓浩于1988年出版的专著《图书馆学原理》。该书由知识、文献引出知识交流中的图书馆活动,从社会知识交流的历史进程探讨图书馆的起源演化,说明图书馆活动的社会化过程和整体化过程。考察构成图书馆活动的内在基本要素,讨论图书馆的工作对象与服务对象——文献与读者,图书馆的工作内容及其内在机理。系统讨论了图书馆学的学科基本理论问题、方法论、学科史,以及未来展望。全书的主旨是把图书馆活动放在知识交流的框架中运转。

最后一篇是刘洪波于1991年在《图书馆》上发表的论文《知识组织论——关于图书馆内部活动的一种说明》。作者认为知识交流论把研究重点放在图书馆与社会的联系上,而较少关注图书馆的内部活动,对图书馆的“非直接参与交流”的活动,缺乏理论解释,触不到本质。认为应当考虑完善知识交流论,建立能说明图书馆内部活动的理论规范,使人们对图书馆全部活动的本质有更加清晰的认识。据此,提出图书馆内部活动的实质是知识组织,论述了图书馆知识组织的原理、特点,并设想了未来图书馆知识组织的方式。

2.4.2 《学报》关键性节点分析

一种学术期刊依赖的知识基础将随着时间的变迁而不断延伸和拓展,最终形成它的核心文献集合,并进而表现为该期刊的高被引文献簇。图5中每个圆形的节点代表一篇文献,节点的大小代表该文献被引用的多少,节点越大,这篇文献被引用频次越高,而节点圆圈所展示的不同颜色年环则描述了该节点在不同年份的引文时间序列,年环的厚度与相应年份的引文数成正比。点的中心性是一个用以量化点在网络中地位重要性的图论概念,在不同的聚类网络中可以起到连接和桥梁的作用。在网络分析理论中,点的中心度是指其所在网络中通过该点的任意最短路径的条数,是网络中节点在整个网络中所起连接作用大小的度量。因此,在文献被引图谱中,中心度大的节点相对容易成为网络中的关键节点[7]。

图5 《学报》关键被引文献图谱

结合表6,按照节点在共引网络中的中心度大小,排在首位的是徐引篪的《现代图书馆学理论》。该专著的共被引频次为26,中心度为0.26,是网络中最大的关键节点。该书探讨了现代图书馆学的研究对象和学科体系、东西方图书馆学说流派和学说、图书馆透析、图书馆类型的理论重组、人类需求的图书馆、信息市场中的图书馆、网络时代的图书馆等内容。孟广均教授评价此书时指出[8]:“这是一部视野宽广,内容丰富,具有独立见解和鲜明时代特征的图书馆学专著,是80年代中期之后我国图书馆学理论研究的又一杰作。”

排在第2名的是张晓林于2000年发表的《走向知识服务:寻找新世纪图书情报工作的生长点》一文。该文认为现代信息环境对图书情报工作提出了挑战,知识经济对图书情报工作形成冲击,应建立“知识服务”核心能力,重新定位市场和地位,提出了知识服务的运营模式,指出应通过竞争创新迎接知识服务的挑战。

排在第3名的分别是王子舟于2003年出版的专著《图书馆学基础教程》和高文于2000年出版的专著《数字图书馆——原理与技术实现》。这两部著作在共引网络中的中心度都为0.10,被引频次各为22和14。《图书馆学基础教程》以知识论为立场,对图书馆学众多理论问题进行了深入梳理与研究,提出了“知识集合”等重要命题,认为应根据客观知识、知识集合,知识受众及其相互之间关系来建立图书馆学的研究客体体系。评论者认为该书是追寻图书馆本质的新成果。后者以宏大的篇幅系统阐述了分类与数据描述标准、XML、多媒体数据管理、中间件、交互界面与内容表现、内容检索与个性化服务、数字水印与版权保护,是国内数字图书馆研究方面的奠基之作。

表6 《学报》关键节点信息

位居第4位的是范并思于2004年在《学报》上发表的论文《公共图书馆精神的时代辩护》。文章指出公共图书馆精神的发展历程经历了平民化、社会教育和民主社会的保障3个阶段。公共图书馆精神实质是保障社会成员获取信息机会的平等,从信息知识角度维护社会公正。信息时代仍需要公共图书馆机构/制度来维护社会信息公平。公共图书馆精神已成为推动图书馆事业发展的动力。此外并列第4位的还有蒋永福于2000年在《图书馆建设》上发表的论文《知识组织论:图书情报学的理论基础》。文章指出图书情报工作的实质是知识组织,分类法和主题法是知识组织工具,认为知识组织理论是最具本质意义的图书情报学理论基础。

借助CitespaceⅡ软件提供的Citation History和详细被引信息,可以分析上述文献的历史受引轨迹和引文突增模式。从图6可以看出,《现代图书馆学理论》作为近10年《学报》中心性最高的著作,其被引时间主要集中在2002~2007年,从该篇文章的历年引文主题来看,可知它是研究图书馆学基础理论最重要的参考文献。

图6 徐引篪(1999)

张晓林于2000年发表的论文《走向知识服务:寻找新世纪图书情报工作的生长点》作为被引频次最高的文献,期间几乎一直处于被引状态(由于CSSCI数据库中2010年数据收录不完整,故2010年数据不能反映完整信息),并且被引次数分布平均,充分显示了其在图书馆学领域的深远影响。

图7 张晓林(2000)

图8 王子舟(2003)

王子舟的《图书馆学基础教程》引文突增时间段分布在2004~2006年,并在2006年达到最高,频次为6,见图8,此后也屡被引用。

高文等撰写的图书《数字图书馆——原理与技术实现》作为国内较早详细介绍数字图书馆的论著,其被引时间集中在2001~2003年,2004年后,由于关于数字图书馆的专著和论文逐渐增多,该文献没有再被引用过,如图9。

图9 高文(2000)

图10 范并思(2004)

范并思于2004年发表的论文《公共图书馆精神的时代辩护》高被引时间集中在2005年和2006年,之后被引频次逐渐减少,在2009年时被引次数有小幅增长,见图10,这与公共图书馆免费开放的趋势有着一定的关联。

图11 蒋永福(2000)

蒋永福的论文《知识组织论:图书情报学的理论基础》被引时间集中在2002、2003这两年,见图11。通过分析该篇文章的受引主题,可知它是联系信息组织、知识组织和知识管理等研究方向的最好中介。

3 结语

笔者以《学报》为研究对象,通过最新信息可视化技术CitespaceⅡ软件的分析和处理,用知识图谱的方式展示了《学报》的研究力量分布、学术代表人物以及相关的重要学术文献,分析了近10年《学报》的热点领域、前沿主题及所依赖的知识基础,由此得出以下结论。

①通过绘制《学报》的研究机构图谱,发现《学报》的研究机构主要分布在高等学校的图书情报教学单位,研究力量相对分散,交流合作不够紧密。

②通过绘制《学报》的作者共现图谱,发现《学报》虽然有着高影响力的作者,但是这些作者之间合作很少,并没有形成核心作者群。

③借助CitespaceⅡ绘制的文献共引网络图谱,从两个层面分析了《学报》所依赖的知识基础构成:一是《学报》的奠基性文献,这组文献包括徐引篪于1999出版的专著《现代图书馆学理论》、周文俊于1986年出版的专著《文献交流引论》、宓浩于1988年出版的专著《图书馆学原理》以及刘洪波于1991年在《图书馆杂志》上发表的论文《知识组织论——关于图书馆内部活动的一种说明》。二是共被引频次和中心性都比较高的关键文献集合,该文献集合构成了数字图书馆、公共图书馆和图书馆学等众多热点主题的研究基础与支柱。

④借助CitespaceⅡ绘制的关键词共现网络图谱,分析了近10年《学报》所关注的热点领域,其中数字图书馆是关注度最高的热点。此外,在识别突现词的基础上(Burst terms)分析出了《学报》关注的前沿主题,包括知识管理、公共图书馆、网络环境、电子政务、信息服务、本体等,这将是研究者今后需重点关注的议题。

[1] 刘则渊,陈悦,侯海燕.科学知识图谱:方法与应用[D].北京:人民出版社,2008:3.

[2] 姜春林,杜维滨,李江波.经济学研究热点领域知识图谱:共词分析视角[J].情报杂志,2008(9):78-80,157.

[3] 侯剑华,陈悦,王贤文.基于信息可视化的组织行为领域前沿演进分析[J].情报学报,2009(3).

[4] 侯剑华.工商管理学科前沿和热点演进的可视化分析[D].大连,2009.

[5] 白雅琴.中国图书馆学术史上的里程碑——评《图书馆学概论》.修订版[J].新世纪图书馆,2006(1):9-10.

[6] 刘兹恒,潘梅.及之知而后知履之而后艰——纪念周文骏先生《文献交流引论》出版20周年[J].中国图书馆学报,2007(1):80-84,95.

[7] 张玲玲,华薇娜.基于知识图谱的国际远程教育研究[J].现代远程教育研究,2011(3):48-53.

[8] 孟广均.一本值得推荐的专业理论读物——序论《现代图书馆学理论》[J].中国图书馆学报,1999(2).60-61

猜你喜欢
图书馆学图谱学报
《北京航空航天大学学报》征稿简则
绘一张成长图谱
致敬学报40年
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
学报简介
学报简介
寂寞与喧嚣:当代图书馆学研究现状剖析
中国图书馆学之当下:反思与瞻望
广西图书馆学会2013年年会暨第31次科学讨论会在贵港举行