陈淋+屈文建
摘 要 论文选择2003-2014年图书情报学18种CSSCI源刊发表的论文作为研究数据,利用共词分析、聚类分析、战略坐标图等方法动态分析了2003-2006年、2006-2010年、2011-2014年三个时间段的研究主题的分布,认为图书情报学的研究主题演化生命周期符合“增长—分化—成熟—衰亡”的规律,并得出图书情报学的研究热点及研究前沿。
关键词 图书情报学 共词分析 主题演化
分类号 G250
DOI 10.16810/j.cnki.1672-514X.2017.12.003
Abstract This paper chooses papers published in 18 kinds of CSSCI source journals in library and information science during 2003 and 2014 as the research data. It conducts co-word analysis, clustering analysis, strategic diagram and so on to analyse the research topic distribution and evolution in three time periods of 2003-2006, 2006-2010 and 2011-2014. The results show that the evolution life cycle of library and information science is according to the law of ‘growth, division, maturity, decay, and the hot topics and research frontiers of library and information science are revealed.
Keywords Library and information science. Co-word analysis. Subject evolution.
21世纪信息化时代的图书情报学充满未知的机遇和挑战,图书情报学的研究领域不再是单一的文献信息,而更多的是面向数字图书馆、知识服务、竞争情报、网络信息化等方面的研究,图书情报学的研究重点正在转向信息资源管理,图书情报学的学科范式也由图书情报学转向信息管理学,因而,我们很有必要对图书情报学研究主题的演化方式进行分析,如研究该学科目前的研究热点在哪里,且是如何转变的等等问题[1]。
本文在结合前学者研究分析的基础上利用共词分析法、聚类分析和战略坐标法来动态分析我国图书情报学的研究主题演化规律[2-6],通过三个不同时间段的研究主题分布情况,运用Bicomb软件确定高频关键词,生成共词矩阵,而后在此基础上运用聚类分析、类团关系分析和战略坐标法进行研究,分布生成三个时间段的战略坐标图。形象的展现我国图书情报领域不同时期的研究热点以及研究主题演化规律。
1 数据来源和数据处理
本研究从中文社会科学索引数据库中选取18种图书情报学核心期刊作为来源期刊,然后检索2003-2014年间的成果论文,检索条件为:“类型=论文、学科=图书情报文献学、时间为2003-2014年”,共检索到48291篇论文,下载有效的题录数据采取纯文本格式进行保存,采用共词分析方法来实现该学科研究主题的微观层面上的实证分析,本研究分别以2003-2006年、2007-2010年、2011-2014年三个时间段,运用Bicomb软件确定每个时间段的论文数和不同关键词数,同时再根据齐普夫第二定律提出的高频低频词界计算方法,分别计算三个时间段图书情报学领域高频关键词分界点[7],如表1所示。
根据表1可知,三个时间段的论文数量随着时间的推移在不断增加,这表明图书情報学的发展正在走上坡路,不同关键词个数也总体在递增,表明该学科研究方向越来越广泛,另外三个时间段计算得到高频关键词的分界点,累计百分比都接近30%,符合“二八法则”,最后我们分别统计三个时间段的高频关键词如表2、表3、表4所示。
另外,为了更好地对高频关键词进行聚类和网络分析,本研究引入Salton余弦系数对原来的共词矩阵进行预处理,将高频关键词共现矩阵转换成相似矩阵,如表5、表6、表7所示。
2 研究主题的聚类分析和战略坐标分析
2.1 三个时间段的高频关键词的聚类分析
本文将表5、表6、表7所述的矩阵输入到SPSS19.0中,对其进行聚类分析,挖掘高频关键词矩阵中相似性最大的类团,以揭示出不同时间段我国图书情报学领域的研究主题。本研究选择系统聚类中欧几里得距离作为变量距离的测量方法,采用平均联接法作为类间距离的计算方法,通过最后的聚类分析,得到三个聚类树状图,其中2003-2006年共聚类为15个类团、2007-2010年选择把186个高频关键词聚为18类、2011-2014年把189个高频关键词聚为19类。然后通过引入钟伟金等学者提出“粘合力思想”,确定每个类团的名称。因为“粘合力思想”是用以衡量类团内各主题词对聚类成团的贡献程度,表达每个主题在类团中所起作用。在类团中,粘合力度最大的主题词称为“中心主题词”,代表该类团的核心概念。通过粘合力的计算公式得到三个时间段的类团名称如表8、表9、表10所示。
2.2 研究主题的战略坐标分析
在共词分析和聚类分析结果的基础之上,采用绘制战略坐标图的方法可形象化展现每个研究主题内部关联度以及主题与主题间的相互影响,进而揭示学科内研究主题的演化发展情况。绘制战略坐标图主要是以向心度为横轴、密度为纵轴,所有研究主题的向心度和密度的平均值作为坐标原点。目前主要使用以下公式来计算向心度和密度,P表示密度,C表示向心度。P和C的计算公式如下所示[8]:endprint
其中,Eij是关键词的共现频次,n是某一研究领域中关键词的数目,N是共词矩阵中所有关键词的数目,Qs指的是一个研究领域,Q指的是全部的研究领域总体,根据高频关键词共现矩阵和聚类分析的结果,分别计算三个时间段的类团研究主题的向心度和密度,然后基于向心度与密度的数值绘制图书情报学三个时间段研究主题的战略坐标图,如图1、图2、图3所示。
根据三个战略坐标图可知,从各主题所处的象限分布状况来看,2003-2006年位于第一象限内的主题包括7个,分别为:类2(知识管理与服务研究)、类4(高校图书馆大学生信息素质研究)、类5(网络环境下图书馆读者服务与人力资源研究)、类8(信息检索与信息组织研究)、类6(信息服务与参考咨询研究)、类9(公共图书馆管理与服务研究)、类14(数字图书馆与知识产权研究);2007-2011年的类2(知识管理研究)、类5(网络环境下大专院校图书馆以及读者服务研究)、类14(数字图书馆与知识产权研究)、类18(高校图书馆与学科馆员研究) 四个研究主题位于第一象限。2011-2014年类2(知识管理研究)、类8(本体与知识组织研究)、类12(文献计量学研究)、类14(图书馆阅读推广与机构知识库研究)、类17(数字图书馆与移动图书馆研究)、类18(高校图书馆研究)六个研究主题位于第一象限;位于第一象限的主题内部联系比较紧密,且与其他的研究主题存在广泛且密切的关联,它们属于相应时间段内发展较稳定的研究,且处于研究网络的中心。它们是相应时间段内图书情报学的活跃研究主题。
战略坐标图第二象限2003-2006年仅有一个类团——类1(图书情报学理论研究);2007-2010年间有两个研究主题即:类1(图书情报理论研究)和类16(资源共享与图书馆联盟研究);2011-2014年间也仅有类1(学科馆员与学科服务研究)。第二象限内的主题特点是内部关联比较紧密,已经自身形成相对独立的研究领域,但向心度小,表示该主题与其他的研究主题联系不是很密切,在学科中表现较“封闭”,处于边缘阶段,在未来的研究中若没有得到有效的发展,可能会慢慢消失。
位于密度和向心度都较低的第三象限的主题2003-2006年有:类3(数据挖掘研究)、类10(全文数据库与电子期刊研究)、类11(网站评价与评价指标研究)、类12(文献计量学研究)、类13(信息安全、信息管理与电子政务研究)、类15(企业信息化研究);2007-2010年间有:类3(数据挖掘与关联规则研究)、类4(信息素质教育研究)、类7(信息资源共建共享研究)、类8(基于本体或语义网的知识组织与信息组织研究)、类10(企业竞争情报研究)、类11(基于层次分析法的用户满意度与评价指标研究)、类12(文献计量学研究)、类13(电子政务、政府信息研究)、类15(机构知识库与开放存取研究)、类17(Web2.0研究);2011-2014年间有类5(公共图书馆研究)和类19(基于微博的网络舆情研究)类3(大数据与数据挖掘研究)、类4(大学生信息素养研究)、类7(数据资源绩效评价研究)、类9(图书馆服务与管理研究)、类11(基于层次分析法的评价体系研究)、类13(电子政务与政府信息研究)、类15(信息检索研究)、类16(图书馆联盟研究)。该象限内研究主题内部结构不紧密,与其他的研究主题也没有很强的关联度,處于研究刚起步阶段或者研究过程中遇到瓶颈,其发展前景可能发展为研究核心成熟热点,也可能一直无法突破,在整个研究网络中处于边缘位置。
战略坐标图第四象限的研究主题2003-2006年仅有一个类团——类7(资源共享与图书馆联盟研究);2007-2010年有类6(信息服务与信息需求研究)和类9(公共图书馆与图书馆服务研究);2011-2014年有类6(信息服务与信息需求研究)和类10 (竞争情报研究)。第四象限内主题的向心度高,即与其他主题联系紧密,在所属的领域表现也较活跃,是整个研究领域受重视的研究主题,但其密度较低,主题自身内部结构较松散,以致主题容易被分解。总的来说,该领域的研究主题发展潜力很大。
3 研究主题动态演化分析
为了更进一步地观察图书情报学研究主题的动态演化趋势的演化趋势,本文将2003-2006年、2007-2010年和2011-2014年这三个时间段中各个研究主题的向心度和密度整合在一起,可以看出属于同一个主题类团且随着时间推移的变化趋势。
3.1 成熟性研究领域的变化
从上述三个时段叠加的类团可知,位于第一象限外侧的研究主题有2003-2006年间类5(网络环境下图书馆读者服务与人力资源研究)、类14(数字图书馆与知识产权研究),2007-2010年间有类2(知识管理研究)、类5(网络环境下图书馆及读者服务研究)、类18(高校图书馆学科服务研究),2010-2014年间类12(基于知识图谱图书情报学研究)、类14(图书馆阅读推广及机构知识库研究),另外通过对比三个时间段位于第一象限的类团主题,可以发现三个时间段都包含的主题有“知识管理研究”“读者服务研究”“知识产权研究”“数字图书馆研究”“高校图书馆研究”,近十二年持续处于成熟区的研究主题是我国图书情报学领域一直都比较关注的核心热点,且根据坐标图显示,处于外侧的研究主题在未来的几年内可能持续会受研究学者的关注,处于核心领域。
通过三个时间段的战略坐标图对比分析,2003-2014年间,随着时间推移,研究主题从第三象限(或者是未出现在坐标图的主题) 发展为第一象限成熟核心区的有:文献计量学、知识服务与知识组织研究、结构方程模型研究、移动图书馆研究、图书馆阅读推广研究、开放存取研究、本体和语义网相关研究、云计算云服务研究、大专院校图书馆研究,这些研究主题部分为理论研究,部分是技术方法研究,而2003-2006年期间,处于成熟区的研究主题中技术方法类的仅包括语义网研究和XML研究,这表明图书情报学研究主题越来越倾向于技术与理论相互融合、相互交叉的形式。其中文献计量学增长速度最快,大多数学者主要关注图书情报学学术期刊引文计量分析,研究方法也开始多样化,如因子分析、聚类分析以及共词分析、知识图谱等,整个研究主题的内部结构非常紧密,与其他研究主题联系强度也逐渐在增大。“移动图书馆研究”和“图书馆阅读推广研究”是近四年突现的研究热点,近几年发展速度非常快,而图书馆服务追求的目标是让读者在任何时间、任何地点都能够享受到图书馆的服务,随着互联网时代的来临,手机用户的增加,图书馆也需要跟随“社会潮流”,追上发展的步伐,在手机等移动终端上使用图书馆服务,是图书馆服务发展的一种趋势。endprint
3.2 分化主题特征
一般容易分化的主题涉及到的研究内容比较多,通常位于第一象限或第二象限靠近原点的区域。如2003-2006年位于第一象限的主题团类4、类8和类9,随着主题的研究,第一个时间段 (2003-2006年)的类4(高校图书馆信息素养和学科馆员的研究)深入分化成第二个时间段(2007-2010年) 类4(信息素质教育研究) 和类18(高校图书馆学科馆员研究),其中分化后的类18位于第一象限成熟区,类4位于第三象限,以后又分别对应第三阶段(2011-2014年)中第一象限类18和第三象限类4;第一个时间段的类8(基于本体理论的知识组织与信息检索研究) 分化成第二个时间段的第三象限的类8仅代表“基于本体理论的知识组织研究”,而信息检索研究在第二个时间段没有出现在战略坐标图中,到第三个时间段,信息检索研究又重聚为一类,称为类15,出现在第三象限,类8又发展成为第一象限成熟区的研究主题;第一个时间段的类9(公共图书馆服务与管理研究) 到第三个时间段分化为三个类团,分别为类9(大学图书馆服务研究) 处于第三象限、类5(公共图书馆公共文化服务体系研究) 处于第二象限、类16(图书馆联盟研究) 处于第三象限。由此我们可以大致总结出主题分化的特征:分化的过程是先从第一个时间段的分化区开始,分化成第二个时间段或者第三个时间段中的两类,其中一类分化到成熟区,另一类分化到非成熟区,或者一类分化到非成熟区,另一类消失于坐标图中,这表明易于分化的主题较成熟的内容会日益趋向成熟区移动,其他内容可能要经过更长的时间完善,当然也有的主题随着时间的发展,可能不再是研究热点。
3.3 新增主题分布特征
通过观察坐标图的第三象限,第二时间段的类10(竞争情报研究)、类15(机构知识库与开放存取研究)、类17(Web2.0的研究) 和第三时间段的类19(网络舆情研究) 均为新出现的热点。究其主要原因可能是因为新的研究热点刚出现时,它们的研究都不够成熟,且与其他研究联系强度也不大,造成类团的密度和向心度都较低,最终处于第三象限。但同时也观察到,第一时间段出现在第三象限的主题团,随着时间的发展,有的发展较快速,研究主题的密度和向心度都在增大,甚至发展到第一象限(如类12、类10),有的发展的比较慢,还处于第三象限(如类3、类13)。因此新增主题一般分布在第三象限,他们的发展趋势一般都是随着时间的发展而向第一象限移动,不过有的主题发展速度快,有的发展速度较慢。
4 结语
(1) 在高频核心关键词中,数字图书馆、公共图书馆、高校图书馆、图书馆学、图书馆员、图书馆服务、信息服务、知识管理、知识服务、信息资源、电子政务、数据挖掘、竞争情报、情报学等一直都是图书情报学的研究热点,同时,网络舆情、知识图谱、云计算、移动图书馆、阅读推广、社会网络、大数据等研究,在近些年也成为图书情报学新的研究热点。
(2) 图书情报学近几年的核心研究主要分布在信息计量和文献计量学、知识管理与知识组织、移动图书馆、图书馆阅读推广、网络舆情与突发事件、开放存取、竞争情报、大专院校图书馆、电子政务、数字图书馆、图书馆服务、知识产权、本体论、大数据等方面,其研究的方法包括语义网、云计算、数据挖掘、评价体系、绩效评估、资源共享、关联数据、知识图谱、计量分析、各种统计分析等,这说明图书情报学发展拥有著自身独具的特点,也明显带有中国科学发展的历史痕迹。在研究方法上,该学科的研究手段由以前的定性分析为主转换为定量分析方法为主,如数据挖掘、数据分析、文献计量分析方法、社会网络分析、实证研究、建立模型等方法;在研究内容上,不断在原有的基础研究内容上,结合新的研究理念,如移动互联网、社会网络、网络舆情、本体、大数据、微博、知识图谱等,形成图书情报学自己的研究特色,预计未来几年在这些方面的研究将会呈现出快速发展的势头。
(3) 图书情报学研究主题不断有新的研究热点出现,并随着时间推移,有的成为学科的研究核心主题,如文献计量学研究和竞争情报研究。但也有的研究热点会被慢慢遗忘,如参考咨询、复合图书馆、图书馆采访、图书馆采购、企业信息化等研究。同时也有的研究主题会分化为两个甚至更多的研究主题,表明该学科研究主题演化生命周期呈现“增长—分化—成熟—衰亡”的发展规律。一个新的热点刚出现,一般出现在战略坐标图中第三象限的外侧“增长区”,随着研究的发展,慢慢进入分化区,即靠近原点的区域;在分化区的研究主题会呈现两种趋势,一是研究主题中较成熟的部分移动到成熟区(第一象限外侧),二是不怎么成熟的部分研究可能会依然停留在第三象限(边缘非核心区),或消失于坐标轴中;而成熟区的研究主题就是整个学科最核心最受欢迎的研究热点,不过该区域的研究主题达到顶峰的时候,也会开始慢慢消失。
参考文献:
许亮,赵玥.信息哲学:21世纪图书馆哲学研究的新范式[J].图书情报研究,2010(4):1-6.
朱明.国内近十年图书馆管理研究领域的实证分析:基于关键词频次统计及共现分析[J].现代情报,2011,31(5):107-112.
BAIL?N-MORENO R, JURADO-ALAMEDAE, RUIZ-BA?OSR. Analysis of the field of physical chemistry of surfactants with the unified scienctometric model:
fit of relational and activity indicators[J].Scientometrics,
2005,63(2):259-276.
邱均平,温芳芳.近五年来图书情报学研究热点与前沿的可视化分析:基于13种高影响力外文源刊的计量研究[J].中国图书馆学报,2011(2):51-60.
杨爱青.我国图书情报学研究态势的可视化研究[D].曲阜:曲阜师范大学,2012.
何南洋.图书情报学知识图谱的构建及解读[D].上海:上海交通大学,2011.
孙清兰.高频词与低频词的界分及词频估算法[J].中国图书馆学报,1992(2):78-81,95-96.
崔鹏,孙宝文,王天梅,等.基于共词分析的网络虚拟社会领域热点及演进态势研究[J].情报杂志,2013(2):40-44,56.
陈 淋 广州大学华软软件学院网络技术系教师。广东广州,510900。
屈文建 南昌大学管理学院信息管理系副教授。江西南昌,330031。
(收稿日期:2016-10-20 编校:刘 明)endprint