刘伙玉
(南京大学信息管理学院 江苏南京 210093)
基于CNKI的图书、情报学与档案学学科文献半衰期分析*
刘伙玉
(南京大学信息管理学院 江苏南京 210093)
引用半衰期与被引半衰期是讨论文献、学科、期刊老化的重要指标。文章以学科分类号为划分标准,以图书馆学、情报学与档案学为研究对象,讨论分析上述各学科的学科引用半衰期和学科被引半衰期特点,以及影响半衰期大小的相关因素。在图书馆学、情报学与档案学学科半衰期实证数据基础上,进一步分析了学科引用半衰期和学科被引半衰期间的内在相关性。
图书馆学;情报学;档案学;学科半衰期;引用半衰期;被引半衰期;引文分析
文献老化是图书馆学、情报学与文献学学者研究的重要内容,半衰期研究是文献老化的主要方法。英国学者Bernal JD从历时角度观察到文献老化现象,提出用“半衰期”来表征文献情报老化速度,而美国学者Burton和Kebler则从共时角度提出文献的半衰期概念。自半衰期概念提出以来,学者围绕半衰期来考察文献老化现象开展了大量研究。罗式胜分别对期刊引用半衰期和期刊被引半衰期的概念、计算方法、意义等进行了系统介绍,并将半衰期的概念进一步推广至学科、作者、机构、国别等。李玉珍、王崇德等对文献半衰期的计算方法进行了探讨,张黄群等对半衰期与其他有关指标进行了相关性研究。在图书情报学与档案学领域,黄利平以图书情报和管理学领域25种期刊为研究对象对半衰期进行了实证研究,陈子玲对图书馆学期刊文献老化进行了分析,方一言研究了档案学期刊的文献老化等。综合对以往文献半衰期的研究可知,大多数半衰期研究都是针对期刊引用半衰期和期刊被引半衰期展开的,以学科为计量对象的半衰期研究还相对较少,而这正是本文研究的切入点。
本文利用CNKI数据库中(2010~2012年)图书馆学、情报学与档案学的中图分类号检索结果,从学科引用半衰期和学科被引半衰期视角探讨了学科间的文献老化差异,并分析影响各学科文献老化的主要因素。最后,还从原理上揭示了学科引用半衰期与学科被引半衰期之间的密切相关性。
本研究以CNKI数据库为工具,根据《中国图书馆图书分类法》(第四版)中的学科分类号,统计了时间跨度为2010~2012年,分类号为G25(图书馆、图书馆事业)、G27(档案学、档案事业)、G35(情报学、情报工作)的学术文献作为学科引用半衰期和被引半衰期的统计对象(相关年度各学科发文情况和引用及被引情况见表1)。需要说明的是,CNKI数据库中文献来源数据库主要包括期刊、特色期刊、博士论文集、硕士论文集及2013增刊、国内会议、国际会议、报纸、年鉴等库,不包含图书信息,而来源文献的引证文献中包含图书信息;被引数据库中有关图书信息记录的具体被引情况无法获取,另外,在CNKI的引文数据库中也没有收录该库尚未收录期刊全文的文献,故可以认为被引数据库不包含图书信息和CNKI未收录期刊的被引论文;在后文会对此进行相关说明。
从发文及引用概况可以看出2010~2012年G25(图书馆、图书馆事业)各年的年发文量都是最多的,超过G27(档案学、档案事业)和G35(情报学、情报工作)年发文量的总和,其参考文献数量和年被引频次也是最多的,三年平均的篇均参考文献数量和篇均被引频次分别为4.64和3.76;G27的年发文量排在第二位,约为G25的1/2,三年的篇均参考文献数量和篇均被引频次分别为1.78和1.45;G35虽然年发文量是最少的,但其三年的篇均参考文献数量和篇均被引频次最大,分别为8.41和4.88。从篇均参考文献数量和篇均被引频次可以初步看出档案学的引用和被引都较少,学科相对封闭;而情报学学科内交流以及与其他学科的交流都较活跃。从总体来看,三个学科的篇均参考文献数量和篇均被引频次都在逐年增长,这说明三个学科的学科内外交流在不断加强,学科质量在不断提高。
表1 CNKI(2010~2012年)图书馆、情报与档案学发文及引用被引概况
3.1 学科半衰期概念及计算方法
3.1.1 学科引用半衰期的概念及计算方法
就单个文献的引用来说,引用行为可以说是文献作者的一种主观行为,其可能引用不同学科、不同地域、不同语种、不同作者、不同发表年代的文献;但就一个学科来说,在学术规范的前提下,引用行为不能单纯认为是一种主观行为,其可以客观地反映一个学科对于某一其他学科、某一研究主题或某一年度发表的文献关联程度的不同。而学科引用半衰期就是从参考文献发表年代的角度,用来衡量该学科对于过去历史文献时效跨度长短要求方面的指标,换句话说,学科引用半衰期用于表示该学科对距今多长时间跨度内的研究特别关注,一般通过参考文献部分的被引文献发表时间来计量。本文将学科引用半衰期定义为:某学科在T年所引用的参考文献中的50%(较新那部分)是在最近(以T年为第0年)多长时间内出版(发表)的。某学科引用半衰期短,则意味着该学科的文献更关注近期发表的学术文章,紧跟较新的研究成果,其表现为学科所有文献中引用的参考文献有一半是短期内发表的;反之,则表示该学科对发表时间较久的文献更感兴趣,更关注早先发表的文章。
根据学科引用半衰期的定义,给出了学科引用半衰期(H1)的计算方法:H1=A+(50%-B)/(C-B)
其中:A为累积百分比接近50%的年数;B为累积百分比最接近50%的那年的累积百分比;C为累积百分比刚超过50%的那年的累积百分比。
以图书馆学为例,计算该学科2012年的引用半衰期:累积百分比(见表2)最接近50%的为2009年的44.01%,其对应的年数为3,因此图书馆学2012年学科引用半衰期为:
表2 图书馆学2012年所引参考文献按出版年代累积百分比分布
3.1.2 学科被引半衰期的概念及计算方法
学科被引半衰期是指某一学科文献在指定年份被引用的全部次数中,较新的一半被引文献发表的时间跨度,具体定义为:某学科在T年(通常为一年时间内)被引用的全部文献中较新的一半是在最近(以T年为第0年)多长时间内发表的。一般来说,最新发表的文献具有最强的生命力,然而随着时间的推移,其生命力会逐渐衰退,受到研究者的关注和引用也就会越来越少。那么,被引半衰期越长,说明该学科文献老化速度越慢,被利用时间越长,生命周期越长;反之,该学科文献老化速度越快,被利用时间越短,文献的生命周期越短。
学科被引半衰期的计算方法和学科引用半衰期的方法基本是类似的。以图书馆学为例,计算该学科2012年的被引半衰期:累积百分比(见表3)最接近50%的为2009年的46.13%,其对应的年数为3,因此图书馆学2012年学科被引半衰期为:
H2=3+(50%-46.13%)/(57.37%-46.13%)=3.34
表3 图书馆学2012年被引文献按出版年代累积百分比分布
学科引用半衰期和学科被引半衰期都是反映一个学科文献老化速度的指标。假设一个学科是封闭的,不与其他任何学科发生交流,那么该学科的引用半衰期和被引半衰期的值会相等,但在实际中,某个学科或多或少会与其他学科发生不同程度的交流,不过学科内的交流必然是占主导地位的。在某个学科所引用的参考文献中,既有本学科内的文献,也有其他学科的文献;同样的,某个学科的文献既会被本学科的文献引用,也会被其他学科的文献引用。这就导致了学科引用半衰期和被引半衰期在数值上的差异,后文中对学科引用和被引半衰期的差异会作具体的分析与介绍。
3.2 学科半衰期在图情档学科中的应用
3.2.1 图情档学科引用半衰期分析
根据图书馆学、档案学、情报学三个二级学科在2010~2012年的引用数据,以及前文关于引用半衰期计算方法的介绍,本文计算得到了三个学科三年的引用半衰期(见表4)。
表4 图书馆学、档案学、情报学2010~2012年引用半衰期
可以看出2010~2012年学科引用半衰期的排序都为情报学>档案学>图书馆学;整体图情档领域的引用半衰期介于图书馆学和档案学之间。
情报学是在图书馆学和档案学的基础上发展起来的,后两者都为情报学的研究提供了信息源,其2010~2012年引用半衰期在3.97~4.40之间,平均为4.25,三年的引用半衰期都是最长的。可以看出相对于较少的载文量,情报学的篇均参考文献数量远远大于另外两个学科,这很符合情报学的学科特点,以各类文献作为自己研究的信息源,学科内外交流较多。情报学的学科引用半衰期最长,这不仅说明情报学文献本身的生命周期长于其他两个学科,更重要的是,情报学是一个交叉性很强的学科,更多地将其他学科较为成熟的成果应用于其自身研究中。细致分析情报学论文本身,单纯以情报学(G35)作为分类号的文献,其中研究情报资料处理的文献约占该学科总文献量的50%,而研究情报资料处理的文献一般都是侧重理论与方法的,如情报分析方法、情报分析处理技术、学科期刊等的评价指标与方法等。一般而言,理论性较强的学科其引用半衰期较长。这些都说明了情报学文献的引用半衰期长于其他两个学科的原因。
档案学的学科引用半衰期介于情报学和图书馆学之间,大于图书馆学,略低于情报学,三年均值为4.11。相对于人文社会科学领域的许多学科,档案学是一门年轻的学科,旨在探索档案学、档案工作和档案事业的发展规律,研究档案信息资源的管理与开发的理论、原则与方法,也偏向于理论与方法的研究。但档案学篇均参考文献数量和篇均被引频次都较低,这说明档案学发展相对封闭,学科内的交流以及与其他学科的交叉和渗透尚显不足。档案学的引用半衰期相对较长,说明档案学文献更关注于较长时间跨度内发表的文献,这也从侧面反映出档案学研究近年来缺乏重大创新性研究成果。
图书馆学的学科引用半衰期最小,说明和其他两学科相比,其对于更短时间内发表的文献更感兴趣,对于文献的时效要求更高,换句话说图书馆学发表的文献更喜欢引用近期发表的文献,这与下文笔者提到的图书馆学近年来研究内容变化是直接相关的。笔者认为,学科引用半衰期与该学科统计当年的研究重点有密切联系,如果该学科当年研究重点是新的热点问题,是一个新兴领域,那么它的参考文献就会偏向于选择近期发表的与该热点相关的文献。
3.2.2 图情档学科被引半衰期分析
本文对图书馆学、档案学、情报学三个二级学科在2010~2012年的引文数据进行了分析,根据前文关于被引半衰期的计算方法,得到了三个学科在这3年的被引半衰期(见表5)。
表5 图书馆学、档案学、情报学2010~2012年被引半衰期
通过观察各个学科的学科被引半衰期具体值,笔者发现2010~2012年三年被引半衰期排序皆为:档案学>情报学>图书馆学;但档案学和情报学较为接近,差值较小,而图书馆学与其他两者差值相对较大。
图书馆学2010~2012年被引半衰期在2.89~3.34之间,平均为3.14,各年都低于档案学和情报学。这说明图书馆学文献的老化速度要快于档案学和情报学,生命周期较短。可以看出,图书馆学年载文量最大,年平均总被引频次最多,篇均被引也较高。这说明被引半衰期和载文量、总被引频次没有直接的联系,从高载文量和高被引频次可以看出图书馆学是一个发展较为繁荣的学科,发展历史相对较长。虽然图书馆学在图书、情报与文献学学科发展中较为成熟,但由于近年来网络环境、信息技术对图书馆学研究的影响,因而学科研究内容产生了较大变化,更多地与网络环境相结合,如数字图书馆、虚拟图书馆、图书馆2.0、图书馆数字资源整合以及个性化图书馆服务等方向的研究,这在一定程度上使得图书馆学被引半衰期缩短。
档案学和情报学的被引半衰期较接近且较长,三年的均值分别为3.43和3.42,说明这两个学科与图书馆学相比,文献老化速度相对较慢,生命周期相对较长。档案学被引半衰期较长一方面说明其文献生命周期较长,另一方面也说明其学科研究内容偏重于理论,笔者通过分析中图分类法以及其相应分类号发表文章情况,发现档案学研究侧重于具体的档案工作与档案管理,更多的是理论研究。另外,档案学近几年发表文献数量增长快也是导致其被引半衰期较长的因素之一。
情报学2010~2012年被引半衰期在3.15~3.61之间,平均为3.42,略低于档案学,但长于图书馆学。从表1看出相对于较少的载文量,情报学的总被引频次和篇均被引都较高,这也在一定程度上说明情报学文献质量较高,学术影响力较大。情报学侧重于研究情报资料的分析处理,同时笔者通过分析发现情报学中研究情报分析方法理论与应用的文献被引频次处于较高水平,如《关于内容分析法的研究》《国外知识管理研究范式——以共词分析为方法》《社会网络分析法及其在情报学中的应用》《期刊评价指标体系及定量方法研究》截止到2013年被引次数分别为203、139、116、78,说明情报学中这些研究领域长期以来一直得到学界的关注,因此该领域文献生命周期较长,被本学科内文献以及其他学科文献引用较多,使得情报学的被引半衰期较长。
总的来说,三个学科之间的引用半衰期和被引半衰期有差异,但差值不大,分别在0.09~0.87之间和0.01~0.31之间,这说明在图情档领域三个二级学科的相似性较高,进一步说明图书馆学、情报学、档案学都是以研究信息(文献)为核心内容的学科,它们各自独立而又密切联系,其研究学者、专业期刊、研究工作学科交叉现象非常普遍。在如今信息化、数字化的环境下,图书馆学、情报学、档案学也呈现出一体化的趋势,学科间的交叉、渗透越来越多。
无论是学科被引半衰期还是学科引用半衰期,图情档领域总的学科半衰期都略大于图书馆学,与图书馆学更加接近,这主要是因为无论是载文量还是被引频次、参考文献总数量,图书馆学都要远远大于其他两个学科。究其原因,图书馆本身更趋向于社会化,从事图书馆学研究和图书馆工作的人员众多,图书馆学期刊也远多于其他两个学科的期刊。同时,许多档案学、情报学研究者和工作者也出自图书馆学。
3.2.3 图情档学科引用半衰期与被引半衰期对比分析
学科引用半衰期和学科被引半衰期都是反映学科发展的重要指标,两者既相互区别,又密切联系。笔者试图通过对两个半衰期进行对比(对比数据见表6),发现其差异以及产生差异的原因,并探讨两者之间密切的联系。
表6 图书馆学、档案学、情报学2010~2012年被引半衰期与引用半衰期对比
可以看出图书馆学、档案学、情报学三个学科的引用半衰期和被引半衰期都在逐年小幅增长,并显示出继续增长的趋势,这一现象表明图情档学科的研究热点持续时间越来越长,同时也表明文献老化的速度在减慢,科学研究成果的生命周期在延长,一定程度上也说明图情档学科科学研究沿袭性、连续性增强,相关的研究工作难度增加。分析其原因,主要有以下因素:一方面,图书馆学、情报学与档案学文献质量在逐渐提高,学者也更加注重对他人成果的引用;另一方面,近年来学科研究的热点引起了学者的一致重视,如数字图书馆、知识组织、知识服务等主题,这些广泛引起重视的主题有一些影响力较大的成果,具有较高的被引次数,因而使得学科整体上引用半衰期和被引半衰期增加。如笔者分别以“数字图书馆”、“知识组织”或“知识服务”为关键词、主题词进行检索,被引频次超过50的论文数量分别为269、128。
虽然学科引用半衰期和学科被引半衰期都是反映一个学科文献老化速度的指标(从某种意义上讲并非是一个学科,因为在计算学科半衰期时涉及到了其他学科,一个学科可能引用其他学科的文献,该学科的文献也可能被其他学科引用,但学科内的引用与被引占主导地位),但两者也有区别:(1)性质不同:学科引用半衰期是主动行为,是本学科的文献对其他文献的引用行为,学科被引半衰期是被动行为,包括本学科及其他文献对本学科文献的引用;(2)文献范围不同:前者研究范围是文献中的参考文献,其中可能包括各学科的文献,后者研究范围是所有学科引用本学科的文献,因此它的范围仅限于本学科文献;(3)意义不同:学科引用半衰期和被引半衰期的长短所代表的意义不同,这一点可以通过(1)、(2)体会到。
从表6的数据可以看出,三个学科被引半衰期和引用半衰期都随着年代增加而增大。从表面数值上来看,学科被引半衰期相对较长,其学科引用半衰期也会相对较长,这说明学科被引半衰期和学科引用半衰期存在着一定程度的整体正相关性。为何两者会存在较强的相关性呢?通过进一步的分析,笔者认为,针对一个学科而言,引用与被引大多发生在学科内的文献中,学科内的文献A引用了学科内的文献B,那么同时也就是说学科内的文献B被学科内的文献A引用了,该引用行为同时触发了被引行为。甚至可以认为引用其实在某种程度上决定着被引,因为有了引用才会有被引。所以说如果假定引用行为与被引行为都发生在一个学科内部,那么引用的总量其实就等于被引的总量。当然不排除学科与学科之间的引用关系,但也存在学科之间的互引,其余单向的引用与被引行为只占小部分,在此可以暂时不予考虑。譬如说2012年学科引用半衰期延长了,说明2012年该学科发表的文献对更久以前的研究成果增加了引用,这会直接导致该学科2012年的被引中有较多被引来源文献发表在更早的时期,因而被引半衰期也延长了。综上所述,学科被引半衰期和学科引用半衰期在根本上存在着紧密的联系。
同时也可以发现,三个学科2010~2012年各年的学科引用半衰期都大于被引半衰期。其原因可能在于:
(1)数据源的问题,CNKI数据库中引文数据库不包含图书信息,而来源文献的引证文献中包含图书信息。一般期刊论文或学位论文的生命周期较图书的生命周期要短,大多数论文在发表3~5年后被引会急剧减少,而图书的生命周期较长,一般发表8~10年,甚至几十年后被引仍较多。这在一定程度上使得计算学科引用半衰期时被拉长。
(2)学科内与学科外引用与被引行为也会对此产生影响。正如前文所述,文献的引用与被引行为并非都发生在一个学科内,学科与学科之间也会产生引用与被引。以图书馆学2012年发文及引文情况为例,图书馆学2012年所有发文的参考文献数量为99696,被引文献来源数量为47917,被引总频次为84255(见图2)。通过对图书馆学2012年发表的文献引用其他学科的参考文献和图书馆学2012年被其他学科引用的文献进行分析,发现本学科引用的是其他学科相对成熟,发表年代较久远的成果;而其他学科引用本学科偏向于引用本学科热点或最新研究成果,这在很大程度上会导致本学科的引用半衰期会大于被引半衰期。
图2 图书馆学2012年发文与引文情况
一般来说,学科半衰期反映了该学科文献的生命周期。学科引用半衰期越大,说明该学科研究热点持续时间长,学科的发展相对成熟,所引用的文献时效跨度也较长。学科被引半衰期值越大,说明该学科文献老化速度越慢,文献生命周期越长,被利用时间也就越长。两者都可以在一定程度上反映一个学科文献老化的速度,进而反映出一个学科的发展情况。学科被引半衰期和引用半衰期是反映一个学科文献老化速度的指标,而非评价一个学科的评价指标,所以我们需要理性地看待学科的半衰期,并不是半衰期越长越好,也非越短越好。
学科被引半衰期和引用半衰期的长短受多种因素同时影响,如该学科文献自身质量与学术价值,近年来所关注的研究重点与热点的变化,学科的性质特点,学科发展所处的阶段,时代的变更等等因素。通过分析图书馆学、档案学、情报学三个学科的学科被引半衰期和学科引用半衰期,发现图书馆学近年来研究重点、热点与网络环境紧密结合,积极关注数字图书馆、数字资源的整合等领域的研究;档案学的研究偏重于档案工作和档案管理,理论性研究较多;情报学的研究侧重于情报分析方法理论与应用,这一部分文献的学术影响力较大。
笔者分别从数值上和原理上对学科被引半衰期和引用半衰期进行了对比分析,从数值上来看,学科被引半衰期与引用半衰期存在着一定程度的整体正相关性;从原理入手分析,认为两个指标在概念上存在较大区别,但从学科引用与被引的根本上来看两者又密切联系,相互影响。同时发现,学科被引半衰期和学科引用半衰期的数值差异主要在于学科内与学科外文献的交流,即本学科引用其他学科的文献与其他学科引用本学科文献的年代差异将会在很大程度上影响学科半衰期的数值差异。这一分析结果对于学科交叉分析和研究也有一定的帮助和借鉴作用。
[1]Bernal J D.The Transmission of Scientific Information:A.User's Analysis[C].Proceedings of the International Conference on Scientific Information,1960:77-95.
[2]Burton R E,Kebler R W.The“half-life”of some scientific and technical literatures[J].American documentation,1960,11(1):18-22.
[3]罗式胜.期刊被引半衰期的概念及其应用[J].情报科学,1994,15(1):23-25.
[4]罗式胜.期刊引用半衰期的概念——一种与期刊被引半衰期对应的指标[J].图书与情报,1995(2):20-21.
[5]罗式胜.文献半衰期的类型及其应用[J].情报学报,1997,16(1):63-68.
[6]李玉珍,郭振平.科技文献半衰期的计算[J].延边大学学报(自然科学版),1997,23(4):74-76.
[7]王崇德.科技文献半衰期的计算[J].图书情报工作,1983,5(1):7-10.
[8]张黄群.期刊被引半衰期与有关指标的相关性[J].学报编辑论丛,2011:114-116.
[9]黄利平.基于引文分析的文献老化研究——以图书情报和管理学为例[J].情报杂志,2011,30(10):30-35.
[10]陈子玲.图书馆学期刊文献老化的分析[J].黑龙江图书馆,1989(3):10-15.
[11]方一言.我国档案期刊情报功能及其文献老化研究[J].上海档案工作,1993(1):20-22.
Analysis of Half-life of Literatures on Libraries,Information and Archives Based on CNKI
The citing and cited half-life are important indexes to describe obsolescence of literatures,disciplines,and periodicals.By taking libraries,information,and archives as the research objects,this article discusses and analyses the features of above disciplines'citing and cited half-life and influencing factors of half-life using disciplines classification number as classification standard.Furthermore,this article analyses inherent relationship between citing and cited half-life of disciplines based on the three disciplines'empirical data.
libraries;information;archives;half-life of a discipline;citing half-life;cited half-life;citation analysis
G250.252
A
10.11968/tsygb.1003-6938.2015019
刘伙玉(1991-),男,南京大学信息管理学院硕士研究生。
*本文系国家社科基金项目“以创新和质量为导向的哲学社会科学评价体系实证研究”(项目编号:12BTQ037)研究成果之一。
2014-06-01;责任编辑:魏志鹏