潘 静
(南京大学信息管理学院 江苏南京 210093)
为了揭示某篇文献的贡献随时间变化的规律,半衰期这一概念最早是由J.D.Bernal从自然科学领域引入到图书情报学科中,经过若干年的不断研究和发展,产生了文献半衰期、期刊半衰期和著者研究半衰期等相关概念。王洵在20世纪80年代发文对当时半衰期的相关研究作了概述,并认为研究文献的老化与半衰期是很有意义的,这是我国最早发表的半衰期方面的论文。之后,孟连生勾画出中文自然科学论文的引文结构图并试图利用引文分析的方法解决诸如中文科学期刊的半衰期、各科学期刊之间的引证关系等问题。王崇德通过数据验证后指出现行计算文献半衰期的方法中,前苏联学者的修正式是较为准确而实用的,后来又有学者对文章中的数学方法进行了修正。罗式胜的贡献主要是对科技文献半衰期与期刊半衰期的概念、类型和应用做了深入详细的研究。张黄群通过分析期刊被引半衰期与期刊影响因子、总被引频次、载文量、出版时滞、普赖斯指数和是否是核心期刊之间的关系,对被引半衰期的相关性进行了进一步研究。罗烨和徐克敏认为对化学文献的老化问题进行较深入的研究是有必要的。虽然近十几年来关于各种学科的各种期刊评价及期刊质量分析的文章大量涌现,但在化学领域关于半衰期的研究成果不是很多。付利对2007~2011年我国化学类核心期刊学术影响力进行了分析,党亚茹对JCR自然科学版期刊半衰期指标的区间变化进行了分析。综上所述,早期的半衰期研究重点一般都在文献半衰期上,后来逐渐转移到期刊半衰期的研究,而很少有文章从引用角度观察学科半衰期的研究成果。
本文以学科半衰期为重点,选取了化学这个学科作为研究对象,通过统计该学科的发文信息与引用情况,对该领域子学科引用半衰期与被引半衰期进行了计算和分析,以此反映我国化学研究的文献老化情况。
学科半衰期着眼于学科,研究的是整个学科的兴盛和衰落,对这一概念的研究有助于在宏观层面上衡量学科生命力和发展阶段。利用半衰期考查学科发展状况的方法有,通过文献引用和被引的时间跨度考察文献在研究中的生命周期,通过分析得到学科文献的引用和被引半衰期,以此来考察学科的活跃度和成长性。
从考察学科的角度我们定义了学科引用半衰期,即以一个学科文献的所引用的文献时间跨度和累积比例进行计算。即,某学科引用半衰期可以定义为该年该学科发表文献的所有参考文献中较新的一半是在多少年内发表的,这个年数就是学科引用半衰期;同样,学科被引半衰期是指所有的被引文献中,该学科文献中较新的一半是在多少年内发表的。这两个半衰期是不完全一样的,计算引用半衰期的文献包括有其他学科文献,也就是说本学科论文会引用其他学科文献;计算被引半衰期的文献都是这一个学科的,但引用这些文献的论文可能遍布众多学科。
学科引用半衰期按年划分计算。某一年的学科引用半衰期指的是这一年中发表文献的所有参考文献中较新的一半是在多少年内发表的。具体计算方法如下:先找出该学科这一年的所有发表文献,再根据这些文献获取它们的参考文献并按出版年递减排序,计算每个出版年参考文献的累积百分比(以计算当年作为第0年),然后计算出参考文献计算当年的学科引用半衰期(H1),其公式如下:
其中,A为累计百分比最接近50%那年历经的年数,其对应的累计百分比的值应在0%至50%之间;B为累积百分最接近50%的那年对应的累积百分比;C为累积百分比第一次超过50%的那年的当年百分比。
例如,以分析化学引用状况的数据为例(见表1),计算2012年学科引用半衰期:
以2012年作为起始年,距离50%最近的是2007年,为45.85%,所以在2012年该学科引用半衰期H1为:
被引半衰期与引用半衰期的计算方法类似。具体计算方法如下:先找出该学科在这一年中所有被引用的文献,将这些文献按出版年递减排序,计算每个出版年参考文献的累积百分比(以计算当年作为第0年),然后计算出参考文献计算当年的学科被引半衰期(H2)为:
其中,A为累计百分比最接近50%那年历经的年数,其对应的累计百分比的值应在0%至50%之间;B为累积百分最接近50%的那年对应的累积百分比;C为累积百分比第一次超过50%的那年的当年百分比。
例如,以物理化学这一子学科的数据为例(见表2),计算2012年学科被引半衰期:
以2012年作为起始年,距离50%最近的是2006年,为49.31%,所以在2012年该年中学科引用半衰期为:
为了计算化学学科及子学科引用半衰期,我们主要查询了CNKI数据库收录的2010~2012年化学学科这三年所有发表的文献及其参考文献,分别按各子学科对应的学科代码进行统计,数据范围覆盖中国学术期刊网络出版总库、中国博士学位论文全文数据库、中国优秀硕士学位论文全文数据库、中国图书全文数据库、外文题录数据库、国内会议、报纸、国际会议等多个数据库。
表1 CNKI收录的分析化学引用数据(以2012为观测年)
表2 CNKI收录化学子学科--物理化学被引数据(以2012为观测年)
以《中国图书馆分类法(第5版)》(以下简称“中图法”)10个化学子分类号作为查询式,由于中图分类体系和学科分类体系存在较大差别,一些非主流子学科的发文量较少,因此,我们仅对应了6个主要子学科,而将其他数据合并为其他子学科,也就是除了已对应的6个子学科外的其他化学学科文献都归并于其中。我们将检索得到的数据经过统计和计算,得到了2012年化学各子学科的发文量、引用文献数量,并计算了该年的各子学科的引用半衰期(见表3)。
表3 化学各子学科2012年学科引用半衰期
由表3可知,2012年化学学科的引用半衰期为6.36年,即该学科在2012年发表的所有文献对应的参考文献中最新的一半是在6.36年内发表的。在表3中,发文量较大的子学科有分析化学、有机化学、无机化学、物理化学和高分子化学,这五个子学科占学科总体发文的95%以上,其子学科引用半衰期在5.57~7.1之间,是对化学学科引用半衰期产生主要影响的子学科。
观察表3,可以发现引用半衰期的值较大的学科均偏向理论,如归为其他化学子学科的化学原理和方法、化学现状与发展等,由于其性质的特殊,需要较多地涉及到一些历史资料,所以引用半衰期也较长。其中最为特殊的是化学现状与发展,2012年的引用半衰期达到了15.05年。在分析了该分类号下面所有的23篇文章后,发现“微波促进的点击化学”和“超越还原:化学理论的语境化研究”这两篇文章的参考文献数量分别为114篇和284篇,单这两篇文章的参考文献数量就已经超过了该子学科所有参考文献总量的80%,而其他文章参考文献相对较少,即这两篇文章的引用半衰期对子学科的引用半衰期的影响相当大。经过进一步查证,这两篇文章一篇为博士论文,一篇是理论研究,因而半衰期较长。引用半衰期的值较小的学科均偏向技术与应用,这类学科研究的多是学科亟待解决的问题,由于参考资料本身也较新,所以引用半衰期较短,如学科性质偏应用的应用化学2012年的引用半衰期只有2.54年,远远小于其他子学科。
按照引用半衰期的计算方法,将三年的数据统计汇总,可得出2010~2012年这三年的化学学科的引用半衰期分别为6.73年、6.44年与6.36年。整体而言,这三年学科引用半衰期的变化不大,但有逐渐缩短的趋势。各子学科的引用半衰期均根据子学科载文量占学科总载文量的比例对学科总半衰期产生或多或少的影响,通过对3年数据的统一整理,可知具有较大影响的子学科有:无机化学、有机化学、高分子化学、物理化学、分析化学这五个子学科,2010~2012年间它们的引用半衰期趋势如图1所示:
图1 2010~2012年各主要子学科引用半衰期趋势图
可以发现2011年与2012年各子学科的引用半衰期与2010年相比均有一定幅度的降低,2011年与2010年相比,引用半衰期在数值上略微下降。除了高分子化学外,其他学科2012年的引用半衰期与2011年相比也都略微下降。总的来说,该学科的引用半衰期有逐渐缩短的趋势。引用半衰期的缩短主要有两个原因:第一是学科本身发展的速度不断加快,年代久远的文献资料引用比例逐渐减少,研究更偏向于对近期成果的引用。以高分子化学领域为例,通过对该学科2010年与2011年发表的文章对当年及之前文章的引用情况进行分析,可以发现2011年发表的文章对以文章发表年开始的近5年文献的引用比率均大于2010年;第二是与本学科研究交叉的学科对本学科起到了推动作用,这些学科的发展推动了本学科的研究进程。以分析化学为例,该学科近几年的研究重点与生命科学、环境科学等新兴学科日渐紧密,这些学科发展迅速,不断产生新的研究成果,推动了分析化学的研究进程。
对文献的引用情况作了进一步的分析后发现,学位论文通常引用数量较多,尤其是博士学位论文的引用数量较大。参考文献较少的是一些研究探索类的文章,这些文章把视角投向了全新的领域,对过去的研究成果依赖程度较弱,因而引用也少。
为了计算化学学科被引半衰期,我们查询了CNKI的引文库,根据被引文献的分类号,抽取出所有化学文献,并根据文献分类号对应到学科分类体系中的各子学科。为了分析化学学科的被引半衰期的年度变化情况,我们分别统计各子学科从2008~2012年的被引半衰期,在此基础上并结合学科背景进行了分析。
我们将2012年获取的被引数据按6个主要子学科和其他化学子学科统计被引半衰期以及每个子学科的被引篇次,通过加权计算得到该年的化学学科被引半衰期(见表4)。
表4 化学各子学科2012年学科被引半衰期
从表4可以看出,2012年化学学科的被引半衰期为6.28年,即该学科2012年被引的、并且被CNKI收录文献中,较新的一半是在6.28年内发表的。在表4中,被引量较大的子学科有分析化学、有机化学、无机化学、物理化学和高分子化学,这五个子学科的被引文献占学科总体被引量的95%以上,其子学科被引半衰期在5.22~6.78之间,是对化学学科被引半衰期产生主要影响的子学科。化学学科每个子学科的被引半衰期有显著区别,观察其半衰期与对应的被引篇次以及子学科性质,发现对应被引篇次越少,半衰期偏大的可能性越大。
对应表4来看,应用化学的发文量较少,半衰期最大,其余子学科的发文量都比较大,半衰期相应偏小;我们还发现子学科性质越偏理论(原理、方法等),半衰期的值越大,如化学其他子学科中的化学原理和方法、化学现状与发展。相对地,越是偏实验研究、偏实践的子学科,它的半衰期的值越小,如无机化学、物理化学、高分子化学、有机化学等。
比较特殊的是应用化学,虽然这一子学科的性质偏研究和实践,但是被引半衰期偏大,引起这一现象的主要原因是,该研究领域的相关成果不多,到2012年为止被引文章只有228篇,2012年被引次数也仅有153篇,加上对1994~1996年发表文章的大量引用,这些使得被引半衰期偏长。更进一步地讲,一般情况下,应用化学的研究成果具有实用性和迁移性,可用于其他学科,而其他学科对应用化学的引用一般是一些较成熟的成果,这些成果很大一部分都不是最新的,但较有意义的成果,这样就导致了在很久之前发表的文章在近几年被引用的现象,上述对1994~1996年文章进行引用的多数是其他学科的文章,因而被引半衰期比较大。
对比无机化学与高分子化学这两个子学科,在被引量大致相同的情况下,无机化学的被引半衰期相对高分子化学而言小了接近一年,这与学科的具体情况有密切关系。首先,无机化学发展较早,也比较成熟,前沿成果的产出频率较高且易被其他邻近子学科引用,这就促使了其被引半衰期的缩短;其次,作为最基础的研究,跨学科被引用的机率相对高分子化学这一更加偏向实用和生产的子学科来说低得多(跨学科引用通常情况下能够延长被引半衰期),于是在被引量与高分子化学接近的情况下产生了较小的被引半衰期。
在这几个主要的化学学科中,分析化学被引半衰期最短,其主要原因还是学科本身的性质所决定的。先进的仪器设备、现代分析技术与方法,大大促进了该学科的发展,该学科的最新研究成果也得到其他学科关注和引用,这也是为什么分析化学的被引半衰期小于其他几个化学学科的原因。
最后可以归纳出这样的几个结论:子学科的被引半衰期的大小不仅与对应的发文量有关,而且与子学科性质也有密切关系。一般说来,一个学科的发文量越大,反映出学科的活跃度越高,其被引半衰期相应就越小;另一方面,一个学科越是偏实验、偏实践、偏分析,越容易产生新的、对其他研究有借鉴价值的研究成果,被引半衰期也会越小。需要补充的是,被引半衰期的波动变化还与学科的发展阶段和具体情况有直接的关系。
用相同的方法计算2008~2012年这五年化学学科的被引半衰期,为了更直观地显示结果及趋势,制作出2008~2012年化学学科被引半衰期时间趋势图(见图2)。
图2 2008~2012年化学学科被引半衰期时间趋势图
由图2可以发现,近几年来,学科被引半衰期逐渐增长,平均增幅达到了5.5%,说明化学学科的学科影响力正不断增强。其中各主要子学科在2008~2012年这五年中的被引半衰期对比如图3所示:
图3 2008~2012年各主要子学科被引半衰期趋势图
图3传递给我们这样一个信息,化学学科各子学科的被引半衰期呈逐年扩大趋势,虽然分析化学在2012年呈下降趋势,主要原因是前几年其被引半衰期增长较快,2012年可看成是理性回归。从五条被引半衰期的年度变化曲线看,无机化学的被引半衰期逐年加速增长,并渐渐与其他学科拉近。高分子化学与物理化学,虽然在2008年还有一些差距,而且2008年高分子化学的被引半衰期在这几个学科中是最大的,但到2012年这两个学科的被引半衰期已经接近重合。有机化学和物理化学在2008年的半衰期也基本靠近,但经过几年的变化,有机化学由于2012年的被引半衰期徒增,稍稍拉开了与物理化学半衰期的距离。另外,分析化学的被引半衰期这几年增长速度较快,其半衰期长度已由2008年的第二位到2012年的第一位。
在衡量文献资料老化速度方面,引用半衰期衡量的是本学科的(也包括部分其他学科)文献老化速度,而被引半衰期衡量的是学科自身的文献老化速度。将2010年至2012年的五个主要子学科及整体的引用与被引半衰期进行对比(见表5)。
表5 化学各主要子学科及整体2010年~2012年引用与被引半衰期(年)对比表
从表5可知,2010~2012年间化学学科呈下降的趋势而被引半衰期逐渐上升,两者之间的数值在逐渐接近。各子学科引用半衰期和被引半衰期虽然和整个学科具有基本相同的趋势,但各个体的表现具有一定的波动。
观察表5可发现,各学科(除了分析化学外)的引用半衰期一般都大于被引半衰期,这恰恰符合我们对引用文献和被引文献采集规律,因为,在引用文献中包含有许多外文文献、图书等,这些文献具有比中文文献和论文更长的生命周期,在计算引用半衰期时,这些文献无形中增加了半衰期的时长。而我们在CNKI中的被引库中所采集的被引文献中并没有外文文献和图书,本文所采集的被引文献主要为中文论文,这就造成了引用半衰期长于被引半衰期的原因。
但分析化学却没有遵循这一规律,被引半衰期反而短于引用半衰期。究其原因,近年来分析化学蓬勃发展,在分析内容上与新兴学科紧密结合并对新出现的分析工具和分析方法具有良好的敏锐度,分析化学论文即使在引用国外的文献中,也极为关注最新的成果,在对引用数据进行统计后发现2010~2012这三年分析化学的发文量逐年急速上升(见图4),从2010年的2617篇,到2011年的5728篇,再到2012年的10176篇,这反映了学界对分析化学的关注度不断增加,观察引用分布数据,发现引用高峰通常在文章发表后的第2年,这说明研究人员更倾向于引用最近几年发表的文献作为参考,因此分析化学的引用半衰期较短。
图4 2010~2012年分析化学引文数量逐年分布图
反观分析化学文献的被引情况,由于分析化学是一门交叉性很强的学科,分析化学的研究成果被其他学科大量引用,例如,分析化学的论文在2012年共被引用36327次(见表6),其中2001年至2003年发表的分析化学文章被引用10231次,占了总引用量的30%左右,而这其中绝大部分是被属于工业技术中的化学工业(TQ)、轻工业(TS)以及医药卫生中的药学(R9)等分类号的文章引用的。正是由于分析化学被引频次的特殊分布,造成分析化学被引半衰期较长。这一结果进一步证实了跨学科的文献引用,一般会引用其他学科的成熟成果,跨学科被引的比例越大,被引半衰期就会越长。这就是造成分析化学的被引半衰期长于引用半衰期的主要原因。
表6 分析化学2001~2012年发表的在2012年被引的文献频次分布表
半衰期是衡量文献老化的重要标准,对于学科半衰期的研究有助于揭示学科研究的时效特性。本文侧重于学科半衰期这一概念,以化学学科为分析对象,在CNKI数据库中以中图分类号为检索条件获取了该学科的相关数据,计算了化学各子学科的引用半衰期和被引半衰期,通过主要子学科文献老化分析,揭示我国化学研究中文献老化的影响因素。笔者在分析数据后发现引用半衰期的值较大的子学科均偏向理论,引用半衰期的值较小的子学科均偏向技术与应用,子学科的被引半衰期的大小不仅与对应发文数量有关,而且与子学科性质也有密切关系,学科的发文量越大,表明该子学科文献更新速度越快,因而被引半衰期也就相应下降;学科越是偏研究、偏实践、偏分析,越容易产生新的、对其他研究有借鉴价值的研究成果,被引半衰期也会下降。需要补充的是,被引半衰期的波动变化还与子学科的发展阶段和具体情况有直接的关系。本文发现了2010年~2012年间化学学科整体及各主要子学科引用半衰期呈下降的趋势,而被引半衰期逐渐上升,两者之间的数值在逐渐接近的规律并针对这一现象做出了合理解释。
[1] 王洵.科技文献的“半衰期”[J].情报科学,1980,(4):21-23.
[2] 孟连生.中文科学引文分析[J].情报科学,1983,(1):11-21.
[3] 王崇德.科技文献半衰期的计算[J].图书情报工作,1983,(5):7-10.
[4] 罗式胜.文献半衰期的类型及其应用[J].情报学报,1997,(1):62-67.
[5] 罗式胜.期刊被引半衰期的概念及其应用[J].情报科学,1994,(1):23-25.
[6] 罗式胜.期刊引用半衰期的概念──一种与期刊被引半衰期对应的指标[J].图书与情报,1995,(2):20-21.
[7] 张黄群.期刊被引半衰期与有关指标的相关性[J].学报编辑论丛,2011,(6):114-116.
[8] 罗烨,徐克敏.中文化学期刊文献老化的分析研究[J].中国科技期刊研究,1993,(4):8-14.
[9] 付利.2007~2011年我国化学类核心期刊学术影响力分析[J].中国科技期刊研究,2013,(3):506-511.
[10] 党亚茹,王莉亚.JCR自然科学版期刊半衰期指标的区间变化分析[J].情报科学,2007,(6):804-810.