三种科技文献半衰期算法的比较研究

2014-10-28 03:34陈京莲
关键词:普赖斯插值法工程力学

陈京莲

三种科技文献半衰期算法的比较研究

陈京莲

(井冈山大学图书馆,江西,吉安 343009)

文献半衰期是测度文献老化速度的一个重要指标,利用文献计量学和数理统计学的方法,对《工程力学》自1992年~2008年10月间的载文引文用三种半衰期的计算方法进行了计算,并且将结果和用插值法计算的结果进行了比较,计算结果表明:对《工程力学》而言,使用B-K方程计算的半衰期与插值法得到的结果最为接近。但是对超导专业期刊载文引文而言,新的半衰期计算公式得到的半衰期与插值法的结果最为接近。由此可见,在计算半衰期时,要选择最合适的公式进行计算。

半衰期;文献老化;同时法

0 引言

文献具有自身的老化规律,人们对其进行研究是因为能指导图情部门的实际工作和进行科学研究。首先,可以根据老化速度的快慢,指导人们选购文献,掌握文献的老化规律,帮助人们判断某类文献的实效和现有价值。对老化越快的文献要及时采购和迅速报道,对老化慢些的文献可以适当让位于那些老化快的。为了解决书刊数量的激增和存放空间日益拥挤的矛盾,要剔除那些陈旧而无用的文献,这也必须要依据文献的老化规律来进行。对文献老化规律的研究,可以使剔旧变得有标准可依,而不是以主观为主。其次对文献老化的研究,可以揭示科技文献在时间序列上的选择规律,可以对某些学科当前所处的发展阶段作出预测,同时也能为学科今后的发展方向和发展速度进行预测,这对于科学管理、科学规划都有重要意义[1]。

1 文献老化及文献半衰期

早在1944年美国的C.F.Gosnell就提出了科技文献老化的问题,指出科技文献具有随时间推移而使用频次逐渐减少的现象,即老化(obsolescence)。该词原意为“逐渐变得过时”(becoming out of date)或“某物被使用得越来越少”(something is less and less used)之意。前苏联情报学家米哈依洛夫认为老化是科技文献随着其“年龄”的增长,失去了作为情报的价值,以及越来越少被科学工作者和专家们利用的过程。文献的老化是一个动态的概念,是针对某一类文献集合而不是单个或者少数文献的,研究的是某个类或学科领域文献的老化规律。

人们用来衡量和揭示文献老化的最常用的指标是文献半衰期和普赖斯指数,本文仅讨论文献半衰期的求法。文献半衰期这一概念是1958 年首先由贝尔纳( J. D. Bernal)提出的,他借用放射化学术语“半衰期”来描述科技文献的老化速度。后来伯顿( R. E. Burton) 和开普勒( R. W. Kebler) 将文献的半衰期(Half-Life)定义为: 在统计当年引用的全部参考文献中,较新的一半是在多长一段时间内出版的。这个定义也被称为“中值引文年限”( median citationage)[2]。人们对文献半衰期的研究有同时法( synchronous) 和历时法( diachronous )两种,两种方法是从不同的角度出发来研究的。同时法( synchronous)是指这样一段时间:在此期间发表了正在被利用文献中较新的一半,也就是固定引文的数量比例(一半) 求出版年限;历时法( diachronous )正好相反, 固定出版年限求引文的数量比例。共时半衰期通常用于评价某一学科或专业文献的老化趋势,而不是个别文献。历时半衰期可以是某一学科文献老化的半衰期,也可以是一种期刊,甚至一篇文献老化的半衰期[3]。本文是基于共时半衰期来讨论的。

文献半衰期是测度文献老化速度和深度的指标。不同学科文献的老化速度是不同的,有些差异还很大,而且用不同的计算方法来计算的半衰期也有些许差异。这就提醒人们要用最合适的方法去计算,才能得出更为精确的数值。

2 文献半衰期的求法

对文献半衰期的求法归纳起来有以下三种,即作图法、插值法和公式法。

2.1 作图法

利用图形来求得,具体做法是根据统计到的数据列成引文频次分布表,以纵坐标表示引文累计量或百分累积量,以横坐标表示被引文献出版的年龄。根据文献半衰期的定义可知,在纵坐标上引文累积量或百分累积量一半处对应的横坐标就是半衰期(见图1)。作图法是根据半衰期的定义,通过图形形象直观地表述半衰期的内涵,这种方法较为粗糙,所求的半衰期也不是那么精确,但是能客观描述半衰期,简单易懂。

图1 利用作图法计算科技文献的引文半衰期

2.2 插值法

根据统计的数据,找出引用累积百分比最接近50%的年份,计算距离统计当年的间隔时间,列出计算式求出文献半衰期,这样求出的文献半衰期很准确,但这只是一个单纯的数值,无法形象地描述引文数量的变化过程和发展趋势。例如由表1可知,中文引文中最接近50%的引用累积百分比是1998年,该年的引用累积量达到51.37%,距离统计当年即2008年是11年,根据插值法计算出《工程力学》中文引文文献半衰期为10.74年。同理可知《工程力学》外文引文文献半衰期为15.76年。用这种方法求出的文献半衰期与作图法不同,精确但不直观。

2.3 公式法

目前人们利用的经典公式有Burton和Kebler文献老化方程(简称为B- K方程)、莫蒂列夫(B.M.MOTIЛeB)修正式。笔者根据半衰期和普赖斯指数的关系,推导出了一个新的半衰期计算公式[4],这里分别作一简单介绍。

1960年美国的B.E.Burton和R.W.Kebler为了计算科技文献老化的半衰期,得出了B- K方程:

式中是时间,以10年为单位;是经过时间时该学科总的引文比率,所以,1-是时间以外的引文比率。该公式包括了被引文献峰值以前的引文文献数据,因而可以说该公式描述了文献使用过程中数量的变化情况,人们能够根据公式的计算,绘制出文献使用过程中的数量变化图形。其半衰期的计算公式为:

1982年前苏联文献计量学工作者莫蒂列夫提出了巴尔顿—凯普勒方程的修正式即莫蒂列夫修正式:

该修正式与原B- K方程相比有其优势,揭示了文献引用过程中的延时问题。其半衰期的计算公式为:

随着人们对文献老化研究理论上的深入,对这两种模型也进行了修正和完善。例如,北大学者丁学东就提出了B- K方程的级数形式,实证表明拟合效果良好。

笔者根据半衰期和普赖斯指数的关系也推导出了一个新的半衰期计算公式[4],所计算的文献半衰期的范围为1.74-15.2年,应用范围较广。下面具体介绍新的半衰期计算公式的推导过程。

由(5)式就可以得到系数与普赖斯指数之间的关系为:

=2.649 - 4.19I(6)

如果以1/2为某学科(专业)文献的半衰期,则由(1)式可得其文献的半衰期为:

(7) 式就是B-K方程的文献半衰期计算公式。

联合(6)式和(7)式,可得到科技文献引文的半衰期与普赖斯指数之间的关系为:

从(8)式可以知道,科技文献的半衰期与普赖斯指数的关系即不是线性关系,也不是负幂函数关系,只要知道科技文献的普赖斯指数就可以计算出其半衰期。此外由(8)式可知,当 0≤1≤1 时,所计算的文献半衰期的区间为:

1.74(年)≤1/2≤15.2(年)

这表明引文半衰期计算新方法所给出的文献半衰期的区间在1/2∈[1.74,15.2]年,即它可以描述的范围是半衰期为 1.74- 15.2 年的学科或专业。而B- K方程半衰期计算公式描述的范围是3.47-6.93年的学科或专业,莫蒂列夫修正式半衰期计算公式描述的范围是3.64-7.93年的学科或专业,可见新的半衰期计算公式的适用范围更大。

可见作图法、插值法、公式法对半衰期的求法各有侧重,但是公式法更具科学意义,它不仅能准确地求出各学科的半衰期,还能描述和揭示文献引用过程中产生的问题,比如B-K方程的修正式揭示了文献引用过程中的延时问题;笔者推导出新的半衰期计算公式则揭示了文献半衰期和普赖斯指数的关系。这些问题的明晰对揭示半衰期的数学意义具有积极的作用,故人们致力于对它的研究。

下文将用新推导出的文献半衰期计算公式、B- K方程半衰期计算公式、莫蒂列夫修正式半衰期计算公式对《工程力学》自1992年―2008年10月间的载文引文进行实证研究以比较计算的结果。

3 实证研究

为了比较几种半衰期的求法,本文选取应用最广泛的B- K方程、莫蒂列夫修正式以及笔者推导出新的半衰期计算公式,利用王惠翔、宋晓燕、王佳飞等2009年发表在《工程力学》上的数据(表1)和图2分别计算半衰期,然后与用插值法求出的半衰期进行比对,看哪个计算公式的计算结果更贴近实际值。《工程力学》(月刊),是中国力学学会主办,清华大学土木系承办的我国工程力学领域的重要学术期刊[5]。该刊自1984年创刊以来一直站在学术的前沿,报道我国工程力学领域的最新研究成果,吸引了本行业的专家学者在刊物上发表研究成果,培养了本行业的年轻新秀,是我国工程力学领域具有重要影响的学术刊物。

表1 《工程力学》中、外文引文的年代分布

图2 《工程力学》中外文引文累积频率

表2和表3分别给出了用不同文献半衰期计算方法计算的《工程力学》和超导期刊的半衰期。

表2 《工程力学》半衰期的计算结果与插值法比较

表3 超导专业期刊半衰期的结果与插值法比较

4 结果与讨论

科技文献的老化是多个因素综合作用的结果,一般来说,文献老化的影响因素有文献的增长、学科的差异、学科发展阶段的差异、文献的种类和性质、用户需求及情报环境等[6]。具体说来,第一、文献的老化是与文献增长紧密联系在一起的,大量新的知识、新的技术、新的理念等等的出现都促进了现有文献的老化。第二、不同的学科,具有不同的性质,其文献的老化速度也是不同的,例如Burton和Kebler计算出化工、机械、冶金等九个学科的半衰期,最短的是冶金学科为3.9年,最长的是植物学为10.0年[7],可见不同学科的半衰期相差还很大。第三、同一个学科在不同的发展阶段其半衰期也是有差异的。在发展的初级阶段,半衰期会短些,成熟阶段则会长些。第四、不同种类和性质的文献半衰期也不同。同一学科的图书、期刊、学位论文、标准文献等半衰期也不同,尤其是现在由于网络技术和通讯技术的快速发展,各种电子文献大量涌现,这些电子文献和纸质文献的半衰期也是差异显著。第五、用户的文献需求特点及其所处的情报环境的质量,也是影响文献老化的一个不可忽视的因素[8]。对于科研人员而言,需要获取最具前沿性的文献资料,只有掌握了最新的知识和本学科的发展方向,才不会重复劳动,才可以“站在巨人的肩膀上”,取得新的研究成果最终推动科学的发展。从已经计算出的《工程力学》的半衰期来看,中文引文半衰期达到了10年多,这和陈立新等人计算出的2003年力学专业期刊的半衰期为10.3488是相吻合的。陈立新等人[9]还根据计算结果得出从1954-2003年的50年间,力学专业领域的引文半衰期越来越长, 力学文献的老化速度正在减慢。而本文中算出的半衰期则印证了这个结果,同时也延续了这种趋势。究其原因,笔者估计《工程力学》的半衰期延长是因为网络环境的影响,索传军和游毅[10]利用数据库的分析功能,在对1994-2006年40种图情类期刊的引文数据分析后得出结论:网络环境下文献老化延缓的现象具有一定的学科普遍性。因而可以猜测《工程力学》也是这种现象。

从表2中可知用四种方法算出的《工程力学》的中文半衰期和外文半衰期有差距,用四种方法计算的结果分别为:插值法计算出的中、外文半衰期相差5.02年;B-K方程计算出的中、外文半衰期相差3.93年;莫蒂列夫修正式计算出的中、外文半衰期相差3.88年;新的半衰期公式计算出的中、外文半衰期相差2.04年。可见外文文献的老化速度比中文明显要慢。

文献半衰期测度方法依据老化模型的不同而存在数值上的显著差异,但所反映的文献老化总体趋势与学科差异具有一致性[11]。尽管如此,我们在比较不同学科的半衰期时,尽量要选择计算准确的公式来进行以保证比较结果的客观性。

目前,经常采用的文献半衰期算法均是基于文献之间的引用关系建立起来的[12],由于文献的被引用,可表明该文献的传播和影响力,因而这种方法是科学可行的,文献半衰期的计算,揭示了文献老化的规律,所以对文献半衰期的研究有着重要的理论意义和实际意义。目前应用最广泛的两种计算方法是B-K方程和B-K方程的莫蒂列夫修正式,但人们在实际应用过程中发现B-K方程的拟合结果并不理想, 其理论计算值与实际统计结果之间存在着显著差异[13],而B-K方程的莫蒂列夫修正式在理论计算上比B-K方程有所改进,但这种情况也不是一概而论的。笔者首次把文献半衰期与普赖斯指数这两个衡量科技文献老化速度和程度的量度指标联系起来,并给出了这两个量度指标之间的关系式,推导出了一个计算半衰期的新关系式。

笔者用B-K方程、B-K方程的莫蒂列夫修正式、新的半衰期公式三种方法对1992年―2008年10月间的《工程力学》中外文引文的半衰期进行计算,并且和插值法的结果进行比较,结果显示(表2和表3):中文半衰期误差比率最小的是B-K方程,为1.676%;外文半衰期误差比率最小的也是B-K方程,为5.774%,可见,对《工程力学》的引文半衰期来说,用B-K方程来计算是最合适的。而同样用以上三个公式计算超导专业期刊的半衰期时发现,新的计算公式得到的半衰期值与插值法的最为接近(表3)。可见,尽管半衰期的计算公式有几个,但对不同的学科,具体情况不同,应该选择的公式也不同,不能偏向于某一个公式。

[1] 丁学东.文献计量学基础[M].北京: 北京大学出版社,1993:119-120.

[2] Burton R E, Kebler R W. The “half‐life” of some scientific and technical literatures[J]. American documentation, 1960, 11(1): 18-22.

[3] 郭红梅,邵艳娥,何钦成.文献半衰期研究现状[J].医学信息学杂志,2011,32(1):56-59.

[4] 陈京莲,胡玮.文献半衰期与普赖斯指数之间的关系研究[J].大学图书情报学刊,2010,28(1):3-5.

[5] 王惠翔,宋晓燕,王佳飞.《工程力学》载文调查、引文分析及核心著者测评[J].工程力学,2009,26(1):8-16.

[6] 黄利平. 基于引文分析的文献老化研究[J].情报杂志,2011,30(10):30-35.

[7] 丁学东.文献计量学基础[M].北京: 北京大学出版社,1993:101.

[8] 徐恩元,徐建华.文献老化理论研究[J].四川图书馆学报,2006,154(6):63-67.

[9] 陈立新,梁立明,刘则渊.力学文献老化速度50 年(1954- 2003) 的变化趋势[J].现代情报,2006,(10):12-15,18.

[10] 索传军,游毅.试论网络环境下图情类文献利用状况[J].图书情报工作,2010,54(7):63-67,126.

[11] 游毅,索传军,钟晶晶. 科技期刊长期老化趋势与影响因素实证研究[J]. 图书情报工作,2011,55(12):140-144.

[12] 邱均平.信息计量学[M].武汉:武汉大学出版社,2007: 67-96.

[13] 靖培栋,刘忠厚. 科技文献经典老化模型的新修正[J]. 情报学报,1999, 18(1):85-90.

THE STUDY AND ANALYSIS ON THREE HALF OBSOLESCENCE LIFE CALCULATION METHODS OF SCIENCE AND TECHNOLOGY DOCUMENTS

CHEN Jing-lian

(Library of Jinggangshan University, Ji’an, Jiangxi 343009,China)

Half-life of literature is one of important index to evaluate literature obsolescence, by using the theoretical methods of bibliometrics and mathematical statistic to calculate the half-life of the "Engineering Mechanics" from Jan 1992 to Oct 2008 as an example by three methods. The comparisons of results fitted by three methods were shown that the result of B-K equation was the closest to the results calculated by interpolation method. But for data of references in superconductor journals, the result of half-life calculated by new method was the closest to the results calculated by interpolation method. So we must choose the most suitable formula when we calculate half-life of literature.

half-life; literature obsolescence; synchronous

G256

A

10.3969/j.issn.1674-8085.2014.04.012

1674-8085(2014)04-0053-05

2014-02-09;

2014-03-11

陈京莲(1970-),女,湖南湘潭人,副研究馆员,硕士,主要从事信息资源管理和计量文献学的研究(Email: chenjinglian@jgsu.edu.cn).

猜你喜欢
普赖斯插值法工程力学
开枪致14人受伤,还能保释上班?
《工程力学》微课教学模式探索
《计算方法》关于插值法的教学方法研讨
《计算方法》关于插值法的教学方法研讨
如果没有忘记
基于二次插值法的布谷鸟搜索算法研究
工程力学
Newton插值法在光伏发电最大功率跟踪中的应用
虚拟仿真技术在复杂工程力学问题实验教学中的应用
大学物理和工程力学在机构运动分析中的应用