摘 要 本文为研究档案学者的学术影响力,以CSSCI为数据源,运用p指数,以档案学领域高被引的43位学者为例,对比分析学者的总被引频次(C)、发文数(N)、篇均被引频次、h指数、p指数,并进行相关分析,实证研究了p指数在档案学者学术影响力评价中的应用。研究表明,p指数与总被引频次、篇均被引频次、h指数有很强的相关性,与发文数量没有相关关系。p指数具有较好的区分度和敏感性。
关键词 p指数 档案学者 信息计量学
中图分类号 G270 文献标识码 A 收稿日期 2020-02-08
★作者简介:陈婧婧,上海申康医院发展中心副研究馆员,硕士研究生,研究方向为档案管理。
Abstract In order to study the academic influence of archivists, the paper chooses the CSSCI as the data source and uses p-index to analyze comparatively 43 scholars who are highly cited in the field of archival science. Their total citations, number of published articles, citation frequency of each paper, h-index and p-index are compared and analyzed. The statistical analysis of application of p-index in the evaluation of academic influence of Chinese archivists is carried out. Results show that p-index is highly correlated with total citations, citation frequency of each paper and h-index, that it is not correlated with number of published articles, and that p-index has good discrimination degree and sensitivity.
Keyword p-index; archivists; informetrics
人才資源是创新活动中最为活跃、最为积极的因素。科研人才作为科学技术的载体,做好科研人才的绩效评价,特别是对于学者个人研究表现的评价,对于调动人才的积极性和创造性具有重要作用。对科研人才的研究和评价一直是学界关注的焦点。笔者以“archivist assessment”“archivist evaluation”为关键词检索Emerald数据库发现,目前国外学者侧重于对档案馆员的角色定义,如伊芙吉尼的《不仅仅是保护:档案馆员角色探讨》等,尚未发现评价档案学者影响力的研究。国内对档案学者进行评价运用的方法主要有主观评价、社会网络分析、文献计量以及综合评价的方法。如王云庆的《从作者分析看我国档案学研究队伍的状况》,吕文婷的《中国档案学学术群体共被引网络探析》,郭瑶的《基于文献计量学的中国档案学者群体研究》等。
这些有效地研究了档案学学者群体,但没有从定量的角度考量学者个体的产出数量和质量之间的关系,因此本文尝试以国内的档案学科领域专家为评价对象,利用新型评价指标p指数对档案学者学术影响力进行评价,可以考察档案学者的个人成就,同时也为证明p指数用于人才科研绩效评价的有效性提供实证资料。
一、p指数算法及其应用
2005年,美国学者Jorge.E.Hirsch提出将h指数作为对研究人员绩效评价的指标。Hirsch将h指数定义为:一个科学家的h值,即是当且仅当在他发表的N篇论文中有h篇论文每篇得到的不少于h次的引文数,而剩下的论文中每篇论文的引文数都小于h。h指数基于纯粹的几何结构,能同时反映产出率和产出质量。因此,一经提出便引起广泛关注,但也存在缺乏灵敏度与区分度不足的问题,因此对评价产生很大的影响。
在h指数的研究基础上,2010年,印度学者G.Prathap提出p指数。p指数可以被称作是卓越指数(prominence factor)或者为威望指数(prestige factor)。P指数的表达式为(C2/N)1/3,其中,C为总引用频次,N为发文数量。通过此表达式可以看出,p能同时反映质量(C/N)和数量(C),可以表达论文的数量和质量之间的关系。p指数与h指数具有相同的维度,并成功模拟了h指数对论文数量和质量的总和考量。此外,p指数还能很好地预计相关性,可以作为新型综合性学术评价指标。
Prathap认为p指数可以应用在很多方面,比如国家、机构、期刊、学者学术影响力等宏观和微观层面的研究。在国内,目前p指数主要用于期刊评价,如张正慧、王圣洁、许新军的研究等,用于学术影响力的评价有王志军、赵蓉英等的研究。
二、研究对象和统计结果
1.统计对象的选择与研究方法。本文借鉴吕文婷在《中国档案学学术群体共被引网络探析》一文中的统计结果,选取档案学领域里被引次数最多的43名学者,统计其发文数量和被引总次数。国外学者对p指数的研究大多选择基于Web的引文索引数据库,鉴于该数据库收录我国档案学领域的期刊类型较少,因此本文选择《中文社会科学引文索引》(CSSCI)作为评价数据库,检索学者的相关数据。CSSCI数据库的回溯期到1998年,因此本文统计这43位学者在1998年至2018年的总被引频次。
2.数据统计结果。目前国内的中文数据库不能直接测得h指数和p指数,笔者利用数据库中的基本引用记录,经过人工偏差识别和修正加工后,计算得出档案学者的h指数和p指数。数据统计结果如表1所示,按照各学者的p指数进行降序排列。需要指出的是,本文中的h指数、p指数限于统计时间区间、研究对象和数据库的特定条件计算而来,任何一个条件变化均有可能引起h指数和p指数的变化。
从档案学领域高被引作者的数据统计结果可以看出,中国人民大学冯惠玲教授的论文p指数最高,为12.6755,p指数大于6的有7位学者,占总人数的16%。按照h指数进行排序,排在前面的为冯惠玲、刘家真、何嘉荪、胡鸿杰、何振、安小米、丁华东。学术论文是评价学者的重要指标,因此冯惠玲教授的排名是可以进行合理解释的。冯惠玲的学术表现和影响也得到了档案学界的承认,这从另一方面也佐证了p指数排名的合理性。
结合表1的数据统计结果以及在数据统计过程中的一些发现还可以得出:表1所示档案领域高被引学者h指数最高值为11,p指数最高值未超过13。Hirsch是一个物理学家,他认为科学家在经过20年的科研后h指数应当达到20。这是由于h指数最早在自然科学领域得到验证,自然科学与社会科学两个领域的学科有不同的引文模式和成果类型,所以两个领域的门槛不尽相同。不过此数据也提示我们,档案学作为一个年轻的学科,学者队伍还需要不断壮大,学者的影响力也需要不断加强。
三、基于档案学领域高被引作者的p指数实证研究
为了研究出p指数与总被引频次、发文数量、篇均被引频次和h指数之间的关系,进行了Pearson相关分析。首先对各变量进行描述统计,结果如表2所示。
由表2可以看出,变量总被引频次的最小值与最大值分别为10和396,取值在合理范围内,均值为81.33,标准差为71.707,偏度和峰度分别为2.602和8.827,可以看出该变量分布相对均匀,并服从于正态分布。变量发文数量的最小值与最大值分别为17和138,取值在合理范围内,均值为70.65,标准差为30.913,偏度和峰度分别为0.011和-0.942,可以看出该变量分布相对均匀,并服从于正态分布。变量篇均被引频次的最小值与最大值分别为0.096和5.143,取值在合理范围内;均值为1.182,标准差为0.880,偏度和峰度分别为2.612和9.063,可以看出该变量分布相对均匀,并服从于正态分布。h指数的最小值与最大值分别为1和11,取值在合理范围内,均值为3.98,标准差为1.766,偏度和峰度分别为1.696和4.934,可以看出该变量分布相对均匀,并服从于正态分布。变量p指数的最小值与最大值分别为0.987和12.676,取值在合理范围内,均值为4.281,标准差为2.073,偏度和峰度分别为1.937和5.648,可以看出该变量分布相对均匀,并服从于正态分布。
笔者使用SPSS22.0绘制出总被引频次、发文数量、篇均被引频次和h指数与P指数的散点图,发现总被引频次、发文数量、篇均被引频次和h指数与p指数近似呈现较强的线性关系,因此对各项统计指标进行Pearson相关分析。研究发现,p指数与总被引频次、篇均被引频次、h指数具有较强的相关关系,与发文数量无相关关系。
1.p指数与总被引频次的关系。在考察档案学领域专家学者的学术影响力时,总被引频次这个指标比较有利于发文较多的作者,但由于引用活动本身的时滞特征,总被引频次很难应用在较近的出版物上。笔者按照总被引频次排序,发现11位学者在两种指标下名次没有变化,31位学者在两种指标下名次变化很小,说明这些学者的论文总体被引比较稳定,他们的学术影响力可以经受这两种不同评价指标的测评。
笔者利用SPSS22.0将p指数排名与总被引频次排名进行了相关性分析,结果显示:总被引频次与p指数的Pearson相关系数为0.961,对应的p值为0.000,在5%的显著水平上十分显著,可以认为总被引频次与p指数之间具有十分强的正相关关系。
2.p指数与发文数量的关系。论文的产出数量虽在一定程度上反映了学者的生产效率,但发文数量高的作者未必一定具有较高的影响力。在用p指数进行评价时,不仅要求发文量,还要求论文具有较高的篇均被引频次,这样才能得到较高的p指数。研究表明在档案学领域,p指数与学者的发文数量之间不具有相关性,学者的发文量对p指数不构成直接的影响。但发文数量指标依然很重要,它可以通过间接影响篇均被引频次来影响p指数。
笔者利用SPSS22.0,将p指数排名与发文量排名进行了相关性分析,结果显示:发文数量与p指数的Pearson相关系数为0.226,对应的p值为0.146,在5%的显著水平上并不显著,可以认为总发文数量与p指数之间不具有相关关系。
3.p指数与篇均被引频次的关系。篇均被引频次为总被引频次与发文数量的比值,因此这个指标可以有效防止学者仅仅追求论文数量的不良倾向。篇均被引频次容易受到那些总被引频次很少的论文的影响,如那些还未来得及被引用的新近发表的前端研究成果,或者发表了若干年而未引起关注的文章,但是在档案学领域,篇均被引频次在现阶段就表现出了对p指数的较大影响。43位高频被引学者在过去20年间总被引频次为3462次,篇均被引频次达到80.5次,说明这些学者对档案学的发展产生了很大的影响,他们在一定程度上更容易引导本领域的研究热点,也更能引领档案学的发展。
笔者利用SPSS22.0软件,对p指数与篇均被引频次进行了相关性分析,结果显示:两者的相关系数为0.936,对应的p值为0.000,可以认为篇均被引与p指数之间具有十分强的正相关关系。
4.p指数与h指数的关系。p指数延续了h指数的简洁计算过程且便于计算的特征,但与h指数相比,p指数具有更好的区分度。以档案学领域43位高被引学者为例,77%的学者h指数集中在3—5之间,h指数与作者存在“一对多”的情况,不能较好地区分学者的学術影响力,也就是说多位学者对应一个h值。反观p指数,每位作者对应一个唯一的p指数,可以很好地区分评价对象,从而进行更合理的排名。
笔者利用SPSS22.0软件,将p指数排名与h指数排名进行了相关性分析,结果显示,两者的Pearson相关系数为0.943,对应的P值为0.000,在5%的显著水平上十分显著,可以认为h指数与P指数之间具有十分强的正相关关系。
我國档案学领域高被引作者评价结果的相关性分析显示,p指数与传统指标之间的相关性较强,与h指数的相关性也很强。p指数弥补了h指数的部分不足,属于更为科学的评价指标。当然,本研究也存在以下不足:一是只考虑了学者在国内的学术影响力评价。有些档案领域的学者可能在国内投入的精力较少,他们注重在国外期刊上发表学术论文,这些文献在CSSCI中是检索不到的,因此会影响到数据分析结果的精确性,从而影响到对学者学术影响力的评价。二是只考虑学者的论文情况,没有将其著作考虑在内。对档案学领域而言,著作也非常重要,有些学者的经典著作也能为其带来长久的影响力。
参考文献
[1]Evgenia Vassilakaki, Valentini Moniarou-Papaconstantinou, (2017) "Beyond preservation: investigating the roles of archivist", Li-brary Review, Vol. 66 Issue: 3, pp.110-126.
[2]王云庆,徐芳.从作者分析看我国档案学研究队伍的状况[J].档案学通讯,2011(4):19-23.
[3][11]吕文婷.中国档案学学术群体共被引网络探析[J].档案学通讯,2018(2):38-43.
[4]郭瑶. 基于文献计量学的中国档案学者群体研究[D].天津:天津师范大学,2011.
[5] Hirsh JE.An index to quantify an individuals scientific research output. Proceedings of the national academy of sciences of the USA,2005,102(46):16569-16572.
[6]张正慧,郑德俊.p指数用于中文社会科学学术期刊评价的适用性分析[J].图书情报工作,2013,57(19):121-126.
[7]王圣洁,蒋旭,何晓庆.期刊p指数与其他评价指标相关性探讨[J].中国科技期刊研究,2014,25(11):1404-1407.
[8]许新军.p指数在期刊评价中的应用[J].情报学报,2015,34(12):1246-1251.
[9]王志军,郑德俊. p 指数运用于人才评价的有效性实证研究[J].图书情报工作,2012,56(14):93-97.
[10]赵蓉英,魏明坤,杨慧云.p 指数应用于学者学术影响力评价的相关性研究[J].情报理论与实践.2017,40(4):61-65.
[12]Ball P.Index aim for fair ranking of scientists[J].Nature ,2005,436(18):900.