基于信誉分配的学者影响力评价算法

2016-11-30 03:16
鞍山师范学院学报 2016年4期
关键词:信誉影响力学者

倪 金

(鞍山师范学院 成人教育学院,辽宁 鞍山 114000)



基于信誉分配的学者影响力评价算法

倪 金

(鞍山师范学院 成人教育学院,辽宁 鞍山 114000)

提出了一种基于信誉分配算法的评价方法(CAIF).该算法采用的实验数据来自美国物理协会数据集(APS),实验结果证明基于信誉分配的评价方法能较好反映不同学者真实的影响力.

信誉分配;学者影响力;评估方法

合理评估学者的影响力不仅能够帮助研究者发现相关学者的研究内容,而且为学者的职称晋升、工作调转、科研奖励等提供重要的依据.由于学者影响力在学术大数据的演进中具有动态变化的特征,公平评价学者影响力具有非常大的挑战性.对学者评价的传统方法有:学者发表的论文数量、学者所发表的论文的总引用量等.目前,较为流行的方法是H-index[1],它反映的学者影响力是一个累计的增长过程.然而,这些方法都不能准确地捕获学者影响力变化的趋势.

为了解决这个问题,学者们已经开展了许多探索性的工作.例如,作者影响因子被介绍[2],它是期刊影响因子的拓展,作者影响因子可以通过一个比值求得,用一个学者近几年所获得的引用量除以这个学者所发表的论文数量.作者影响因子被介绍方法的优点在于能够捕获学者的科学产出影响力的变化趋势,但这个方法存在一个弊端,即一篇文章所获得的引用量被同等地分配给同一文章的共同作者.这样会造成引用量的膨胀,同一篇文章,每个作者的贡献是不相同的,论文的引用量采用同等对待的方法是不合理的.

为了公平地分配一篇论文的影响力给它的不同的作者,信誉分享算法被提出[3],这个算法采用一个共被引的机制,通过在引用网络中感知学者的贡献,来分配一篇论文的影响力.

为了公平地评价作者的影响力,我们提出了基于信誉分配的评估方法(CAIF),其特点如下:

(1)CAIF方法能够准确呈现学者影响力的动态变化曲线,反映一个学者在某一段时期内的真实研究的影响力,弥补H-index方法不能反映学者影响力变化趋势的缺点.

(2)CAIF方法利用一段时间内引用的平均值进行计算,对存在恶意操纵引用量的论文起到惩罚的作用.

(3)CAIF 方法的定义简单,容易实现.

1 相关工作

目前,关于计算学者影响力的方法大体分为3类:第一,是基于引用的度量方法,包括:H-index,引用量,以及H-index的多种变体[4];第二,是基于网络的度量方法,这种方法也受到广泛的关注,例如,PageRank算法、HITS算法以及中心度量方法.中心度量方法主要度量在网络中的重要性;第三,是基于用法的度量方法,这种方法是利用在线的数据,比如,在线下载量、转载量、关注度等.

对于学者的影响力,早期的评估方法有学者发表的论文数,学者的总的引用量,每篇论文的平均引用量,重要论文数量(比如,引用量≥100),H-index以及H-index的变体.较为流行的方法为H-index,但是H-index存在一些弊端,H-index是一个累计上升的过程,不能反映出某个学者阶段性的影响力的变化.

基于网络的评估方法有:

(1)co-Rank方法,利用PageRank和HITS算法共同排序作者和论文;

(2)Tri-Rank方法,利用PageRank方法,共同排序作者、论文和出版社.

利用用法的度量方法.主要是利用网络平台,如ImpactStory,ScienceCard,PLoS Impact Explorer等.在这些平台上,会收集作者的引用量、下载量、关注度等信息.

在评价学者影响力中,其中一个核心问题就是,一篇文章如果多个作者共同完成,那么它的影响力如何进行合理地分配?本文就如何解决公平地评价一个学者影响力的问题,设计了一个CAIF算法.

2 CAIF算法

CAIF算法的架构图如图1所示.算法分为两部分:(1)计算每篇论文的共同作者的影响力评分,这里的论文影响力评分,用引用量表示;(2)结合作者的信誉评分,计算学者影响因子(AIF).基于学者影响因子和信誉分享算法,本文提出了一种合理评价学者影响力的方法.

2.1 信誉分配算法

信誉分配算法是用于合理地分配一篇文章共同作者的贡献[3].它通过在科学社群中的感知来分配共同作者的贡献,如图1所示.具体方法描述如下:

图1 信誉分配算法

假定一篇文章P0有n个共同作者,为了确定每个作者的信誉分享的共享值,算法首先识别所有引用P0的作者集合M{m1,m2,m3…}.其次,识别所有共被引集合P{ P0,P1,P2…},表示一个引用共被引的论文全集.每个共被引论文Pj通过共引权重Sj与P0联系起来.Sj定义为共被引的次数.例如,对于论文P1,S1=1时只有一篇论文引用P0和P1,而S2=4时有4篇论文(m1,m2,m3,m5)引用了P0和P2.需要说明的是,目标论文P0也被看作它本身的共被引论文,其共引权重为它的引用量.再次,计算信誉分配矩阵A,Aij表示ai从共被引论文Pj得到的信誉值.作者ai总的信誉值计算如下:

(1)

2.2 学者影响因子

学者影响因子在文献[2]中被提出,它的计算方法与影响因子的计算方法非常类似,用作者发表的论文数代替期刊发表的论文数,用作者获得的所有引用量代替期刊获得的引用量.其方法计算如下:

(2)

AIF表示学者的影响因子,CAuthor表示作者所有论文引用量之和,Npapers表示作者所发表的所有论文的数量.

2.3 基于信誉的学者影响力评价算法(CAIF)

学者影响因子是把一篇文章的引用量同等地分配给了它的所有作者,这样就会产生一个膨胀的效用,引用量被反复计算.基于作者的影响因子以及信誉分配算法,我们提出一种合理分配共同作者贡献的方法,命名为CAIF算法.作者j的信誉评价算法具体公式如下:

(3)

基于信誉的学者影响力评价算法克服了学者影响因子的弊端,它通过共被引机制去合理地分配共同作者的影响力.

3 实验过程

实验数据来自于美国物理协会数据集(APS)的一个子集PRC.数据集里包含从1970~2013年的论文,每篇论文包括如下字段:题目,DOI,作者,出版日期,作者机构以及出版商.值得一提的是,这个数据集单独提供一个引用列表文件,从这个文件中抽取了PRC上包含的引用关系,并对不完全数据以及有误数据进行了移除处理.

在PRC数据集上,分别利用本文提出的CAIF算法和AIF算法进行计算,计算的比较结果如表1所示.排名第1的作者,按AIF算法排名得分为2 252.462,按CAIF算法排名得分为1 056.794,两种排名方式均第1.按AIF排名的作者,从第3到第8个作者,在CAIF前10的列表里均未上榜.通过这样的一个对比结果可以发现,一篇文章的影响力如果同等地分配给共同作者,作者的影响力会膨胀起来,这样不能反映作者的真实的影响力.通过本文提出的CAIF算法,能够更合理地将文章的影响力分配给共同作者.

表1 CAIF和AIF的比较

本文还调查了作者影响力排名靠前的作者以及他们影响力变化的趋势.图2展示了排名前10的作者影响力变化趋势.横轴表示年份,纵轴表示按信任分配的作者影响因子的评分.通过对作者影响力的分析,发现排名靠前的作者具有如下特征:(1)发表文章的年限比较早,多数都从70年代开始;(2)排名靠前的学者的论文每年都会有一定的引用量.也有比较特殊的情况,论文在某一段时间里获得了特别高的引用量.

图2 影响力排名前10的学者

4 结论

本文提出了一个新颖的评价作者影响力的算法.它能够更客观地分配每篇论文的影响力给它的共同作者.研究发现排名靠前的学者基本上都具有长期科研能力,所发论文每年都会有一定的引用量.

[1] Hirsch J E.An index to quantify an individual’s scientific research output[J].Proceedings of the National academy of Sciences of the United States of America,2005,102(46):16569-16572.

[2] Pan R K,Fortunato S.Author Impact Factor:tracking the dynamics of individual scientific impact[J].Scientific reports,2014(4):516.

[3] Shen H W,Barabási A L.Collective credit allocation in science[J].Proceedings of the National Academy of Sciences,2014,111(34):12325-12330.

[4] Bornmann L,Mutz R,Hug S E,et al.A multilevel meta-analysis of studies reporting correlations between the h index and 37 different h index variants[J].Journal of Informetrics,2011,5(3):346-359.

(责任编辑:张冬冬)

Credit allocation based on scholars’ reputation evaluation algorithm

NI Jin

(Adult Education College,Anshan Normal University,Anshan Liaoning 114000,China)

Evaluating scholars’ impacts have given rise to attention widely.Although current appraisal methods of scholars’ impacts have obtained prominent success,these existing methods have some drawbacks.For example,the impact of one paper is allocated to different signed authors equally,leading to unreasonably assess.In order to evaluate the scholars’ impact,we proposed an evaluation method based on credit allocation algorithm,named as CAIF.Our experiments have conducted on American Physical Society dataset (APS),our results present that our methods can better reflect the true impact of different scholars.

credit allocation;scholar’s impact;evaluation method

2016-03-01

倪金(1975-),女,辽宁海城人,鞍山师范学院成人教育学院实验师.

G353

A

1008-2441(2016)04-0049-04

猜你喜欢
信誉影响力学者
以质量求发展 以信誉赢市场
基于单片机MCU的IPMI健康管理系统设计与实现
学者介绍
学者简介
学者介绍
信誉如“金”
天才影响力
黄艳:最深远的影响力
学者介绍
江苏德盛德旺食品:信誉为翅飞五洲