基于欧几里得指数的学术影响力评价
——以《经济研究》2009年-2018年论文作者为例

2020-07-28 12:37:04王春雷
湖北工程学院学报 2020年4期
关键词:公理化列表影响力

王春雷,韦 梅

(广西大学 商学院,广西 南宁 530004)

传统上,学术影响力评价主要针对的是宏观层面的国家或中观层面的机构,极少针对微观层面的个人。这是因为个人论文数量相对减少,一篇引用数量较大的论文就会显著影响作者的评价结果。[1]为克服这一缺陷,Hirsch(2005)[2]提出了h指数,它等于作者发表的论文中至少有h篇论文的被引频次不少于h次。由于h指数非常容易理解,且通过一个简单的指标概括了论文数量和引用次数的信息,自其问世以来就受到了研究者的极大关注,各种关于h指数的扩展研究层出不穷。[3-4]

但是,h指数及其以之为基础的扩展指数都存在一个潜在的问题,即它们都是研究者基于直觉或者经验提出的,逻辑上可能存在不一致性。[5]我们列举一个简单的例子来说明这一问题。假设有两位作者A和B,他们都发表了5篇论文。作者A有 3篇论文获得了4次引用,2篇论文获得了0次引用,h指数为3;作者B有2篇论文获得了3次引用,3篇论文获得了2次引用,h指数等于2。根据h指数可以判断作者A的影响力要大于B。现在假设A和B的每篇论文的引用次数都增加了2次,逻辑上来说,A的影响力仍然会大于B。但是,A的h指数仍然等于3,但B的h指数却增加到4。也就是说,当A和B的论文引用次数增幅完全相等时,根据h指数计算的影响力结果却发生了反转。

此外,由于一段时间内一位作者在某一本期刊通常发文很少,如果将样本局限于某一本期刊,那么许多学者的h指数均相等,完全没办法通过h指数区分学者之间的学术影响力差异。这也是为什么研究文献通常以某一领域的文献进行分析,但这很容易造成错误的结果。以经济学领域为例,假设作者A只在《经济研究》期刊发表了3篇论文,每篇论文被引用了1000次,h指数等于3;作者B在某普通经济类刊物发表了10篇论文,每篇论文被引用了5次,h指数等于5。显然,如果只根据h指数判断作者的学术影响力差异就大错特错了。

为避免依据经验或直觉带来的不一致问题,应采用公理化的方法来确定影响力指数的函数形式[6],即先设定影响力指数要满足的一些公理,如对称性、单调性等,然后推导出一类或一个特定的函数形式。其中,Perry和Reny(2016)[7]为我们比较在某一本期刊论文作者的学术影响力提供了一种新的思路。在这篇发表于《美国经济评论》的论文中,作者利用五个公理化假设,得到了一个学术影响力测度指标。这一指标能够应用于某一本期刊,不会出现对许多作者无法评断学术影响力大小的局面,也不会人为制造权威期刊论文与普通期刊论文等价的尴尬局面。纵观国内现有文献,研究学者们并没有对影响力指标的公理化基础给予充分关注。[8]因此,本文首先介绍Perry和Reny(2016)提出的公理化假设及影响力指数计算公式,然后以《经济研究》这一经济领域最为著名的权威期刊收录的论文为样本,利用中国知网提供的论文引用数据,比较《经济研究》期刊作者过去十年的学术影响力大小。

一、学术影响力计算公式:欧几里得指数

为方便起见,用一个n维向量表示某一作者的论文引用次数列表,x=(x1,x2,…,xn)。其中,n表示作者发表的论文篇数,xi表示每篇论文获得的引用次数。作者发表论文的影响力指数用I(x)表示。由于作者的学术影响力体现为他的论文能否被其他学者引用,当他发表了一篇引用次数为0的论文,这篇新论文并不会提升他的影响力。如果用x+1=(x1,x2,…,xn,0)表示新的论文引用次数列表,则影响力指数I(x+1)=I(x)。如果另一位作者的论文引用次数列表为y=(y1,y2,…,ym),m

第一个公理化假设是单调性:如果一位作者的一篇论文获得了更多引用,其学术影响力显然也会增加。如果用di≥0表示作者第i篇论文新增的引用次数,则新的引用次数列表可以表示为向量x+d=(x1+d1,x2+d2,…,xn+dn),则I(x+d)≥I(x)。需要说明的是,虽然一篇论文的引用次数肯定是整数,但由于一篇论文通常有多位作者,在计算单独一位作者的影响力时,需要将合著论文的引用次数分配到每位论文作者,而每位作者分得的引用次数不一定是整数,故不限定d是否为正整数。

第三个公理化假设是深度相关性:如果将一位作者引用率较高的一篇论文替换成多篇引用率较低的论文,作者的学术影响力反而会下降。例如,作者的论文引用次数列表用向量x=(x1,…,xi,…,xn)表示,某一篇论文的引用次数为xi,令xi=a+b,且a、b均为正整数,则I(x)>I(x1,…,a,b,…,xn)。这个公理表明论文拆分并不能让作者的学术影响力变大,一篇重要论文要比多篇一般性论文更有影响力。

第四个公理化假设是规模不变性:如果将作者的论文引用次数列表中的每篇论文的引用次数扩大或缩小相同的倍数,不会改变论文作者的学术影响力大小。例如,如果用λx=(λx1,λx2,…,λxn)和λy=(λy1,λy2,…,λyn)表示新的论文引用次数,λ>0,则根据I(x)≥I(y)可以推出I(λx)≥I(λy)。

根据上述四个关于学术影响力的公理化假设,可以证明对于任何一个论文引用次数列表x=(x1,x2,…,xn),学者的论文影响力指数可以表示为:

由于计算影响力指数的目的是得到作者的学术影响力排名,其相对大小有意义,但其绝对数值差异无意义,因此I(x)的任何单调增函数均可以用来计算论文作者的学术影响力。

最后,为了确定参数σ的大小,Perry和Reny(2016)提出了第五个公理化假设:针对两位作者的论文引用次数列表,作者的影响力指数相等,如果将一个新的引文次数向量d加入到两位作者的引用次数列表,而影响力指数仍然相等,即I(x+d)=I(y+d)。那么,对于任意λ>1,必有I(x+λd)=I(y+λd)成立。这一公理被称为“方向不变性”。依据这一增加的公理可以确定参数σ=2。此时,影响力公式等价于n维空间中距离的计算公式,因此被称为“欧几里得指数”。

二、实证分析

1.数据来源与处理。我们选择中国知网收录的《经济研究》期刊2009-2018年的学术论文作为样本,不包括论坛介绍、会议综述以及增刊。经统计,这十年间共有1562篇论文发表,共有2211个作者署名,其中有995位第一作者。表1给出的历年发表论文的作者人数及引用次数情况。由于知网引用数据会随时间发生变动,因此我们专门在2019年12月14日当天收集所有论文的引用数据。

表1 论文作者人数及引用次数情况

根据表1可知,《经济研究》论文以两人或三人合著为主,所占比例一般超过60%。四人合著论文有逐渐增加的趋势,五人及以上合著论文比较少见。由于《经济研究》刊登的论文主要是合著论文,为了比较每位作者的学术影响力,首先需要对合著论文的引用次数进行分解,即将每一篇合著论文的引用次数分配给每位作者。

有两种简单的方法分配论文的引用次数:一种方法是第一作者全得,不管论文是多少人合著,我们将所有的引用次数全部分配给第一作者,其余作者分配的次数均为0;另一种方法是所有作者平分,如果一篇论文有n为作者,每位作者分得的引用次数均为论文总引用次数的1/n。第一种方法过分强调第一作者,完全不考虑其余作者的贡献,第二种方法又完全不考虑作者贡献的差异。它们均与学术界的实际情况不符。例如,当一位即将毕业的经济学博士求职时,其简历上面通常会有几篇导师第一作者本人第二作者的论文,将这些非第一作者的论文列入简历也能反映求职者的学术功底。此外,国际经济学期刊的作者署名次序通常是按照姓名首字母顺序排列,而《经济研究》期刊的论文作者署名并不是遵循这一惯例,这也从一个侧面反映了作者的学术影响力与作者署名次序有关。

为了体现每位作者的贡献,同时又能够区别每位作者的贡献差异,本文主要采用三种方法来分解每篇论文的引用次数。第一种方法是几何法,前一位作者分得的引用次数是后一位作者的两倍,如果一篇论文有n位作者,第i作者的分配比例为2n-i/2n-1。第二种方法是调和法,它类似于调和平均数,第i位作者的分配比例为(1/i)/(1+1/2+…1/n)。第三种方法是比例法,每一位作者分配的引用次数与作者排序一致,第i位作者的分配比例为2(n-i+1)/n(n+1)。表2给出的是三种分配方式下每位作者分得的引用次数比例。

2.结果分析。根据上面的思路,我们为每一位作者构建了一个引文数据向量,其维度等于作者发表的论文篇数,然后通过计算“欧几里得指数”比较论文作者的学术影响力大小。表3给出的是影响力排名前十位的作者名单。由于篇幅限制,其余两千多位作者的排名没有列出。

表2 合著论文每位作者分配的引用次数比例

表3 不同引用次数分配方法下影响力排名前十位的学者

由表3可知,几何法、调和法、比例法等三种方法计算得到的学术影响力排序结果非常接近,前十名作者名单基本相同。特别地,排名前六位的作者名单则完全一致。这说明本文的计算结果非常稳健,不会因为论文引用次数分配方法的变动而发生大的改变。需要提及的是,排名第七到第十位的作者的影响力指数基本在700到800之间,表明这些作者的学术影响力差异并不像排名体现的那么明显。

为了对比,表3还列出了只认第一作者和所有作者平分两种引用次数分配方式下的学者排名。结果显示,一些在“只认第一作者”分配方式下影响力排名前十的学者,其名字并没有出现在“所有作者平分”分配方式下的影响力前十名单,反之也是如此。即便是均排在这两个榜单前十的作者,其名次也变动很大。例如,在“只认第一作者”分配方式下,干春晖排名第一,但在“所有作者平分”分配方式下,他却只排名第六。因此,不宜采用这两种方法来分配论文的引用次数以确定论文作者的学术影响力大小,与前文的逻辑分析一致。

三、结论及展望

本文采用几何法、调和法、比例法等三种方法将2009年-2018年在《经济研究》期刊发表的每篇论文的引用次数分配到署名的每位作者,可以得到每位作者的论文引用列表,然后依据Perry和Reny(2016)提出的“欧几里得指数”计算每位作者的学术影响力大小。结果显示,学术影响力计算结果非常稳健,三种论文引用次数分配方法下的结果基本一致。复旦大学的陈诗一是过去十年间《经济研究》期刊最有影响力的论文作者。值得一提的是,陈诗一在2019年获得了第十八届孙冶方经济科学奖,其学术影响力得到了业界公认,也从一个侧面反映了本文计算公式的合理之处。另外,根据我们的分析,中国社会科学院的蔡昉的学术影响力紧随其后,方军雄、干春晖、王小鲁、权小锋等人的学术影响力也非常大。

要想更加完整地分析论文作者的学术影响力,需要将更多的期刊纳入分析。这是因为,一些在《经济研究》期刊发表论文的作者通常也在其他一些有影响力的期刊,如《中国社会科学》《管理世界》《经济学季刊》等期刊上发表论文。例如,陈诗一获得孙冶方经济科学奖的论文就是发表在《中国社会科学》期刊上。然而,本文暂时没有进行这样的尝试,主要是出于不同期刊影响力不一样的考虑。因此,只有在能够区分不同期刊引用次数质量差异的基础上,将更多的期刊纳入分析才有意义。如何区别对待不同期刊的论文引用次数以及如何合成作者的引用次数列表,将是下一步的研究重点。

猜你喜欢
公理化列表影响力
巧用列表来推理
学习运用列表法
扩列吧
论经济学中的公理化方法
大经贸(2019年8期)2019-10-30 08:08:13
对外汉语教学中的数学方法
天才影响力
NBA特刊(2018年14期)2018-08-13 08:51:40
黄艳:最深远的影响力
人大建设(2017年11期)2017-04-20 08:22:49
基于独立公理的离散制造系统精益设计公理化映射研究
管理现代化(2016年5期)2016-01-23 02:10:19
3.15消协三十年十大影响力事件
传媒不可估量的影响力
人间(2015年21期)2015-03-11 15:24:39