王 琳 岳卫平
(科睿唯安学术研究事业部,北京100090)
1955年,尤金·加菲尔德博士在Science上发文介绍了引文索引这一概念[1],他认为作者发表论文的文后参考文献能够将这位作者的工作与其他相似主题的论文联系起来。加菲尔德博士把这一现象称为“association-of-ideas index”,并由此提出了一种新的检索方法——引文检索。他发明引文索引的初衷是为了让文献检索更加高效与准确,后来也意识到引文索引的数据能够更深层地揭示科学活动本身[2-4],包括科学的结构、科学随时间的变迁、以及文献作者之间的联系。这些数据可以在国家、机构甚至个人维度上进行分析。通过对论文数据的分析,能够了解论文的产出情况;通过对引用情况的分析,能够了解论文的学术影响力信息。然而引文数据在科研评估中的应用是其间接、或者衍生的作用,其首要功效还是为科学探索本身服务。
引用究竟代表了什么,以及如何去解释引用的统计数据是长久以来人们争论的一个问题。很多人认为引用代表了论文的重要性或者受欢迎的程度。20世纪领先的科学社会学家Robert K.Merton先生就把引用参考文献称为“一种同行认可的行为”[5],认为引用是科学系统中用来偿还知识债务的货币,只有对作者的科学研究有贡献的文献才会被作为参考文献列在其文章的末尾。他同时强调引用参考文献是研究人员规范化行为的重要组成部分,是一种经过考虑的、正式的强制性活动,是科学共同体所遵从和出于学术道德所必须的行为。正是基于这种观点,引文分析能够用来识别那些有影响力的研究成果。很多已有研究表明,在大多数领域中,论文或者科研人员获得的引用频次与同行之间的认可程度都存在着正相关[6-8]。所以赋予“引文桂冠奖”此项殊荣的其实并非科睿唯安,而是科学家的同行——全球相关领域的科研人员,他们通过在论文中引用“引文桂冠奖”得主的研究成果,认可其在该领域所作出的贡献,及对他们的科研所产生的推动和影响。引文的分布并不符合正态的高斯分布,而是呈现偏斜性规律,也就是帕累托法则、二八法则[9]。加菲尔德先生曾经指出20%的论文可能贡献了80%的引用[10],后来亦有研究表明,对于一个科学家来讲,可能需要更多比例的论文才能贡献其80%及以上的引用[11]。同时应该看到,引用行为发生在一定的社会背景之下,一旦获得过引用,一篇文章可能在未来更容易获得引用,这种现象也被称为累积优势、优先依赖,默顿先生把这种现象称为马太效应[12],这种现象进一步拉大了高引用论文和其他论文的差距。表1统计了1970—2019年科研论文(article)和会议论文(proceeding paper)的被引情况。Web of Science平台共有将近4600万篇文章,只有2篇文章获得了10万次以上的引用;200多篇文章获得了1万次以上的引用;4800多篇论文被引用了超过2000次,也就是大约有万分之一的论文获得2000次以上的引用,获得1000次以上引用的论文也仅有18000多篇。可以看出,论文想要获得高引用次数的难度很大。
表1 Web of Science数据库中1970—2019年所收录科研论文和会议论文的被引频次分布Tab.1 The citation distribution of articles and proceedings papers indexed in Web of Science from 1970 to 2019
加菲尔德之前曾经发表了很多文章重点介绍获得引用最多的科研人员和诺贝尔奖获得者的情况[13]。根据其思路,科睿唯安自2002年以来就利用引文数据来“预测”诺贝尔奖级别的科学家。到2019为止,一共有54位科睿唯安“引文桂冠奖”得主获得了诺贝尔奖。“引文桂冠奖”遴选办法兼具定量与定性层面的考量,依序从以下四个维度展开:
1)引文分析
首先选出论文总被引次数达到1000次及以上的作者,然后统计其在不同领域中的总被引次数、篇均被引次数、高被引论文数(被引频次位于同年度、同学科前百分之一的论文)和h指数;对其是否发表了高引用次数的综述、是否发表了研究前沿的核心论文(在Essential Science Indicators(ESI)数据库中,若一组高被引论文通过聚类分析可得到特定研究主题,则这组高被引论文为研究前沿的核心论文)进行分析;同时发掘其被引频次背后的特征,即引文是否呈上升趋势,以及引文是否集中在某一项重要成果而非来自许多不同方向的研究。
2)评估科研人员的研究内容
在进一步分析引文背后的信息时,需要判断引文是否集中于同一项成果;考察高被引论文所属类型(是否属于方法性研究、综述文章或合作论文)、作者贡献(是否主要贡献者、作者数是否超过百位);分析研究内容在其领域是否属于重要成果(是根本性进步或革命性发现,还是扩展了基础性工作);同时考虑这一研究是否已经被授予过诺贝尔奖,研究成果与其他候选人相比是否具有优势。
3)识别主要贡献者
基于前述分析结果,识别重大研究成果的主要贡献者。根据诺贝尔的遗嘱,每个奖项的获奖者不得超过三人,同时诺贝尔委员会倾向于选择开创性发现,而不是扩展性工作,不管这些扩展性的工作多重要。
4)补充指标:参考同行的尊重与认可
分析候选人是否获得过其他奖项,特别是一些“风向标”类的奖项,如拉斯克医学奖、加拿大盖尔德纳奖、沃尔夫奖、日本奖、京都奖、克拉福德奖、邵逸夫奖、富兰克林奖、格鲁伯神经科学奖、约翰·贝茨·克拉克奖等;分析其身份,是否是院士、外籍院士或学协会会士,是否在国内及国际会议上进行过重要的主旨发言,是否在机构内担任重要职务,是否为大型实验室的负责人,以及是否担任高影响力期刊的编委等。
科睿唯安自2002年开始每年遴选“引文桂冠奖”,2003—2005三年内只对部分领域的获奖者进行调整,2006年起开始每年在诺贝尔奖的四个领域中各遴选三项发现或研究方向,以及与之相关的科学家进行研究。表2列举了2002—2019年在诺贝尔奖的四个学科领域获得“引文桂冠奖”的科学家名单。18年来,全球336位获得“引文桂冠奖”的科学家中,54位获得了诺贝尔奖,其中9位在获得“引文桂冠奖”当年获得诺贝尔奖,12位在次年获奖,16位在2~3年内获奖,7位在10年及以上获奖。2011年四个领域的诺贝尔奖得主均曾获得“引文桂冠奖”。在这54位科学家中,15位来自生理学或医学领域,16位来自物理领域,6位来自化学领域,另有17位来自经济领域,涉及30个细分研究领域。
图1展示了336位“引文桂冠奖”获奖人的地理分布,可以看到美国的获奖人数遥遥领先,共有200人,占总人数的近60%;英国紧随其后共有43人获奖;日本以25人位居第三。此外,加拿大、法国、德国均有超过10人次获奖;我国仅有1人在2016年获得化学“引文桂冠奖”,是来自我国香港地区香港中文大学的卢煜明教授。
表3按照四个领域统计了每个领域中获奖人数最多的Top国家。四大领域的获奖总人数分别为:生理学或医学96人;物理85人;化学76人;经济学80人。美国依然是四大领域中获奖人数最多的国家;英国在除化学外的三大领域中获奖人数仅次于美国;日本在化学领域获奖人数位居第二,在生理学或医学以及物理领域获奖人数位居第三;此外,加拿大、法国、德国等均有不俗的表现。
表3 各领域“引文桂冠奖”得主人数Top国家Tab.3 Top countries of“Citation Laureates”winners from the four areas
图1 “引文桂冠奖”获奖人国家/地区分布Fig.1 Country/region distribution of“Citation Laureates”winners
图2展示了“引文桂冠奖”得主在获奖时的年龄分布。总体来说大部分获奖者集中于50~70岁,其中30~40岁的获奖者共有3位,最年轻的获奖者是来自曼彻斯特大学的Kostya Novoselov,获奖(物理)时只有34岁,他在两年后因为“二维石墨烯材料的开创性实验”而与其导师一同获得2010年诺贝尔物理学奖。最年长的获奖者是来自慕尼黑大学的Rolf Huisgen,于2019年获得化学“引文桂冠奖”,已经99岁。在336位获奖者中共有15位女性科学家,占总人数的4.5%。
正如瑞典化学家阿尔弗雷德·诺贝尔的遗嘱所说,诺贝尔奖的设立是为了“奖励那些在前一年为人类做出卓越贡献的人”[14]。诺贝尔奖并不是基于引文次数做出决定,因为引文只从侧面反映了科研人员的学术影响力。但引文数量在某种程度上与同行专家主观判断出的哪些研究以及哪些科学家在相关领域拥有最高影响力(包含社会、经济等)有很强的相关性。同行评议是小范围自下而上的定性角度,而引文分析是一种大范围自上而下的定量视角。正如前文所述,引文的来源是科研人员自身,基于研究人员自己的学术判断,所以引文分析从某种程度上也是同行评议的一种体现。
图2 “引文桂冠奖”得主获奖时的年龄分布Fig.2 The age distribution of the“Citation Laureates”winners at the time of selection
通过“引文桂冠奖”的成功,我们看到引文在分析科研表现时拥有一些优势,但在应用时应该特别谨慎与小心。在评判研究业绩和精英地位时,没有任何指标或方法可以让所有人都满意,使用不同的方法就可能产生不同的结果。因此,没有出现在“引文桂冠奖”名单上并不意味着科研人员在其领域内不具重要的影响力。科睿唯安一直希望数据能够得到正确的使用,不要由于数据误用而引发科研人员行为的改变,不要让获得引用或提升排名成为科研人员与大学的目标,应该追求的是卓越科研成果本身。将引用或者排名设为唯一目标时,往往会对科研带来一定的阻滞,这是因为,当人们通过改变行为以优化得分的时候,分数将不能正确评估它想要测量的内容。正如 Goodhart’s定律所说[15],一旦出于控制目的施加压力,任何观察到的统计规律都将趋于崩溃。大学管理者的重点应该是确保科学家拥有一流的环境和支持以实现自身的潜力,这样,好的甚至卓越的研究就会浮出水面,这些成果会自然而然地获得引用,得到真正意义上的认可。当我们通过被引频次位于前百分之一、前千分之一乃至前万分之一的论文来定量分析一位科研人员时,可以充分表明该科研人员贡献了一些非常有价值、甚至有重要意义的东西,当他发表了多项这类成果的时候,我们可以更准确地判断该科研人员的研究具有重要的学术影响力。但如果我们利用高被引论文等数据去做出晋升或科研经费奖励等决定的时候,需要对数据进行更深度的解读。
尤金·加菲尔德博士发现引文分析能够成为同行评议的一种补充,用于确保评价的客观性或者为专家提供更多的信息[16,17]。人们不应该用论文和引文数据来代替阅读及评估科研人员的成果,进而代替同行的判断。应该利用一系列标准化指标相结合来进行分析,避免使用单一指标,比如单一的h指数进行评价。因为每个指标仅能揭示某一个维度的活动或表现,而科研活动与科学家的职业生涯都需要多维度的分析。因此,在遴选“引文桂冠奖”的过程中,我们同时应用了定量与定性的多维度数据来遴选诺贝尔奖级别的科研精英。