文/陈和
替代计量学与传统计量学比较研究
文/陈和
自从人类历史跨入21世纪以来,随着科学技术发展,特别是以Internet为代表的信息技术的迅猛发展和普及,人类的日常工作、学习和生活发生了翻天覆地的变化。反映到人类的科学研究活动,同样也发生了巨大而深刻的变化。科学家的科研活动不仅限于具体的实验室,已经出现了网上科研协同;作为主要学术交流载体的期刊和专著,从传统纸质印刷出版逐渐转变为数字出版,并且出版形式越来越多样化;学术交流以发表论文为主要形式转变为以Internet为载体的多样化学术社交网络形式。
相应地,用于科研评价的传统文献计量学在科研环境已经变化的情况下,也需要作出相应的变化,因为在新的科研环境下,其科研评价的局限性日益明显,主要表现为如下3个方面:
1.基于引文的传统文献计量指标评价时滞过长,无法及时反映科学家的科研成果;
2.传统文献计量学主要评价对象为期刊论文,但期刊论文只是科学家众多科研成果之一,评价影响力片面;
3.引文分析的固有缺陷,包括引文动机不明确,评价对象面窄,指标数据容易作弊等。
因此,替代计量学作为新的科研评价方法应运而生。2010年7月,美国北卡罗来纳大学博士J.Priem和B.M.Hemminger提出了科学计量学2.0(Scientometrics2.0)概念,旨在基于分析微博、社会化书签等Web2.0应用提供的数据,即时、多角度地反映论文的影响力。基于此概念,同年10月,J.Priem 与D.Taraborelli 等人在专门设立的网站(http://altmetrics.org/ manifesto)发表“Altmetrics: A manifesto”宣言,正式提出“Altmetrics”术语。从此,“Altmetrics”引起了全球文献计量学家、教授学者以及相关专业人员的高度关注,并进行了热烈讨论。国内学者在介绍“Altmetrics”时,把它翻译为“替代计量学”、“补充计量学”、“选择性计量学”等。本文采用“替代计量学”作为“Altmetrics”的中文译名。
替代计量学目前还没有形成统一的定义,它是一种基于社会网络的影响力评价方法,通过各种工具获得开放获取(Open Access)平台、学术社交网络,以及各种文献管理系统中涉及某一研究成果的相关信息(比如下载量、引用次数、浏览次数、评论、转发等),然后对这些信息数据进行聚类分析和统计计算,测量研究成果受到的网络关注程度,进而全面、即时地反映科学研究的影响力。
替代计量学作为新生事物,与传统计量学既相互关联,又存在差别。本文对替代计量学与传统计量学进行对比分析,并指出替代计量学在进行推广与未来发展时可能存在的问题与应对思考。
无论是传统计量学还是替代计量学,都是为科研学术评价服务,为学术成果评级、人才遴选考核等不同评价场景提供参考依据。对学术论文进行评价不仅是对学者进行科学创作及其学术作品的客观肯定,而且科学、公正地评价对人才评估体系的建立、科学研究等具有十分重要的指导意义。人员职称晋升时,需要使用计量方法评价职员的学术能力及影响力;基金资助方对项目进行评审时,使用计量学方法对项目成员的学术水平进行评价。
基于引文分析的传统计量学在科研活动中起着重要的学术评价作用,但是随着时代的发展,科研环境的变化,传统计量学也将迎来自我发展和变化,即替代计量学的出现。替代计量学与传统计量学的差异主要表现为如下几个方面。
1.计量数据源
传统计量学是基于引文分析的计量,所以其计量数据来源于引文数据,更进一步地说是,已经发表的论文或专著的参考文献的统计数据。对这些数据运用不同计量算法得到不同的计量指标值。由美国科学情报所(Institute for Scientific Information,ISI)创建并推出的科学引文索引(Science Citation Index,SCI)是国际公认的进行科学统计与科学评价的引文数据库之一,是传统计量学最常引用的数据源。SCI每年都会发布影响因子、被引频次、即时指数等计量指标来对知名期刊、论文等进行排行,同时为用户提供不同方式的引文查询。传统计量学的数据源除了SCI,还包括社会科学引文索引(Social Science Citation Index,SSCI)、工程索引(Engineering Index,EI)、国际会议索引(Index to Scientific & Technical Proceedings,ISTP),以及中国的“中国科技论文与引文分析数据库”、“中国社会科学引文数据库”等。
出版形式越来越多样化;学术交流以发表论文为主要形式转变为以Internet为载体的多样化学术社交网络形式。
随着Internet的出现和普及,以及出版形式多样化的数字出版,科学家的学术成果发布已不再仅仅局限于传统期刊论文的发表,越来越多的原创性的最新学术成果发表在开放获取的数字出版平台上,比如PLoS开放出版平台。同时,越来越多的科学家在科学研究和学术交流过程中应用社会网络工具(比如Twitter、Facebook等)与同行进行学术探讨,利用在线文献管理工具(比如Zotero、Mendeley、CiteULike等)记录、管理他们的工作流程。
因此,替代计量学的计量数据源除了传统的引文数据外,还包括网络书签、文献管理软件、推荐系统、评论、微博、博客、维基百科、学术社交网络和开放数据平台等的所有用户在网络系统上留下的“踪迹”数据。
2.计量对象
从计量数据的来源可知,传统计量学评价的主要对象是期刊或发表论文。比如,期刊影响因子是用来计量期刊有用性和显示度的指标,反映期刊的整体学术水平;论文被引次数用来计量期刊论文的有用性的指标,反映期刊论文的学术影响力。
替代计量学不但能够用来对正式发表论文在论文层面进行计量评价,而且可以对开放获取论文、工作文档、电子图书、研究数据集、开源软件、演示文稿、课件、博客文章、网站等网络学术资源进行计量评价,从不同侧面计量学术成果被阅读、讨论、保存、点赞、推荐和引用的情况,从而对其影响力更加全面而细致的分析。
3.计量时效
一篇论文从被传统期刊录用到出版,再从出版到被引用要经过编辑审核、同行评议、稿件修改、出版社出版、被其他作者阅读、被其他作者在科学论文中引用、引用文章被同行评议,修改和出版等环节,这个过程至少需要大概一年的时间。如果一篇论文在开放获取平台出版,出版后即可被浏览、下载,以及被各学术社交网络提及、讨论、推荐、加标签或引用等。
因此,传统计量学计量时效比较漫长,对一些科研活动或成果进行评价因为时间漫长而无实际意义。替代计量学的计量数据来自网络,可以实时获取用户在网络系统上留下的“踪迹”数据,并且实时计算得出结果,计量的时效可以缩短到以天数来计量。
4. 计量影响力
传统上一般认为,如果一篇学术论文被另外的学术出版物引用,则表明该论文有一定的学术影响力。科学家的学术影响力主要由其发表的论文被其他科学家的引用来体现,如果科学家发表的论文越多,其他科学家引用他越多,则表明该科学家在学术界的影响力就越大。因此,基于引文的传统计量学可以计量期刊和论文及其作者的学术影响力。
随着学术开放获取运动的深入,以及学术社交网络的普及与开放,不仅专业学术人员可以很容易地获取科学家的学术成果,普通的非专业学术人员(如爱好者、感兴趣者、新闻媒体人员等)也可以轻易地获得他们感兴趣的科学家的学术成果。专业学术人员可以在网络上对学术成果进行阅读、下载、推荐、讨论,某些专业学术人员有可能会在他们自己新创作的学术作品中引用这些学术成果。非专业学术人员也可以对发布的学术成果进行阅读、下载和讨论等互动操作,然而他们未必会创作新的作品并引用这些学术成果,对他们的影响可能是扩大了他们的视野,增长了个人知识,改进了某个想法或做法,而这些影响正是学术成果的社会影响力的体现。通过对这些受众群体的“踪迹”数据(阅读量、下载量、讨论、收藏、推荐、点赞、引用等)进行计量,可以测量成果的学术影响力情况和社会影响力情况。
因此,替代计量的结果不仅可以反映科学家及其学术成果的学术影响力,而且可以反映其社会影响力,并从多个角度去揭示影响力的内涵,扩充影响力的覆盖范围。
5.应用领域
由于传统计量学与替代计量学都是为科研评价服务,所以它们都可以具体应用于如下几个方面:为学术研究人员遴选高质量和高影响力的学术论文;为基金遴选资助项目;在机构招募人员或评估考核研究人员时,提供定量评价指标供参考以及其他需要证明学术影响力的场景。
替代计量学与传统计量学相比,还可以有如下应用:
1.为科学家寻找潜在的合作机会。替代计量学能帮助科学家追踪哪些人对他们的学术成果感兴趣,以及追踪如何使用学术成果中的相关数据,藉此找到潜在的合作对象及资助伙伴。
2.展示科学家的社会影响力。由于替代计量学可以计量评价学术成果及作者的社会影响力,科学家可以在个人学术总结或个人简历附上替代计量学相关指标,为项目管理人员遴选项目或招聘单位录用或考核人员时提供参考。另外一方面,科研单位可以引用替代计量指标展示科研单位科研成果的学术影响力和社会影响力。
3.促进科学研究更加公平、开放、透明。替代计量学用于科研评价,评价指标值的高低,很大程度上取决于学术成果的开放性。因此,要获得较高评价值,科学家尽量让自己的学术成果通过开放获取平台出版或发布,让尽可能多的人发现、阅读、讨论、利用,从而获得较高的学术影响力和社会影响为,并获得大众的认可。科研机构也应鼓励科研人员的学术成果开放,并构建本机构知识库,提高科研机构的学术与社会影响力。
替代计量学在计量学领域属于新兴的事物,从术语被提出到今天,只有5年左右的时间,各方面的发展还不成熟,其存在的问题归纳起来主要表现在以下几个方面:
1.计量数据源的不确定性。替代计量学的计量数据主要来源于学术开放获取平台和学术社交网络,这些平台和网络在收集用户“踪迹”数据时并没有统一的规范,数据参差不齐。另一方面,有可能由于各种因素导致平台或网络终止运行,或者产生新的平台或网络。
2.计量指标有待确定和统一。从现有的文献来看,不同的计量学研究者提出不同的替代计量指标,有些计量指标的评价属性还存在争议,需要继续深入探讨和研究。另一方面,计量指标影响力算法也不一致,因为不同指标在不同阶段所体现的影响力情况各不相同,而且不同来源、不同评价人员所体现的影响力情况也不一样,所以需要对不同的评价指标给予不同的分值来体现各项指标的影响力。
3.计量指标的不可验证性。与传统计量学指标相类似,由于替代计量指标计量方法公开透明,有人可能为了某些利益想获得较高的计量指标,根据计量方法对某个指标进行作弊操作,比如可通过自动下载程序连续下载论文,可在短时间内获得大量的下载量和页面浏览量;也可能通过收买Twitter、Facebook、博客等使用者,恶意进行分享学术成果,从而提高成果的分享量与分数。
4.缺乏权威计量工具。目前计量评价实践中可以参考的计量工具有Altmetric. com、ImpactStory、Plum Analytics、PLoS ALMs等。由于这些计量工具在技术层面、利益考虑等各方面原因,其涵盖的数据源、评价策略、评价指标等方面存在不一致性。比如,对于相同的数据源,Altmetric.com收集Google+ user数量,ImpactStory收集Google+ plugs posts数量。即使评价同一个对象,各个计量工具得出的评价结果可能并不一致。因此,各个工具之间互有利弊,缺乏权威和统一性。
另外,目前有关替代计量学的理论和工具都是基于英语环境和自由网络之上的,若要在非英语环境下推广和利用替代计量学,可能还需要结合当地语言环境和国情进行本地化实践。比如,国内人群较少使用Twitter、Facebook、Google+等社交网络,而是比较多利用腾讯QQ、微信、微博等社交网络,如果利用Altmetric. com、ImpactStory等计量工具评价国内科学家的影响力,显然有所欠缺。
针对替代计量学存在的问题,美国国家信息标准协会(National Information Standards Organization,NISO)执行董事Todd Carpenter的一段话很好地进行了阐述,“如果替代计量学要走出现在的测试和概念验证阶段,学界必须开始将注意力集中在给出一套公认的定义、计算方法和数据共享实践上。组织和科研人员如果想利用这些指标,就应该充分地理解它们,确保其一致性和意义统一性,而且应该有方法来审计其准确性。我们必须就一些基本问题达成共识,包括:应该测量哪些指标,衡量指标质量好坏的标准,这些指标应该在何种粒度上进行收集和分析,替代计量所测量的时间跨度应该是多少,社交媒体在替代计量中的角色,要交换这些数据需要什么样的技术基础设施,以及哪个替代计量指标是最有价值的。”因此,替代计量学要进行真正推广应用,还必须先对上述的问题进行研究和解答。
从传统计量学发展到替代计量学,这是基于科研活动在网络时代发展的必然趋势,邱均平学者认为这种必然性源于以下5点:
(1)科学家越来越多地使用网络来进行学术追踪和交流;
(2)这种交流不仅在学术圈内,而且已经成为全民的交流习惯;
(3)这种新的交流体系确实能提高交流效率,降低交流成本;
(5)开放学术运动的不断深化,在线科研交流成为实现开放学术的重要手段,势必带来科研交流的网络化。
另一方面,人类科学研究虽然已经进入网络时代,但是原有的科研环境并没有被彻底替代,原有学术交流模式也没有被终结,在新旧科研环境与学术交流模式并存的情况下,为科研评价服务的传统计量学与替代计量学也将并存,而且相互学习,取长补短,共同为科研评价服务。
(作者单位为厦门大学图书馆)
放获取运动引领的出版体系变革,将以
为重要特征;