信息计量学的新发展:开放、融合、拓展
——第17届ISSI会议综述*

2020-06-10 08:04杨思洛
图书馆论坛 2020年6期
关键词:计量学影响力论文

杨思洛,祁 凡

0 引言

Web 2.0时代,科学交流与科技创新进入更快速、更高效的节奏。在此背景下,会议论文由于出版周期短,以及特有的科学交流属性,成为反映领域内研究热点与发展趋势的风向标[1]。“国际科学计量学和信息计量学学会”(International Society for Scientometrics and Informetrics,ISSI)是科学计量学与科技评价领域最高级别的国际专业学会,其主办的两年一次的大会学术水平高、参与人数多、影响力大,是信息计量学界的权威学术会议,在国际上享有很高声誉。学者对往届ISSI会议进行了研究。梁立明等对第7 届[2]和第13 届ISSI 会议[3]进行分析,揭示信息计量学发展趋势。赵蓉英等[4]从历时角度分析历届ISSI会议,展示科学计量学的发展进程。邱均平等从第15届[5]和第16届[6]ISSI会议论文的国家/地区、机构和主题等角度分析全球信息计量学的发展趋势。杨思洛等[7]以第16届ISSI会议为视角,探索新时期“五计学”的研究内容与发展趋势。2019年9月2-5日,第17届ISSI会议在意大利罗马大学召开,其目标是汇集信息计量学、文献计量学、科学计量学、网络计量学和替代计量学领域的学者,探讨新的研究方向、方法与理论,及其在科学计量学发展史和实际应用中的具体表现,展示本领域的最佳研究成果。本文以第17 届ISSI(ISSI 2019)会议论文集为数据源,从国家(地区)、机构、作者和主题4个角度,利用文献计量方法进行可视化分析,选取有代表性的论文进行主题内容的梳理,探讨信息计量学的发展趋势。

1 ISSI 2019会议概述

本次会议共收到420 余篇投稿论文,经过200余名专家审核,筛选出261篇全文以及156篇海报。其中,收录到会议论文集中的全文论文共257篇。

1.1 国家与机构分布

本次会议所收录的论文来自六大洲43个国家。图1为各大洲ISSI 2019会议发文情况,表1为ISSI 2019 发文量在5 篇以上的国家统计表。由图1、表1 可知,欧洲在发文量上占绝对优势,荷兰、德国、意大利异军突起,超越美国、加拿大等,分别位居第二、三、四名,这可能与本次会议在意大利举办有关。作为信息计量学的发源地,欧洲有较好的历史传承与研究基础。亚洲发文量达78篇,其中中国是ISSI 2019发文最多的国家。北美洲由于美国和加拿大两个科研强国的存在,也在全球信息计量学领域占有一席之地。一些不发达地区,如非洲、中东、拉丁美洲,也逐渐参与到ISSI国际会议中来,表明信息计量学的全球化趋势日益显著。总体而言,全球信息计量学的研究主体主要分布于欧亚大陆。

表1 ISSI 2019发文量5篇以上的国家

ISSI 2019吸引全球272个机构参会,表2列出发文量在5篇以上的机构。荷兰莱顿大学在发文数量上占有绝对优势,排名第一。约32%机构的发文量高于本次会议平均水平(1.79篇/机构)。

表2 ISSI 2019发文量5篇以上的机构

图2显示,各国在ISSI 2019会议论文的合作上较为密切。在合作网络中,中国和美国的节点最大,表明两国在国际合作中处于核心地位。荷兰、加拿大和西班牙等国的节点较为明显,在国际合作中也不容忽视。结合表1,德国、意大利等国虽然此次会议发文量超越美国、加拿大等国,但在合作度上小于这些传统意义上的科研强国,说明这些国家的独著率较高。从节点间连线粗细来看,中国、荷兰和美国之间形成了紧密的合作三角网络。以中国、美国、荷兰等国为核心,向外发展出以各自为中心的较为紧密的合作网络。结合往届会议情况[4],表明这几个国家在信息计量学领域的科研合作面较广,形成了长期稳定的科研合作关系。存在较强合作联系的还有中国与比利时、德国与荷兰、意大利与法国等。

图2 ISSI 2019国别共现网络

表3 ISSI 2019高产作者分布

1.2 作者分析

257 篇论文中,29 篇是独著,228 篇为合著,作者合作率88.72%,合作度2.87,可见ISSI收录论文中作者的科研合作较为紧密。ISSI 2019发文量在5篇以上的高产作者如表3所示,共有8 位。加拿大蒙特利尔大学的Vincent Larivière发文量最高,达11篇;在第16届ISSI会议中,他的发文量也排名第一;作为合作中心,他与Cassidy R.Sugimoto等形成较大的合著网络[6]。莱顿大学作为本次会议合著网络的核心之一,也为会议贡献了很多位高产作者,如Ludo Waltman、Nees Jan van Eck、Rodrigo Costas。罗马大学Cinzia Daraio、武汉大学张琳(Lin Zhang)和阿姆斯特丹大学Loet Leydesdorff 3位高产作者的发文量并列第6位。

2 ISSI 2019论文主题分析

本次会议将257篇论文划分为19个主题分会场。对ISSI 2019 会议论文集逐篇阅读,将19 个主题归结为四大研究专题,并以分会场主题为单位进行重点分析,分布情况见表4。

2.1 指标与数据库

指标是衡量研究对象特征的单一或复合数据的表现,其出现是为了提高计量与统计的可操作性。本届会议中的相关研究集中在3个方面。

(1)文献计量新指标。文献计量指标是科学评价的重要工具,对指标的创新性研究是推动信息计量学前进的主要动力之一。相关计量指标的研究涉及交叉学科论文测度、作者贡献分配、已有指标的替代和改进,以及数据标准化等内容,主要围绕以下几方面展开。一是对已有指标的改进和提出新指标。Fassin[8]将HF(High Fame Rating)作为H指数的补充,提出更适合交叉学科比较研究的新指标。Leydesdorff 等[9]、Bornmann等[10]对I3(Integrated Impact Indicator)指标在衡量影响力方面的表现进行评估,发现I3能够对其他文献计量指标起到有效的替代作用。二是指标计算方法的创新。Bu等[11]从引文数、引文深度和引文可信度3个维度提出了一种评价科学出版物的多维度视角,并以科学计量学领域的出版物为例对三维引文影响力框架进行实证研究。Hounejani等[12]针对被引量多零值、离散化分布的数据集,提出了一种面向零变位的新算法。Colavizza等[13]通过直接引用和间接引用来量化出版物的长期影响。Alkemade[14]以传统引文为对象,根据引文的内容和上下文情境提出RIS(Reference Impact Score),以评估高被引论文的影响力。三是对指标对象和视角的创新。Baas等[15]对同行评议中评审专家操纵引文的现象进行了分析和预判。Cingolani等[16]以人工智能为例,分析参考文献中的地理信息对引用的作用,发现地理位置对知识扩散有着重要作用。

表4 ISSI 2019分会场主题分布情况

(2)替代计量学。科研人员在科学研究和学术交流中越来越频繁地使用社交媒体,产生大量在线活动数据,科研影响力也从单一的学术层面扩展到社会层面,因此,对替代计量学的研究逐渐向系统化和多样化发展。本届会议上替代计量学的研究主要围绕其缺陷和热点问题展开,分为3个方面。一是对替代计量指标数据可信度进行探讨,包括数据来源和覆盖率两个角度。Yu等[17]、Holmberg等[18]分别就政府政策文件和谷歌检索结果两个数据来源的准确性做了评估。Ortega[19]对比了几个大型Altmetric数据提供商中博客和新闻两个指标的覆盖率,发现Altmetric.com中博客的覆盖率更高,而PlumX收录的新闻社交媒体更多。二是探讨替代计量指标与引文的关系。Costas等[20]从国家层面比较Mendeley的阅读数和被引量,发现二者反映了科学出版物不同层面的影响力。三是从微观角度探索学者在社交媒体上的信息行为。Diaz-Faes 等[21]、Arroyo-Machado等[22]、Toupin等[23]探索推特、微博等社交媒体上科研用户的识别与分类。

(3)数据库。数据库是科学计量研究的主要数据来源,也在学科服务中起到重要作用。数据库的研究与优化对信息计量学的发展意义重大。宏观层面,Visser 等[24]对Web of Science(WoS)、Scopus、Dimensions和Crossref等主流数据库的题录数据覆盖率、引文链接完整性和准确性进行对比。本次会议还针对一些特定数据库或特定文献类型的覆盖率、准确性及时效性等进行细节性探讨。Moskaleva等[25]对WoS和Scopus数据库收录的非英语出版物,就其研究领域、语言、获取类型及引文模式等方面的分布进行探索,发现非英语出版物在原著国以外的阅读量和被引量都很小,开放获取对阅读和引文的影响在非英语出版物上表现得尤为明显。针对数据的准确性,Donner等[26]、Tekles等[27]从方法论视角分别比较几种机构消歧系统和姓名消歧方法。Bordignon[28]追踪2011-2018年Scopus收录出版物的内容更新情况,并对学科与期刊之间的关系做了定量分析。

2.2 分析方法

(1)研究领域可视化。以可视化方法展示研究领域的计量分析结果,可以更直观地展现其研究走向和脉络。相关研究主题有3个。一是可视化技术在学科发展中的应用,主要表现为理解新兴学科和识别研究主题。Tian等[29]分析了基于主题演化和作者更替的技术升级换代。Barrera[30]通过展现斑马鱼研究的扩散,可视化研究机构间的合作关系和个体研究者的流动模式。除较为新颖的学科外,Rehs[31]还对德国统一前后经济学和化学两个传统学科的研究主题变化做了可视化研究。二是利用可视化技术表示抽象的计量概念。Hartstein[32]提出一个使用认知网络方法来计算作者间认知距离的框架,将抽象的“认知”差异转化为直观的距离。Demarest等[33]通过可视化方式展示论文中的社会和文化认知特征,进而揭示学科间未知的联系。三是可视化技术的创新与发展。Maynard等[34]对本体和语义技术在可视化方面做了创新应用,以建立政策文件和数据源之间的映射关系。

(2)文本自动处理。随着计算机技术的发展和学科交叉融合的深化,信息计量学研究慢慢从对题录信息的简单统计分析,发展到对出版物文本的深度挖掘。本次会议所收录的论文中,大部分应用到深度学习和机器学习技术。Kenekayoro[35]将研究者个人网页上的履历信息转换成为机器可读的形式,运用深度学习方法识别其中的实体及实体间的联系。文本自动处理技术推动了文献计量研究的细化,研究单元由篇、章演化为论文中的特定部分、段落以及词语。Li等[36]运用关键词提取技术,加深了对论文中“Future work”部分的理解。Thijs[37]将神经向量嵌入段落,测量文章内部及文章间的相似性。Murray 等[38]关注科学研究中的观点分歧和争论现象,检测到观点分歧的信号词语,以及不同学科论文中容易产生分歧的位置。

2.3 创新与政策

科技创新、科技评价和科技政策构成科研发展流程的有机整体。该部分围绕科学研究的社会背景和政策,探究科研的自生动力与客观因素对科技创新和科学发展的推动作用。

(1)R&D相关研究。(科学)研究与发展是社会进步的重要动力。该主题的研究主要围绕4个方面展开。一是对学术不端现象,特别是撤稿论文的研究。Bar-Ilan 等[39]以Retraction Watch Database中的撤稿论文为数据源,分析了撤稿类型、出版到撤稿之间的时间差、撤稿原因以及撤稿前后的被引量差异。Makeeva等[40]从社会化因素、理性选择和便利性3个角度预测俄罗斯博士学位论文中的剽窃现象,发现便利性是最主要的因素。二是科研人员的职业生涯与人才流动的研究。Gunnes[41]将博士后的个体特征与是否获得终身教授资质进行逻辑回归计算,探究影响挪威博士后学术生涯的因素。三是开放科学,特别是开放引用的研究。Di Iorio等[42]尝试利用开放数据来评价意大利学者。四是R&D的社会环境与国家系统研究。Confraria等[43]探索了非洲医药需求与医药研究之间的匹配关系。Zhao等[44]分析了维基百科的社论和编辑的意识偏见对传统中医论文的负面影响。

(2)高等教育系统。高等教育机构是科学研究的重要主体之一。该主题所收录的文章以高校为研究对象,涉及的内容有高校网站影响力研究、高等教育机构研究特征与偏好、高等教育的学科结构、国家和社会对高等教育的影响等。Shirabe[45]使用学科聚合指标来衡量高校的研究能力,并对日本的大学进行了排名。Abbasi等[46]基于引文表现,衡量高校研究多样性的广度和深度,发现高校的研究多样性越高,其引文影响力和排名越高。Robinson-Garcia等[47]根据高校开放获取的出版物数量及比例分析机构层面开放获取的完整程度。

(3)技术创新。该主题聚集了以科学计量方法更深层次地探讨有关技术创新的研究,所涉及的研究主要有技术机遇与进步分析、知识流动与技术转移、创新政策分析和技术创新性测度等。Song等[48]构建了测量技术聚合性的多维影响力指标,用以评估某一技术领域的聚合能力,并由此定义领域间的关系。Khor等[49]通过检测隔热涂层领域热点主题的变化,揭示航空飞船发动机制造技术的进步。Yamashita[50]构建了两个基于参考文献的指标:被专利引用的参考文献数量和作者为公司研究员的参考文献数量,用以识别与技术相关的文献。

(4)科技评价与决策。科技评价是信息计量学的重要应用之一,也是科技决策的重要依据,涉及的研究对象多种多样,包括学科、国家、研究机构、期刊论文等。相关研究包括开放同行评议模型、评价标准的构建、对评价标准和评价者的评价、基金资助的影响等。Wolfram等[51]对开放同行评议的早期使用者和现状进行了调查研究,发现自2001年以来,开放同行评议应用稳步增长,在医学和自然科学领域最为盛行。Moeller[52]通过致谢中的基金信息分析基金资助主体对欧洲五国科学研究整体的贡献,发现国外的资金资助比国内的影响力更大;国家的影响力越大,其资金资助对科研的影响力就越大。

2.4 专题研究

(1)全球化与合作。全球化进程的加快和信息技术的发展为不同国家(地区)之间的学术交流与合作提供了更多的机会,本次会议涉及的主题有两方面。一是影响科学合作的因素,其中对政府资助的研究获得了很多学者的关注。Pan等[53]研究CSC奖学金在科研产出与科学合作上的影响,发现被WoS收录的出版物中,受CSC奖学金资助的论文数量在2008-2017 年间显著增加;CSC 奖学金也促进了中国学者的跨国合作与交流,国际合著论文提高了中国科研的可见度和影响力。一些学者对科学合作的其他影响因素做了探索。Ploszaj等[54]研究了潜在合作者之间的距离与航空交通可用性对科学合作的影响,发现地区间航空条件是否便利与科学合作是否频繁密切相关。Rorstad等[55]基于5,554名挪威研究者的数据,探索年龄与国际合作之间的关系,发现研究领域是对国际合作影响最大的因素,年长研究者的国际合作强度弱于年轻一代。二是与科学合作相关的知识迁移与学者流动现象的研究。Aman[56]运用基于词汇的方法来识别学者流动带来的知识迁移,发现化学、医学与天体物理学中,四分之一学者曾为知识传递者,同时知识传递者往往比普通学者更年轻,论文产出更高。Zhao等[57]利用ORCID的数据,研究与中国有联系的学者在学术迁移方面的表现,发现除巴基斯坦和日本外,中国与其他国家学者的输入与输出基本处于平衡,学者迁入中国之后,论文产量趋于增加,成为通讯作者的可能性趋于提高。

(2)学术出版。开放获取研究是学术出版领域的热点话题,相关研究包括开放获取发展趋势、定价机制、开放获取对期刊影响力的影响等。Traag等[58]探究了期刊实现开放获取后,是否会通过降低论文质量标准来增加获利的问题,发现期刊的等级制度在开放获取出版中是持续存在的,然而文章审核的收费上限确实会对学术出版产生一定的影响,收费上限越低,期刊间的质量差距就越小。学者们还关注预印本的多维影响力、期刊的专题研究、灰色文献影响力等。Antonoyiannakis[59]分析单篇论文如何影响期刊的影响因子,发现高被引论文会影响着期刊的影响因子,而且对小型期刊的影响更大。这对学术出版界有很大的启示,促使具有高影响因子的期刊保持较小规模和较高的竞争力。

(3)其他研究。①专利分析。专利分析是竞争情报分析的重要形式,它将文献计量方法应用于专利信息研究,揭示专利文献深层动态特征,了解技术发展的历史和现状,以便进行技术评价和创新预测。本次会议的相关研究主题包括发明者流动与知识迁移、专利引用分析、专利诉讼网络、专利创新与基金资助和专利技术构成等。Zhao等[60]基于专利的应用情况、地区分布、质量、数量等指标,研究人工智能领域的全球竞争模式和技术发展趋势。Zhang等[61]从专利角度分析影响中国生物制药新兴公司获得风险投资的因素,发现法律信息是对风险投资影响最显著的因素,其次是技术信息和商业信息。Zhang等[62]以1980-2017年美国的专利为数据源,探索政府资助与技术创新和进步之间的关系。②性别研究。围绕性别差异的研究近年受到信息计量学界广泛关注。本次会议主要关注致谢部分的性别差异、特定领域不同性别的不同贡献、知识产权中的性别差异、面向性别平等的评价模型、出版轨迹中的性别差异等。Paul-Hus等[63]根据2015年收录在WoS中291,167篇论文的致谢信息探索性别在其中的影响,发现女性在致谢中比在作者署名中更容易被忽略,且女性作者在致谢中更多是感谢女性。Zhang 等[64]收集WoS 中2011-2017年第一作者国籍为挪威的30,003篇期刊论文,探索不同年龄、性别、职称的研究者在传统引文影响力和更广泛的影响力上有何差异,发现男性在传统引文影响力中的优势地位依然存在,但在较为年轻的团体中,女性也有不错的表现;女性作者的影响力相对更为广泛,很多方面甚至超过男性,如社交媒体影响力。③人文与社会科学。科学界长期以来注重对自然科学和医学的关注,人文与社会科学研究常常被忽略。本次会议的研究主要以人文与社会科学为研究对象,用文献计量方法进行研究,主要涉及艺术家个体影响力的评价、非英语人文社科出版物研究、人文社科期刊分类、人文社科领域的评价问题、人文社科研究的出版实践等。Thiedig[65]调查1980年代后德国社会科学专著的引文模式,在人文社会科学交流与出版变革的背景下,探索德国专著的学术价值和地位的转变。Wieland等[66]从科学计量视角分析两大巴洛克艺术天才——贝尔尼尼和博罗米尼之间的竞争,以此来寻找适合评价个体广泛影响力的数据源,发现西文过刊数据库(JSTOR)、博硕士论文文摘数据库(PQDT)、谷歌学术等可以提供丰富的信息。

3 研究趋势

3.1 开放:深受开放科学影响

开放科学进程的加快深刻影响了信息计量学,出现了开放获取、开放同行评议、开放科学数据等多种新兴话题。开放科学作为热门话题,与R&D相关研究、高等教育系统、科研评价模型、学术出版与交流等主题的研究有了深入交叉与融合。开放获取改变了阅读模式,使科研成果的受众群体变得更为广泛,其影响力也日益深化,致使围绕科学研究多维影响力的研究层出不穷。开放同行评议改变了学术论文的评审方式,其中评审意见的公开化透明化一方面有助于学术公平与规范,另一方面使关于“评价的评价”的研究成为可能。开放科学数据等众多开源数据为信息计量学研究提供了更多素材,便利了学者的数据获取工作,也拓展了研究的深度和广度。

3.2 融合:学科交叉融合发展

作为方法性学科,信息计量学需要在学科交叉中寻找新的机遇。首先,“五计学”内部的学科融合,如替代计量指标与传统指标的融合,“五计学”理论、方法与工具的融合等;其次,与其他学科的外部融合趋势也越来越明显。研究方法上,传统的文献计量方法已经不能满足新形势的需求,数据量的激增对数据处理和计算能力提出了新的要求,研究的日益深化也要求研究方法有更高的分析能力和解释能力。因此,信息计量学与数学、计算机科学和信息科学等学科的交叉融合是推动本学科向科学、精准、高效方向发展的途径之一。此外,在对研究结果的解读和分析上,信息计量学需要以更为多元的学科背景作为基础,才能更全面、更准确地揭示数据背后的价值。因此,与社会学、经济学、心理学等社会科学的交叉融合,也是信息计量学发展趋势之一。

3.3 拓展:向社会公众延伸

信息计量学与社会的交互体现在两个方面。一是多元的社会数据,如医疗、经济、政策、社交数据等,为科研成果的评价提供了新的思路和素材,使其不再停留在传统的学术影响力上。这使得信息计量学的数据驱动特征日益显著,主要表现在数据样本量级提升、数据来源更加广泛、从题录数据向全文本数据过渡。二是复杂的社会需求与社会问题呼吁信息计量学从科研角度提出解决方案。Altmetrics的出现使探索更为广泛的影响力成为可能,推动信息计量学向社会经济领域延伸。本次会议中设置了很多社会型议题,表明信息计量学不再满足于解决科研本身的问题,而是向社会公共领域延伸,以问题为导向,以科研成果为智力支持,为决策者提供科学的决策依据,解决更多的社会实际问题。

支撑数据

本文支撑数据由作者自存储,包括两个文件:2019 ISSI Conference Proceedings(PDF)、2019 ISSI Paper Statistics(Xlsx)。获取渠道:909591921@qq.com.

猜你喜欢
计量学影响力论文
基于Web of Science数据库的老年综合评估文献计量学分析
天才影响力
本期论文英文摘要
黄艳:最深远的影响力
我国有氧踏板操研究的文献计量学分析
本期论文英文摘要
本期论文英文摘要
基于SCIE的大学化学学科文献计量学研究——以河南大学为例
基于科学计量学的公安院校科研与评价
3.15消协三十年十大影响力事件