新冠疫情爆发前后我国国际科研合作模式的变化
——基于bioRxiv 的分析

2022-08-10 01:38曹仁猛谢维熙耿屿王贤文
图书情报知识 2022年3期
关键词:强度节点论文

曹仁猛 谢维熙 耿屿 王贤文

(1.大连理工大学科学学与科技管理研究所,大连,116024;2.大连理工大学WISE实验室,大连,116024)

1 引言

新冠肺炎引发的全球大流行是一场史无前例的全球危机,科学合作被视作应对新冠肺炎疫情的关键行动[1-3]。新冠肺炎在全球爆发后,科学活动和科学合作受到了很多阻碍,如科学家面临工作时间的减少,面对面会议和讨论会的缺乏导致难以建立新的合作关系以及资助项目的减少等问题[4-5]。为了及时地对疫情做出响应,全球科学合作网络发生了明显的结构性变化,团队规模缩减,涉及国家数量较少是疫情时期的典型特征[6-8]。

为了进一步探索全球大流行下国际科研合作动态,国内外许多学者基于新型冠状病毒论文相关文献,利用复杂网络分析方法,从科学计量视角对国际合作模式进行了多维度的分析[9-16]。许多研究指出,我国不仅是全球科学文献的主要生产国,同时在促进疫情期间全球合作中发挥重要角色[7,17-18]。不过,在众多新冠病毒的科学合作的研究中,仅有少数研究对疫情前后新冠病毒和非新冠论文合作模式进行深层次的分析。比如,Wu等以我国为中心建立合作主导网络,发现在疫情早期,我国更倾向于与欧洲、美国等发达地区合作,在后期也增强了与亚洲等地区的合作;以美国为中心建立合作主导网络,发现在疫情期间美国更倾向于与疫情爆发较严重的国家或地区合作[19]。此外,一些研究表明,随着不同国家的参与,新冠肺炎疫情研究的国际合作呈现出清晰的核心-边缘结构,由早期的我国主导,到后来由美国推动发展[15]。虽然我国在论文数量上占据领先地位,但美国始终是国际合作主导网络的核心,北美、亚太和欧洲共同主导了国际科技合作[20]。Fry等研究认为,与COVID-19前的冠状病毒研究相比,COVID-19研究的团队更小,涉及的国家也更少;我国和美国始终处于全球冠状病毒相关研究网络的中心,而其他发展中国家相对缺席COVID-19时期的早期研究活动[7]。

我国作为全球科学文献产出的中坚力量,在疫情期间的国际合作上发挥着重要作用。探究疫情前后我国国际合作模式的特征和差异,不仅能够给相关科学政策管理部门提供建议,也能够进一步了解我国科研国际合作态势。然而,一方面现有的研究都是以新冠病毒文献为数据集,但很明显特殊时期特殊领域的合作和平常时期普通领域的合作是存在差异的,针对新冠病毒相关文献的研究结论也不能推广到其他学科领域[5,14,21-23]。另一方面,很多文献都是基于正式发表论文的数据集,但是由于从开展合作关系到论文经历审稿程序正式发表,会经历一个较长的时间滞后周期,正式发表论文中体现的合作关系无法准确反映彼时的合作状态。而基于预印本文献的研究,将大幅地缩短这一时间滞后的缺陷。

本研究选取2017年至2021年bioRxiv平台上新冠病毒和非新冠病毒领域文献作为研究对象,结合复杂网络分析和科学计量方法对我国大陆地区与国际之间的合作增长情况、合作生存概率、合作规模、合作强度以及合作地位进行细致化的分析。重点关注以下几个研究问题:

(1)新冠疫情前后,我国的国际科研合作关系比重、合作规模、合作强度发生怎样的变化?

(2)新冠疫情前后,我国的国际科研合作生存概率是怎样的?

(3)在新冠、非新冠病毒领域的科学论文合作中,我国的国际科研合作规模和强度发生了哪些变化?在合作主导网络中的地位又如何?

2 研究方法

2.1 研究设计

为揭示新冠疫情前后我国国际科研合作模式的变化情况,本研究将科研合作看作由论文、科学家以及合作关系组成的复杂系统,并利用复杂网络分析方法来测量。图1展示了我国国际科研合作网络在疫情爆发前后网络结构变化的缩影(连边数字表示合作次数)。在疫情爆发之前,全球科学家与合作伙伴开展稳定的国际科研合作,已有合作关系不断加强,新的合作关系陆续产生。然而,突然袭来的新冠疫情在一定程度上打破了这一趋势,使得一些国际科学合作变得难以进行。例如,科学家b和c在疫情爆发之前有着稳定的合作关系。但在疫情之后,b和c之间的合作关系没有得到延续。科学家b和a之间的合作关系也是如此,致使科学家b完全脱离了这个合作网络。科学家a和e之间合作关系虽然在疫情后依然存在,但合作次数明显降低。最终,这个合作网络中仅有4条合作关系得到延续,并且较疫情前相比网络结构发生明显的变化。这些变化可总结为以下几个方面:

图1 新冠疫情爆发前后我国国际科研合作网络变化缩影Fig.1 The Snapshot of International Scientific Collaborations Network of China Before and After COVID-19 Outbreak

(1)节点度:一个科学家的合作者数量。例如,科学家f在疫情之前有3个合作伙伴c、d和e,而在疫情后只剩下e。

(2)连边数量:合作网络中的连边数。例如,疫情前合作网络连边数为9,疫情后连边数仅为4。

(3)连边权重:一个科学家与另一科学家之间合作次数。例如,科学家a和e在疫情前合作次数为5,疫情后合作次数仅为2次。

(4)生存概率:疫情前后保留下来合作关系比重。

(5)节点重要性:一个科学家在网络的合作地位。例如,科学家d在疫情之前的合作网络中处于核心位置,并与多个科学家合作;而在疫情之后,失去了大部分合作者,不再处于网络中心位置。

对于上述这些结构变化,本研究利用合作规模、合作强度、合作生存概率、合作中心性和权威性指标来进行测量(各指标定义详见2.4章节)。

2.2 数据选取

本研究的数据来源于生物学预印本bioRxiv平台。由于bioRxiv不提供结构化的元数据,所以通过Dimensions数据库获取数据。Dimensions是由Digital Science公司发布的一个全新的科学数据平台,该平台收录大量的文献出版物、基金、专利信息和临床实验数据①https://www.dimensions.ai/。本研究利用该平台收集了2017年至2021年发表在bioRxiv平台的129,278篇科学文献。对于每篇bioRxiv论文的标题/摘要使用Dimensions数据库提供的如下检索式:"COVID-19" OR "2019-nCoV" OR "coronavirus" OR"Corona virus" OR "SARS-CoV" OR "MERS-CoV" OR "Severe Acute Respiratory Syndrome" OR "Middle East Respiratory Syndrome" OR "HCoV-2019" OR "hcov" OR "severe acute respiratory syndrome coronavirus 2" OR "severe acute respiratory syndrome corona virus 2"。若该论文标题/摘要包含上述的关键词,则认为是新冠病毒领域的科学文献,简称“新冠论文”;若不包含该关键词,则认为是非新冠病毒领域的科学文献,简称“非新冠论文”。最终,本研究得到7,052篇新冠论文和122,226篇非新冠论文数据。数据字段具体包括论文作者姓名(全称和简称)、作者所在机构名称、机构所在国家、DOI、出版时间。为解决作者重名问题,采用作者姓名全称字段,并利用“作者姓名全称+作者所在机构名称”的形式作为网络节点来构建科研合作主导网络。

欧盟成员国是我国国际合作的重要伙伴,在对我国与欧盟合作分析时,本研究将这27个欧盟成员国(不包括英国)②奥地利、比利时、保加利亚、塞浦路斯、克罗地亚、捷克、丹麦、爱沙尼亚、芬兰、法国、德国、希腊、匈牙利、爱尔兰、意大利、拉脱维亚、立陶宛、卢森堡、马耳他、荷兰、波兰、葡萄牙、罗马尼亚、斯洛伐克、斯洛文尼亚、西班牙和瑞典。当做是一个整体。鉴于英国脱欧时间线较长(2016年全民公投脱欧至2020年欧盟正式批准英国脱欧)以及脱欧对英国国际科学合作的潜在影响,本文在接下来的研究中将对英国进行单独分析。

2.3 科研合作主导网络

在科学论文合著中,每个作者的贡献是不同的。通讯作者通常在论文合著中发挥主导作用,对合著论文的实质性贡献最大[24]。同时,通讯作者也扮演桥梁作用,会促进新的科学合作产生[25]。基于129,278篇科学文献和1,201,676条合作关系,本文构建了一个有向、加权、动态、以通讯作者为中心的全球科研合作主导网络[26-27]。该网络定义为:G_global=(V,E,W,T)。其中,V是合作主导网络的节点,即论文的作者集合;E为网络的连边,即一篇论文中通讯作者与其他作者的合作关系,连边的方向为其他作者指向通讯作者;W表示某一作者与通讯作者的合作次数,即权重;T表示合作关系形成的时间,即论文在bioRxiv平台上的发表时间。图2展示了该科研合作主导网络的构造示意图。T表示论文出版时间,*表示该用户为论文的通讯作者。以论文1为例,该论文共包含3个作者:a、b、c,b是该篇论文的通讯作者。于是,在节点a和节点b之间添加一条a指向b的连边,连边产生的时间为T1;同样,在节点c和节点b之间添加一条c指向b的连边,连边的产生时间为T1。对于另外7篇论文也是如此,最终得到图2中所绘制的网络拓扑结构图。

图2 全球科研合作主导网络的构造示意图Fig.2 Schematic Diagram of the Construction of the Dominant Network of Global Scientific Collaboration

2.4 测量指标

2.4.1 合作规模

本文将科学家的合作规模定义为,在全球合作主导网络中,与其相连接的科学家数量。对于任意一位科学家i,其合作规模为:

其中,表示从其他节点指向节点i的连边数

表示从节点i指向其他节点的连边数。

2.4.2 合作强度

科学家合作强度,指在全球合作主导网络中,某一位科学家与其相连的合作者之间的合作次数之和,其计算公式如下所示:其中,Ni表示与科学家i直接相连的合作者集合,wij为科学家i与其直接合作者j之间的合作次数。

2.4.3 合作生存概率

合作生存概率指在全球合作主导网络中某一时刻t1所建立的合作关系集合C,在时刻t2依然存在的概率,其计算公式为:

式中Ct1表示在t1时刻科学家们所建立合作关系集合,Ct2表示在t2时刻所建立合作关系集合。

2.4.4 合作中心性和权威性

Hyperlink-Induced Topic Search(简称HITS)算法[28]最早于1997年被Kleinberg提出用于信息检索。由于其出色的性能,该算法目前已被应用到期刊、论文或节点的重要性评价中[29-31]。在有向网络当中,HITS算法从两个方面衡量节点的重要性:权威性和中心性。该算法认为,如果一个节点指向许多高权威性的节点,那么该节点就具有较高的中心性;如果一个节点被许多高中心性的节点指向,那么该节点就具有较高的权威性。因此,在有向网络中,每个节点都能被分配两个分数:权威分数和中心分数。那么节点i的权威分数ai可以定义为网络中所有指向节点i的节点的中心分数之和;节点i的中心分数hi可以定义为该节点所指向的所有节点的权威分数之和。该算法每次迭代计算过程如下所示:

其中,n表示网络中节点的数量,如果存在从节点j指向节点i的连边,则aji=1,否则为0,同理aij也是如此。每一次迭代后,将两个值标准化为:

3 结果分析

3.1 我国国际科研合作增长情况

本文首先分析了我国(仅中国大陆地区)的国际科研合作增长情况。如图3所示,疫情来临之前,我国的国际和国内合作关系比重、规模以及强度均表现出良好的增长趋势。然而,随着新冠疫情在全球蔓延开来(2019年12月之后),我国的国际和国内合作关系比重、规模和强度在经历了一个短暂的上升后整体表现出下降趋势。具体来说,我国的国际科研合作关系比重先增长至历史最高点0.03(2020年3月),随后下降至0.01(2021年1月);我国的国际合作规模增长至最高点1.85(2020年)后,又下降到1.72(2021年);合作强度上升至最高点2.22(2020年)后,又跌落至2.13(2021年)。

图3 我国的国际科研合作增长情况Fig.3 Growth of China's International and Domestic Scientific Collaborations

总的来说,在新冠疫情全球爆发后,我国的国际合作在合作关系比重、规模和强度方面均经历了疫情初期的增长继而下降的趋势。经过对数据进一步检视,我们发现,疫情初期的合作增长主要是因为在新冠病毒领域我国早期处于领先地位,所以许多国家的科学家(如美国和欧盟地区)在疫情初期都选择积极与我国合作。本节的实验结果汇总见表1。

表1 3.1节的实验结果汇总Table 1 Summary of the Results of Section 3.1

3.2 我国与主要国家的科研合作增长情况

在疫情来临之前,中美、中欧之间科研合作始终保持着良好的增长趋势,如图4所示。在疫情爆发之后,中美的合作关系比重、规模和强度首先经历了大幅增长(2019-2020年),然后大幅下降(2020-2021年)。具体来说,中美的合作关系比重从0.014(2019年12月)增长至最高点0.036(2020年3月),随后下降至0.008(2021年1月);中美的合作规模从1.64(2019年)增长至1.78(2020年),又下降至1.66(2021年);中美合作强度从1.95(2019年)增长至2.11(2020年),又下降至1.98(2021年)。

图4 我国与主要国家的国际科研合作增长情况Fig.4 Growth of Joint Research for China Collaborated with the Major Countries

中欧的三个合作指标在疫情爆发后的增长趋势有所不同。中欧的合作关系比重呈现先增长后下降的趋势,而合作规模在疫情爆发后一直处于下降趋势,但下降幅度不明显;合作规模指标从1.54(2019年)下降至1.51(2021年);合作强度指标先轻微的下降,并随后得到提升,从1.895(2019年)下降至1.892(2020年),又大幅增长至1.957(2021年)。本节的实验结果汇总见表2。

表2 3.2节的实验结果汇总Table 2 Summary of the Results of Section 3.2

3.3 我国国际科研合作生存概率

本研究进一步分析了我国的国际科研合作的生存概率。如图5所示,疫情来临之前(2017-2019年),我国的国际和国内合作生存概率皆呈上升趋势,即我国与国际正在逐步建立长期稳定的科学合作关系。然而,突如其来的新冠疫情打破了这一趋势,在2019-2020年间,我国的国际生存概率急剧下降,从最初的0.0206下降至0.0136,并达到有史以来的最低点。在2020-2021年间,我国的国际合作生存概率展示出明显的增长趋势,从0.0136上升至0.0175。

图5 我国的国际科研合作生存概率Fig.5 Survival Probability of China's International Scientific Collaborations

中美两国的合作生存概率连年下降,从0.0172(2018-2019年)下降至0.0127(2019-2020年),2021年大幅反弹(0.0127上升至0.0242)。经过进一步检查数据,我们发现2020-2021年大幅增长主要是因为中美在新冠肺炎领域的大量合作导致。中欧的国际合作生存概率在疫情爆发之前保持着良好的增长趋势。但在疫情爆发后,其经历了大幅下降,从最高点0.0204下降至0.0126,并在2021年小幅增长。总的来说,在疫情爆发之际,我国与美国、欧盟之间的许多合作有所中断。随着疫情不断地被控制,在疫情爆发后的一年内,我国与美国、欧盟的合作生存概率有所上升,一些科学合作得到了延续。本节的实验结果汇总见表3。

表3 3.3节的实验结果汇总Table 3 Summary of the Results of Section 3.3

3.4 我国在新冠和非新冠病毒领域的国际科研合作情况

为了比较我国在新冠、非新冠病毒领域的国际科研合作模式上的差异,本文对比了它们合作主导网络的规模和强度。如图6所示,在非新冠病毒领域,我国与其他国家/地区的合作规模和强度特征分布具有明显的“长尾”特性,它们之间合作规模和强度最大值能达到40左右。而在新冠病毒领域,我国与这些国家的合作规模和强度最大值仅为20左右。具体来说,中美两国在新冠和非新冠病毒领域的合作规模较为接近(均值:1.784 vs 1.780),但二者的合作强度差异明显,非新冠病毒领域的合作强度要高于新冠病毒领域(均值:2.122 vs 2.052)。相较于非新冠病毒领域,中欧和中英在新冠病毒领域的合作规模和强度表现出衰退趋势(中欧的合作规模均值:1.549 vs 1.430,中欧合作强度均值:1.957 vs 1.840;中英合作规模均值:1.513 vs 1.396,中英合作强度:1.841 vs 1.729)。可见,疫情全球爆发之后,我国在新冠病毒领域的国际合作是以缩减的规模和强度开展。这也许是因为新冠相关的研究成果特别注重时效性,很难在短时间内找到大规模的国际合作伙伴,从而组织大规模的研究队伍。本节的实验结果汇总见表4。

表4 3.4节的实验结果汇总Table 4 Sumary of the Result of Section 3.4

图6 我国与不同国家/地区国际科研合作规模和强度分布情况Fig.6 Distribution of the Scale and Strength of Joint Research for China Collaborated with other Countries/Regions

3.5 我国在新冠和非新冠病毒领域的国际科研合作地位

本文基于HITS算法从中心性和权威性两个维度对比了疫情前后我国在新冠、非新冠病毒领域的国际科研合作地位变化情况。图7展示了中心性和权威性指标均排在前20名的国家的数值分布情况(距坐标轴原点越远,某一维度的影响力就越高)。实验结果表明,相较于2020年,我国在新冠和非新冠病毒领域的合作地位在2021年均有明显的提升,而且我国新冠论文合作的地位远高于非新冠论文。具体来说,在非新冠病毒领域,我国的中心性指标增长了2%,权威性指标增长了14%;在新冠病毒领域,我国的中心性和权威性指标分别增长了53%和4%。

图7 我国在新冠和非新冠病毒领域的国际科研合作地位变化情况Fig.7 Variation of International Scientific Collaboration Status of China in the Field of COVID-19 and Non-COVID-19

美国和英国一直处于新冠、非新冠论文合作主导网络的绝对核心位置,并在新冠论文合作中进一步得到加强。同样,一些欧盟国家(如德国、法国和意大利等)的合作地位也得到提升。印度和日本的中心性指标增加幅度较小,但权威性增长幅度明显。由此可见,随着疫情在全球肆虐,各国的科学家积极地联合起来抵抗疫情。那些历年来处于合作主导网络绝对核心位置和相对核心位置的国家,其合作地位得到进一步的巩固。而那些处于合作主导网络非核心地位的国家则成为了许多位于网络核心位置国家的重要合作伙伴。本节的实验结果汇总见表5。

表5 3.5节的实验结果汇总Table 5 Summary of the Results of Section 3.5

4 结论

基于bioRxiv平台上大规模的科学文献数据,本文构建了一个有向、加权、以通讯作者为中心的全球科研合作主导网络,并从国际合作增长、国际合作生存概率、合作规模、合作强度以及合作地位这五个方面分析了新冠疫情前后我国国际合作模式的变化情况。

(1)国际合作增长情况。比较了2017-2021年间我国国际合作增长情况,发现新冠疫情爆发后,我国的国际合作关系比重、合作规模和强度均经历了疫情初期的增长继而随着疫情发展的下降趋势。疫情初期的增长主要是由于我国在新冠病毒领域的早期研究处于领先地位所致。

(2)国际合作生存概率。在疫情爆发之际,我国的国际生存概率大幅下降,与美国、欧盟之间的许多合作有所中断。随着疫情不断地被控制,在疫情爆发后的一年内,我国与美国以及欧盟的合作生存概率有所上升,一些科学合作得到了延续。

(3)合作规模和强度。与非新冠论文相比,我国在2020-2021年的新冠论文合作中规模和强度均有所降低。其中,中美在新冠、非新冠病毒论文合作中的规模和强度总体上较为接近,而中欧在新冠、非新冠合作中的规模和强度相差较大。

(4)国际合作地位。相较于2020年,我国在2021年新冠、非新冠论文中的国际合作地位均得到明显的提升,而且我国在新冠论文合作中的地位要远高于非新冠论文,意味着我国不仅在一定程度上主导着新冠疫情的合作,同时也是其他高影响力国家的重要合作伙伴。但是对于非新冠论文所反映的其他学科领域来说,我国在国际合作主导网络中的影响力还有待提高。

虽然在疫情初期,我国在新冠肺炎的研究中发表了诸多重要成果,在新冠肺炎研究的国际科学合作中占据重要位置,推动了全世界对这一新型病毒的认识。但是我们要看到,在其他众多科学领域,我国在全球科学合作主导网络中并非主导,而仅仅是参与者角色,在网络中的合作地位(中心性和权威性)低于美国、英国和欧盟。未来,从提高科学研究实力的角度出发,我国应该积极主动开展国际科学合作,包括:

(1)提高国际科学合作的参与程度。资助更多青年学者和学生走出去,多参加国际交流,结识国际伙伴,建立合作关系。

(2)提高国际科学合作的主导地位。通过主导大科学计划、国际合作科研项目等,以我国科学家为主导,吸引更多优秀国际学者参与,在国际科学合作中占据主导地位。

(3)提高国际科学合作的广泛性。除了积极与美、英、欧盟、日韩等发达国家和地区开展科学合作外,还应积极推动与“一带一路”沿线国家开展科学合作,扩大国际科学合作范围,提升国际科学合作程度。

本文的研究也存在一些局限性。第一,疫情前后全球合作主导网络的动态变化是复杂的,仅从合作规模、合作强度、合作地位以及生存概率这四个维度来测量不够全面和完善;第二,本研究仅使用了生物医学领域的科学文献数据,并不能完全代表我国国际合作情况。在未来的研究中,我们将完善这一研究,通过多源数据和更丰富的测度指标来进一步揭示后疫情时代科学交流演变规律,为我国从参与到主导国际合作的演变提供借鉴与参考。

作者贡献说明

曹仁猛:设计研究方案,数据分析,论文写作与修改;

谢维熙:数据收集与处理;

耿屿:数据分析,论文修改;

王贤文:提出研究思路,设计研究方案,数据收集,论文修改。

支撑数据

支撑数据由作者自存储,E-mail:xianwenwang@dlut.edu.cn。

1、曹仁猛,谢维熙,王贤文.我国在新冠病毒领域的国际合作数据.txt.新冠病毒领域的国际合作数据.

2、曹仁猛,谢维熙,王贤文.我国在非新冠病毒领域的国际合作数据.txt.非新冠病毒领域的国际合作数据.

猜你喜欢
强度节点论文
分区域的树型多链的无线传感器网络路由算法
基于移动汇聚节点和分簇的改进节能路由算法
基于点权的混合K-shell关键节点识别方法
本期论文英文摘要
计算电场强度常用的几种方法
电场强度叠加问题的求解
电场强度单个表达的比较
本期论文英文摘要
求电场强度的新方法お
本期论文英文摘要