倪四秀 亓永康
(江苏师范大学图书馆,江苏 徐州221116)
学术论文作为科学研究正式交流最主要的介质,在科学研究与科学交流中扮演着不可替代的角色。高水平论文是指具有重要学术价值,一定程度上反映某一研究领域的前沿与热点的学术论文。本研究中高水平论文包括ESI数据库中近十年内各学科每年论文被引次数居前1%的高被引论文,以及近两年内以每两个月为单位被引次数居前0.1%的热点论文[1]。
目前,有关学术论文特征及其影响力的研究受到各界学者的广泛关注。Garfield[2]在1955年提出通过论文的被引频次衡量论文的影响力,Kos⁃mulski[3]对论文被引频次与引用文献做对比分析,将论文被引频次大于其参考文献数的论文定义为成功论文;Bornmann L.等[4]通过对科学家引证行为的研究表达了对被引频次的质疑,发现论文引证行为受多方面因素的影响。Xiaojun Wan等[5]研究证实了参考文献的重要性,提出了引用强度概念以衡量学术论文参考文献的影响力。Shao,W[6]指出学术论文影响力的评价是科研管理的重要内容,建立综合的学术论文影响力评价体系,才能客观、直接地实现影响力评价社会性和动态性。
在国内,主要针对SCIENCE、NATURE等最顶级期刊刊载论文,采用文献计量方法,从期刊[7]、研究领域[8]、研究机构[9]等维度对顶级期刊论文刊载和引用的特征进行深入分析。梁帅等[10]以我国F5000论文为对象,从关键词维度,综合分析了优秀论文在创新、内容等方面的特征;周晓英等[11]针对我国图书馆学和情报学最高被引的100篇论文的内部与外部特征进行对比分析;刘武英等[12]以编辑出版类核心期刊为对象,揭示了零被引论文与期刊的H指数、影响因子之间的密切相关性。
生命科学已经发展成为21世纪最活跃的学科之一,成为自然科学的前沿学科[13]。SCIENCE评选的十大突破中过半数与生命科学研究直接相关[14],被誉为“科学界奥斯卡”的“科学突破奖”将生命科学设为三大突破奖之一。李克强总理对“2018世界生命科学大会”作出重要批示,强调“要深入交流、凝聚共识、加强协作,推动生命科学研究和技术创新取得更多突破”[15]。当前在顶级期刊中也刊载有多篇关于生命科学研究方法的突破[16]与生命科学领域研究最新进展[17]的成果,有学者从文献计量学视角研究了生命科学领域论文特征,发现了该研究领域的论文开放获取比率最高[18],也有学者以生命科学为样本基于B-SFA对基金资助做分析[19]。
笔者以生命科学为例,从发文特征、引文特征、合作特征等多维视角,分析高水平论文的传统影响力产生与分布特征,以便为进一步增强该领域研究成果影响力提供依据。
笔者以ESI数据库的高水平论文为数据源,在ESI数据库中检索限定学科为生命科学领域所包含的4个学科:生物与生化、环境/生态学、微生物学、分子生物与遗传学,得到2008年1月1日至2018年8月31日的生命科学领域Top Papers(高水平论文)共计19125篇,筛选去除没有DOI信息的文献数据,得到有效数据19080条;以19080条文献DOI号分别在Web of Science核心合集中匹配到相应的文献,检索匹配得到其中19057条文献的标题、作者、来源期刊、DOI、文献类型、语种、出版日期、被引次数、最近180天使用次数、2013年至今使用次数、页数、引用文献数、研究方向、WOS类别并导出。此即为本课题研究的基础数据,在此基础上基于发文信息、被引频次、合作网络3个视域展开对生命科学领域高水平论文特征的综合评价分析。
图1显示了本课题研究样本论文(19057篇)的发表时间和学科大类,发现2008年至2018年生命科学领域的高水平论文中关于生物与生化的研究论文数量最多,其次是环境与生态。为了验证研究时段内论文数量的变化趋势,对历年论文数量做趋势线拟合分析,趋势线公式为:y=1311.6e0.0503x,R2=0.9834,拟合度极高,表明生命科学领域高水平论文在2008-2018年的时段内论文数量分布呈明显的指数型增长态势。可以预见,在学术界与社会日益关注下,在理论基础不断完善与研究技术不断革新的背景下,关于生命科学领域的研究会进一步升温,论文数量会保持高速增长,高水平论文的数量与质量也会不断提高。
图1 生命科学领域高水平论文数量分布
选取19057篇生命科学领域高水平论文的来源(国家)地区信息,默认第一作者的第一归属单位所在的地区为其来源地区,发现除38篇论文的国家信息空缺外,其余19019篇论文归属于113个国家(地区),其中25个国家(地区)仅有1篇论文,23个国家(地区)的论文数量超过100篇,且此23个国家(地区)所拥有的高水平论文占据了全球的93.22%。
从论文数量看,美国以5748篇论文占据了全球生命科学领域高水平论文的30%以上,居第1位,领先优势较大;中国1675篇论文居第3位,与美国尚存在不小差距,但是在国际上已占有重要地位。从论文篇均被引频次看,23个国家(地区)中最高的是日本,达到了498.33;发文量最高的美国篇均被引次数为336.79,也处于较高水平;中国的论文篇均被引次数为168.84,在23个国家中最低,与发达国家还有较大差距,中国近年来在生命科学领域的研究中取得了巨大进步,高被引论文数量显著提升,已经与发达国家处于同样的位置,但是在论文质量层面还是存在较大的差距,在量变的同时还需致力于质的提升。
选取论文的来源机构指标,并统计论文的第一作者所属的第一单位,除38篇论文信息缺失外共得到19019条机构信息,统计得到3523个机构,超过发文量均值(不少于6篇)的机构有522个。
表1中列出了生命科学领域高水平论文发文量150篇以上的12个机构发文情况。从整体看,论文的分布较为集中,前100位的机构论文量占据总数超过一半,前22位的机构中有13个来自美国,美国的科研机构在生命科学领域的研究中有极高的影响力。中国科学院以277篇论文位居第4位,国内论文数量较多的机构还有清华大学(39篇)、北京师范大学(37篇)、复旦大学(37篇)等高等学校。
从机构性质看,各个国家的国家研究院都具有较高的影响力;而美国的机构中私立大学和公共组织在生命科学领域的研究中起到了主导作用,特别是私立研究型大学,依托美国开放的学术环境与雄厚的科研和资金实力,与世界各国的高校、组织开展了广泛的合作,取得了丰硕成果;中国科学院作为中国最高层次的研究机构,代表了中国在生命科学领域最权威的影响力,众多高校还需充分发挥各自学科资源优势,实现优势互补、合作共赢。
表1 生命科学领域高水平论文机构分布
笔者提取19057篇论文的文献类型信息,发现生命科学领域高水平论文主要为3种文献形式:研究型论文、综述类论文、会议论文,3种类型的论文在2008年-2018年间的数量分布以及论文篇均被引频次如表2所示。
在我国,临床中有越来越多的脑梗死患者接受治疗,血管性帕金森疾病的发病率也在上升,临床中主要采取的是美多巴与多巴胺受体激动剂治疗,但是治疗的结果不佳。血管性帕金森综合征患者没有出现脱色神经元以及路易小体[2-3],症状和帕金森疾病相似。在一些其他的研究中,血管性帕金森患者有比较多的患者基底核区梗死对其影响比较大,梗死让多巴胺突出以及突触后结构被破坏,影响了多巴胺系统功能,临床中引起了各类症状表现。
从论文数量上看,2008年至2018年生命科学领域高水平论文的主要形式为研究型论文,达到了13156篇,占总数的超过69%,会议论文仅124篇,综述类论文为5777篇,与研究型论文构成了高水平的主体;研究型论文的年份分布与论文总体分布保持一致,论文数量随发表时间的变迁而增长。
从论文被引频次看,总体上研究型论文和综述类论文的篇均被引频次接近,且均与论文发表时间成正比;综述类论文在发表的最近两年被引频次要高于研究型论文,综述类论文大都以简洁概括性的语言对某一问题做系统阐述,在论文发表的最初阶段受到了广泛关注,但是综述类论文的被引存在明显的时效性特征;2016年之前发表的研究型论文在总体上被引频次高于综述类论文,且领先幅度与论文发表时间成正比,研究型论文的被引更具有厚积薄发的持续性。
互联网的发展与普及催生了传统学术资源传播方式的变革,开放获取论文以其免费获取、质量高、无限制使用的特点成为学术知识传承创新和交流发布的主体和新趋势[20],开放获取扩展了论文的获取渠道,无疑会增加论文被阅读与利用的机会,开放获取对论文的被引次数乃至论文的传统学术影响力是否有影响还需进一步验证。
提取19057篇生命科学领域高水平论文的开放获取信息,得到如表3所示的开放获取与论文被引频次,表中统计了2008—2018年历年的开放获取与非开放获取论文数量、最大被引频次、篇均被引频次和开放获取论文比重。从横向看,高水平论文中共有11817篇论文为开放获取论文,超过总数的62%,非开放获取论文为7240篇,生命科学领域的高水平研究成果更多地被开放获取期刊所收录;历年开放获取论文的篇均被引频次均高于非开放获取论文,开放获取论文不论在被引数量还是被引质量上都高于非开放获取论文,开放获取对论文的被引用具有积极作用。
从纵向看,除2018年外,历年论文开放获取比重均超过50%,2018年开放获取比重受论文数据只采集到前8个月的影响较低(37.36%),但是在近3年论文开放获取比重明显呈下降趋势,非开放获取论文的数量也有明显增加,或因开放获取期刊通常会收取高额的费用且为了利益盲目扩张论文发表数量,导致期刊质量下降,众多有价值的实验研究转投了传统非开放获取高质量期刊,对开放获取期刊形成了不小的冲击。
科学基金是最基本的科研资助方式[21],随着研发经费支出的迅速增长,科学基金在论文产出过程中的地位日益突出[22]。为了验证基金资助对生命科学领域高水平论文的被引频次是否有影响,提取了19057篇高水平论文的基金资助信息,发现有16653篇论文至少有1条基金资助信息,超过总数的87%,生命科学领域高水平论文大部分取得了高质量的基金资助。统计论文的基金资助数量并计算对应基金资助数量下论文的篇均被引频次,制得基金资助与论文被引频次关系图(如图2所示)。
表2 不同文献类型论文被引频次分布
表3 开放获取对论文被引频次影响
图2 基金资助对论文被引频次影响
图2 中纵轴表示论文的基金资助数量,0-13逐条排列,13以上区间排列,横轴表示对应基金资助条数的高水平论文数量和篇均被引频次。可以发现,有2404篇论文没有基金资助信息,默认为这2404篇论文没有取得基金资助,但是这些论文也取得了篇均被引342.01次的高被引水平;取得一项基金资助的论文数量最高,达到3430篇,论文数量随论文取得的基金资助数量的减少而增加,半数论文得到了不多于3项基金资助。
笔者提取19057篇高水平论文的作者和所属国家(地区)信息,统计每篇论文对应的作者数和国家数,得到了如表4所示的生命科学领域高水平论文作者合作与国家(地区)合作情况分布表,默认单篇论文的作者数大于1为合作论文,单篇论文所属国家(地区)数大于1为国际合作论文。
表4 生命科学领域高水平论文合作分布
从论文的作者合作看,19057篇论文中除去4篇没有明确的作者信息,共有18251篇论文的作者数量大于1,即合作论文占总数的95%以上,可见在生命科学领域的研究中多学者、多团队的协同合作是攻破科研难题取得高影响力的重要条件;802篇由单一作者完成的论文能够入围高水平论文行列突出了作者高水平的研究能力,其中有368篇论文归属于美国;作者数为两人或3人的论文数量最高,占合作论文总数的27%,作者数量大于10人的论文有5180篇。
从论文的国家(地区)合作看,除去没有明确国家信息的38篇论文,有10397篇论文由单一国家(地区)所独有,占总数的约54%,国际合作在生命科学领域的研究中没有凸显;在国际合作论文中,有4560篇论文由两个国家共同完成,可见少数国家间形成的稳定的合作模式在生命科学领域的研究中比较普遍;在中国的1675篇高水平论文中有948篇为国际合作论文,国际合作比例达到56%,中国学者在生命科学领域的研究会更乐于寻求与国际上其他国家的合作,其中中国与美国学者合作完成的论文686篇,在所有国家中是最高的;而美国的国际合作论文仅11篇,而国内多作者合作论文高达5369篇,占总数的93.4%,美国学者在生命科学的研究中更倾向于寻求本国其他机构学者的合作,这与美国众多私立研究型大学、民间科研组织所拥有的强大科研实力是密不可分的。
统计论文的来源国家(地区)信息,以生命科学领域的4个研究学科为划分依据,分别构建了4个学科的国家(地区)合作矩阵,并利用VOSviewer软件绘制如图3所示的合作网络图谱。
图3中的4个合作网络图谱展示了生命科学领域4个学科各国家(地区)合作发表论文的情况,每一个节点代表一个国家(地区),节点之间的连线代表各国家(地区)之间合作的强度,合作越为紧密则连线越粗。可以发现,4个合作网络图谱之间存在较大差别。分子生物与遗传学和环境/生态学两个学科的合作网络密度明显较高,各节点之间的连线更多,体现了各国家(地区)在这两个学科的科学研究中存在更为广泛的紧密合作,也催生了更多的国际合作的科研论文。4个合作网络中美国都是最大的一个节点,与世界各国的联系也最为密切,在分子生物与遗传学中美国、英格兰、德国、中国、加拿大构成了合作核心,环境/生态学中美国、澳大利亚、英格兰、德国、中国、法国构成了合作核心,生物与生化中美国、德国、英格兰、法国、中国、瑞士构成了合作核心,微生物学中美国、英格兰、德国、法国、荷兰构成了合作核心。
中国在4个学科的合作网络中处于紧密合作的核心位置,与美国的合作最为密切。为了更清晰地展现中国在生命科学领域高水平论文合作网络中的位置,抽取全部论文的国家(地区)信息,构建生命科学领域全网络合作矩阵,并得到全网络合作图谱,截取如图4所示的中国在生命科学领域中的合作网络图谱。
图3 生命科学领域四学科高水平论文合作网络图谱(阈值=10)
图4 生命科学领域高水平论文合作网络图谱(中国)
由合作网络图谱可以发现,紫色的最大节点代表中国,同为紫色节点的国家(地区)构成同一个聚类,这一聚类包括了中国、韩国、沙特阿拉伯、日本、新加坡、马来西亚、巴基斯坦以及中国香港地区和台湾地区,均分布于亚洲,可见在生命科学领域的论文合作中地缘因素与科研合作有较大关联,同处一个区域的国家(地区)更容易产生合作的可能。在知识图谱中与中国所代表节点连线最粗的是美国,同时也是整个网络中的最大节点,英格兰、德国、法国、荷兰、澳大利亚、加拿大、瑞典、西班牙是最主要的合作对象,也与这些国家(地区)共同构成了生命科学领域高水平论文合作网络中的核心。
笔者以生命科学为案例,从发文信息、被引频次、合作网络3个视域对高水平论文发文特征、引用特征、合作特征进行分析发现:
(1)发文特征方面,高水平论文数量呈明显的指数型增长态势,关于生命科学的研究持续升温,高水平论文的数量与质量不断提高;美国在生命科学领域的研究占有先导地位,领先优势巨大,中国论文数量位居前列,但是论文被引频次与主要国家相比还有不小差距;美国各种性质的研究机构凭综合学术环境、资金支持与科研实力优势取得了丰硕成果,无论是论文数量还是质量均具有高水平;生物医药等与人类健康密切相关的学科研究越来越受到科学界的关注,取得了极高的影响力。
(2)引用特征方面,生命科学领域的高水平论文被引处于极高水平,综述类论文因对研究热点前沿的追踪与概述,在论文发表的最初阶段受到了广泛关注,取得了极高的学术影响力;开放获取论文不论在被引数量还是被引质量上都高于非开放获取论文,开放获取对论文的被引用具有积极作用;基金资助论文的数量明显高于非基金资助论文,绝大多数的高水平论文都取得了足够的基金项目的资金支持。
(3)合作特征方面,在生命科学领域的研究中多学者、多团队的协同合作是攻破科研难题取得高影响力的重要条件,美国拥有的强大学术影响力是各国开展国际合作的首选对象;生命科学领域4个学科的高水平论文合作网络中美国都是最重要的合作对象,各合作网络均产生了多个国家(地区)构成的紧密合作核心团体,中国在合作网络中占有重要地位,影响力逐步提升。
(4)笔者通过揭示生命科学领域高水平论文的特征,明确当前我国生命科学领域研究与发展的方向,并通过中国与世界主要国家的对比,为中国生命科学领域研究找寻新的突破路径。