陈廉芳
(福建医科大学图书馆,福建 福州 350122)
学术论文被引频次作为科研影响力的重要指标,为科研人员所关注。提升学术论文质量是追求学术论文高被引的首要任务。有研究发现论文被引频次与学术论文诸多外在特征相关,如标题和摘要区分度、作者和机构数量、作者所属区域、基金资助、参考文献量、下载次数、论文长度等[1],某些特征可能是高质量论文的外在表现,也有可能通过作用于论文可见度或受欢迎度影响论文被引频次,其中科研合作与被引频次关系受关注程度较高。论文合作是科研合作的重要表征,论文合作有着不同的方式,如,从合作规模可以分为不同人数的合作,从组织跨度可分为机构内合作、机构间合作和国际合作,从学科范畴可分为学科内合作和跨学科合作。图书馆的发展需要技术与人文双管齐下,服务转型创新需要借助技术力量,数字图书馆是图书情报领域中与数据存储检索、云计算、区域链和人工智能等计算机网络新兴技术关联最为密切的领域,该领域一直为从业人员所关注,代表着图书馆发展技术热点前沿,有着重要地位和较大发文量,因此探索该领域论文合作方式对被引频次的影响,以期为相关研究者提供参考。
有研究认为合作方式与被引频次关系显著。刘则渊通过对物理、化学和生物等学科论文数据分析,证实科学合作最佳规模现象的存在,并提出全面探索科学合作最佳规模现象与定律设想[2]。苏芳荔以图情类4种期刊为研究对象,发现通过合作能显著提高论文影响力,但国际合作并不优于国内合作,机构合作频率与篇均被引次数没有显著相关[3]。刘小鹏和姜雪发现临床医学方面论文,被引量与合作单位量具有线性相关,国际合作论文影响力高于国内合作,医院与非医院合作高于医院之间合作[4]。Ronda-Pupo和Katz运用幂标度法分析图情期刊论文中合作与引文影响之间的关系,发现引文影响和合作模式呈幂律关系,多作者的马太效应强于单作者[5]。Matveeva 和Poldin 使用来自不同学科研究人员数据构建回归模型,发现被引次数与合著作者数、研究者在合著网络中位置正相关,积极合作者通常有更好的文献计量指标[6]。
但也有部分研究认为合作方式与被引频次关系不大。王黎明等通过对2015 年《图书情报工作》发文统计,认为单作者论文与多作者论文平均被引频次没有显著差异,作者数对被引频次几乎没有影响[7]。Iribarren-Maestro 统计某大学10 个院系论文产出,发现虽然多机构和多国的作者身份能增加被引次数,但合著与被引次数却无关[8]。Thijs 等应用多种回归分析方法,在期刊、机构和国家等不同层次的聚合范围评估作者数量对引文指标的影响,在使用期望作者率矫正后,结果显示与作者数量无关[9]。
上文所述文献选取的样本来自不同学科领域,认为关系显著的5 篇文献中,样本来自图情的2 篇、生物物理化学的1 篇、医学的1 篇、多学科的1篇;认为关系不大的3篇文献中,样本来自图情的1 篇,多学科的2 篇。有的学科领域偏向于人文思辨研究,多人合作探讨可能减弱个体独特性,反而降低论文亮点;而对于以实证或技术研究为主的学科领域,多作者多机构合作,更有可能具备优越技术条件和实验设备,增加数据完整性和统计合理性,从而提升论文质量。同样来自图情领域的3篇文献,有的样本选自1份刊物,有的选自4 份刊物,也有的选自更多的刊物,结论不一致的原因在于样本范围不同。数字图书馆领域是图书馆学与计算机科学技术的交叉领域,是社科与自科的综合、理论与实践的结合、思辨与实证的融合,具有综合学科特点,选取“数字图书馆”研究领域学术论文为样本,研究范畴具有一定的新颖独特性。
本调查选取中国知网CNKI 近十年的“数字图书馆”学术论文为样本,于2019年10月13日,检索CNKI 数据库,选取文献分类为“数字图书馆”,年份为2009-2018 年,共10 年,来源类别为CSSCI(含扩展版)的所有期刊论文,剔除新闻报道和编者按等非学术论文,共检出该方向研究论文2173篇,进行描述统计。
表1 样本描述统计特征
在进行作者人数、合作跨度、第一作者、合作人员、基金级别、影响因子级别等5 个变量描述统计之后,使用SPSS 软件探索合作与被引关系。数据服从正态分布且方差齐性是参数检验的前提条件,通过对被引频次正态性检验,得出Kolmogorov-Smirnov(D 检验)和Shapiro-Wilk(W检验)的Sig. 值均小于0.001,不服从正态分布,要选用非参数检验。
以合作人数为自变量,应用Kruskal-Wallis检验被引频次差异,显著性水平小于0.001,说明不同合作人数的论文被引频次有显著差异,再进行所有组别的多重成对比较,结果表明:3 人合著的显著比1人独著的高,2人合著的也显著比1人独著的高,其他作者人数的无显著差异。
表2 不同合作人数的论文被引频次差异
以合作单位跨度为自变量,应用Kruskal-Wallis 检验被引频次差异,显著性水平小于0.001,说明不同合作单位跨度的论文被引频次有显著差异,再进行所有组别的多重成对比较,结果表明,单位内合作显著比无合作的高,单位间合作显著比无合作的高,单位内合作与单位间合作无显著差异。
表3 不同合作单位跨度的论文被引频次差异
数字图书馆方面的研究者以图书馆员和高校教师为主,第一作者(含独著)为此两类人员的论文占样本的97.2%,应用Mann-Whitney U检验比较两者被引频次差异,两者无显著差异。
表4 不同第一作者的论文被引频次差异
第一作者为馆员且为合著的论文中,把合作者也是馆员的定为“馆员与馆员”类,合作者中有教师的定为“馆员与教师”类,应用Mann-Whitney U 检验比较两者被引频次差异,两者无显著差异。
表5 第一作者为馆员的不同合作类型论文被引频次差异
第一作者为教师且为合著的论文中,合作者也是教师的定为“教师与教师”类,合作者有馆员参与的定为“教师与馆员”类,应用Mann-Whitney U 检验比较两者的被引频次差异,两者无显著差异。
表6 第一作者为教师的不同合作类型论文被引频次差异
按基金资助级别,将论文分为“无基金”“厅级及以下”“省部级”“国家级”等4类。按是否合作,将论文分为“无合作”和“有合作”。在不同级别基金资助条件下,分别进行Mann-Whitney U检验,探索合作对被引频次的影响。结果显示:无基金论文,有合作的被引频次显著高于无合作的,而有基金资助的论文,不管是哪一种级别的,有合作的与无合作的均无显著差异。
表7 不同基金级别论文有无合作的被引频次差异
影响因子整数部分为“0”的460 篇,“1”的1327篇,“2”的357篇,“3”的1篇,“5”的28篇,其他的均为0篇,故将论文分为“0<影响因子<1”“1≤影响因子<2”和“影响因子≥2”等3 类。按是否合作,将论文分为“无合作”和“有合作”。在不同影响因子级别条件下,分别进行Mann-Whitney U 检验,探索合作对被引频次的影响。结果显示中间显著,两端不显著,在“1≤影响因子<2”这一级别上,有合作的被引频次显著高于无合作的,而在其他2 个等级中,有无合作无显著差异。
表8 不同影响因子级别论文有无合作的被引频次差异
合作论文(1096篇,占50.4%)比无合作论文(1077 篇,占49.6%)稍多,合作人数越多的论文数量越少,不同合作人数的论文存在被引频次的显著差异,作者人数为2 或3 的论文被引频次要显著高于独著论文,与刘则渊证实的科学合作最佳规模现象的存在相一致[3]。数字图书馆是技术应用性强的领域,研究的复杂综合使得协作的优势得以体现,研究人员为2-3 人为最佳模式,能使合作功效达到最大,而人数继续增加可能会出现意见众多难以协调或者无实质贡献人员挂名现象,不能提升被引频次。来自同一单位作者合作(498 篇,22.9%)与来自不同单位作者合作(598篇,27.5%)的论文,在被引频次上不存在显著差异,但都显著高于无合作论文。同单位合作沟通交流协作更方便,更有利于深入合作,跨单位合作能实现设备、技术、方法、思维和观念等的互补,两种合作类型优势相当,都强于单兵作战。
图书馆员与高校教师是该领域研究主力,第一作者为馆员(1166篇,占53.7%)与第一作者为高校教师(946 篇,占43.5%)在论文被引频次上无显著差别。“馆员与馆员”和“教师与教师”的同类人员合作要比“馆员与教师”和“教师与馆员” 的交叉合作比例高,但馆员与馆员合著的论文被引频次无显著差异于馆员与教师的合著,同样,教师与教师也无显著差异于教师与馆员。在图情研究方面,高校教师的研究实力总体上要强于图书馆员[10],但由于数字图书馆领域实践性强,馆员作为服务人员可能有更多实际管理和操作实践机会,高校教师是专职的教学科研人员,有理论优势,缺少实践机会,两类人员研究实力相当。交叉合作具有知识技能互补优势,同类人员合作有沟通交流便捷优势,两者优势均衡,被引频次无显著差异。
基金课题通常以团体名义申请,有基金论文本身就具有较大合作概率,基金与合作两者呈弱相关(r=0.284**)。在不同基金级别论文上,有无合作的被引频次差异也呈现不同,无基金论文(1187 篇,54.6%)中,有合作的被引频次要显著高于无合作的,而有基金论文(986 篇,45.4%)中,有无合作无显著差异。在同等情况下,无基金论文存在机构认同和资金资助劣势,且其中无合作的篇数要多于有合作的,借助合作可以增强研究实力,弥补劣势,提升论文质量。有基金资助论文本身具有较大合作概率,研究者也已经具备较高学术水平,特别是省部级以上基金资助级别项目水平更高,合作对被引频次提升无显著作用。
在不同影响因子级别论文上,有无合作的被引频次差异呈现不同,中间层次的有合作显著高于无合作。根据2019年10月20日在CNKI检索得到的综合影响因子,样本中的图情类CSSCI刊物,“0<影响因子<1”的5 种,均为扩展版期刊且扩展版期刊仅出现在此处,“1≤影响因子<2” 的15种,“影响因子≥2”的4种。期刊数量上,中间层次期刊占多数,两端的较少;显著性上,中间显著,两端不显著。CSSCI刊物论文质量通常较好,“0<影响因子<1”的刊物论文具有一定研究水平,但离CSSCI 正版刊物论文有一定距离,在这一层次上,有无合作影响不大;“1≤影响因子<2”的刊物数量多,这一层次发文作者数量较多,通常有更高研究水平,合作能够让他们锦上添花,获取更高的被引频次;在“影响因子≥2”的刊物上发文的作者们通常具有深厚专业学术功底和良好学术声誉,从被引频次角度上看,是否合作对其影响不大,但这部分作者和论文毕竟只占少数。
通过统计分析,在数字图书馆研究领域,关于论文合作方式对被引频次的影响有如下结论或建议:
(1)研究人员应该增强合作但人数又不宜过多,以2-3 人为最佳。研究者要扩大合作视野,尽量取长补短实现跨单位合作,但未能实现跨单位合作的作者,也可便捷地寻求本单位合作者,同样也能提高论文影响力。
(2)图书馆员研究实力并不逊色于高校教师,且交叉合作与同类合作无显著差异。从被引频次上说,馆员寻求馆员合作与寻求教师合作是无差别的,但目前,交叉合作较少,馆员增强与教师的合作,或许能有更新思路更强技术的助推,更好实现理论实践相结合。
(3)无基金资助论文合作概率低,且有合作的被引频次显著高于无合作的。近年来,各种级别基金项目增多,越来越多的研究人员申请到了科研基金项目,伴随着基金的获取,合作概率也增大。数量上比有基金资助论文稍多的无基金资助论文在寻求合作上存在劣势,手头暂无基金项目资助的研究者们,除了加强基金申请外,更要积极寻找合作者,以便提高论文影响力。
(4)在图情类CSSCI 刊物中,影响因子居中的刊物有合作的被引频次显著高于无合作的,且这部分刊物数量占多数。虽然能在顶级刊物上发文的作者们可以忽视合作的影响,但他们只是少部分学术功底深厚的专家学者,而对于广大的普通的追求CSSCI 期刊发文的研究者们应该积极寻找合作以便提高影响力。