■苟 莉 陈一龙 王 雁 刘 丹 杜 亮
1) 四川大学华西医院华西医学期刊出版社,四川省成都市武侯区国学巷37号 6100412) 四川大学华西临床医学院(华西医院)生物医学大数据中心,四川省成都市武侯区国学巷37号 6100413) 四川大学医学大数据中心,四川省成都市武侯区国学巷37号 610041
传统的科技文献学术影响力评价方法之一是引文评价法。引文分析是利用数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对文献的引证与被引证现象进行分析,进而揭示其中的数量特征和内在规律,具体评价指标有发文量、总被引频次、篇均被引频次、影响因子等。由于一般每篇文献出版后2~3年才能达到引用高峰[1],故该评价方法存在评价时滞长的缺陷。
随着网络技术的发展,学术信息的交流模式和传播途径也在不断演变,不仅局限于被引用,还包括被科研人员通过各种文献管理软件,如Mendeley、CiteULike、Zotero等进行管理、利用;通过博客、推特等进行提及、评论和分享;另外,主流媒体也会对重要的学术成果进行深度报道、转载和评论。基于社交网络环境中学术文献影响力评价的计量学(Altmetrics,又称替代计量学)便应运而生[2-3]。Altmetrics是对学术文献在社交网络下的传播进行跟踪、计量,快速反映学术成果在社交网络下的讨论热度,为研究人员选择利用热点文献提供了参考,也是对传统文献评价体系的有益补充[4-7]。
既往研究结果显示,Altmetrics指标与被引频次间的关系随着学科不同而有差异[8-11]。对于易引发大众关注的临床医学学科,文献被引频次与Altmetrics指标之间的关系尚未明确。郭飞等[7]研究发现临床医学基本科学指标(Essential Science Indicators,ESI)热点论文被引频次与Altmetrics评分呈弱正相关关系(r=0.243);黄晓等[10]研究发现临床医学ESI高被引论文被引频次与Altmetrics评分呈微弱负相关关系(r=-0.067)。这两者结果差异是因为分析的文献集不一致,但也表明临床医学文献被引频次与Altmetrics之间的关系尚需进一步明确。同时,既往从Altmetrics视角分析提升临床医学文献学术影响力策略的研究报道较少,故本研究拟以ESI临床医学热点论文作为研究对象,分析单篇文献被引频次与Altmetrics评分以及Altmetrics元数据之间的相关性,并据此提出基于Altmetrics视角下促进临床医学科技期刊学术影响力提升的可行策略,以期为国内医学科技期刊拓展社交网络传播途径来提升学术影响力提供参考。
由于本研究是通过分析高学术影响力临床医学文献被引频次与Altmetrics之间的相关性,进而提炼出提升临床医学科技期刊学术影响力的社交网络途径,故本研究选择ESI热点论文作为研究对象。ESI是科睿唯安通过分析Web of Science收录的11000多种期刊的文献及其参考文献,提供各学科的科学家、机构、国家和期刊的排名数据。ESI热点论文是按ESI学科(22种学科分类)统计最近两年发表、在最近两个月里被引频次进入世界前0.1%的论文,研究者通过ESI热点论文可及时获知各领域近期最关注的话题;ESI数据库每2个月更新一次[12]。
本文研究对象来自2019年3月14日公布的ESI热点论文(学科:临床医学),合计572篇文献,获取每篇文献的DOI信息。数据提取时间为2019年3月22日。
1.2.1 被引频次
本研究的被引频次(Citation Frequency)是指该篇文献自出版以来总的被引频次,取自Web of Science。通过Web of Science高级检索功能,以“DO=(DOI1) OR DO=(DOI2) OR … OR DO=(DOIn)”的格式对所选文献进行检索,其中DOI1,DOI2,…,DOIn分别为ESI热点论文的DOI。最后导出检索文献,并通过与原ESI热点论文的DOI以及文献名称进行双重匹配,提取出所需文献的被引频次。本研究共获取572篇文献的被引频次,数据提取时间为2019年7月3日。
1.2.2 Altmetrics 数据
本研究Altmetrics 数据包括Altmetric Attention Score(AAS)和Altmetrics元数据。目前Altmetrics 的四大数据提供商分别为Altmetric.com、ImpactStory、Plum Analytics 和 PLoS[2,13-15]。Altmetric.com 拥有一套完整的算法体系,对每种类型社交传播途径数据赋予不同权重后加权求和,计算得到最终每篇文献的AAS;其中新闻的权重最大,其次是博客、维基百科和政策文件,相对而言,推特、新浪微博、Facebook以及LinkedIn等社交媒体的权重比较小[13]。本研究根据每篇文献的DOI从Altmetric.com 获取该篇文献的AAS,合计成功匹配556篇文献,16篇文献的AAS缺失。数据提取时间为2019年3月29日。
Plum Analytics公司提供每篇文献的 PlumX Metrics,包括4项Altmetrics元数据,即:使用(Usage)、捕捉(Captures)、提及(Mentions)和社交媒体(Social Media),具体每项指标的含义和社交网络途径见表1,每项指标最后取值是各种社交网络途径提及次数之和[16-17]。Elsevier公司旗下的Scopus数据库是目前全球规模最大的文摘和引文数据库,从2017年开始为其收录的文献提供PlumX Metrics,从ESI检索到的热点论文基本可以通过Scopus数据库获得PlumX Metrics。故本研究通过每篇文献的DOI从Scopus数据库匹配提取PlumX Metrics,纳入4项Altmetrics元数据;合计成功匹配571篇文献,1篇文献数据缺失。数据提取时间为2019年3月26日。
表1 PlumX Metrics中Altmetrics元数据含义
本研究剔除上述16篇AAS缺失的文献,以及1篇PlumX Metrics缺失的文献,本研究共获取555篇文献完整的被引频次、AAS以及Altmetrics元数据,并将其作为本次研究的数据来源。
采用R软件对所有数据进行分析和描述。首先采用One-Sample Kolmogorov-Smirnov Test对每项指标的正态分布进行检验。由于各项指标均不符合正态分布,故采用Spearman 秩相关分析被引频次与AAS、Altmetrics元数据之间的相关性。检验水准设置为α=0.05。
对各指标的正态分布情况采用One-Sample Kolmogorov-Smirnov Test检验,P值均小于0.05,被引频次、AAS、使用、捕捉、提及、社交媒体这6个指标均不符合正态分布。纳入研究的555篇文献的被引频次、AAS以及Altmetrics元数据描述性结果见表2。
表2 各项指标统计描述结果(n=555)
由于6个指标均不符合正态分布,故采用Spearman秩相关分析被引频次与Altmetrics各指标间的相关关系,6个指标间的相关性矩阵结果见表3。
表3 Spearman秩相关分析结果(n=555)
注:上三角形为Spearman秩相关系数,下三角形为对应的P值。
2.2.1 被引频次与AAS的相关性分析
从表3可以看出,被引频次与AAS的相关系数为0.2276,呈微弱正相关关系。这表明早期在社交媒体获得广泛关注的医学研究成果,后期也可能会获得较高的学术引用,但二者相关关系比较微弱。
本研究中AAS反映的是学术文献在社交网络下的关注热度,主要反映的是主流媒体或大众对该事件的关注程度,而被引频次则是反映专业科研人员对该研究成果的再利用程度,从整体来看,二者的变化具有一定的联系,但由于关注的群体不一样,故二者关联程度并不紧密,大众早期对临床医学科学知识的广泛关注扩散并不会完全直接转换为后期文献的学术引用。
2.2.2 被引频次与Altmetrics元数据的相关性分析
从表3可以看出,被引频次与Altmetrics元数据中的使用、捕捉、提及、社交媒体的相关系数分别为0.5370、0.3892、0.3124、0.2480,其差异均有统计学意义(P<0.0001)。其中,被引频次与使用呈中等强度的正相关,与捕捉、提及呈弱正相关,与社交媒体呈微弱正相关。
从表1可以看出,PlumX Metrics 评价体系内使用是指通过阅读或以其他方式使用文献的途径,具体包括点击、下载、查看、图书馆馆藏、视频播放等。对文献进行点击、下载和查看的人员主要为科研人员,他们是利用和引用文献的主体,因此该项指标与被引频次呈中等强度的正相关。从提升医学科技期刊学术影响力的角度来看,该群体也是科技期刊出版单位进行有针对性的宣传推广的重要对象,同时也需要通过优化文献获取途径,立体化展现研究内容,以最大程度地吸引专业学者利用文献。
被引频次与捕捉呈弱正相关。捕捉在PlumX Metrics评价体系内是指研究人员为了便于后期使用文献所作的一些标记,比如使用书签、收藏夹、读卡器等对文献进行管理;捕捉主要也是反映科研人员对文献的利用管理,是后期文献引用的重要潜在人群。
被引频次与提及呈弱正相关。提及在PlumX Metrics 评价体系内是指新闻媒体或博客上报道或转载研究活动;新闻、博客和维基百科等由于包含更丰富的内容和针对性评论,故可能会产生更深入和更持久的社会影响力,以至于影响后期学术研究的引用,二者呈现一定的相关性。
被引频次与社交媒体呈微弱正相关。推特、Facebook等社交媒体的用户多为大众群体,对科学事件的转发或评论,仅仅起到扩散作用,对后期的学术引用并无明显促进作用。
本文的研究对象为2019年3月14日公布的ESI热点论文(学科:临床医学),合计572篇文献,通过文献DOI从Altmetric.com获取文献的AAS,合计成功匹配556篇文献,仅16篇文献的AAS缺失,覆盖率为97.2%。这表明这些临床医学高被引文献在社交网络也能获得普遍关注。
由于该批热点论文均为2017年和2018年发表的文献,为了进一步了解高被引文献与发表当年Altmetrics热度的一致性,笔者将572篇热点论文的DOI与Altmetric.com公布的2017年和2018年Top100的文献进行匹配,结果仅23篇文献匹配成功,占比为4.0%,表明仅极少数的高被引文献在发表当年获得极高的社交网络关注度。这也表明,在学术界快速引用的热点论文并不一定能在社交网络获得极高的关注度。但由于Altmetric.com每年公布的Top100没有区分学科,同时目前尚不能通过Altmetric.com 了解每个学科内文献的AAS排序,故该结论可能存在偏差,二者的关系尚需进一步深入研究。
(1) 以引文数据为评价基础的临床医学ESI热点论文,其被引频次与表征社交网络传播热度的AAS呈弱正相关关系;与Altmetrics元数据中的使用呈中等强度正相关关系,与捕捉、提及呈弱正相关关系,与社交媒体呈微弱正相关关系。
(2) 临床医学高被引文献出版后在社交网络能获得普遍关注,但仅极少数在发表当年获得极高的社交媒体关注度。
(3) 从Altmetrics视角,医学科技期刊出版单位可以通过增加出版文献的社交网络曝光度,提升其学术影响力。最为有效的社交网络途径有:通过点击、下载、浏览、视频播放等途径直接利用文献;通过书签、收藏夹、读卡器等文献管理软件管理利用文献;通过主流媒体、维基百科和博客等评论、引用和分享文献。通过推特、Facebook等社交媒体转发分享文献,对提升其学术影响力作用甚微。
(1) 医学科技期刊出版单位可以通过完善官网建设,增强网站的检索功能,采取优先出版以及开放获取全文等措施提升文献获取的便捷性;同时出版单位需加强与国内大型数字出版平台,如中国知网、万方、维普等合作,以为专业学者多途径获取文献提供便利;文章正式出版后及时将期刊内容数据报送国内外收录数据库,如MEDLINE、PubMed、Scopus、EBSCO、CSCD、CSTPD等,以确保文献能及时被检索[18]。
(2) 出版单位还可以为每篇文献提供出版增值服务,如语音或视频介绍论文、在线问答、共享研究数据和资料等,以更加丰富、立体地展示和传播研究成果,提升文献的阅读量和下载量,进而提升文献的学术影响力。
(3) 出版单位还可以在官网或各大合作数字出版平台,提供多种版本格式的全文,以便于专业学者采用各种文献管理软件,如EndNote、BibTeX、NoteExpress、Mendeley等收藏利用文献。
(4) 对于意义重大、具有开拓性创新的研究内容,出版单位可以主动向主流媒体(如今日头条、科学网等)发送新闻稿,以增强大众媒体对出版内容的深度报道宣传;同时可以对原创研究建立百科词条,以扩大研究成果的深度传播,进而扩大其学术影响力[19-20]。
以上是基于本次相关性研究结果提出的Altmetrics视角下提升临床医学科技期刊学术影响力的社交网络传播途径策略,希望能为国内医学科技期刊在拓展和丰富社交网络传播途径的选择上提供参考。由于本研究仅对高被引临床医学文献被引频次与Altmetrics的关系进行了探讨,文献选择有一定偏倚,故其结论外推至所有临床医学文献时有一定的局限性;同时提出的社交网络传播策略,尚需在实践中进一步丰富和完善。