■魏明坤 李一然 赵蓉英
1)河北大学管理学院,河北省保定市莲池区七一东路2666号 071002 2)武汉大学中国科学评价研究中心,湖北省武汉市武昌区八一路299号 430072 3)福州大学经济与管理学院,福建省福州市福州大学城乌龙江大道2号 350108
随着学术成果国际化程度不断加深,我国学者在国际期刊上发表论文数量越来越多,其产生的国际学术影响力成为学术研究领域关注的焦点。学术论文作为学术成果的重要表现形式,其学术影响力的测度一直被学术领域和科研管理部门关注。学术论文的影响力不仅反映学者在学术领域的学术造诣、被社会公众的认可程度以及学术论文具有的学术价值,还成为国际学术话语体系构建的重要因素。在我国国际合作学术论文产出数量达到一定规模时,如何提升我国国际期刊论文影响力成为目前更为突出的问题。在社交媒体快速发展时代,影响力不仅在正式学术交流方式下产生,还在非正式学术交流方式下产生,关注量、评论量等社交媒体指标对学术成果影响力测度具有积极的作用。在建设中国国际话语体系的新形势下,国际化已经深入社会活动的各个领域,特别是在学术研究领域,学术成果国际化有助于国外同行了解我国最新科研成果,推动学术成果国际学术影响力的扩散。国际期刊论文的发表对国际知识交流、传播具有积极作用,基于文献矩阵聚类得到的组群关系可识别科研论文的研究主题[1-2]。中国社会科学学术话语权的建设与国际影响力的提升具有密切的关系,中国社会科学学术话语权的建设离不开高影响力的学术成果,学术论文作为主要的学术成果成为国际影响力的主要有形载体[3]。基于社交媒体指标可即时获得学术成果在线交流的受关注情况,反映学术成果的在线影响力。社交媒体指标弥补传统指标在影响评价方面的不足,揭示评价对象的社会影响力[4]。尽管如此,传统引文指标在影响力评价中仍是不可或缺的,结合引文指标与其他指标进行影响力评价的方法被众多学者认同[5-6]。Altmetrics是Web 2.0时代网络计量学的补充[7],结合Altmetrics指标进行影响力测度的方法被研究者认可[8-9],但是部分学者认为Altmetrics更加侧重测度学术论文的社会关注度[10-11],无法准确测度论文质量[12]。
影响力是不断发展的概念,基于社交媒体指标分析期刊论文影响力是对学术成果衍生数据的重构,能更加客观反映学术成果的影响力。通过文献追踪和梳理发现,从影响扩散角度对我国图情领域国际期刊论文影响力的分析较缺乏,结合文献指标与网络指标的学术论文影响力评价已取得一定进展,但尚未从学术传播视角进行学术论文影响力测度。因此,本研究试图基于社交媒体指标展开对我国图情领域国际期刊论文影响力的分析,提升我国学术话语权,提高期刊在学科领域内的知名度,以期为我国国际期刊论文学术话语权构建提供一定参考。
学术论文影响力评价经历了从传统引文指标测度[13]到结合传统引文指标与网络指标测度的历程[14]。针对被引频次[15-16],有学者基于共引网络识别研究算法进行学术论文影响力测度,为交叉学科研究成果评价提出新思路[17]。也有学者从论文引用和知识网络与扩散角度出发,提出ID指数进行单篇论文影响力测度[15]。随着学术交流环境的多样化,基于引文的方法在论文影响力评价中的缺陷引起相关学者的关注[16]。Web 2.0时代,影响力测度方法不断丰富,主要通过浏览量、保存量、引用量、推荐量、分享量、下载量、转载量、阅读量等指标进行评价。短期影响力主要利用Altmetrics指标进行测度,目前应用较为广泛的测度工具包括Plum Analytics、Altmetric.com、Impactstory、ReaderMeter、ScienceCard[18]。与传统评价指标相比,Altmetrics评价指标具有更快速的特点,可即时提供评价结果。社交媒体成为科研人员重要的研究工具,对学术交流、信息共享以及科研合作方式产生了很大影响。有学者对基于社交媒体指标构建的短期影响力评价模型与引用模型进行研究,发现两者对高影响力论文的评价效果一致[19]。曹进军[20]通过改造自然出版指数,借助被引半衰期修正的期刊影响因子、H5指数等指标进行加权,构建具有时效性的影响力评价体系。宋玲玲[21]利用PLoS ALMs工具对论文影响力进行评价,发现PLoS ALMs论文层面计量指标与传统引文指标测度结果存在差异,前者更侧重测度论文的社会影响力,在一定程度上可成为传统指标的补充。评价过程中也存在部分网络指标覆盖率低、可信度低等问题。
在大量影响力研究中,复合型指标的应用不断增加,如从作者层面、同行评议层面等构建论文影响力的评价指标体系,包括浏览量、下载量、链接量等指标[22],也有学者通过引文量、链接、网页、PageRank算法等来测度开放获取期刊的学术影响力[23]。针对网络环境学术交流的特点,有学者提出了包含被引频次、被引广度、被摘引量、下载量、浏览量、浏览时间以及转载量的影响力评价指标体系[24],也有相关研究基于论文内容质量、基金资助、下载量、被引频次、期刊综合影响力、网络述及量、链接流行度、网络被引频次构建了论文学术影响力评价指标体系[25]。社交媒体环境下期刊论文影响力测度指标类型不断丰富,社交媒体重构了期刊论文影响力评价指标之间的关联关系。基于此,本文尝试从社交媒体数据特征和关联关系出发,将社交媒体指标分为学术型社交媒体指标和社会型社交媒体指标进行期刊论文影响力测度研究,以期为学术期刊影响力扩散提供一定参考。
研究数据源于Web of Science(WoS)核心合集中的SCI-Expanded、SSCI和A&HCI,设置检索领域为 Library Science &Information Science,研究对象的文献类型包括Article和Review。研究的国际论文国家/地区为PEOPLES R CHINA,检索数据时间设置为1995—2023年,其中2023年数据截至2023年8月31日,共检索到8963条记录。WoS核心合集收录的期刊包含研究领域中最新的研究成果和学术动态,根据布拉德福的文献集中离散分布规律,这些期刊中文献较多也相对集中,能够满足研究需要。在社交媒体指标方面,主要通过提取研究对象的DOI字段,利用Altmetric.com平台获取研究对象的社交媒体指标数据,对覆盖率超过30%的指标进行分析。
LDA(Latent Dirichlet Allocation)模型作为一种文本语义分析模型,通过无监督机器学习实现文档主题识别。首先,基于LDA模型,根据先验知识确定摘要的主题分布;其次,从摘要所对应的主题分布中抽取一个主题,根据先验知识确定摘要主题的词语分布;最后,从抽取的主题所对应的词语分布中抽取一个关键词。对检索的文献摘要抽取主题后,根据主题进行文本分类,并通过困惑度(Perplexity)对LDA主题抽取效果进行评价,具体计算公式为
(1)
(2)
式中:Dtest代表测试语料集;M代表语料集文本数量;Nd代表第d篇文本的大小;w代表单词;p(wz)代表文本的概率;p(w)代表测试语料集中每个单词出现的概率;p(z|d)代表文本中主题z出现的概率;p(w|z)代表单词w在主题z下出现的概率。对于M篇测试文本,对任意单词w,p(w)为主题分布值与单词w所在文本的主题分布之积。采用文献信息计量方法对统计的文献数据年代分布情况进行分析,揭示我国图情领域国际文献数量发展趋势。利用LDA模型对我国图情领域国际论文摘要进行分析,研究我国图情领域国际发文主题分布情况。通过分析我国图情领域国际合作的国家,生成作者国际合作矩阵,构建我国学者图情领域国际学术合作网络。
文献量及其变化在一定程度上用于评价、预测某学科或领域的研究水平、发展趋势,评估选题的吸引力和研究价值。为了基于论文数量分析我国图情领域国际期刊论文变动情况,从历时发展角度对年度发文量及趋势进行分析,绘制1995—2023年论文量年度分布图,如图1所示。1995年之前,我国图情领域的国际期刊论文尚未形成一定规模,在国际领域的影响力也十分有限。1995年,我国图情领域国际期刊论文量为10篇,其后发文量快速增加:2023年发文739篇(不能代表全年发文情况),2022年发文1281篇,1995—2023年发文量呈指数增长。拟合曲线的表达式为y=9.7062exp(0.173x),R2=0.8631。R2接近1,表明拟合效果较好。
图1 我国图情领域国际期刊论文年度分布
关键词是文献的信息知识标签,高度概括文献研究主题,通过关键词分析可以厘清研究领域的现状和热点。通过计算困惑度来判断最优主题数量情况,困惑度值越小表示对样本分类的效果越好,反之模型的效果越差。通过Python语言genism库的 LDA模型对我国图情领域国际期刊论文摘要进行主题识别,利用pyLDAvis工具对最佳主题数结果进行可视化,如图2所示。结果表明20个主题为最优选择。
图2 不同主题数下主题困惑度变化曲线
为了更为清晰直观地识别我国图情领域国际期刊论文的20个主题分布情况,对20个最优主题分布进行可视化,如图3所示。通过观察可发现,我国图情领域国际期刊论文多涉及model、digital、service、innovation、library、citation等主题。通过对这些主题的分析,发现这些主题既包括图情领域传统主题,也有一些新兴主题。图书馆是图情领域研究的基础内容,大部分论文围绕图书馆或基于图书馆展开研究,研究涉及信息服务、知识服务、知识管理、图书馆服务等。这些论文不断探索文化服务需求,推动图情学科的发展。引文分析自20世纪被相关学者研究[26-27],经过90多年的发展,从引文分析理论到引文分析应用,以引文分析为主题的研究仍是图情领域的重要内容。随着网络技术的发展,社交媒体、数据挖掘、Web 2.0、云计算、虚拟技术、链接分析等成为图情领域出现的新兴研究主题,这些新兴主题主要涉及技术,相关理论研究较少。
图3 我国图情领域国际期刊论文主题分布
根据LDA主题模型训练结果,对每个主题下出现概率排名前10的词汇进行统计,结果如表1所示,这些词汇在一定程度上反映了不同主题研究的主要内容。受到大数据发展的影响,数据量级发展以及数据类型改变对图情领域传统技术方法提出了挑战,新技术方法驱动图情学科交叉融合发展,新兴主题不断涌现。这些新兴主题以图情领域传统主题为基础,具有时代特征,如从图书馆到数字图书馆、从引文分析到链接分析、从小众数据到大数据等。随着我国国际论文数量不断增加[28],论文研究主题质量的重要性凸显。我国图情领域的新技术、新方法及应用研究内容逐渐突出,在推动我国国际期刊论文影响力提升的同时,一定程度上促进了我国图情学科国际学术话语权构建。此外,我国图情领域学者更加侧重学科间的交叉融合,将大数据技术、人工智能、数据科学、物联网技术等融入图情领域研究,为图情领域发展注入新的活力。
表1 我国图情领域国际期刊论文Top 10主题词统计
国际期刊论文发展的内在动因是国际话语体系建设需要,国际视野对于优秀学者是必不可少的,不同国家的科研人员看待问题和解决问题的方法存在差异,这些差异会使科研人员在科研交流中碰撞出新的思想火花,激发潜能,促进学术创新。从知识创新的角度来看,未来科学研究的发展取决于当前知识存储、传播程度。国际期刊论文作为正式国际学术交流载体,不仅实现了研究成果的国际化交流、传播,还提升了学术成果的国际影响力。学术成果国际影响力是学术话语体系构建的重要内容[29],尤其随着Web 2.0的发展,开放科学理念推动了在线学术互动与交流。学术成果影响力测度不仅可提高个人学术成果显示度,还可促进学术成果的社会传播。网络技术的发展为学术论文国际化交流提供了多种途径,社交媒体为学术论文国际化发展注入了新的活力。在Web 2.0时代学术论文国际化发展表现出勃勃生机,学术论文如何产生更大的国际影响力也成为目前学者关注的重要问题[30]。我国图情领域期刊论文的国际化交流不仅彰显我国图情学科的国际学术地位,也成为构建图情学科国际学术话语权体系的重要途径。
随着大科学时代的发展,国际合作成为学术创新的重要方式,通过集世界研究者之力,攻克科学难关,推动科学进步。学术研究无国界,学者则有归属的国家。通过分析我国图情领域国际期刊论文的合作趋势,不仅可以识别研究领域内的活跃作者,还能识别与不同国家的合作强度。为了更加直观地展示作者之间的合作关系,通过可视化软件展示我国图情领域国际期刊论文作者合作关系,得到活跃作者的分布情况,如图4所示。网络中节点大小反映作者的合作活跃度,网络中节点之间的线段表明作者之间的合作关系,节点之间的线段越粗表明作者之间的合作越频繁。通过观察作者合作网络及计算作者中间中心性,得出中心性排前5的作者分别是Ding Y、Rousseau R、Davison R M、Zhang C Z、Liu H F。这些作者在作者合作网络中处于重要地位,其体现的影响力较突出,表明我国图情领域国际期刊论文作者合作网络中部分国外学者发挥重要作用,在团体作者的合作网络中起到中介作用。
图4 我国图情领域国际期刊论文作者合作网络
作者是一篇论文的重要组成部分,不同作者论文的影响力不尽相同。在论文中,作者排名按实际的贡献度执行,第一作者和通信作者扮演着关键角色,他们对于论文的质量和影响力具有决定性作用。通常第一作者是研究的主要执行者,负责设计和开展实验、收集和分析数据等,而通信作者负责协调研究、监督实验进程、撰写论文等[31]。作者的合作范围、合作领域以及作者数量等成为学术论文影响力的直接影响要素。在作者合作网络中,中间中心性反映作者控制学术信息的传递而影响网络群体的程度,作者的中间中心性越大,其体现的影响力越大,反之则影响力较小。通过作者合作网络规模和结构关系,进一步体现研究领域的兴衰起伏、分化渗透等现状。随着我国图情领域国际化论文数量不断增多,作者合作规模不断扩大,学术论文影响力扩散的广度更大。可见,我国图情领域国际化研究力量不断加强,其产生的影响力不断提升。随着学科交叉发展,科学分工对提高科研绩效发挥重要作用,国际科研合作具有重要意义[32]。在科学技术快速发展的大科学时代,作者合作是一种社会关系和社会网络[33],学者可通过合作交流新观点、经验和技术,有效提高科研效率。因此,学术论文作者合作网络可基于知识扩散的广度反映学术论文影响力大小。
Altmetrics指标可评价学术论文影响力,有些学者认为其反映的是社会影响力或网络影响力,而无论是社会影响力还是网络影响力,都是由论文直接或间接产生的,都属于论文的内涵和外延影响力。作为非正式学术交流平台,网络平台在很大程度上改变了学者分享、传递学术思想和信息的方式。Altmetrics指标体系不仅包含了学术型社交媒体指标,还包含许多社会型社交媒体指标,侧重测度学术成果的社会参与情况。基于学术型社交媒体指标与社会型社交媒体指标分析我国图情领域学术论文国际影响力情况,不仅扩大了我国图情领域国际期刊论文影响力评价范围,也促进了学术成果社会化发展。通过Altmetric.com平台对我国图情领域国际期刊论文的DOI进行批量检索,获取1940条文献记录,占图情领域国际发文总量的32%。对Altmetric Attention Score与社交媒体指标的相关性进行分析,如图5所示。我国图情领域国际期刊论文在学术型社交媒体上呈现的影响力主要由Mendeley Readers和Dimensions Citations指标体现,在社会型社交媒体上呈现的影响力主要由Blog Mentions、News Mentions、Twitter Mentions、Facebook Mentions体现。总体而言,社会型社交媒体指标表现较弱。
图5 Altmetric Attention Score与社交媒体指标相关性
具体分析结果如表2所示。通过相关性分析,发现Altmetric Attention Score与Blog Mentions、News Mentions、Twitter Mentions、Facebook Mentions具有显著相关性,Pearson相关系数分别为0.795、0.604、0.826、0.556,表明Altmetric Attention Score更突出社会型社交媒体指标。此外,不同社交媒体指标体现的影响力不尽相同。Mendeley Readers和Dimensions Citations指标侧重文献资料的获取和研究成果的追踪,强调学术作用,并不强调社会参与度。Blog Mentions、News Mentions、Twitter Mentions、Facebook Mentions指标体现了论文社会参与度,强调交流过程,在一定程度上从不同层面体现了学术成果影响力的变化。学术论文影响力测度基于学术论文的传播交流过程,包括学科领域内的纵向扩散和跨学科领域的横向扩散。社交媒体成为学术论文影响力横向扩散的有效路径,融合社交媒体进行学术论文影响力测度成为促进学术论文传播交流的有效手段。
表2 社交媒体指标相关系数
随着Web 2.0的发展,学术交流方式不断丰富。论文的非正式交流成为学术论文影响力测度的重要方面,受到越来越多研究者的关注。从社交媒体指标角度对我国图情领域国际期刊论文影响力分析,发现学术型社交媒体指标体现的学术论文影响力较突出,社会型社交媒体指标呈现的影响力较弱,在一定程度上表明我国图情领域国际期刊论文影响力分布不均衡。通过对不同类型指标进行分析,发现学术型社交媒体指标侧重论文的正式交流产生的影响力,在测度非正式学术交流产生的影响力方面表现较弱。随着开放科学的发展,开放共享成为学术交流的趋势,未来的影响力测度将更加侧重学术论文的社会参与度情况。通过融合学术型社交媒体与社会型社交媒体指标数据,能更好地测度学术论文影响力。
本文在对我国图情领域国际期刊论文分布趋势进行分析的基础上,利用LDA模型挖掘论文主题分布,构建我国图情领域国际期刊论文作者合作网络,并探究Altmetrics指标所呈现的论文影响力。学术论文影响力评价是学术交流的起点而非终点,进行学术论文影响力细粒度测度与构建我国国际学术话语权成为影响力研究的必然趋势。本文尚存在不足之处:仅选择了我国图情领域国际期刊论文进行影响力分析,后续研究将对不同学科领域展开分析,并针对不同学科领域提出具有针对性的期刊论文国际影响力提升策略。