赵蓉英 王 旭
(1.武汉大学中国科学评价研究中心 湖北武汉 430072)
(2.武汉大学信息资源研究中心 湖北武汉 430072)
(3.武汉大学信息管理学院 湖北武汉 430072)
学术期刊承载着原创的科学知识,是科研产出的重要载体。在当前的学术生态中,学术期刊位于学术生产机制的末端环节,既承担了一定的学术评价功能,也是进行学术评价的对象之一,分析评价学术期刊影响力对于推动期刊发展具有重要意义。期刊评价由来已久,自加菲尔德提出期刊影响因子以来,从引文角度来研究文献及科学发展动态,为期刊评价测度提供了量化参考。但由于学术研究的复杂性、不可预见性及时下不良的学术生态环境,这种基于影响因子等引文指标的传统期刊定量评价方法,具有时滞长、评价指标体系及评价主体单一、虚假引用、“马太效应”引用、以刊评代文评等不足。特别是在Web2.0环境下,传统的基于引文指标的期刊评价计量方法已无法全面评价学术期刊影响力,为了弥补其局限性,补充计量(Alternative Metrics,Altmetrics)应运而生,并成为科学评价研究中备受瞩目的研究领域。Altmetrics指标在已有计量学指标的基础上增加了线上指标,如浏览、保存、讨论、推荐和引用等,将学术平台和大众社交平台的指标结合起来;另一方面,Altmetrics不仅研究新型的计量指标,同时也研究非传统的计量对象,是对传统引文分析对象在社交媒体和开放存取平台上的扩展,具体包括文献、期刊、图书、博客、学术会议、PPT、软件、源代码等形式。Altmetrics数据具有公开透明,累积即时等优势,学术期刊影响力评价研究中综合使用基于Altmetrics指标数据与传统引文指标数据可使评价结果更加客观公正。
目前,学界关于Altmetrics理论、方法及应用主要侧重于论文和期刊层面上的研究,其中针对学术论文评价的研究较多,但不乏期刊评价层面上的研究。如樊学明等对科技期刊的网络影响力、声誉等属性进行了评价;匡登辉指出应结合Altmetrics指标与引文指标进行期刊影响力综合评价;李勇等以小木虫论坛媒体平台为实证背景,构建期刊多维度测评指标模型;张洋等分析了四种网络数据源在期刊影响力评价方面的异同;Yu H等对Atmetric.com平台收录论文在微博与推特上的Altmetric指标进行了对比研究。另外,关于引文指标和Altmetrics指标相关性问题一直是当前研究的重点,如王宇等发现Altmetrics与谷歌H5指数存在正相关 性;Costas R 等对 Altmetric.com 提 供 的 各 学 科领域出版物的Altmetrics指标与其引文指标进行了分析,并指出Altmetrics在期刊评价中具有潜在价值。然而,在期刊评价层面上,仍缺乏将传统期刊学术影响力指标与网络社媒社会影响力指标结合进行全面评价及指标间相互关系的研究,已有的少数研究也较为分散、单一。因此,为了对学术期刊影响力进行综合评价,本研究在前人经验基础上,以国际图书情报期刊为例,结合学术期刊的传统引文指标并引入Altmetrics指标,试图构建基于传统引文指标和Altmetrics指标的学术期刊影响力综合评价模型,从期刊的学术影响力、社会影响力两个维度系统地进行期刊评价指标体系的构建,并通过因子分析、主成分分析及相关性分析方法分别对学术期刊的学术影响力、社会影响力进行评价,并分析各指标间的相互关系,以此得到学术期刊影响力二维评价结果,以期为学术期刊影响力评价提供参考。
米哈伊洛夫将科学交流模式分为正式交流与非正式交流两个过程,据此,笔者将期刊影响力分为学术影响力与社会影响力。期刊学术影响力是学术期刊通过正式(传统)科学交流过程产生的影响力,在正式科学交流过程中,学术期刊的知识传播是通过其所刊发论文被其它学术论文引用而实现的,体现出学术期刊所具有的知识信息被同行专业学者吸收利用,是一种单向性的科学交流。学术期刊社会影响力是学术期刊在Web2.0网络环境的非正式科学交流过程中产生的影响力,在非正式科学交流过程中,学术期刊的知识传播是通过其所载论文在在线社交媒体和网站平台上被传播使用实现的,体现了学术期刊的知识信息由于知识性、话题性或者趣味性等原因获得了社会大众群体的关注,是一种多向性的非正式的科学交流。
学术期刊影响力的测度从学术维度和社会维度两方面来选取指标,本文采用多指标融合的方法构建学术期刊影响力评价模型(见图1)。在期刊学术影响力评价方面,以JCR为数据来源,选取8个指标进行学术影响力评价;在期刊社会影响力评价方面,以Altmetric.com为数据来源,选取12个指标进行社会影响力评价;然后使用因子分析、主成分分析和相关性分析进行期刊学术与社会影响力评价;最后将两者的评价得分映射到二维直角平面上进行评价。
3.1.1 数据来源
图1 学术期刊影响力评价模型构建过程
在 Journal Citation Reports(2016 版,JCR,期 刊引证报告)的 Information Science&Library Science(图书馆学情报学)学科类目中,共收录85种图书情报学期刊。经统计85种期刊的影响因子总和为127.958,平均影响因子为1.505,笔者选择了影响因子大于平均值的期刊,共计35种期刊。引文分析中用于评价的指标会根据每位学者的研究内容有所不同,选择的指标也都存在差异,JCR中由于部分期刊的引用半衰期、被引半衰期值缺失(只显示其值大于10年),因此剔除掉这两项指标,最终选择指标为总被引频次(Total Cites)、影响因子(Impact Factor)、5年影响因子(5-Year Impact Factor)、即年指数(Immedicy Index)、特征因子分值(Eigenfacetor Score)、论文影响分值(Artcle fluence Score)、期刊影响因子百分位(Average Journal Impact Factor Percentile)、标准化特征因子(Normalized Eigenfactor)8 个指标(数据获取结果见表1)。
3.1.2 数据分析与评价结果
期刊学术影响力评价即基于传统引文指标的期刊影响力评价。首先,利用SPSS20对上述JCR中获取的图书情报期刊8个指标变量进行相关检验(见表2)。检验数据显示所有的相关系数相对较高,各指标间呈现较强的正相关。同时通过KMO-Bartlett球度检验得到KMO值为0.736,显著性值为SIG=0<0.01(见表3),各变量间显著相关,因此样本可以进行因子分析。
表1 JCR中35种期刊指标数据(前10位)
表2 各指标间的相关性分析
表3 基于引文指标的KMO和Bartlett的检验
虽然样本数据能够进行因子分析,各指标间显著正相关即存在共性,但这些共性能否准确反映各指标间的原始信息仍需进行验证。如何提取主成分将各强关联的指标聚到一起是进行因子分析的关键,也直接决定评价模型的构建。利用主成分分析法作为因子提取方法,各指标提取的公因子方差介于0.620-0.966之间,其值均较高、信息丢失都较少,因此本次因子提取的总体效果较理想,能够反映指标的原始信息。
在各指标揭示的总方差表中,“初始特征值”“提取平方和载入”和“旋转平方和载入”形成的数据组分别代表方差特征值、贡献率、和累积方差贡献率(见表4)。可以看到,成分1的特征值为5.016,解释原有8个变量总方差的62.702%=5.016÷8×100%;成分2的特征值为1.732,解释原有8个变量总方差的21.645%=1.732÷8×100%,前两个公共因子解释的累积方差贡献率达84.347%,而后面的公共因子特征值较小,对解释原有变量的贡献越来越小,因此提取两个公共因子是合适的,即将8个原始指标划分至两个主成分中。同时,根据表4中“初始特征值”栏中的“合计”列数据绘制各指标特征的碎石图(见图2)。观察发现,第2个公共因子后的特征值变化趋缓,故而选取2个公共因子是比较合适的,再一次验证了主成分数。
图2 各指标特征值碎石图
通过SPSS得到各成分得分系数矩阵,由此可得最终的因子得分公式:F1=-0.069*被引频次+0.302*影响因子+0.223*5年影响因子+0.308*即年指数-0.128*特征因子分值+0.148*论文影响分值+0.288*期刊影响因子百分位-0.128*标准化特征因子;F2=0.312*被引频次-0.064*影响因子+0.023*5年影响因子-0.172*即年指数+0.353*特征因子分值+0.101*论文影响分值-0.086*期刊影响因子百分位+0.353*标准化特征因子。同时根据表4“旋转平方和载入”栏中的2个主成分的方差贡献率43.254%、41.093%,可以得到期刊学术影响力评价的综合得分公式:F=0.43254*F1+0.41093*F2。最后由综合评价得分值大小得到35种图书情报期刊的学术影响力评价结果(见表5)。
表4 各指标解释的总方差表
3.2.1 数据来源
本文借助Altmetric.com的Altmetrics Explorer平台,以JCR中前35种图书情报期刊的ISSN为检索和过滤项,检索时间为2018年5月21日,获取Altmetrics相关指标共12个:Altmetric Attention Score,all time(所有时间 Altmetric关注总得分)、Altmetric Attention Score,the past year (近 一 年Altmetric 关 注 总 得 分 )、News mentions、Blog mentions、Policy mentions、Twitter mentions、Patent mentions、Peer review mentions、Facebook mentions、Wikipediamentions、Google+ mentions、NumberofMendeley readers(由于剩余Altmetric指标大部分为0值,故暂不考虑剩余指标)。检索得到15858篇论文Altmetric指标数据,经统计最终得期刊Altermetric指标数据表(见表6)。
表5 学术影响力评价结果
3.2.2 数据分析与评价结果
期刊社会影响力评价即基于Altmetrics指标的期刊影响力评价。首先,利用SPSS20对上述Altmetrics Explorer中获取的图书情报期刊12个指标变量进行相关性分析,结果显示大部分指标间呈现较强的正相关。同时通过KMO-Bartlett球度检验得到统计量为622.857,KMO值为0.753,显著性值为SIG=0<0.01,各变量间显著相关,因此样本可以进行因子分析。利用主成分分析法作为因子提取方法,得到各指标提取的公因子方差介于0.464-0.981之间,其值均较高、信息丢失都较少,因此本次因子提取的总体效果较理想,能够反映指标的原始信息(篇幅限制,未列出)。
表6 期刊Altmetric指标数据表(前10位)
在各指标揭示的总方差表中,“初始特征值”“提取平方和载入”和“旋转平方和载入”形成的数据组分别代表方差特征值、贡献率和累积方差贡献率(见表7)。可以看到,成分1的特征值为8.153,解释原有12个变量总方差的67.942%=8.153÷12×100%;成分2的特征值为1.142,解释原有12个变量总方差的9.517%=1.1422÷12×100%,前两个公共因子解释的累积方差贡献率达77.46%,而后面的公共因子特征值较小,对解释原有变量的贡献越来越小,因此提取两个公共因子是合适的,即将12个原始指标划分至两个主成分中。
最后,通过SPSS得到各成分得分系数矩阵,由此可得最终的因子得分公式:
同时根据表7“旋转平方和载入”栏中的2个主成分的方差贡献率67.9%、9.56%,可以得到期刊社会影响力评价的综合得分公式:F=0.679*F3+0.0956*F4。最后由综合评价得分值大小得到35种图书情报期刊的社会影响力评价结果(见表 8)。
表7 各指标解释的总方差表
表8 社会影响力评价结果
3.3.1 相关性分析
由于在Altmetrics Explorer平台,通过刊名及ISSN号都未能检索到期刊 《Information&Management》的各项指标,从而导致上文该刊F得分为0。为了不使缺失值影响整体相关性结果,因此本文暂对该刊排除,利用SPSS软件对其余34种期刊的学术影响力评价得分值F和社会影响力评价得分值F进行Spearman相关性分析可知(见表9),两变量间的相关系数为0.774,SIG=0,二者具有较强的相关性,说明本文基于社会即Altmetrics指标的期刊影响力评价对基于学术即引文的期刊影响力评价具有较好的补充。Web 2.0时代,开放存取运动盛行、线上学术交流活动频繁,学术期刊刊载的论文在社交媒体上被分享,报道后往往会激发领域内其他学者的阅读兴趣,其中学术价值较高的成果易受关注继而被引用。由于学术论文引用具有滞后性,其滞后于网络浏览、分享、评论等行为,从而对学术期刊被引用也造成滞后结果,然而基于Altmetrics指标评价学术期刊的时效性明显优于引文指标。同时,由于二者成较强正相关,可知Altmetrics指标得分对被引得分的高低也有一定的预见性,如果某期刊在早期获得较高的Altmetrics分值,那么该刊在之后也会获得较高的被引得分。然而,两种评价维度仍存在一定差异,并不可完全替代,这也说明将二者结合进行综合评价具有一定的价值。
表9 学术影响力评价得分值和社会影响力评价得分值相关系数表
3.3.2 二维评价
二维矩阵是选择两个分类维度,绘制四象限图的分析方法,是由“波士顿矩阵分析”方法演化而来,可用来综合反映评价对象在领域中所处水平与状态。 王妍从学术和社会两个维度构建学者影响力二维测度框架并进行实证分析。本文借鉴其评价思想,将基于学术影响力和社会影响力评价得分作为学术期刊影响力评价的两个维度,并将其投射在二维直角坐标系中进行综合评价。学术期刊在学术和社会这两个维度上的活跃度,可以用来判断其科研角色。期刊在学术维度上的得分,测度的是期刊的学术贡献以及同行对该刊刊发成果的认同度,直接反映期刊学术质量的高低;而社会维度上的得分,测度的是在网络环境下该刊刊发的研究成果引起的社会关注度与知名度,以及大众在研究过程中的参与情况。因此,经计算两个维度评价得分的几何平均值分别为189、1629,根据该值确定期刊影响力高低标准分界线,故横坐标以189为基于学术期刊影响力高低标准分界线,纵坐标以1629为基于社会期刊影响力高低标准分界线 (划分之后得到四个象限期刊的角色定义见图3)。
(1)“名望”期刊:分布于第一象限,学术影响力和社会影响力都很高,既享有较高学术威望,又具有较高知名度和关注度。这一区域共有13种期刊,占比37.14%。如以Journal of the American Medical Informatics Association(每年6期)为例,学术影响力得分为762.022,排第3位,其社会影响力得分为017,排第1位,该刊是医学信息方面的期刊,与医学相关内容更容易在网络上得到关注及传播。
(2)“明星”期刊:分布于第二象限,具有高社会影响力,低学术影响力,Altmetrics得分较高而被引得分较低,这部分期刊虽然具有较高的社会关注度和知名度,但其学术质量不如第一象限。这一区域共有3种期刊,占比8.6%。如以Journal of the Medical Library Association(季刊)为例,学术影响力得分为87.974,排第29位,但其社会影响力得分为1709.453,排16位,从2002年起支持开放获取,拥有较高的社会影响力。
(3)“普通”期刊:分布于第三象限,学术影响力和社会影响力均低于平均水平,无论在社会关注度还是学术贡献方面均表现平平,属于默默无闻坚守在学术阵营的大多数普通期刊。这一区域共有14种期刊,占比40%。
图3 学术期刊影响力二维评价图
(4)“专家”期刊:分布于第四象限,具有高学术影响力、低社会影响力,被引得分较高而Altmetrics得分较低。他们所刊论文研究能力卓越,成果也有代表性。这一区域共有5种期刊,占比14.3%。如以MIS Quarterly为例,学术影响力得分为1443.598,居于榜首,但其社会影响力得分为1241.078,仅排23位。究其原因可能是由于该刊为季刊,文献数量较少,从而导致期刊在社交媒体的提及次数较少,社会影响力评分较低。期刊Information&Management(每年8期)的学术影响力得分为577.402,排名第6位,但其社会影响力得分为0,这是由于在Altmetrics Explorer平台未收录该刊的各项指标。这说明期刊的社会影响力受限于客观数据的采集,单纯通过社会影响力评价学术期刊存在一定的局限性,因此将其作为学术期刊影响力评价的辅助参考,与学术影响力结合进行综合评价具有实际意义。
本文以国际图书情报学期刊为例,结合学术期刊的8个传统引文指标并引入12个Altmetrics指标,构建基于传统引文指标和Altmetrics指标的学术期刊影响力综合评价模型,从期刊的学术影响力、社会影响力两个维度系统地进行了期刊评价指标体系的构建。通过因子分析、主成分分析及相关性分析方法分别对期刊学术影响力、社会影响力进行评价,然后得到学术期刊影响力二维评价结果。同时,经相关性分析发现,基于JCR的总被引频次、影响因子、5年影响因子、即年指数等8个传统引文指标间呈现较强的正相关;基于Altmetrics Explorer的Altmetric Attention Score、Twitter mentions、Facebook mentions、Google+mentions等12个Altmetrics指标间大部分呈现较强的正相关,部分呈现中度相关;基于引文指标期刊学术影响力评价得分与Altmetrics指标期刊社会影响力评价得分间存在较强正相关,后者对前者有较好的补充作用,且Altmetrics指标分值对被引分值高低也有一定的预见性,如果某期刊在早期获得较高的Altmetrics分值,那么该刊在之后也会获得较高的被引得分。
在以用户主导的Web2.0时代,评价学术期刊影响力的标准不应仅基于传统的引文指标及JCR的指标数据,还应将网络环境下Altmetrics指标数据纳入评价学术期刊影响力的范围内。综合学术影响力和社会影响力来进行学术期影响力的二维评价在一定程度上还是比较精准的。考量期刊在某一学术领域内的作用效果时,可以把其收录文章的被引用次数等学术引文指标数据作为测评的主要依据;考量期刊在社会上的作用效果时,可以把社会Altmetrics指标数据作为测评的主要依据。无论以上哪种评价标准,其评价结果都具有客观性,为了进一步从整体上考量客体基本状况,需综合各种评价结果才能实现对学术期刊影响力的准确评价。
然而,本文研究所采用的Altmetrics指标数据均来自于AltmetricsExplorer平台,并未考虑诸如Impact-Factory、PlumAnalytics等平台的补充计量学指标数据,所以对于基于Altmetrics进行分析学术期刊影响力会存在一定的误差。再者,由于国内期刊在网络传播平台受限、使用率较低,从而导致中文期刊在国际上受关注度较低,本文只选取国际图书情报学期刊为研究对象,未对其他领域期刊进行探讨、对比研究。在未来的研究中,笔者会进一步扩大数据源,尽量克服受限,对学术期刊影响力评价做进一步深入研究。