Web 2.0时代,学术成果载体和学术交流模式发生了深刻变革,网络电子载体和在线学术活动成为科学计量学的重要研究内容。Altmetrics的概念是Priem于2010年正式提出的[1]。虽然学界对Altmetrics的具体指标还未形成完全统一的认识,但都应包括网络环境下用户群体对学术成果的传播、获取、关注、推荐过程中产生的复杂指标,而且相关的研究和应用已开展[2]。
Altmetrics指标的评价对象多样,除了传统的图书、期刊、论文等以外,还能应用于评价数据集、代码、视频、网页等多种形式的学术成果[3]。与以引文数据为基础的传统计量体系相比,采用Altmetrics指标进行学术评价更为高效和迅速,可以反映传统计量体系难以表现的社会影响力,并且应用于期刊、作者、论文的评价中[4]。
Altmetrics指标能够在引用数据缺乏或无效时,代替引用数据对学术成果进行影响力衡量。
将Altmetrics指标用于学者评价的可靠性和有效性的验证研究工作还相对较少,因此本文对Altmetrics指标与学者H5指数的相关性进行研究,明确Altmetrics指标用于学者评价的可靠性和有效性,丰富学者评价体系。
Altmetrics的概念于2010年正式提出,随即引起了学术界的广泛关注。学者刘春丽将Altmetrics概念引入国内[5]。国内外相关研究集中在Altmetrics指标与传统指标的相关性探讨和Altmetrics指标在学者评价中的应用。
Altmetrics指标与传统指标的相关性是了解Altmetrics指标评估价值的基础。Daniel Zoller等人将微软学术引用与社交书签系统BibSonomy的用户活动,即发布、标记、访问或者导出等指标进行比较,研究结果验证微软学术引用与BibSonomy中的Altmetrics指标总体上呈现弱相关性[6]。Rodrigo Costas等人通过研究证实Altmetrics指标普遍存在密度较低,但是在特定学科的出版物中呈现密度大量提升,而且Altmetrics指标与引文以及期刊影响力得分之间的关系是较弱正相关的关系,说明Altmetrics并不能完全替代引用评价,而应作为互补的指标反映出版物更具综合性的影响力[7]。郝若扬选取2014-2016年的Altmetric.com Top 100数据集为样本研究Altmetrics指标与传统文献计量指标的相关性,指出高Altmetrics指标论文集中于医疗健康与生物科学,以及高Altmetrics指标论文的Altmetrics分数与其被引频次存在正相关关系[8]。还有研究初步筛选出了一定范围的Altmetrics指标,探索了这些Altmetrics指标与引用频次之间的相关性,普遍认为二者具备一定的相关性。Altmetrics指标与引用频次的积累速度存在差异,需要保持时间窗口一致性。
Altmetrics指标和传统指标间的相关性的研究,促进了Altmetrics在学者评价中的应用,使Altmetrics成为学者评价研究的新思路。Chen Kuang-hua等人收集了一组社会科学和人文科学领域学者的18个Altmetrics指标数据,通过主成分分析得到4个主要维度,深入探讨了学者在正式交流和非正式交流过程中学术影响力的评价方式[9]。杨柳等人选取机构知识库学者为研究对象,基于标准化Altmetrics得分、Altmetrics Score、标准化被引得分3种方法进行学者影响力评价,并开展能测度学者社会影响力与学术影响力的二维评价,以促进机构知识库的建设[10]。郭颖等人参考国外Altmetrics指标来源平台,从国内相似平台选取指标,引入因子分析法筛选出指标并构建指标体系,利用相关性检验和二维评价方法对所得指标体系进行验证[11]。王菲菲等人以基因编辑领域学者为对象,利用学术迹、合作引用强度、引文网络PageRank值、Altmetrics-h指数等多维度指标进行综合影响力学术评价,并证实评价结果与领域研究的实际推动者之间较为一致[12]。Altmetrics应用于学者评价的研究多以特定机构或领域的学者展开。
学者对Altmetrics指标应用于学者评价进行的初步探索,显现出在学者评价中Altmetrics的重要性和特殊性,然而目前还缺乏对学者H5指数和Altmetrics指标相关性的研究探索。
传统评价方式只关注引用数据及其衍生指标的作用,但在学术文献传播的过程中还存在大量的非引用行为,故也应作为学术评价的有效指标,如图1所示。Altmetrics指标是选取非引用行为作为新的评价指标,在一定条件下尤其是在引用数据难以获取或缺失的状态下代替或补充引用数据及其衍生指标来完成学术评价。既然引用行为和非引用行为都能表征文献的学术影响力,那么二者之间应存在一定的相关性。通过深入挖掘这种相关性,可检验Altmetrics指标代替或补充引用指标的可靠性和有效性,从而形成学术评价的新方法。事实上,Altmetrics指标在不同学科的积累效率是不一致的。指标积累主要集中于医学和生命科学领域,而且指标在短时间内急速积累,发表时间长的文献并不能在指标积累上体现出明显优势。因此本文选择指标分布相对密集的医学领域作为研究领域,并将时间范围限定为近5年以内,以保持Altmetrics指标和引用数据时间窗口的一致性。
图1 Altmetrics原理
本文的研究数据来源于Dimensions数据平台和Web of Science平台。选取Dimensions数据平台收录的顶尖医学期刊的主要作者作为研究对象,获取学者积累的Altmetrics指标。
在Dimensions数据平台中设置检索式,即出版年:2014~2018年;出版类型:Article;来源刊物:BMJ系列期刊、JAMA系列期刊和TheLancet系列期刊以及NewEnglandJournalofMedicine。通过检索获得110 665篇文献,筛选出其中100位高产学者作为本文的研究对象。在Web of Science核心合集中检索对应学者2014-2018年发表的文献,将文献类型限制为Article,由此确定学者的H5指数。检索日期为2019年7月16日。
Dimensions数据平台所提供的Altmetrics指标包括News,Blog,Policy,Twitter,Peer Review,Weibo,Facebook,Wikipedia,Google,Reddit,F1000,Q&A,Video。虽然Altmetric.com工具直接赋予各项指标权重形成Altmetric Score[13],但缺乏指标间统计学关系的探究。为了真实反映指标间的统计学关系,需要利用主成分分析法降低指标数据维度,将纷杂的原始指标转换为几个具有综合意义的主要成分;需要通过主成分分析结果,将纷杂的原始指标凝练为学者R-A指数,并将其与学者的H5指数进行对比;需要通过进一步的相关性验证,探索Altmetrics指标应用于学者评价的可靠性和有效性。
本文选择SPSS 24.0作为数据处理软件,实现主成分分析及进一步的相关性分析。
2.3.1 实验前检验
在进行主成分分析之前,需要对Altmetrics指标变量进行相关性检验,将收集的14个Altmetrics指标进行KMO和巴特利特球形检验(图2)。巴特利特球形度检验统计量为1317.534,对应的显著性为0.000,KMO取样适切性量数为0.848(大于0.8),说明因子对变量的解释能力非常好,符合进行因子分析的假设检验条件。
图2 KMO和巴特利特检验
2.3.2 主成分提取
文献的难度不尽相同,如果由教师指定阅读任务,公平性难以保证;随机抽取虽然公平,但难以发挥每组的特长。如果由教师指定某些知识点,然后由学生自主查找文献,这样既减轻了教师负担,也锻炼了学生的文献查找能力,同时也更为公平。文献的分配方式可以进一步探讨。
利用SPSS 24.0软件提取主成分,得到Altmetrics指标的公因子方差(表1)。从表1可看出,所有指标变量的提取公因子方差都较大,而且都保持在0.700以上水平,说明在主成分提取的过程中保留了各个指标变量的绝大部分信息。因此本次主成分提取的效果较为理想,主成分分析结果具有可靠性。
表1 Altmetrics指标提取公因子方差
事实上,SPSS软件默认的主成分分析法只提取特征值大于1的成分,将特征值小于1的成分作为碎石处理。实验过程中发现,如果保留默认设置,将只保留4个主成分,那么主成分提取时,Peer Review和Weibo指标变量的提取公因子方差会较低,说明4个主成分难以保留这2个指标变量的信息,因此本文纳入第5个成分作为主成分。同时也注意到,碎石图中第5个成分之后连线趋于平稳(图3),而且第5个成分和第6个成分之间连线相对陡峭,因此可以将第6个及其之后的成分作为“碎石”。
图3 提取主成分特征值碎石图
进一步通过如表2所示的总方差解释可知,前4个成分的特征值均大于1,第5个成分的特征值为0.902,接近1。前5个成分的总方差贡献率达到86.880%,从整体上反映了原有Altmetrics指标变量的绝大部分信息,因此保留5个主成分作为主成分分析结果是更合理的选择,同时主成分分析结果也相当理想。
表2 提取成分总解释方差
注:成分6-14为“碎石”,不再计算提取载荷平方和
2.3.3 主成分函数
在主成分分析结果的基础上,得到成分矩阵(表3)。将主成分1表示为F1,主成分2表示为F2,其余3个主成分以此类推。由表3可以得到原始指标的主成分分析模型,如News=0.8(F1)+0.439(F2)+0.144(F3)-0.184(F4)-0.152(F5)。
表3 原始指标主成分矩阵
将所有Altmetrics指标全部转换为5个主成分函数表达,将Altmetrics指标蕴含的信息转换为维度更低的主成分。
为了进一步利用主成分分析结果对学者进行Altmetrics指标评价,需要形成一个综合评价指数(本文将该综合评价指数称为R-A指数)。由表4所示的成分得分系数矩阵可知各主成分基于原始Altemtrics指标的函数表达。例如F1=0.112(News)+0.126(Blog)+0.035(Policy)+0.115(Twitter)+0.017(Patent)+0.077(Peer Review)+0.104(Weibo)+0.131(Facebook)+0.047(Wikipedia)+0.123(Google)+0.117(Reddit)+0.090(F1000)+0.098(Q&A)+0.118(Video)。
表4 主成分得分系数矩阵
2.3.4 Altmetrics指标与学者H5指数相关性分析
将R-A指数和学者H5指数进行斯皮尔曼相关性分析,结果如图4所示。从图4可知,学者H5指数和R-A指数的斯皮尔曼相关系数为0.727,在0.01级别(双尾)呈现显著相关性,说明该数据集中学者H5指数和R-A指数在统计学意义上是显著相关的,也就意味着R-A指数越高,学者的H5指数水平越高。
图4 H5指数和R-A指数斯皮尔曼相关性
按照R-A指数取值范围可以将学者分为3类:第一类,R-A指数>1,这类学者受关注程度极高,学术成果传播广泛,受到各类群体的青睐,且这类学者的H5指数平均值为57.6;第二类,0 如表5所示,将学者H5指数和R-A排名前1 0的学者进行比较发现,有3名学者同时出现在2个前10榜单之中。Simon Iain Hay[14]是华盛顿大学医学院教授、英国牛津大学博士,主要致力于传染病时空分布的流行病学研究,以支持更合理地实施疾病控制,其最具影响力的工作是“疟疾地图集”项目。该项目利用大数据和地理空间科学在全球、地区、国家范围内准确定义面临疟疾风险及其负担的人口,并因为该项目获得诸多奖项。Frank B Hu[15]是哈佛医学院教授,美国伊利诺伊斯大学芝加哥分校博士,在糖尿病和冠心病的病因与预防领域取得了世界公认的成就,特别是对营养、遗传因素及其交互作用在肥胖与糖尿病发生发展中的作用的研究作出了原创性的贡献,并于2015年当选美国国家医学科学院院院士。Christopher J L Murray[16]是华盛顿大学医学院教授、英国牛津大学博士,全球疾病负担(Global Burden of Disease,GBD)研究的创始人。该研究旨在按时间、年龄、性别和地理位置对由于疾病、伤害和危险因素导致的健康损失的相对数量进行量化。他同时也是美国国家医学科学院院士。3位学者的H5指数都大于50,说明他们在专业领域内都取得优秀研究成果,并被领域同行认可。3位学者的R-A指数都大于1,均属于第一类学者,说明学术成果在社会上也受到广泛关注和传播。结合2种评价指数的学者遴选结果与实际学者调研结果保持一致。 表5 H5指数和R-A指数Top 10学者对比 注:*表示2个榜单中重复出现 斯皮尔曼相关系数较高和学者评价结果的重叠现象都说明学者H5指数和R-A指数在学者学术影响力评价上保持着一定程度的一致性。这种一致性表明,无论是引用行为还是非引用行为都是学者影响力的传播途径,同时也表明引用行为和非引用行为之间存在区别。这应当归结于H5指数是学术影响力在学术界的集中体现,而R-A指数侧重于学者社会影响力的体现。R-A指数或者Altmetrics指标在一定情况下能够应用于学者评价,并成为引用行为的可靠替代和有效补充,与H5指数结合能够实现学者多维度评价。 Altmetrics是科学计量学的新兴研究热点,它将学术评价的视角从只关注引用行为转变到关注非引用行为上。互联网时代,通过各种网络平台进行学术交流活动已经成为趋势,以社交媒体平台、专业论坛网站、信息服务平台等为代表的网络平台都成为学术交流活动产生的主要场景。Altmetrics的目标在于利用这些网络平台上的获取、下载、浏览、收藏、分享、评论行为,有效展现学术成果所具备的社会影响力。 本文统计了顶尖医学期刊中100位高产作者的Altmetrics指标及其H5指数,发现即使选择了Altmetrics指标产生较为迅速和高效的学科领域及期刊,仍然面临学者Altmetrics指标数据呈现一定程度稀疏性的问题。这是因为数据库资源的限制导致对单个学者的Altemtrics指标统计不完全,而且Altmetrics指标在学者层面的积累难以达到大量数据的规模,学者产出成果有限,同时学者受到关注也相对更为分散。丰富和拓展Altmetrics指标来源将会有效地弥补这一不足。微博是目前唯一中文数据来源,其他数据来源仍有待开拓,尤其中文数据来源Altmetrics指标亟待开发。 通过对同一时间窗口下的学者H5指数和R-A指数进行相关性分析,证明学者H5指数和R-A指数之间呈现显著相关性,二者的斯皮尔曼相关系数为0.727,说明引用行为和非引用行为都是学者影响力的展现形式,只是引用行为更侧重于学术影响力的评价,而非引用行为则侧重于社会影响力的展现。 在对学者和学术成果进行评价时,应将二者有机结合,形成二维甚至多维的评价方式。通过将2种评价手段有效结合,筛选出最优秀的3位学者,并通过个人信息调研证实这3位学者的研究成果具备很高的学术影响力和社会影响力,说明将传统评价方法与Altmetrics结合起来能够形成更为全面有效的研究学者遴选机制。显著相关性证实,在引用数据完善的情况下,Altmetrics指标可作为有效的补充评价手段;在引用行为数据难以获取或存在缺陷时,Altmetrics指标可以作为可靠的替代计量手段。只关注引用行为的学术评价方式已受到人们的诟病,视野更广阔的多维评价方式才能更客观地反映学者和学术成果的价值。 本文通过Dimension平台和WOS平台收集学者的Altmetrics指标和引用数据,确保了数据来源的可靠性和准确性。实证结果证实了Altmetrics指标应用于学者评价的可靠性和有效性,然而学者筛选条件严格导致获取学者数据较为有限,结论的普适性仍有待进一步研究确认。目前相对成熟的Altmetrics计量工具都是以国外数据源为主,不少信息资源平台已经开展相应服务,而如何利用中文数据源建立国内Altmetrics评价体系和工具是亟待解决的问题。中文数据源所积累的大量Altmetrics指标将是开展相关研究的重要资源;借鉴和利用国外Altmetrics计量工具应用和开发的经验,完善国内Altmetrics评价体系将是国内Altmetrics研究发展的重要方向。3 结论
4 结语