结合全文本分析的论文影响力评价模型研究

2022-03-11 17:08杨思洛聂颖
现代情报 2022年3期
关键词:评价模型

杨思洛 聂颖

关键词:全文本分析;Altmetrics;论文影响力;评价模型

2020年2月,教育部、科技部陆续下发《关于规范高等学校SCI论文相关指标使用 树立正确评价导向的若干意见》[1]《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》[2]等文件,要求落实“除四唯,破五唯”,体现了国家对科学研究和科技评价的重视。学术论文是科研成果的重要形式,也是科学研究的重要产物;而学术论文评价是学科、期刊、学者等其他层面评价的基础,科学合理的论文评价能促进科学研究良性循环与正向发展[3]。

影响力是论文评价的重要内容,因为论文是一种科学交流的载体和工具,其产生目的是传播文化与知识并对他人产生作用和影响[4-5]。衡量论文影响力的传统方法是统计论文被引量,这种方法简单客观,但迟滞性强、评价片面且不能排除过度自引等不良情况[6]。为此,学者尝试修正被引频次指标,提出了论文h指数[7]、学术迹[8]、影响矩[9]等评价指标。然而这些评价指标的立足点仍为被引频次,侧重于评价论文产生的学术影响。随着互联网的蓬勃发展,在线学术交流已成为大势所趋。多种社交平台成为学者或普通用户进行学术交流的重要阵地,Altmetrics[10](替代计量学)由此被提出,其重点在于计量分析论文在社交平台上的传播活动,包括转发、评论、使用等,有别于传统的引用与被引。这种方法测度主要是论文在社会层面的影响力,不仅丰富了论文影响力评价的内涵,还为全面评价论文影响力提供了新指标和新途径[11]。

开放存取运动以及人工智能时代为挖掘、获取和分析全文本数据提供了极大便利。一方面,学界开始重视不同引文存在的实质差异,如不同引文在同一施引文献中出现的频次、位置及施引作者表达的情感会有所不同。这种差异反映的是引文对施引文献的重要程度,体现的是引文的实际学术影响力[12]。另一方面,大众在社交网络上讨论论文时可能会产生相应的文本内容,如提及论文的评论性文本等。与引文内容相似,分析论文在此类型文本中被提及的具体情况,如发布者表达的情感、提及论文的动机和位置等,也可以真實反映论文在社会层面产生的影响。总而言之,全文本分析法打破了同等看待不同引文的传统,超越了传统的被引频次和新兴的Altmetrics频次指标等所在的计量分析层面,从内容分析和语义理解入手,深入剖析引文、评论文本等全文本内容,实现了定量与定性的结合,提高了论文评价的深入性、准确性和全面性。

由此可见,论文影响力评价方法已从单一统计被引量发展成多维度、多数据的评价模式。本文拟结合全文本分析,基于引文和Altmetrics构建论文影响力评价模型,并以PLoSMedicine期刊论文为样本进行实证分析,验证该评价模型的可用性和有效性,为更加全面、深入和精准评价论文影响力提供新思路。

1相关研究综述

1.1基于被引频次的论文影响力评价

GarfieldE[13]在1955年就提出以论文被引频次来衡量论文的影响力,自此被引频次成为评价论文影响力的主要指标和客观方式。然而随着时代发展,被引频次的不足也逐步凸显。许多学者指出被引频次存在以下几个问题:①迟滞性:论文从发表到实际被引经历的时间长,不利于新文献评价[6,14];②片面性:只基于参考文献列表,未考察参考文献在施引文献中的引用强度、位置和情感,不够深入具体[15];③无法区分作者的引用动机,如过度自引[5]。

了改善被引频次指标存在的不足,许多学者开始以引用和被引为基本点提出新评价指标。Hir⁃schJE提出了综合考虑发文量和被引量的h指数[16]。SchubertA参考h指数提出了定量评价单篇论文影响力SchubertAh指数,涉及指标有文献被引量及其施引文献被引量[7]。王术等和唐继瑞等先后提出了基于被引频次的学术迹和影响矩指标,并将其运用至论文影响力评价,有效避免了迟滞性、过度自引等问题[9,17]。诸如此类的修正指标还有基于引文网络的论文权力指数[18]、Hi指标[19]等。这些由被引频次演变而来的评价指标在一定程度上克服了被引频次的缺点,但实际上这些指标及方法仍未离开计量层面。换而言之,这些研究还未考虑引文内容的差异性及其对评价论文影响力的重要性。

1.2基于Altmetrics的论文影响力评价

在社交网络时代,Altmetrics指标全面多样、时效性强、评价覆盖面广等优势满足了论文评价的需求[14]。有关将Altmetrics应用于论文影响力评价的研究主要有以下两个方面。

1)与传统评价方法的比较研究。此类实证研究旨在探索Altmetrics指标与被引频次之间的相关性。大部分结果表明,以Twitter为代表的社交媒体数据与被引频次指标的相关程度普遍不高[20-22];Mendeley读者数[23]、论文使用数则与其为中度相关[24]。但这种相关性也会受样本数据的影响,如MohammadiE等调查发现,人文社会学科论文的Mendeley指标与被引次数的相关程度并不高[25],而一项以Altmetrics主题论文为样本的研究则得出两者为中度相关[26]。因此,在应用过程中需要根据具体数据来分析和选择可用性强、代表性高的数据。

2)与传统评价方法的融合应用研究。Altmet⁃rics指标与论文被引量间的弱相关性表明两者侧重维度不同,可相互补充[27]。学者们开始将Altmet⁃rics融入传统评价方法以构建新论文影响力评价模型。参与构建的Altmetrics指标和传统引文指标呈现多样化,Altmetrics指标有社交媒体数据、学术网站论文使用数据等;传统评价指标有被引频次、h指数、影响矩等。研究方法主要是通过主成分分析法、模糊层级法等划分维度或分配指标权重,以不同论文样本验证模型适用性[20,28-29]。

基于Altmetrics的论文影响力评价研究考虑了论文在学术界和社会层面的认可和关注,全面反映了论文影响力。然而此种评价模型仍属于定量评价,未深入分析引文内容或Altmetrics文本内容的性质,有待进一步改进。

1.3基于全文本引文分析的论文影响力评价

全文本引文分析是全文本分析的一部分,其出发点是引文并非等价[30]。赵蓉英等将全文本引文分析的研究内容分为引用强度、引用位置和引用内容,引用内容包括引用情感和动机两方面[31]。引用强度、位置和情感的不同,代表引文对施引文献的作用不同,产生的影响力不同[30,32],对优化论文评价方法具有重要意义。笔者将应用全文本引文分析进行论文评价的研究分为3个方面。

一是将被引频次优化为引用强度。DingY等将引用强度定义为CountX,并利用CountX和被引频次统计出高被引论文,结果存在35%的差异[33]。胡志刚等认为,这种差异在于引用强度能够有效预测和挖掘潜在高被引论文[34]。刘盛博等提出一种实为引用强度的引文质量评价指标(Q),Q值越大说明引文质量越高[35]。ZhuXD等根据引用强度对引用进行加权,将h指数优化为评价效果更好的hip指数[36]。

二是结合引用强度和引用位置。Maricˇic'S等将论文分为引言、方法、结果和总结4个部分并赋予不同权重,将引用位置应用于论文评价[37]。Som⁃batsompopN等认识到分析引用位置的重要作用,提出引用位置影响因子,即引文在施引文献的不同位置的引用强度与施引文献总数的比值,并将其用于泰国论文质量评价[38]。彭秋茹等统计了57篇被引文献的引用位置和强度,与F1000评分进行相关性分析,结果表明,在结果部分被引比例越多的论文,越受领域专家欢迎[15]。

三是融合引用情感分析。魏杨烨等从引用强度和引用情感两个角度对论文进行了新评价,并认为该方法有利于挖掘新兴重要文献[39]。耿树青等利用层次分析法确定不同引用情感的权重,提出了一种能全面深入评价单篇论文学术影响力的CS指标[3]。姜霖等对引用语句中包含的情感词进行极性量化,构造了一种细粒度的学术评价指标[40]。

总而言之,基于全文本引文分析的论文影响力评价研究极大改善了传统指标片面单一的缺陷,实现了更加深入准确的论文学术影响力测度。然而如前文所述,产生于社交网络时代的Altmetrics也提供了评论或提及论文的文本内容,对其进行分析同属于全文本分析的范畴,也能提高评价论文社会影响力的深入性和准确性。已有部分学者通过对不同领域论文的有关推文进行文本内容分析并提出以下观点:①对论文表现出赞同、推荐等正面情感的推文应当获得更高权重[41];②应忽略无论文实质内容的推文[41];③Altmetrics指标应根据不同文本内容类型进行权重区分,如发布对论文的评价比发布题录信息更有价值[42];④发布者有不同的动机,包括参与讨论、实际应用、自我提升、随意转发等[43]。这些观点表明Altmetrics指标同被引频次一样,存在片面性,需要结合内容分析进行深入理解。

目前,结合全文本分析的论文影响力评价研究还较少,大多还停留在改善以被引频次为基础的系列指标、结合被引频次指标和Altmetrics频次指标,少部分尝试基于引文内容分析对论文进行评价。因此,本文尝试结合全文本分析,在被引频次和Alt⁃metrics的基础上,融入由内容分析产生的各种指标,构建出论文影响力评价模型,以期能够提高论文影响力评价结果的深入性、准确性和全面性。

2论文影响力评价模型构建

本研究提出一种结合全文本分析的论文影响力评价模型,如图1所示。被引频次系列指标评价的是论文学术影响力;以Twitter为代表的Altmetrics频次指标评价的是论文社会影响力。与此对应的论文影响力评价模型,从被引频次指标延伸至以被引频次为基础的系列指标,再扩展到融合Altmetrics指标的综合评价;评价维度从一维的学术影响力评价递进到二维的学术影响力和社会影响力综合评价。而全文本分析作为一种新兴的评价方法,既可结合引文内容深入准确反映论文学术影响力,又可结合论文在社交平台获得的评论文本,进一步深化论文社会影响力的评价。

因此,本研究的论文影响力评价模型具体以评价论文的学术影响力和社会影响力为目标,在以往的二维评价模型基础上,继续将其拓展为结合全文本分析的论文影响力评价模型:将全文本类指标,包括次数类、位置类和情感类融入其中,新增对引文內容和Altmetrics文本内容的语法及语义分析,是计量分析与内容分析的结合。其中有关引文计量和内容分析指标可融合论文学术影响力指标,包括引用强度、引用位置和引用情感;有关Altmetrics计量与内容分析的指标可作为论文社会影响力指标,包括提及强度、提及情感,以此实现对论文影响力全面、深入、准确的评价。

2.1论文学术影响力指标

基于全文本分析的学术影响力指标主要融入了次数类指标、位置类指标和情感类指标,对应引用强度、引用位置和引用情感,从语法和语义两个层面对引文内容进行分析。

1)引用强度(Nc):笔者以施引文献为基础,通过参考文献列表在正文中定位被引文献,计算出现总次数。当被引文献出现在图表中,而图表名称被多次提及时,引用强度均计为1次。

2)引用位置(Np):Introduction,Data&Meth⁃ods,Results,Discussion&Conclusion是学术论文的经典结构[15]。笔者基于前期抽取部分文献试标注的情况,将引用位置划分为4部分,划分标准如表1所示。

3)引用情感(Ns):利用机器学习进行情感分类效率高,但学术论文所包含的情感较为隐晦,普通陈述句较多,明确表达情感的语句较少[15],因此该方式的准确性有待提高。在本研究中,笔者通过设定情感判别标准,人工判断引用语句包含的情感,在一定程度上保证引用情感判别的准确性。判别标准如表2所示。

4)权重分配:本研究直接应用学者彭秋茹等[15]利用层次分析法得到的引用位置和引用情感权重分配结果。学术影响力计算公式如式(1)所示,Wp代表引用位置权重,Ws代表引用情感权重,Nc代表特定引用位置和引用情感对应下的引用强度。

2.2论文社会影响力指标

论文在社交媒体平台传播时,会获得大众的评论、转发和分享,以及媒体或政策文件提及和报道等,其中产生的文本内容可能包含发布者对论文的评价,可进行情感分析,但这种文本较难划分统一结构。因此,在本研究中,笔者主要考虑将次数类指标和情感类指标融入论文社会影响力指标中,对应论文在Altmetrics中的提及强度和提及情感。

1)可用指标筛选:由于部分社交网络平台普及性不高,许多指标数据较为稀少,不宜参与到评价中[20]。因此,笔者需要利用指标覆盖率来筛选可用指标,以25%为基准[44],筛选出m个指标A1,…,Am,并计算论文在各指标对应平台中的总提及强度R。

2)指标权重计算:通过SPSS软件提供的主成分分析法为m个指标分配权重,进行主成分分析的前提是大部分指标的提及强度相关系数大于0.3[45]。在此基础上,利用主成分分析提取出累计贡献率大于80%的n个主成分:F1,…,Fn,对应特征根为λ1,…,λn,总和为λ;以各个指标在各主成分中的载荷Pmn为基础,通过式(2)和式(3)计算综合得分系数和各指标权重[46]。

同时笔者还需要为提及情感分配权重,本研究暂时应用前文的引用情感权重Ws,如表4所示。最后得出基于全文本分析的社会影响力计算公式(4)。Rs代表论文在第m个Altmetrics指标中获得特定提及情感时对应的提及强度。

3论文影响力评价的应用与结果分析

3.1数据获取及处理

本文选择的目标论文来源于PLoS平台的《PLoSMedicine》,是国际上水平较高的生命科学与医学领域的期刊。同时,PLoS平台不仅提供免费全文和论文使用数据,还链接了Altmetrics.com平台,为笔者获取数据提供了便利。在检索时,选择期刊“PLoSMedicine”,发表时间限定为2019年,检索时间是2021年1月11日。为保证引文数据量,笔者选择了被引频次排名前50的文献,共导出施引文献信息1042条。同时,笔者还从PLoS平台获取了文献对应的Altmetrics数据。杨思洛等人认为,论文社会影响力主要包括科研工作者或大众通过社交网络工具对论文的评论与分享、维基百科对论文的使用、新闻媒体对论文的报道以及相关政策文件对论文的提及等[14]。因此,本研究获取的Altmetrics指标有Twitter、Facebook、Wikipedia、Reddit、NewsOutlets、Blog、PolicySource、VideoUpload、Comment和Google+User,暂未获取Alt⁃metrics指标涉及的文本内容。

1)对于全文本引文数据,笔者通过WOS、GoogleScholar等进行检索,最终获取施引文献全文共1003篇,另有36篇无法获取全文,1篇注而未引,2篇为更正信息。首先,人工抽取施引文献中包含被引文献的语句,共获得1583条;其次,部分施引文献类型为非实证类论文,包括综述、评论型论文,其内部无明确结构,对此,笔者将其引用位置标注为“Others”,权重以均值0.25为计;最后,笔者结合施引文献全文和引用句中的情感词,对引用情感进行判断。在判断过程中,需要注意情感词的来源。部分包含明确情感词的语句是被引文献中的原句,并不能代表施引作者对被引文献的情感,笔者将这种情况下的引用语句标注为中性引用。具体实例如表5所示。

2)对于论文Altmetrics指标,通过覆盖率筛选的指标仅有Twitter、Facebook、NewsOutlets和Blog,其他指标大部分在10%以下,不宜参与评价。Spearman相关性分析的结果表明,4种指标均可参与主成分分析。其中,KMO检验系数为0.615,显著性概率P值小于0.05,说明4个指标适合做进一步分析。旋转得出的两个因子方差总贡献率为86.24%,符合主成分分析的要求。根据式(2)~(4)可计算出各指标的综合得分系数和权重并构造出论文社会影响力计算公式(5),如下所示:

社会影响力=0.2337Twitter+0.2495Facebook+0.2462NewsOutlets+0.2706Blog(5)

3.2论文评价指标结果分析

1)引用強度分布

从表9可知,被引频次和引用强度之间存在一定差异。50篇文献共被引1003次,篇均被引20.06次;引用强度总和为1583次,篇均引用强度为31.66。每篇被引文献在单篇施引文献中平均被提及约1.6次,与李铮等的研究结果相似[12]。这说明施引文献在正文中多次提及同篇参考文献的现象较为普遍。因此,相比于单纯根据文后参考文献统计文献被引频次,深入文章内部统计文献出现次数更能真实反映文献被引情况,优化传统计量指标[15]。

2)引用位置分布

处在不同位置的引文对施引文献有不同的作用和贡献,获得的学术影响力理应不同。大部分引用语句可根据实际情况标注为引言、数据与方法、结果、结论与讨论。这些引用中,在结论与讨论部分出现的最多,占比40%;其次是引言部分;占比最少的为结果部分,只有8.96%。作者撰写学术论文时需要在引言中引用若干文献以引出问题并对研究现状进行概述;在数据与方法部分,作者通常会使用特定文献的数据、方法;在结果部分,作者主要是对实验结果进行分析和对比;在结论与讨论部分,作者会引用他人研究做进一步论述和展望[12,47]。

3)引用情感分布

引用情感的分布差异代表着不同引文对施引文献的不同参考价值,可反映引文的不同学术影响力。根据表11可知,87%的引用为中性引用,只有少部分为正面引用和负面引用。方法部分的正面引用比例最高,论文作者在这部分有时会应用被引文献中提供的数据和方法。其次是引言和结论与讨论两部分,作者通常会在引言中表达对被引文献的肯定,在结论与讨论部分通过比较研究结果,用以支持研究结论。整体来看,施引文献作者在撰写论文时措辞较为严谨,不会轻易表现出明显的情感倾向,多是客观描述被引文献的研究结果和结论。

4)论文Altmetrics数据情况

由指标覆盖率和均值可看出,所有论文都在Twitter平台获得了转发或讨论;有68%的论文获得了相关新闻报道;54%的论文在Facebook上得到了关注;42%的论文被博客文章提及或引用。指标覆盖率初步说明,Twitter平台上的学术交流活动更为活跃,是一个利于扩大学术论文社会影响的平台。但从各指标均值和离散程度看,不同论文得到的Twitter用户关注存在较大差异,获得的社会影响力也有很大不同。

3.3论文影响力评价结果分析

根据式(1)和式(5)计算50篇被引文献的学术影响力和社会影响力得分及排名,结果如表13所示。论文2的学术影响力最大,得分为6.58,其引用强度高达105,篇均被提及约1.9次。社会影响力最大的是论文17,得分为73.06,其中Twitter和Facebook指标值为255和14,是指标最大值,NewsOutlets和Blog指标值为35和5,远超指标均值,说明该论文在各平台上都受到了较多关注,社会影响广泛。

为综合评价论文影响力,检验本评价模型的评价效果,笔者以学术影响力为X轴,社会影响力为Y轴,绘制散点图。同时以两个指标均值为划分标准,将散点图分为4个区域,分别代表普通型、明星型、专业型和名作型的论文类别。从图2可看出论文分布呈发散状,多数论文集中在两轴交点区域,即学术和社会影响力均较低的普通型论文,剩余论文则向周围扩散分布。明星型、专业型、名作型和普通型论文的学术影响力平均值为1.28、4.21、3.29和1.23;社会影响力均值为41.99、31.04、10.62和8.77,各类型论文分别占论文总数的22%、18%、14%和46%。

综合来看,普通型论文的学术影响力和社会影响力水平均低于其他类型论文的水平,不太受学者和大众关注。明星型论文的社会影响力要优于普通型论文,学术影响力却较低,原因是能引起大众广泛关注和讨论的论文一般科普性或应用性较强,能激发传播交流的兴趣,但相应的学术参考和引用价值就会偏弱[48]。例如代表论文17,篇名为CosteffectivenessofFinancialIncentivesforImprovingDietandHealthThroughMedicareandMedicaid,是关于饮食健康、医疗保险和补助等一些与大众生活紧密相关的话题[49]。

对于专业型论文,其两个维度的影响力与明星型论文相反。较高的学术影响力在一定程度上代表着较强的专业性,研究重点很可能是领域的基础理论或创新成果。对于普通读者来说,此类论文易读性较低,导致讨论欲望减小,社会影响力也就偏低。例如论文4,篇名为COSMOS-E:GuidanceonConductingSystematicReviewsandMeta-analysesofObservationalStudiesofEtiology,该研究旨在为科研工作者撰写病原学领域系统性综述提供步骤指导[50]。论文内容专业性强且具有高参考价值,但普通读者很难对此类论文发表评论和意见。

名作型论文有着高学术影响力和高社会影响力。此类论文不仅是领域研究者关注的焦点,更是大众讨论的热点。例如论文7,篇名为WomensandGirlsExperiencesofMenstruationinLow-andMiddleincomeCountries:ASystematicReviewandQualita?tiveMeta-synthesis,是一篇关于中低收入国家女性月经情况的定量与定性综述[51]。一方面,该论文可为学者提供有关问题研究现状和发展趋势;另一方面,女性健康也是大众关注并可参与讨论的话题。

由此来看,本研究提出的论文影响力评价模型在一定程度上可以区分出不同特点的论文,可以实现对论文的评价,达到与其他评价模型[14]类似的效果,具备可用性和有效性。

3.4与其他评价方法的比较分析

为进一步体现本评价模型的优势,证明其评价论文影响力的全面性、深入性和准确性,笔者将其与被引频次和引用强度进行了对比研究。从表15可看出,学术影响力与被引频次和引用强度均为显著相关,相关系数分别为0.755和0.951,表明本评价模型中的学术影响力指标在很大程度上能代替被引频次指标。从数据重复率看,被引频次的重复率为60%,引用强度重复率降为32%,而学术影响力指标仅有18%,说明绝大部分文献的学术影响力得分互不相同。

图3直观展示了这种差异:被引频次和学术影响力整体趋势为“由高到低”,但显然学术影响力的折线更加曲折多变。这种高区分度得益于该评价模型基于全文本分析引入了引用位置和引用情感两个指标,并为其设置了权重。因此,学术影响力指标能够利用权重分配带来的数学运算优势,使论文学术影响力评价趋于深入准确,不同论文学术影响力得分更具差异性和区分度[3]。

图4显示引用强度和学术影响力变化曲折且相似,但仍存在细微差异。例如论文4的引用强度为58,但学术影响力比引用强度为87的论文7略高;论文7[51]是一篇系统综述,多在引言部分被引且获得的引用情感多为中性。论文4[50]是方法指导型论文,许多施引文献在方法部分应用了其提出的研究步骤和方法等,该类型的引用情感为正面引用。在方法部分的正面引用代表被引文献的更高价值和影响,造就了论文4的高学术影响力。因此,不论是对比传统的被引频次或是引用强度,基于全文本分析的学术影响力指标不再止步于“数量”,而是剖析引文“质量”,能更细致深入地反映论文的真实学术影响力。

在显著性水平α为0.05时,社会影响力指标和被引频次为弱相关,相关系数为0.289;与引用强度、学术影响力不存在显著相关性。这说明一方面,社会影响力指标与被引频次指标在量化论文影响力时仍存在交叉。若本研究仅选取被引频次作为学术影响力指标,那么它和社会影响力指标的评价维度会有所重叠,指标就丧失了一定的独立性和代表性。另一方面,社会影响力指标和学术影响力指标之间关系独立,能真正实现同时评价论文的学术影响力和社会影响力,达到本研究的目的。由此可见,社会影响力指标会是评价论文影响力的有效补充,本研究提出的评价模型也能够较好地从学术和社会两个层面全面反映论文影响力。

4结语

本文构建了一种结合全文本分析的论文影响力评价模型,并通过实证研究证明了该评价模型的适用性,以及评价结果的深入性、准确性和全面性。具体将全文本分析涉及的引用强度、引用位置、引用情感和Altmetrics指标合并且划分成学术影响力指标和社会影响力指标。随后以2019年《PLoSMedicine》中被引量前50的文献及其1003篇施引文献为研究样本,描述分析了引用强度、引用位置、引用情感和Altmetrics指标的具体情况,并根据两指标得分将论文划分成了4种各具特点的论文类型,实现了论文的全面综合评价;最后将评价模型与传统被引频次、引用强度等进行对比以及相关性分析,证实了本评价模型的优势所在。

研究结果表明:①单篇文献在一篇施引文献平均被提及1.6次,被引频次已不能很好地反映论文学术影响力。引用行为通常发生在结论与讨论、引言两个部分。出于撰写论文的专业性和严谨性,引用情感多为中性,正面引用易出现在应用他人研究方法或比较研究结果的方法和结论与讨论两个部分;②根据论文在学术和社会层面的影响力得分高低,将论文划分为明星型、名作型、专业型和普通型4种类型,有利于领域专家和普通读者筛选符合阅读需求的论文,也为挖掘高学术价值和社会影响的论文提供了新路径;③将引用强度、引用位置和引用情感纳入评价模型是对传统被引频次指标的改进和完善,很大程度消除了被引频次指标的片面性。分析引用位置和引用情感使单篇论文对其施引文献的作用和贡献更加具象,进而使得評价单篇论文学术影响力更加深入、细致和准确;④为引用位置和引用情感设置相应权重,进一步提高了评价模型的区分能力,大体消除了被引频次和引用强度数值重复率过高的弊端,为更好地评价论文的学术价值和水平提供了参考;⑤评价模型包含的社会影响力指标和学术影响力指标间的关系相互独立,优势互补,进一步保证了论文影响力评价结果的全面性、深入性和准确性。

本研究提出的评价模型是对已有评价模型的改进,结合了计量分析与内容分析,是定量分析和定性分析的有机融合,符合论文评价方法的发展趋势[5]。本研究不足之处主要在于:①内容分析由人工处理,数据处理量较小。在后续研究中,笔者将把研究范围扩展至多领域、多期刊的文献,以期得到更具代表性的结论;②本研究获取的Altmet⁃rics指标数据覆盖率较低,导致能够进入评价模型的指标数量少。今后笔者将尝试获取更多平台的Altmetrics指标,融合成更具代表性的社会影响力指标;③本研究提出的评价模型需要对引文内容和Altmetrics文本内容进行分析,但笔者仅初步获取分析了引文内容及Altmetrics指标,得出的评价结果和结论还不够完善。在今后的研究中,笔者将着重分析Altmetrics指标涉及的文本内容,使评价进一步深入和细粒化。

3033500338279

猜你喜欢
评价模型
基于DEA的汽车上市公司相对效益评价
公共图书馆数字化服务的有效性评价模型
基于学业质量的增值性评价系统的分析与构建
基于产业集群的技术创新风险评价模型构建
基于熵权法的西安市外向型经济发展综合评价研究
大学生平时成绩动态评价模型的研究与应用
高校内部财务控制与风险管理评价模型构建及实证研究
乡村旅游目的地居民低碳意识的调查与实践研究
我国国有企业社会责任管理能力评价模型研究
政府公信力的提高与评价实证研究