科技期刊低被引论文的界定与评价方法探究
——以《期刊引用报告》凝聚态物理学65种期刊为例

2017-03-23 02:56:06■王
中国科技期刊研究 2017年7期
关键词:界定分区论文

■王 新

中国人民大学图书馆,北京市中关村大街59号 100872

基础科学的学术成果多以期刊论文的形式发布、交流和传承,从文献计量学角度评价学术成果的影响力主要基于分析期刊论文被引用的数据,而学术成果中低被引论文有史以来就是十分普遍的现象。但迄今为止,文献计量学分析的两个核心指标期刊影响因子(IF)和h指数,从严格意义上讲,对评价对象的低被引论文都没有明确体现。IF将一定时间内期刊发表文章的平均被引用程度作为整体评价指标,侧重于期刊刊文的平均影响程度;h指数集期刊高被引文献的数量和被引频次为一体,侧重于被评价对象的高被引程度。学术评价中忽略对低被引论文这一高概率事件的计量分析,显然有失于全面客观地评价对象。

研究低被引论文的重要前提是界定低被引论文。低被引论文可以分为三类:绝对零被引论文、近似零被引论文和低被引论文。绝对零被引论文是指论文在出版后某个引用窗口中未被引用过,即零被引现象[1-4];近似零被引论文是指其被引用频次限定在1~2次,这两类研究对象的定义比较明确。20世纪五六十年代Garfield[1-4]便开始关注零被引现象,Barber[5]提出了“迟滞发现”的概念,但直到2004年,荷兰著名科学计量学专家van Rann赋予“迟滞发现”一个美名“sleeping beauties in science”[6]后,学术界对零被引现象和“迟滞发现”的研究才开始迅速升温。人们从不同学科入手,探讨零被引现象的成因,以及“迟滞发现”的规律[8-9]。国内学者朱梦皎等[10]和魏瑞斌等[11]对零被引现象作了全面的综述和实证分析;刘雪立等[12]提出了零被引用率作为期刊反向评价指标的观点,探讨了零被引用率与IF、h指数等其他文献计量指标的关系。然而,关于近似零被引和低被引论文在期刊评价方面的研究鲜有文献报道。周洁[13]通过定量分析被引用1次和2次的科技论文,首次提出将1次和2次被引指标作为对正向评价指标的信息补充的评价思路。杨利军等[14-15]连续发表两篇文章,率先提出低被引的界定思路,又以18种国内图书情报领域的期刊为研究对象,实证探讨低被引的评价方法。

低被引论文可以描述为被引频次低于某个界定值的论文,但是目前还没有共识的定义域。有些学者将h指数核心区外认定为低被引区域[16],也有学者依据二八定律,将被引频次降序排列,定义排在前20%的累积被引频次以外的区域为低被引区,或者根据分析的需要自定义占被引总频次的百分数。但是对采用以上方法界定出低被引区域内的论文进行系统地研究的文献却很少。笔者期望通过以凝聚态物理期刊(CMJ)的65种期刊为研究对象,参考h指数核心区域的被引特征,分析期刊几个最少被引区域内论文的被引特征及其相关因素,探究合理界定低被引论文区的思路、方法以及评价指标,为寻求期刊的低被引论文计量分析和客观评价提供实证依据。

1 研究对象与研究方法

1.1 研究对象

凝聚态物理学是物理学二级学科,研究群体的规模和科研成果的数量在物理学科中所占比例均为最大。近十几年在基础研究和实验研究上都取得巨大的突破和进展,我国在非常规超导材料、拓扑绝缘体材料,以及相关领域的理论研究方面已经走在了世界的前列,因此选择CMJ为研究对象,对深入了解物理学科的学术产出以及评价具有代表性和实际意义。依据Web of Science (WoS)子库期刊引用报告(JCR)的学科分类列表,符合研究条件的CMJ共有65种。本研究的数据来源为WoS中科学引文索引扩展版(SCIE)子库,检索2009—2013年间论文、综述、修订和书信4种文献类型,按照传统方法收集清洗数据[17];引用了中国科学院文献情报中心(LAS)发布的《2014年科技期刊分区报告》(以下简称《期刊分区报告》)中的分区数据和3年期影响因子IF3。LAS的报告以IF3为依据,把SCI期刊划分为4个等级,各学科分类中IF3排在前5%的期刊划分为1区,排在前6%~20%和20%~50%的期刊分别划分为2区和3区,而排在后50%的划分为4区。

1.2 研究方法

以各期刊h指数核心区域内论文的被引频次和篇均被引的相关数据为参照,分析零被引论文和最低被引论文的累计被引频次占总被引频次Tci的比例为5%,10%和20%区的论文的分布特性,确定合理的CMJ低被引论文定义域,分析期刊的被引结构,探究低被引论文区的有效的计量和描述方法。研究过程中所涉及的变量见表1。数据分析和作图主要使用Excel的数据分析和OranginPro9.0。

表1 本研究相关变量及指标

2 整体数据与零被引分析

2.1 凝聚态物理学期刊的整体指标

整体认识凝聚态期刊是分析低被引的必要步骤。65种CMJ截至2015年12月底在2009—2013年间的统计数据见表2。65种CMJ共发表论文13.3万余篇,总被引次数为199万余次,总引用文献数量387万余篇,总篇均被引次数15次,总篇均引文数量29篇,总零被引文献1.36万篇,总零被引率为10.2%。在4个分区的期刊数量分布分别为3,4,13和45,位于1区的期刊为NatureMaterials,AdvancesinPhysics和SurfaceScienceReports,它们的IF3分别为36,24和18,65种期刊的IF3平均值为4。篇均被引次数与CMJ分区值和IF3相关系数分别为0.993和-0.896,相关性检测的结果证明了《期刊分区报告》的IF3和R与SCIE数据具有高度统一性,在研究中可以互相参考和引用。

表2 65种期刊的主要数据

2.2 零被引分析

2.2.1 N0与rN0的分布特征

N0具有直观描述期刊零被引率的优点。图1(a)所示为N0的概率分布,有46种CMJ的N0集中分布于200以下,其余19种期刊散落在大于200篇的区域,形成明显的偏正态分布;图1(b)所示为4个区N0的平均值和最大值。显而易见,除了3区有两个点的N0高出了平均值262,即AppliedSurfaceScience(平均值375)和PhysicalReviewB(平均值1159),其余的高零被引数据均集中于4区,共17种。因此整体而言,零被引期刊基本上与期刊的质量分区值成负相关,特别是4区零被引程度远远高于1~3区。

图1 N0 与rN0比较

rN0体现一种期刊不被论文引用程度,是一个相对量,利于期刊之间的比较。两种期刊按不同指标排序得到不同排名,按N0升序排名,CriticalReviewsinSolidStateandMaterialsSciences的h指数为20,Np为47,N0为0,位居第1,而PhysicalReviewB的h指数为141,Np为28953,N0为1109,位居第65,而事实上PhysicalReviewB是凝聚态物理学领域公认的非常具有影响力的核心期刊,它的h指数排名位列第4,如果按照rN0排名位居第14(rN0=0.040),显然以rN0排序的客观性明显高于N0,见表3。

表3 2个典型期刊按各指标的排名

图1(c)所示为rN0的分布,整体上有超过25%的期刊的rN0小于0.05,另有超过25%的期刊rN0介于0.05至0.10之间,近20%的期刊的rN0介于0.10至0.15之间,其余为无效论文程度更高的少数期刊,rN0的分布也不属于正态分布。图1(d)所示为rN0在1~3区的平均值在0.008~0.038只有一个歧点,4区的平均值为0.153,rN0平均值的总体趋势与N0基本一致,即:分区值越高其无效论文程度越高,但2区例外,数值最小,这恰恰凸显了rN0在数据分析方面比N0更加灵敏。

2.2.2 rN0与文献类型和发表年限分析

图2(a)所示为自发表年到被统计年2015年12月65种CMJ的N0的总体分布状况。总体而言,N0随着出版时间的增长而减小,为此,在2013年发表的期刊rN0最高,为14%。期刊论文发表时间超过2年,rN0基本处在8%~9%的范围内,表明CMJ刊载的90%论文的发现周期为2~3年,而其余10%的论文只好寄期望于成为“睡美人”了。此外,图2(b)所示为65种CMJ在不同出版年的rN0与期刊分区的关系。图2(b)虽然表明各分区期刊之间rN0数值相差较大,但是它们历时变化的趋势和幅度的差异并不显著,除了1区在2011年出现峰值(6%)以外,2区的期刊在发表2年后(即2013年)就达到平台值1%,3区的期刊在发表3年后到达平台值3%~4%,4区在发表3年后即在2012年就基本保持在12%~15%之间。这一结果说明CMJ的论文被学术共同体发现的周期与CMJ质量分区R的关系不大。零被引论文类型的分析如图3所示。图3的数据表明零被引论文类型以论文为主,占总零被引论文的76%。

图2 rN0与出版时间及各分区的关系

图3 N0与期刊类型分析

2.2.3 rN0与其他期刊评价指标的关系

以上分析表明rN0作为评价指标具有其独特的优势。但是rN0与传统的期刊评价指标是否有明显的强相关性迄今依然缺乏数据分析。图4所示为rN0与CMJ分区R、Np、Tci、IF3、Cipp、h指数和Rpp的相关性分析,结果发现rN0与最能够反映期刊影响力的传统的核心指标h指数、Cipp、IF3和CMJ分区R的相关性都不强,相关系数介于0.4~0.5,而与Np和Rpp几乎不相关。这一结果正说明rN0与传统指标评价视角有别,它不可以被已有的评价指标简单线性替代,从统计学原理角度考虑,这恰恰是rN0成为一个独立的期刊评价指标的充分条件。

图4 rN0与各评价指标的相关性

如果说h指数代表期刊的质量,Np代表期刊的规模,Tci代表期刊的受众度,IF和Cipp反映期刊的影响力度,那么rN0可以反映期刊在一定时间段内论文的无效程度。rN0较为科学、合理、实用,容易计算和操作,并不因个体非相关因素的差异而涨落。

3 低被引区分析方法探究

3.1 低被引区的界定

界定低被引区域是低被引计量分析的关键,而CMJ的低被引划分显然需要依据这个领域期刊的被引分布结构。

3.1.1 h指数核心区域与低被引区域

h指数描述期刊的高被引,65种CMJ 在h指数核心区域的论文数为2705,总被引频次为445564,如果定义核心区内论文数占总可被引论文数之比rh=h/Np为期刊高被引率(核心区大小),核心区内累计被引频次占期刊总被引频次之比rTci h=Tci h/Tci为高被引密度(核心区密度),那么rh=0.020,rTci h=0.224。仅仅占论文2%的h核心区域的累积被引频次却大于20%,说明CMJ的h指数的平均水平比较高。那么h核心区域以外作为低被引区是否合理?

表4所示为65种CMJ的h指数核心区域关键参数的统计描述。h指数的平均值为41.6,rh和rTci h的平均值分别为8.4%和28.5%,说明不到10%的高被引论文贡献了近30%的总被引次数,但是因为h指数、rh、Tci h和rTci h共同的特点是取值离散(极差大),因此不意味着所有期刊都满足该比例关系,h指数与rh和rTci h的相关系数很低,分别为:-0.037和0.01,图5所示的概率分布出现了明显的长尾,这些都明显说明了存在不可忽略的个刊差异。造成个刊差异的因素主要来自每个期刊的被引特性和规模,例如Laser&PhotonicsReviews和JournalofMagnetismandMagneticMaterials的h指数同为51,rTci h却分别为58.1%和12.3%,见表5,如果界定h核心区域外为低被引区,那么前者低被引区域的累计被引次数占总被引次数的41.9%,而后者占87.7%。再如AdvancesinPhysics和PhysicalReviewB期刊规模悬殊,AdvancesinPhysics的Np=38,h=29,rTci h=98%,而PhysicalReviewB的Np=28953,h=141,rTci h=6.9%,如果以h指数划分,AdvancesinPhysics低被引区论文数为9,而PhysicalReviewB低被引区论文数为28812,样本量相差甚远。因此,研究表明65种CMJ的h指数平均值不适用于界定低被引区域,并且各期刊的h指数也不适用于界定自身的低被引区域。

表4 h核心区域相关数据统计描述

表5 5种期刊主要分析指标举例 (按rTci h降序排列)

注1:R:CMJ分区值;A:rTci 20%/rTci h;B:rTci cipp/rTci h;

注2:65种期刊全数据见电子版的文末附表。

3.1.2 确定低被引论文的定义域

(1) 最低被引频次百分位界定法

受经典的二八定律启发,从被引结构角度寻找低被引区域,将低被引端论文的累计被引频次为期刊Tci的5%,10%和20%的区域定义为低被引区域,假定每种期刊可被引论文的篇数为Np,取值为n,将

图5 h核心区域相关参数分布。(a)h;(b)Tci h;(c)rh;(d)rTci h

其按被引频次的大小降序排列,序列号i自上而下,即i=1,2,3,…,k,…,n。第i篇可被引用论文的引用次数可表示为Tci i,则该期刊所有可被引用论文的总引用次数Tci可表示为

(1)

在此排序中,从最低被引的第n篇论文向高被引论文端统计被引次数,累计达到Tci的5%,10%和20%时,分别记为Tci 5%,Tci 10%,Tci 20%。对此,3种情况可表示为

(2)

式中kx为累计被引频次达到Tci的x%的论文序号,Tci x%为在kx

(2) 期刊篇均被引Cipp界定法

鉴于期刊篇均被引在期刊评价中广泛接受和应用,与以上类同的思路提出期刊篇均被引Cipp界定法,将每个期刊的论文按照被引频次降序排列,序列号i自上而下,即i=1,2,3,…,k,…,n。以每个期刊总被引频次Tci计算期刊的篇均被引Cipp,然后在降序列表中找到第k篇论文即kcipp,使Ci k=Cipp,以序列号k作为分界点,满足i≥kcipp的论文为被引频次小于Cipp的论文,定义为低被引论文,此区域论文总数为Ncipp,累积被引频次Tci cipp,则

(3)

(3) 数据比较与分析

依据以上方法计算了65种期刊在最低被引频次为5%,10%,20% 和Cipp区域内的论文占比N5%,N10%,N20%和Ncipp。图6(a)所示为各区域rN x%的取值范围、中位线、平均值(图中□所示)和误差线。通过比较3个区域的数据,发现rN 20%和rN cipp区域的中位数分别为0.613和0.706,与它们的平均值0.627和0.709非常接近,最大值与最小值之间的极差较小,概率分布比较对称,见图6(b),这些特征都表明20%点的数据比5%和10%的两点更具有统计学优势,见表6。因此最低被引的20%区域和论文被引小于篇均被引的区域具有作为CMJ低被引论文区的统计学依据。

表6 各参数对比

3.2 CMJ低被引区域被引特征分析

3.2.1 低被引率RLC与低被引密度DLC指标

如同分析高被引h核心区域,将低被引区域论文与总可被引论文的百分比定义为低被引率RLC,rRLC 20%=rN 20%=N20%/Np,rRLC cipp=rN cipp=Ncipp/Np。将低被引区论文的累计被引频次与期刊总被引频次的百分比定义为低被引密度DLC,rDLC cipp=rTci cipp=Tci cipp/T,rDLC 20%=rTci 20%=Tci 20%/T,最低被引的20%区域rDLC 20%≡0.2。

图6 CMJ论文分布。(a)各被引区百分比分布;(b)各低被引区论文百分比分布

rRLC 20%的优点在于相比较的期刊有共同的比较基准,一种期刊的20%的低被引论文比例一目了然,缺点是有些数据不能由WoS数据库直接提供;而rRLC cipp和rDLC cipp指标的优点在于,由于长期以来篇均被引Cipp的内涵已经深入人心,所以使用rRLC cipp和rDLC cipp描述被引小于篇均被引区域内的低被引特性更助于认知整个期刊的被引结构。

3.2.2 CMJ被引结构分析

评价期刊的前提是了解期刊的被引结构。由表6可知:第一,在最低被引20%Tci区域,期刊低被引端约60%的可被引论文对全刊被引的贡献率为20%,换言之,一个期刊80%的被引率来自40%的高被引端论文。第二,在被引小于Cipp的区域,rDLC cipp实际平均值和统计平均值分别为29.9%和28.0%;rRLC cipp实际平均值和统计平均值分别为70.0%和70.9%,也就是说高于Cipp的论文是期刊论文Np(自高被引端)的三分之一,而其累计被引是整个期刊被引Tci的70%。虽然两个区域的数据都不符合二八定律。但是它们的比值在被引结构上都具有合理性。因为对于有相对较高的h指数平均值的CMJ,选择太低的最小被引作为低被引区进行评价意义不大,反之,低被引区域选择过于靠近高被引端,而CMJ数据又具有散差大的特点,可能增加与h核心区域重叠的可能性。以被引小于篇均被引定义域的数据分析,如果将低被引密度上限设置为30%,65种期刊中只有6种期刊的h核心区域与低被引区域发生交集(见电子版的文末附表),误差低于10%。此外,表6表明被引小于篇均被引定义域的数据整齐,几乎所有数据:极差、标准差、平均值等的统计特征都强于最低被引20%定义域的数据,所以Cipp作为一个分割点,对期刊被引结构的认识具有特殊的意义。当然,不同学科领域期刊的低被引定义域的分割点很可能不同,是否都可以找到如此有意义的分割点需要进一步研究,但是该方法对其他学科方向的科技期刊应该具有参考意义。

图7 被引结构比与期刊分区

图8 Nature Materials与Physical Review B的被引密度

图9 Nature Materials与Physical Review B篇均被引

图10 Nature Materials与Physical Review B被引形态

为了探究CMJ的被引分布是否存在具有典型意义的被引结构形态。选取期刊的低被引密度与高被引密度的比值,即Tci cipp/Tci h作为分析指标,结果发现这一比值随期刊四个分区的分区序号呈上升趋势,见图7。在1区,期刊低被引区域是高被引区域的0.5左右,而在4区低被引区域为高被引区域的1.8倍左右,说明从1区到4区低被引区域论文的比例越来越高,逐渐成为评价的主要成分。表6中NatureMaterials,PhysicalReviewB,两种期刊的h指数接近,分别为180和141,但是它们的IF分别为36.2,3.7,Cipp分别为154.9及15.7,数值相差10倍,由于期刊的规模差异(Np分别为749和28953),导致NatureMaterials和PhysicalReviewB的高密度指标rTci h分别为0.644和0.069,而在小于篇均被引区域的低密度指标rDLC cipp分别为0.285和0.305,两种期刊的被引密度出现翻转,见图8。图9~10所示为两种期刊在3个区域的篇均被引以及被引情况。如果用一种形态描述它们的被引结构,两种期刊都以高h核心开始,一个是尾巴短粗,一个是尾巴细长。实际上还存在更多的结构形态,描述这些不同结构形态特征需要进一步实证分析和理论研究。

3.2.3 被引结构与评价策略

依据电子版的文末附表的数据按高被引密度指标rTci h降序排列,将65种期刊分为3段,即H段:高被引占优势rTci h≥0.78;L段:低被引占优势rTci h<0.1;M段:中间段。图11所示为不同区段Tci与h指数、Cipp和Cipp 20%的关系分析。在H段,一般期刊规模小,h指数并不高,但是高被引密度DHC较高,Tci表现出对h指数和Cipp 20%敏感度高于Cipp,见图11(a);在M段,Tci表现出对Cipp 20%、Cipp 20%到h指数的敏感度程度自强至弱的变化趋势,表明3个指标在3个区域内评价优势的变化趋势,见图11(b);在L段DHC较低,低被引论文变成评价的主要成分,Tci对h指数的敏感度降低到与Cipp同等的水平,而对Cipp 20%的敏感度上升为三个区域中的最高值,说明Cipp 20%在L段具有绝对的评价优势,见图11(c)。

目前的评价体系主要是以h指数和IF为基础衍生和发展起来的,从期刊被引频次的结构考虑,这些指标基本可分为两类,即用于评价高被引的一簇,如h指数、rh和Tci h,以及用于评价低被引的一簇,如IF、Cipp、rTci cipp和rTci 20%。在一个评价系统中两类指标之间可能是竞争关系,高被引和低被引的组成比例决定了它们在评价中的优势。研究期刊的被引结构及评价指标的竞争关系,其意义在于准确把握评价指标的选取、实现期刊的精细评价以及开展期刊与期刊之间的被引构形的分析。实际上,改变传统的由一两个指标描述或评价期刊的模式已经成为当前学术评价的需求,而引文数据库的不断完善、分析工具的愈加智能化恰恰为学术期刊评价的个性化和精细化提供了可能。对于不同评价指标在评价过程中与被引构形的依赖或优势关系的研究还需要在可能的条件下进行大量的实证分析和理论研究。

图11 不同rTci h区段Tci对h、Cipp和Cipp 20%的依赖关系。(a)H段;(b)M段;(c)L段

3.2.4 期刊低被引区域的描述与评价

表7展现了低被引指标、高被引指标与传统指标的相关性的强弱,可归纳为以下几点:第一 ,rN0、RLC(rN 20%,rN cipp)和DLC(rTci 20%,rTci cipp)与传统指标(h、Tci、IF、Np、Cipp)不存在显著相关性,具备成为低被引区域独立指标的前提。第二,两个低被引区的RLC之间具有较强的相关性(rN0=0.686),在此前提下发现零被引对低被引指标的影响更加直接,见表7的rN0列;而与期刊整体指标基本不相关,因为rN0与Np和Tci的相关系数分别为-0.166和-0.291。第三,相关性分析进一步说明了低被引相关因素之间的复杂性,在评价中难以用一个独立指标完成,建立多参数多维度的评价理念和方法是客观要求。

表7 低被引指标、高被引指标与传统指标的相关性分析

(1) 复合描述指标Evel{rN0,rN x%,rTci x%}

rN0,rNx%,rTci x%3个参数集中反映了期刊在低被引区的特征,将其组成一个复合指标描述低被引情况。

例如,NatureMaterials的Evel{rN0,rN cipp,rTsci cipp}=Evel{0.032,0.694,0.285};JournalofNanoscienceandNanotechnology的Evel{rN0,rN cipp,rTci cipp}=Evel{0.140,0.709,0.296}。

此指标包括了一个期刊无引用论文程度、一个合理的结构域内论文的占比和被引用论文的占比,它们分别是期刊零被引用率rN0、低(高)被引率RL(H)C(等于rN x%)和被引密度DL(H)C(等于rTci x%)。x为20或Cipp时,表明研究对象在低被引论文区,x为h时,表明研究对象在h核心区域。

(2) 复合评价指标Evel{h,Ci 20%,Ci cipp,Ci h}

通过不同被引区段内篇均被引值描述期刊被引构形,见电子版的文末附表。

例如,NatureMaterials的Evel{h,Ci 20%,Ci cipp,Ci h}=Evel{180,51.8,154.9,415.2};JournalofNanoscienceandNanotechnology的Evel{h,Ci 20%,Ci cipp,Ci h}=Evel{41,1.6,4.9,70}。

第四,就CMJ总体而言,Tci与h指数的依赖关系强于Cipp,反映了此学科领域的整体水平较高。

4 结论

首先,对以WoS收录的凝聚态物理学65种期刊为样本,研究期刊低被引界定方法和被引规律是在假定h指数核心区为高被引区的前提下进行的。h核心区的分析显示,h核心区域的论文占整体期刊论文的2%,累计被引大于期刊总被引的20%,虽然高于此平均水平的期刊近半(见电子版的文末附表),但是由于h指数和Tci h分布的不对称、数据离散、标准差大等原因,所以h指数缺乏作为凝聚态物理期刊低被引区界标的统计学依据。

CMJ的rN0仅为10.2%。期刊零被引的程度与期刊的质量分区存在一定程度的负相关,但是其历时演化与分区无显著相关;CMJ被学术共同体发现的周期为3年左右。rN0与期刊的Np、Tci、IF、h等传统指标基本不相关或弱相关,因此rN0具有独立成为评价指标的统计学特性。在实际评价中rN0比N0更易于比较不同期刊。

通过对小于篇均被引Cipp的论文集合,以及最低被引累计为期刊总被引Tci的5%,10%和20%的三个区域内论文集合被引特性的比较分析,界定最低被引比例20%以及小于Cipp区为CMJ的低被引论文区,前者界定的论文集合占期刊全部可被引论文的60%,换言之,40%高被引端的论文对整个期刊被引频次的贡献率为80%;后者界定的论文集合占期刊全部可被引论文的70%,论文的累计被引占期刊总被引频次的30%。虽然以上结果都不符合经典的信息二八定律,但是具有期刊被引结构分析的统计学意义,为界定低被引区域提供了理论依据。

大量相关性分析表明,期刊低被引论文的评价过程复杂,相关因素较多,以一个简单变量很难评价一个复杂事物,提出两个由多因子组成的复合指标,Evel{rN0,rN x,Tci x%}以及Evel{h,Ci 20%,Ci cipp,Ci h}。

期刊低被引评价必须建立在对被引分布结构分析的基础上。本文通过高被引密度DHC即(rTci h对65种CMJ按被引频次划分为高、中、低三个区段,并分析不同区段Tci对h指数、Cipp和Cipp 20%敏感度的变化,发现被引结构与评价指标存在一定的依赖关系,提出不同的评价指标在高低不同被引区域内可能存在优势竞争的观点,以及将期刊分类和被引结构形态模型化的可能。

零被引、低被引是科技文献引用中的高概率事件,无论是评价期刊在学科领域内的学术地位,还是评测低被引论文生产者的学术水平,建立系统的低被引论文的评价方法或在传统评价体系中融入低被引论文分析的权重都具有实际意义。虽然本文只引用物理学分支领域的期刊探讨此问题,但是期望对更多学科或领域带来试探效果。随着索引数据库的日趋成熟和引文规范不断普及,数据的质量不断提升,文献计量分析将更加注重学术期刊的立体评价。

[1] Garfield E. I had a dream about uncitedness[J].Scientist,1998,12(14):10.

[2] Garfield E. Uncitedness and identification of dissertation topics[J].CurrentContents,1972,14.

[3] Garfield E. Uncitedness III: Importance of not being cited[J].CurrentContents,1973(8):5-6.

[4] Garfield E. To be an uncited scientist to scientific discovery[J].Scientist,1991,5(6):390-391.

[5] Barber B. Resistance by scientists to scientific discovery[J].Science,1961,134(3479): 596-602.

[6] van Raan A F J. Sleeping beauties in science[J].Scientometrics,2004,59(3):467-472.

[7] Egghe L. The distribution of the uncitedness factor and its functional relation with the impact factor[J].Scientometrics,2009,83(3):689-695.

[8] 高继平,潘云涛,武夷山. 零被引论文的形成因素分析:以光谱学领域零被引论文的国家、机构和主题分布为例[J]. 科技导报,2015,33(8):112-119.

[9] 徐晓芹. 零被引论文产生的原因分析:以《植物营养与肥料学报》为例[J]. 中国科技期刊研究,2015,26(7)763-768.

[10] 朱梦皎,武夷山. 零被引现象:文献综述[J]. 情报理论与实践,2013,36(8):111-116.

[11] 魏瑞斌,石磊,武夷山. 学术期刊零被引现象的实证研究:以图书情报学期刊为例[J]. 图书情报工作,2015,59(1):82-88.

[12] 刘雪立,方红玲,周志新,等. 科技期刊反向指标:零被引论文率及其与其他文献计量学指标的关系[J]. 中国科技期刊研究,2011,22(4):525-528.

[13] 周洁,王昕. 科技期刊论文低被引情况与探讨[J]. 中国科技期刊研究,2015,26(8):851-855.

[14] 杨利军,万小渝. 期刊论文低被引标准的界定方法[J]. 情报理论与实践,2013,36(7):51-53.

[15] 杨利军,万小渝. 低被引期刊论文学术价值的评价方法研究[J]. 情报理论与实践,2014,37(7):95-101.

[16] 唐野琛. 基于信息价值的h核内和h核外依赖关系研究导引[J]. 情报杂志,2011,30(10):43-48.

[17] 王新. 学科期刊的h-index、IF5和hTci-median实证评析[J]. 图书情报工作,2014,58(6):105-112.

[18] Egghe L. The mathematical relation between the impact factor and the uncitedness factor[J].Scientometrics,2008,76(1):117-123.

[19] Rousseau R. A case study: Evolution of JASIS′ Hirsch index[J].ScienceFocus,2006,1(1):16-17.

猜你喜欢
界定分区论文
上海实施“分区封控”
环球时报(2022-03-29)2022-03-29 17:14:11
我国首次对“碰瓷”作出明确界定
浪莎 分区而治
高血压界定范围
金色年代(2016年4期)2016-10-20 17:40:14
对“卫生公共服务”的界定仍有疑问
中国卫生(2015年4期)2015-11-08 11:15:58
基于SAGA聚类分析的无功电压控制分区
电测与仪表(2015年8期)2015-04-09 11:50:16
基于多种群遗传改进FCM的无功/电压控制分区
电测与仪表(2015年7期)2015-04-09 11:40:16
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登