z指数在期刊评价实践中的应用研究

2018-06-01 00:56何晓庆王圣洁

中国科技期刊研究 2018年5期

■何晓庆王圣洁胡琳

四川大学图书馆，四川省成都市一环路南一段24号 610065

期刊评价是科学计量领域一个重要的研究方向。学术期刊作为记录科研人员创新性科研成果最主要的载体，其评价方法的合理性、科学性、准确性是学者们关注的焦点。情报学家Garfield于1955年提出了作为学术量化评价工具的影响因子(Impact Factor,IF)的概念，并得到了广泛的应用，但是在实际使用中，不少学者发现IF存在缺陷。之后众多学者致力于研究新的综合性评价指标，如2005年Hirsch 提出h指数，2006年Egghe提出g指数，2010年Prathap提出p指数等，这些评价指数各有优势但是又各有局限，比如h指数不能区分h 指数相同而被引频次相差较大的情况[1]；g指数存在忽略g核以外的论文数量及其被引频次的缺陷[2]；p指数无法呈现期刊的被引分布情况[3]。

z指数是p指数的提出者Prathap为弥补p指数不能体现引文集中程度的缺陷，于2014年提出的一个新的综合性评价指标[4]。由于z指数是一个全新的期刊评价指标，目前国外的相关研究主要由Prathap完成[5-8]。文献[5]进一步解释了z指数中的指标；文献[6]分析了z指数与h指数之间的联系；文献[7]将z指数用于评价太阳能电池(polymer solar cells)研究进展情况；文献[8]应用z指数评价印度近期的整体科研情况。Prathap认为z指数是一个新型3D能效指标，相较于以往的评价指数，其属于更高阶的期刊评价指标[5]，但是目前国内对z指数的研究主要集中在学者学术影响力[9]，而利用z指数对期刊评价的研究鲜有报道。因此本研究拟以“社会科学引文索引”(Social Science Citation Index，SSCI)收录的信息科学和图书馆学期刊为样本，辨析z指数、h 指数、p指数之间的关系，剖析z指数的优势与不足，为z指数在期刊评价中的进一步应用提供实证研究资料，也为更加客观、科学地评价期刊探寻新的视角和方法。

1 z指数的提出及其计算原理

Prathap认为z指数能够将体现数量因素的N(总发文数量)、体现质量因素的i(篇均被引频次)和反映被引用集中程度的η有效地结合到1个指数中。被引分布变化的一致性指标η可表示为

(1)

式中X和E为能量因子，N为总发文数量，C为总被引频次，Ck为第k篇文章的被引频次，k=1,2,…,N。

z=Z1/3

(2)

(3)

Prathap认为C可视为一阶性能指标,X和E可视为可靠的二阶性能指标，而X和E的同时存在为既不是衡量质量也不是衡量数量的三阶指标η的提出创造了条件。η的计算来源于经济学中一种测量集中度的综合指数Herfindahl-Hirschman Index (HHI)的计算思路。

(4)

当η=1时，即X=E，表明引文呈绝对均匀分布；当η≪1时，表明引文集中程度较高，因此η可视为引文“浓度”的衡量指标。进而z指数可视为quantity-quality-consistency或者volume-velocity-variety(variability)的3D评价指标。

2 实证分析

2.1 数据统计

来源数据库为Web of Science，时间范围限定为2012—2016年。选取2016年版JCR中位于Q1、Q2分区的信息科学和图书馆学期刊共计42种，由于TelematicsandInformatics、JournaloftheAssociationforInformationScienceandTechnology以及AslibJournalofInformationManagement在JCR中的近5年数据不全，因此将这3种期刊排除，最终列入研究对象的信息科学和图书馆学期刊共计39种。本研究统计了2012—2016年39种样本期刊的总发文数量、总被引频次、篇均被引频次、一致性指标η、h指数、p指数、z指数，结果见表1。

表1 2012—2016年39种样本期刊的文献计量指标统计

2.2 结果分析

2.2.1z指数、p指数及h指数排名比较分析

如表1所示，依照p指数值排名，MIS Quarterly位居第1，其发文数量较小，总被引频次居中，但是其篇均被引频次高达22.37次，因此其p指数排名相对靠前。按照z指数和h指数值排名，MIS Quarterly仅位居第2，被Journal of the American Medical Informatics Association超越。究其原因可以发现，虽然MIS Quarterly的篇均被引频次遥遥领先于其他期刊，在292篇论文中，高被引论文多达24篇，但是其论文的被引分布极其不均匀，如“Businessintelligenceandanalytics:frombigdatatobigimpact”的被引频次达到676次，但是该期刊也有零被引文献。而Journal of the American Medical Informatics Association的篇均被引频次虽然不及MIS Quarterly，但被引分布相对均衡，并且Journal of the American Medical Informatics Association的总发文数量远远大于MIS Quarterly，最终导致Journal of the American Medical Informatics Association的z指数和h指数排名第1。Government Information Quarterly、International Journal of Information Management等期刊由于其被引分布的不均衡性，因而z指数的排名低于p指数的排名；Information and Organization、MIS Quarterly Executive等期刊由于受到总发文数量的局限，其h指数的排名低于p指数和z指数的排名。由此可见，z指数、h指数和p指数均为综合性评价指标，都对期刊的质量和数量有所诉求，而z指数能够进一步反映被引分布情况。

2.2.2 概念对比分析

从h指数的定义可以看出，h指数在一定程度上兼顾了质量和数量，并且能够体现被引分布情况。但是h指数只关注核心区的论文数量和质量，缺乏对期刊低质量论文的约束力，因而不可避免地存在“以偏概全”的问题。

p指数综合考虑了总发文数量和篇均被引频次，解决了h指数忽视核心区以外论文的缺点，使得每1篇论文都会对p指数产生影响。但其为几何平均数，一视同仁对待高被引和低被引的论文，使得p指数无法完全体现被引分布情况。

z指数是在p指数的基础上引入第3个指标η，η是一个描述被引分布曲线的指标。η的融入使得z指数在继承了p指数兼具期刊数量和质量评价功能的同时，很好地反映了整个期刊的被引分布情况。

2.2.3 典型研究案例分析

为了更好地验证h指数、p指数以及z指数是否能够很好地体现被引分布情况，本研究设计了3个具有相同p指数而被引分布完全不同的典型研究案例，分别见图1～3。将文献按照被引频次降序排列。案例2和3在Hirsch前区都是高核区(案例2前5篇文献的被引频次均大于等于5，案例3前10篇文献的总被引频次为200)，在Hirsch研究中案例3为长尾(后区的30篇论文总被引频次为0 )，案例2为短尾(后区的5篇论文总被引频次为5)。在3个典型案例中，p指数完全一样，案例2的h指数和案例1、案例3的指数有所不同，但是h指数对于案例1和案例3却无法精确区分。只有z指数很精确地区分了案例中的3种情况。案例1中η=1，表明每篇文章的被引为绝对平均分布，案例2中η=0.4587，案例3中η=0.1969，表明案例2比案例3的被引集中程度更高。η很好地区分了案例的3种被引分布曲线，可以作为描述被引分布的一致性指标。

图1 案例1被引分布情况

图2 案例2被引分布情况

图3 案例3被引分布情况

2.2.4 相关性分析

通过对39种样本期刊z指数、h指数以及p指数的相关性分析(表2)发现，z指数与h指数以及p指数的相关性均在 0.01 水平(双侧)上显著相关，其相关系数分别为0.934和0.958。这表明z指数能够很好地模拟h指数及p指数。

表2 z指数和h指数及p指数的相关性

注：**表明在0.01 水平(双侧)上显著相关。

z指数在探索h指数、p指数的研究中被发掘出来，它们之间必然存在很多共性，它们都是质量兼顾型的期刊评价指标。但是在对SSCI收录的信息科学和图书馆学期刊学术影响力评价表中发现，不少期刊的h 指数相同，可见在一定程度上h 指数的区分度不太明显。例如案例3中，无论h1区域的文献的被引频次如何增长或者降低，只要被引频次大于h，h指数都不会产生任何变化；同样地，无论h2区域的文献的被引频次如何降低,或者只要增加的频次小于h，则对h指数均不会有任何影响。h指数具有忽视高被引文献的贡献以及完全忽视h指数以下的文献数量及被引频次的缺陷。p指数的计算仅仅涉及总被引频次和总发文数量，在对3个典型案例的分析中发现，当评价对象具有相同的总被引频次和总发文数量，无论被引分布情况如何，p指数相同。然而期刊的每1篇文献的被引频次都应该对其影响力变化产生作用。z指数继h指数及p指数发展后被提出来，是h指数和p指数的优化和升级，一定程度上克服了h指数和p指数的缺点，改进了h指数对期刊学术影响力评价区分度不大、忽视高被引文献和h指数以下的低被引文献的情况以及p指数完全不能反映被引分布特征的缺陷。

3 z指数的优劣分析

3.1 z指数的优势

3.1.1 有助于激励期刊发表高水平论文

z指数是一个引文数量、被引率以及被引分布共同作用的综合性指标，单一的论文数量的增加不仅不会对其产生直接的提升作用，甚至低被引论文的增长还会对z指数产生负面影响。将39种样本期刊中z指数排名第22位的InformationandOrganization的被引分布按照被引频次降序排列，见图4。为了检验低被引论文的增长对z指数数值的影响，将InformationandOrganization被引分布图中的67篇文献保持不变(情况1)，新增10篇零引用论文(情况2)。在前67篇文献不变动的情况下，z指数的数值并没有因为这10篇零引用论文的增加而出现增加，反而由原来的13.348下降到12.173，η也由0.343下降到0.299。由此可以看出，低引用论文的增加对z指数产生负面作用。只有提升期刊论文的整体质量，让论文的被引分布更加均匀，才能获得高z指数数值。因此z指数也能够从一定程度上激励期刊更加注重论文的质量，减少低质量论文的发表。

图4 Information and Organization被引分布情况

3.1.2 高灵敏度

为了验证z指数的灵敏性，分别将案例3的40篇文献中被引频次最高的文献增加1次引用(情况1)和将被引频次排名第11的文献增加1次引用(情况2)。由于总被引频次增加，而总发文数量并没有增加，情况1和情况2的p都相应变化为10.0333，因此p指数并没有分辨出这2种情况。情况1和情况2的h指数保持不变。而情况1的η变化为0.19570，z指数变化为5.8252；情况2的η变化为0.19882，z指数变化为5.8560。在使用z指数进行期刊评价时，增加的每1篇发文、获得的每1次引用都会引起z指数的变化，因此z指数具有很高的灵敏度。

3.1.3 较高区分度

从表1的39种期刊中可以发现，高达30种期刊存在和其他期刊具有相同h指数值的现象，而其p指数和z指数数值均独一无二，由此可见，p指数和z指数均具有优于h指数的区分度。在进一步的典型案例研究分析中，可以发现z指数的区分度优于p指数。

3.2 z指数的不足

3.2.1 不能区分施引文献影响力大小

由于z指数的计算过程是均等看待每一次引用，使得不同层次的施引文献也被平等对待。因此z指数并不能区分出文章在被引频次相同的情况下因施引文献层次不同而导致的不同影响力。

3.2.2 不能反映时间发展因素的变化特征

随着时间的推移，每篇论文的被引数量只会增加而不会减少。但是由于z指数的计算公式中并没有考虑到被引频次随时间发展的问题，只要论文的被引频次相同，则对z指数的贡献相同。因此，z指数并不能区分发表1 年后被引200次和发表10年后被引200次的具有不同影响力的论文，也不能分辨论文发表后被引频次逐年增加和逐年减少的不同影响力论文[11]。

3.2.3 不易获取

p指数的计算只需要利用现有的大型文献检索平台的强大引文分析功能，不需要任何其他指标的录入和辅助。h指数则需要把评价期刊的论文按照被引频次降序排列，然后将文献序号和被引频次进行比对。z指数需要计算每篇文章的被引频次的平方，进而需要掌握每篇文章的被引频次。相较于h指数而言，z指数并不需要对每篇文献进行排序。但是相较于p指数而言，z指数的获取难度相对更大。

4 结语

目前国内外对于z指数的研究并不多，但是从本研究可以看出：z指数充分结合了期刊h 指数和p指数的优点，使得z指数不但兼顾了质量和数量因素，还充分考虑了被引分布情况，比h指数和p指数更具有整体性和灵敏性，是一个具有广阔应用前景的期刊综合评价指标。但是无论在理论研究还是在实践应用方面，利用z指数评价期刊影响力的过程中还存在诸多问题，有待进一步探究。因此在评价期刊时，不能仅利用单一的指标对期刊作出定论，而应该凭借多种文献计量指标和方法，从不同的视角对期刊进行综合考量，才能得到公正合理的结论。

[1] 王圣洁,蒋旭,何晓庆. 期刊P指数与其他评价指标相关性探讨[J]. 中国科技期刊研究,2014,25(11):1404-1407.

[2] 田甜. 一种评价领域作者影响力的改进G指数GN-C的评价与实证研究[J]. 图书情报工作,2016,60(10):108-114.

[3] 夏慧,韩毅. 一个新的综合性科技评价指标——p指数研究综述[J]. 图书情报工作,2014,58(8):128-132.

[4] Prathap G. The zynergy-index and the formula for the h-index[J].JournaloftheAssociationforInformationScienceandTechnology,2014,65(2):426-427.

[5] Prathap G. A three-class, three-dimensional bibliometric performance indicator[J].JournaloftheAssociationforInformationScienceandTechnology,2014,65(7):1506-1508.

[6] Prathap G. Letter to the editor: Measures for bibliometric size, impact, and concentration[J].JournaloftheAssociationforInformationScienceandTechnology,2015,66(8):1740-1741.

[7] Prathap G. A three-dimensional bibliometric evaluation of research in polymer solar cells[J].Scientometrics,2014,101(1):889-898.

[8] Prathap G. A three-dimensional bibliometric evaluation of recent research in India[J].Scientometrics,2017,110(3):1085-1097.

[9] 何晓庆,王圣洁,胡琳. z指数在学者学术影响力评价中的应用[J/OL]. 情报理论与实践[2018-04-18]. http://kns.cnki.net/kcms/detail/11.1762.G3.20180112.1106.002.html.

[10] 叶鹰. h指数和类h指数的机理分析与实证研究导引[J]. 大学图书馆学报, 2007(5): 2-5.

[11] 许新军. p指数在期刊评价中的应用[J]. 情报学报,2015,34(12):1246-1251.