基于CW算子的学术期刊组合评价研究

2018-07-17 00:50张发明钟颖璐陈美娟叶兆青
中国科技期刊研究 2018年6期
关键词:算子分析法排序

■张发明 钟颖璐 陈美娟 叶兆青

1)南昌大学经济管理学院,江西省南昌市红谷滩新区学府大道999号 3300312)南昌大学外国语学院,江西省南昌市红谷滩新区学府大道999号 330031

学术期刊评价一直以来都是期刊界和学术界关注的重点,其评价结果对引导期刊提升学术质量和社会影响力起着十分重要的作用。因此,学术期刊评价研究具有十分重要的现实意义和应用价值[1]。

目前,国内外关于期刊评价问题的理论研究已较为丰富,并且也取得了丰硕的研究成果[2-22]。姚红[12-13]运用灰色关联分析法与秩和比法综合评价期刊,这2种方法都基于实际数据客观评价期刊,其评价结果相对公正,但是该类方法侧重于客观数据,较少考虑主观因素,因此在评价过程中主客观的协调性相对一般。李红[14]和辛督强[15]分别运用主成分分析法对学术期刊进行综合评价并排序,何文[16]采用因子分析法对期刊进行评价,取4个因子并以因子的方差贡献率为权重构建综合评价模型,这类评价方法不仅可以解决指标之间信息重叠和权重确定的问题,还可以通过降低维度减少计算量,但是这类方法一方面可能会损失部分数据信息,另一方面缺少主观因素介入,因此最终评价结果与实际情况有些许偏差。刘莲花[17]针对数学期刊评价问题,构建基于变异系数法的距离综合评价模型,该方法对原始数据的利用比较充分,信息损失相对较少,但是该方法的规范化矩阵求解过程比较复杂,正负理想解的确定存在一定困难。与传统的单一评价方法不同,王居平[18]从组合评价的角度出发,利用熵值法和层次分析法这两种主客观赋权方法,建立离差最大化模型对学术期刊进行组合评价,但是该模型侧重于权重组合,其评价结果与评价值组合的结果相比,误差较大。俞立平[19]集合了多种不同机理的评价方法,提出了基于排序选择模型的学术期刊组合评价方法,但是由于该方法对原始数据的数量有一定的要求,在实际应用过程中具有一定的局限性。之后,俞立平等[20]又提出了一种基于结果一致度的学术期刊组合评价方法,该方法体现了“民主”思想,衡量了某单一评价方法对其他评价方法的认可度,但是该方法所选取的用于组合评价的单一方法都是客观的评价方法,方法选取上不够全面。王一华[21]采用拉开档次组合评价法对图书情报类期刊进行组合评价,从期刊评价体系的整体水平出发,确定3种期刊评价体系在各学术期刊中所占的权重,但是该方法削弱了期刊评价体系内部间的联系。熊国经等[22]利用熵值法、因子分析法和TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)法建立组合评价模型和复合评价模型来综合评价学术期刊,发现组合评价模型、复合评价模型比单一评价模型有更高的区分度,但是该模型中单一方法偏少,其结论的可靠性有待进一步检验。

纵观上述研究可以发现,单一评价方法和组合评价方法在学术期刊评价问题上都已经得到了一定的应用和推广。但是不同的单一评价方法由于其机理不同,对于同一对象的评价结果往往存在差异,而组合评价方法在一定程度上可以弥补单一评价方法评价结果的片面性,能够结合不同单一评价方法的特点,发挥各种单一评价方法的长处,达到优势互补,从而得到更加全面、客观并且唯一的评价结果。基于此,在前人较丰硕的研究成果基础上,本研究提出一种基于组合权重(Combined Weight,CW)算子的学术期刊组合评价方法。该方法对传统的组合评价方法进行了改进,从评价信息密度分布的角度考虑了各个单一评价方法间的信息疏密程度,更大程度地挖掘了评价数据的信息量;利用多种主客观相结合的单一评价方法分别评价学术期刊,充分发挥各组合评价方法的特点,使得组合评价结果更为精确。首先,分别利用熵值法[23]、灰色关联分析(Grey Relational Analysis,GRA)法[12]、TOPSIS法[24]、主成分分析法[15]和决策试验和评价实验(Decision Making Trial and Evaluation Laboratory,DEMATAL)法[25-26]对学术期刊进行多属性综合评价,得到5种单一方法的综合评价值,在此基础上再利用基于等级相关系数增量的分组方法对5种方法进行分组;然后,结合组合评价的特点和评价信息的疏密程度,确定组内重要性权重和组间密度权重;最后,利用CW算子进行信息集结,得出最终的评价结果。

1 方法与模型

目前,国内外已经建立了数百种多属性综合评价方法,但是鉴于人为决策的不确定性和方法结构、信息选用的差异性,多种理论上可行的评价方法对同一对象的评价结果可能不同。基于此,提出一种基于CW算子的学术期刊组合评价方法。该方法首先选取5种典型的单一评价方法分别评价期刊,然后利用CW算子将5种评价信息进行集结,最后得出综合评价结果。

1.1 5种评价方法

为了得到更加精确全面的评价结果,同时也为了使评价结果更加符合实际情况,在考虑方法本身特性、计算复杂程度以及社会认可度的前提下,选取了熵值法、GRA法、TOPSIS法、主成分分析法和DEMATAL法5种主客观相结合的评价方法对学术期刊进行组合评价。

1.1.1熵值法

熵的概念源于热力学,之后由Shannon等[23]引入信息论。信息熵可用于反映指标的变异程度,差异越大,指标对系统的比较作用就越大,即包含和传输的信息越多。熵值法通过各项指标观测值所提供的信息量的大小确定指标的权重。

1.1.2GRA法

GRA法是灰色系统理论的重要组成部分,是一种挖掘数据内部规律的有效方法。该方法根据待分析系统的各个特征参量序列曲线间的几何相似或者变化态势的接近程度来判断其关联程度。GRA法的优点在于能够处理信息部分明确、部分不明确的灰色系统。学术期刊评价问题是一个关系复杂并且涉及较多不确定因素的系统,采用GRA法可以有效地解决该问题。

1.1.3TOPSIS法

TOPSIS法是一种由Yoon等[24]提出的逼近理想解的排序方法。基本思路是:先建立初始化决策矩阵,而后基于规范化后的初始矩阵,找出有限方案中的最优方案和最劣方案(即正、负理想解),然后分别计算各个评价对象与最优方案和最劣方案的距离,得出各评价方案与最优方案的相对接近程度,最后进行排序,并且以此作为评价方案优劣的依据。TOPSIS法的优势在于对原始数据的利用比较充分,信息损失少,能够较大程度地利用数据信息。

1.1.4主成分分析法

主成分分析法是一种常用的统计学方法,通过研究相关矩阵内部的依存关系,采用降低维度的思想,将原来的多个关系复杂的因素组合成少数几个综合因子,从而得到指标的内在联系。该方法的优势在于能够消除指标间的相关共线性,大大简化原指标体系的指标结构。

1.1.5DEMATAL法

DEMATAL法是20世纪70年代由日内瓦研究中心提出的一种用于研究和解决错综复杂的影响因素的方法。基本思路是利用专家打分的方式,识别因素间的相互影响关系及重要程度,然后结合中心度和原因度确定因素的主观权重。该方法能够有效地识别各个因素之间的相互关系,适用于研究复杂系统因素之间的交互影响以及权重确定问题。

1.2 基于CW算子的组合评价模型

CW算子是一种专门针对组合评价问题的信息集结算子[27-28],相比于传统的信息集结算子[29-31],CW算子能够充分考虑组合评价方法间的差异性和相似性,其评价结果具有强化一致性程度高并且弱化一致性程度低的特点,在处理信息时,充分考虑了评价信息分布的疏密程度,能够更大程度地挖掘各个评价方法的评价信息,并且达到增强组合评价结果稳健性的效果。基于此,利用CW算子对5种评价方法的评价值进行集结,据此得到最终的评价结果。

步骤1:评价值矩阵的数据标准化。构建5种评价方法的组合评价结果矩阵Y,并进行标准化处理,得出矩阵Y=(yij)n×m。

(1)

式中yj=(y1j,y2j,…,ynj)为标准化处理后第j种评价方法的评价向量。

步骤2:评价方法数组的聚类分组。借鉴针对点值的有序增量分割法的思想,采用Spearman等级相关系数作为分组的衡量标准,构建一种基于等级相关系数增量的分组方法,具体计算可参考文献[27-28]。

步骤3:确定组内重要性权重向量w。融合相似与差异特征的组合评价思想,求解各个单一评价方法的重要性权重wj,

(2)

步骤4:确定组间密度权重向量δ。设第r组方法集的密度权重为δr,则

(3)

式中λ表示信息疏密程度偏好,当λ趋近0时,表明评价者偏向于信息密度大的数据;当λ趋近1时,表明评价者偏向于信息密度小的数据;当λ=0.5时,表明评价者对信息疏密的偏好程度相同,无特殊偏好。

步骤5:计算综合评价值,

(4)

2 实证分析

2.1 数据来源及标准化处理

《中国学术期刊影响因子年报》作为期刊质量评估的权威文献之一,为全面准确地反映期刊学术影响力状况提供了参考信息。本研究数据主要来源于2015年《中国学术期刊影响因子年报(人文社会科学)》,选择该年报公布的41种图书情报类期刊数据,为了得到更加精准的评价结果,剔除部分数据缺失的期刊,最终选取了其中的30种期刊进行评价。在数据分析之前,首先对数据进行标准化处理,以解决不同量纲数据之间的可比性问题,再利用标准化后的数据进行数据处理。效益型指标数据的标准化处理公式为

(5)

成本型指标数据的标准化处理公式为

(6)

2.2 选取期刊评价指标

根据全面性、科学性、针对性、公正性、合法性和可操作性原则,以《中国学术期刊影响因子年报》提供的指标为基础,经过反复科学实验最终选取了影响力指数(X1)、复合总被引(X2)、影响因子(X3)、他引影响因子(X4)、5年影响因子(X5)、即年指标(X6)、可被引文献数量(X7)、基金论文比(X8)、引用半衰期(X9)、被引半衰期(X10)、引用期刊数量(X11)、被引期刊数量(X12)、互引指数(X13)、Web即年下载率(X14)这14个指标构成期刊评价指标体系,情报类学术期刊评价原始数据见表1,限于篇幅,本研究省略了部分原始数据。

表1 图书情报类期刊评价指标原始数据及标准化结果

2.3 5种方法的评价结果及分析

分别采用熵值法、GRA法、TOPSIS法、主成分分析法和DEMATAL法评价30种期刊,其中主成分分析法要进行KMO检验和Bartlett检验,采用SPSS软件进行数据处理,得到的KMO值为0.638,大于0.5的最低标准;Bartlett球形检验的近似卡方值为750.639,显著性水平小于0.0001,因此符合主成分分析法的条件。5种评价方法的评价结果及排序见表2。

由表2可知,部分期刊在不同的评价方法下排名差异较大,例如《图书情报知识》在主成分分析法、DEMATAL法下排序为9,而在GRA法下排序为16;《图书馆杂志》在DEMATAL法下排序为10,而在主成分分析法下排序为18;《现代情报》在TOPSIS法下排序为10,而在熵值法下排序为17;《农业图书情报学刊》在熵值法下排序为14,而在DEMATAL法下排序为21。可以发现,利用不同的单一方法评价期刊时,由于各个方法的机理不同,部分期刊的评价结果往往相差较大,因此,无法较为准确地评价期刊质量,评价结果也难以得到公认。

2.4 基于CW算子的组合评价结果及分析

(1)对5种评价方法进行分组。利用基于等级相关系数增量对二维数据进行分组,得到具体分组结果,每两种方法相应的等级相关系数矩阵ρ5×5见表3。

评价方法的分组结果为S1=(s1,s4),S2=(s2,s3),S3=(s5)。

(2)计算各个单一方法的重要性权重向量。按照(2)式的非线性规划模型,结合组合评价的特点,取α=0.8,β=0.2,利用MATLAB软件编程可得:

w=(0.204,0.186,0.247,0.212,0.151)

(7)

然后对权重进行归一化处理,得到各组的权重分别为w(1)=(0.489,0.511),w(2)=(0.427,0.573),w(3)=(1.000)。

(3)确定组间密度权重向量δ。取λ=0.7,较重视信息密度高的方法组,利用(3)式,可得到组间密度权重向量为w=(0.417,0.420,0.163)。

(4)信息集结。利用CW算子按照(4)式进行信息集结,得到最终的评价结果。具体结果见表4。

表2 5种评价方法的评价结果及排序

注:2017年《现代图书情报技术》更名为《数据分析与知识发现》。

表3 Spearman等级秩相关系数矩阵

由表4中30种图书情报类期刊的综合评价值和排序结果可知,《中国图书馆学报》排名第1,该期刊作为图书情报领域的顶级期刊,多项指标数据都高于其他期刊,排名首位毋庸置疑;排在第2~10位的期刊分别为《图书情报工作》《情报杂志》《情报科学》《图书与情报》《图书馆学研究》《情报理论与实践》《大学图书馆学报》《情报资料工作》和《图书馆论坛》,这些期刊的综合评价值相对较高,并且在图书情报领域的学术影响力较高,属于图书情报领域的权威期刊。参考2014—2015年《中国社会科学引文索引》(ChineseSocialSciencesCitationIndex,CSSCI)来源期刊目录可知,CSSCI图书情报类来源期刊都聚集在表4排名的前19位。值得注意的是,排在第13位的《现代情报》虽然属于CSSCI(扩展版)收录期刊,但是该期刊的复合总被引、基金论文比、被引期刊数量和互引指数明显高于其他部分图书情报类期刊,并且《现代情报》在2017年被收入了CSSCI(2017—2018)来源期刊目录,说明该期刊在不断地进步和成长;而排在第18位的《农业图书情报学刊》虽然属于一般刊物,但是该期刊的复合总被引、可被引文献数量、引用期刊数量和被引期刊数量的指标值都相对较大,提高了该期刊的综合评价值;《图书馆》为CSSCI来源期刊目录中的一员,但是该期刊的排名相对靠后,主要原因在于其复合总被引、可被引文献数量和引用期刊数量3个重要指标的数值相对较低,从而影响了期刊的整体排名。从整体评价结果来看,期刊综合评价情况符合实际。此外,本研究提出的基于CW算子的组合评价方法有效地解决了“多方法评价结论非一致性”的问题,在集结过程中能够起到强化关联程度相对较高、弱化关联程度相对较低的单一评价方法的作用,使所得的评价结果更加客观、合理。总体而言,该期刊综合评价方法真实有效。

表4 学术期刊综合评价值及排序

注:《现代图书情报技术》2017年更名为《数据分析与知识发现》。

3 结语

针对以往学术期刊多属性评价过程中多方法评价结论非一致性的情况,提出一种基于CW算子的学术期刊组合评价模型,该模型在结合熵值法、GRA法、TOPSIS法、主成分分析法以及DEMATAL法各自优势的基础上,充分考虑了评价方法间评价信息分布的疏密程度,更加深入挖掘了不同评价方法的评价结果信息。选取的5种评价方法的机理各不相同,各具自身的优势,例如熵值法能够客观反映指标的差异程度;GRA法能够挖掘评价数据内部规律;TOPSIS法能够充分利用原始数据,使得数据信息损失少;主成分分析法可以消除指标间的相关共线性;而DEMATAL法作为主观方法,通过专家打分来确定各指标间的相互影响关系,能够结合现实情况,给出合理的结果。通过对图书情报类30种期刊进行评价,得出该类期刊的排名情况,发现实证分析结果与实际情况吻合,进一步验证了模型的可行性与有效性,同时也为期刊的评价工作提供了一种行之有效的方法。

作者贡献声明:

张发明:提出研究方向,撰写论文,修订论文;

钟颖璐:设计研究方案,参与论文的撰写与修订;

陈美娟:分析与处理数据;

叶兆青:获取文献资料。

猜你喜欢
算子分析法排序
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
一类截断Hankel算子的复对称性
异步机传统分析法之困难及其克服
拟微分算子在Hp(ω)上的有界性
作者简介
Heisenberg群上与Schrödinger算子相关的Riesz变换在Hardy空间上的有界性
恐怖排序
节日排序
层次分析法在生态系统健康评价指标体系中的应用
基于时间重叠分析法的同车倒卡逃费探析