李晴 陈鹏宇
摘 要:为了研究指标无量纲化方法对熵权法评价结果的影响,以期刊学术影响力评价为例,采用熵权TOPSIS法,对比分析了标准化和均值化两种方法对评价结果的影响。结果显示,两种方法所得熵权和评价结果均存在一定差异。其中,均值化方法可以保持原始数据的差异信息,评价结果更符合实际,更利于有效区分评价对象。标准化方法改变了原始数据的差异信息,有可能导致评价结果偏离实际。因此,该文建议在使用熵权法时,采用均值化方法处理原始数据。
关键词:无量纲化方法 熵权 期刊 学术影响力
中图分类号:G304 文献标识码:A 文章编号:1672-3791(2019)03(a)-0184-03
在多指标综合评价中,指标权重的确定是一项重要的工作。权重的确定方法很多,一般可分为主观赋权法、客观赋权法和组合赋权法3类。熵权法是目前常用的一种客观赋权法,其根据样本数据信息确定指标权重,避免了主观性倾向的影响。熵权法以信息熵评价某项指标在不同评价对象中的差异程度[1],若某项指标的数据变幅很大,说明该指标提供的信息量大,相应的信息熵小,赋予的权重大;反之亦然。若某项指标的数据全部相等,说明该指标对评价对象无法提供区别信息,相应的信息熵最大,权重为零。
在多指标综合评价中,评价指标的量纲往往不同,在计算熵权前,需要对指标进行无量纲化处理。研究发现无量纲化方法对数据的差异信息存在影响[2-3]。标准化会消除各指标变异程度上的差异,均值化则可以保留各指標变异程度的信息[2]。由于熵权与数据的差异信息密切关系,因此有必要分析指标无量纲化方法对熵权的影响,以选择合适的方法。为此,该文以期刊学术影响力评价为例,结合TOPSIS法,研究标准化和均值化两种指标无量纲化方法对熵权以及评价结果的影响,并提出相应的建议。
1 研究方法
1.1 熵权TOPSIS法
熵权法常常与TOPSIS法结合用于评价与决策[4-5]。该文同样采用熵权TOPSIS法作为评价方法。当然,这里TOPSIS法仅作为一个算例,也可以与其他评价方法相结合。熵权TOPSIS法的基本步骤如下。
(1)假设有m个评价对象;n个评价指标,建立评价指标矩阵R={rij},其中rij为第i个评价对象的第j个评价指标值。
(2)对评价指标矩阵R进行无量纲化处理,将其转化为无量纲矩阵R′={r′ij},其中rij为第i个评价对象的第j个评价指标的无量纲化值。
(3) 计算评价指标的信息熵。计算公式如下:
1.3 变异系数
为了对比标准化和均值化两种方法对熵权以及评价结果的影响,需要对数据的差异程度进行衡量。该文采用变异系数作为衡量数据差异程度的参考依据,计算公式如下:
标准差虽然能衡量数据的离散程度,但是如果数据量纲不同的情况下,不适合进行比较。若除以平均值,则可以消除数量级和量纲的影响。
2 实证研究——以期刊学术影响力评价为例
期刊评价是一项复杂的工作,一般需要考虑多个指标才能尽可能全面评价期刊质量的优劣。期刊的引用情况反映了该期刊在学术交流中的地位和作用,是期刊学术影响力的重要体现。选择与期刊引用相关的计量指标,包括总被引频次、影响因子、即年指标、他引率、引用刊数、学科影响指标、学科扩散指标作为评价指标[6]。以7种管理科学期刊为例,数据来源于《2012年版中国科技期刊引证报告》(扩刊版),具体如表1所示。
各指标均为正向指标,分别对表1中的数据进行标准化和均值化处理,计算处理前后各指标的变异系数,如表2所示。从表2中可以看出,标准化处理后,各指标的变异系数均发生了改变,都表现为增大。这说明标准化处理放大了数据的差异信息,以他引率指标为例,未处理前的变异系数仅为0.013,从表1中也可以看出,各期刊的他引率比较接近,在0.93~0.98之间,说明数据差异程度较小。但是标准化处理后,变异系数增大到了0.564,数据的差异信息被放大。均值化处理后,各指标的变异系数与处理前保持一致,说明均值化不会改变数据的差异信息。
按熵权的计算步骤,计算各指标的信息熵和熵权如表3所示。对比标准化和均值化的计算结果可知,标准化后各指标的信息熵值均低于均值化的结果。这与表2中标准化对数据差异信息的放大是对应的。差异信息越强,信息熵值越小。相应的,熵权计算结果也存在较大差异。以他引率指标为例,标准化对应的信息熵为0.89757,熵权为0.06223,均值化对应的信息熵几乎为1,熵权几乎为0,这与表2中的变异系数也是对应的。均值化对应的变异系数为0.013,接近于0,所以对应的信息熵值接近于1。标准化对应的变异系数为0.564,所以对应的信息熵值更小。
为了进一步对比两种方法的合理性,还需对比最终的评价结果。按熵权TOPSIS法的计算步骤,计算各期刊的综合评价值及排序,结果如表4所示。从表4中可以看出,各期刊综合评价值存在一定差异,但排序基本一致,仅数理统计与管理和研究与发展管理两种期刊的排序不一致。
根据表1的数据对比两种期刊,数理统计与管理有4个指标值相对更大,其中引用刊数和学科扩散指标大0.73倍,即年指标大0.41倍,总被引频次稍大。其余3个指标相对更小,其中影响因子小0.35倍,另外2个指标稍小。单从这些数据来看,数理统计与管理的排序应大于研究与发展管理,即均值化对应的排序结果更符合实际。
客观赋权的一个重要目的在于有效区分评价对象[7],以利于排序和决策。因此,计算表4中综合评价值的标准差、平均值和变异系数如表5所示。从表5中可以看出,均值化方法对应的标准差和变异系数均大于标准化方法,说明均值化处理后,综合评价值的差异程度更利于有效区分评价对象。
综上所述,均值化方法可以保持原始数据的差异信息,评价结果更符合实际,更利于有效区分评价对象。标准化方法改变了原始数据的差异信息,有可能导致评价结果偏离实际。因此,该文建议采用均值化方法处理原始数据。
3 结论
为了研究指标无量纲化方法对熵权法评价结果的影响,该文以期刊学术影响力评价为例,采用熵权TOPSIS法,对比分析了标准化和均值化两种方法对评价结果的影响。所得结论如下。
(1)均值化方法可以保持原始数据的差异信息,而标准化方法改變了原始数据的差异信息,这是导致两种方法熵权计算结果存在差异的主要原因。
(2)由于熵权计算结果不一致,均值化和标准化方法的评价结果存在差异,以均值化方法的评价结果更符合实际。标准化方法由于改变了原始数据的差异信息,有可能导致评价结果偏离实际。
(3)该文实例中,均值化方法对应的标准差和变异系数均大于标准化方法,说明均值化方法更利于有效区分评价对象。建议在使用熵权法时,采用均值化方法处理原始数据。
参考文献
[1] 俞立平,武夷山.学术期刊客观赋权评价新方法——指标难度赋权法[J].现代图书情报技术,2011(4):64-70.
[2] 叶宗裕.关于多指标综合评价中指标正向化和无量纲化方法的选择[J].浙江统计,2003(4):24-25.
[3] 张卫华,赵铭军.指标无量纲化方法对综合评价结果可靠性的影响及其实证分析[J].统计与信息论坛,2005,20(3):33-36.
[4] 李艳,张巧良,王正军.熵权TOPSIS法在垃圾渗滤液处理方案优选中的应用[J].统计与决策,2017(10):85-87.
[5] 李煜华,刘立佳,胡瑶瑛.基于熵值TOPSIS模型的Kindle创意产品优化评价[J].统计与决策,2016(20):183-185.
[6] 程慧平.基于主成分分析与熵权TOPSIS方法的期刊学术影响力研究[J].情报科学,2015,33(12):77-82.
[7] 李刚,李建平,孙晓蕾,等.主客观权重的组合方式及其合理性研究[J].管理评论,2017,29(12):17-26,61.