张祥国 丁瑞 蒋幸幸
摘 要:为了全面、系统地分析问题,必须考虑众多影响因素,这也常对进行多元评价的相应背景。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。多元评价模型常用方法有层次分析法,但该方法定量数据较少,定性成分多,不易令人信服。本文利用主成分分析与熵权法的结合,对多元评价模型进行新的探究,使多元评价模型建立的更加精准。
关键词:多元评价模型 结合 主成分分析 熵值法
一、多元评价模型中评价指标体系框架的构建与评价指标的确定
对于一个待评价对象的评价指标体系由反应该对象内涵的指标集及其标准和量化符号构成。“评价对象”与“指标”是相对而言的。在评价体系中,指标的级数越往下,指标越具体。假设一个待评价对象已经建立好了两级的评价指标。第一层评价指标是直接作用于评价对象的,评价指标A,B,C,D等。第二级评价指标是作用于第一层评价指标,有a,b,c,d,e,f,g等,共N个样本。为了对多元评价模型更加精准的建立,我们没有采用普通的分层模式,而是采用了第二层中的每一个指标与第一层中的每一个指标都有关系的模式。
二、利用主成分分析优化指标
1.原始度量数据的标准化收集
p维随机向量,N个样本,构建样本阵列并归一化到下面的样本元素:
(1)
其中,
(2)
得到归一化阵列Z。
由归一化阵列Z得到的相关系数矩阵:
(3)
2.确定主成分,样本相关矩阵R特征方程的求解:
(4)
获取特征根P,确定主成分:
根据 (5)
标准化的指标变量被转换成主成分:
(6)
称为第一主成分,称为第二主成分,…,称为第p主成分。
P指标是从第一层指标中選出,从而利用这一P指标来取代第一层指标,将多指标转化为少数几个综合指标,直接用于评价对象。
二、利用熵值法客观计算指标权重并综合评价
熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。根据熵的特性,我们可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大,通过分析P指标所具有的数据的出相应的客观的加权。然后通过每个指标对应的权重,评估出该评价对象的综合得分。
1.权重计算
的值(第j个指标下的第i年的指标的比率)
(7)
第j个指标的熵
(8)
计算权重
(9)
(二)
各评估年度的综合评价值
(10)
是在第i年的P指标的综合值,即第i年该评价对象的综合得分。
三、该评价方法的优势
采用主成分分析法可以做到把多数指标转变成几个综合指标,消除评估指标之间的相关影响。因为实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。变量太多会增加计算量和增加分析问题的复杂性。使用主成分分析进行定量分析的过程中,可以从影响带评价对象的很多个指标中,剔除那些影响较小的指标,把保留的指标转变成几个综合指标。既使指标数量大大减少,又不影响待评对象的综合评价。
在采用主成分分析确定综合指标的基础上,又使用熵值法客观计算指标权重并进行综合评价。熵值法基于"差异驱动"原理,突出局部差异,由各个样本的实际数据求得最优权重,反映了指标信息熵值的效用价值,避免了人为的影响因素,因而给出的指标权重更具有客观性,从而具有较高的再现性和可信度,且鲁棒性较好。
基于主成分分析与熵值法结合的多元评价模型的研究,解决了多元评价模型常用的层次分析法定量数据较少定性成分多,不易令人信服的缺点。
参考文献
[1]杜栋,庞庆华,吴炎.现代综合评价方法与案例精选[M].北京:清华大学出版社,2008.
[2]费浦生等.数学建模及其基础知识详解[M].武昌.武汉大学出版社,2007.
作者简介
张祥国(1996—),男,汉族,山东郓城人,本科生,研究方向:电力系统及其自动化。