(河南大学经济学院,河南开封475004)
作为一种简单而实用的多指标综合评价技术,主成分综合评价方法已广泛应用于自然科学和社会科学领域。无论是对其方法本身的研究,还是利用这一方法进行实际问题研究,都始终是学术界关注的重要领域。究其原因,一方面是由于各个学科都逐渐开始重视对所研究对象的全面认知,另一方面是由主成分综合评价方法本身的特性决定的,主要表现为两个层面:一是其理论基础较为简单,计算方便(大部分运算可借助统计软件完成);二是该方法采用客观赋权,避免了主观赋权的随意性,且不需要多人参与,减少评价流程的同时降低了成本。总的来说,主成分综合评价方法大大降低了各领域开展评价工作的门槛,使得缺少数学基础的研究者也可以运用这一统计方法完成评价工作,在某种程度上促进了其他学科的发展。
但也正是操作简单等独特属性,导致该方法的合理性与科学性受到质疑。而与此形成鲜明对比的是,近年来很多复杂评价方法不断涌现。因此,有学者认为主成分综合评价方法已经过时。其实不然,综合评价结论的合理性、科学性与评价模型及计算过程的复杂程度无关;由含义与过程简明的评价方法输出可读性强的评价结果,远优于一个复杂数学过程获得的似是而非的评价结果,新奇的评价思想与方法并不一定比成熟老套的评价思想与方法更加先进科学。[1]因此,主成分综合评价方法的科学性及合理性与方法本身的难易程度无关。作为一种基本评价技术,主成分综合评价方法虽然在一些环节上存在争议,但其所具备的独特属性表明,对其开展研究与应用依然具有一定的学术价值。
在我国,厉无畏[2]较早地将主成分分析方法应用于评价研究,为该方法在综合评价中的运用提供了开创性思路。此后,邱东[3]将这类评价方法确定性地称为“多指标综合评价”,并首次对主成分综合评价的理论基础、内在机理等方面做出系统论述,奠定了主成分综合评价在评价方法中的重要地位。此后一些学者(如白雪梅和赵松山[4],陈述云和张崇莆[5],阎慈琳[6],李艳双等[7])陆续发表了一些有影响力的成果,为这一方法改进与发展做出了贡献。这一阶段的成果主要是对方法本身的一些研究,而关于实践运用的文章并不多见。
2000年,苏为华[8]对主成分综合评价进行了全方位的重新认识,提出了很多创新性思路,标志着这一方法开始走向成熟,相关研究与应用也进入到一个全新阶段,主要表现为:一方面,越来越多的学者加入到这一方法的研究中,推动了主成分综合评价方法的不断完善,如傅荣林[9]、叶双峰[10]、童其慧[11]、叶宗裕([12]、侯文[13]、林海明[14]、王学民[15]、林海明和杜子芳[16];另一方面,很多有影响力、涉及多学科的应用成果不断涌现,如王晓鹏[17]关于河流水质、潘安娥和杨青[18]关于武汉市经济社会发展、郑成功和朱祖平[19]关于企业技术创新能力、李晓燕和邓玲[20]关于城市低碳经济、郭馨梅[21]关于流通业资源利用效率、安静等[22]关于A指数对医学期刊的综合评价效能等方面的综合评价问题。
上述成果为主成分综合评价方法的研究与实践运用提供了有益思路,但仍存在进一步研究的空间,具体表现为两个方面:就方法本身而言,虽然对传统多元统计分析方法直接运用于综合评价的局限性已达成广泛共识,但对于在哪个环节加以改进以及如何改进,还存在较大分歧,缺乏一个关于该方法的统一、完整的标准使用范式;实际运用中,该方法也常常出现被误用甚至滥用的情况,这主要是由研究者对该方法理论的生疏,以及对适用性边界认知的不清晰造成的。任何一种评价方法都有其理论基础及适用性边界,然而目前对这方面的研究还不够充分、全面和系统。
在已有研究的基础上,本文的贡献主要在于以下几点:首先以综合评价的三个流程①为主线,对主成分综合评价的基本方法及不同改进思路进行全面梳理(以往文献大都就几个问题展开研究),并试图给出关于该方法的一种可行、完整的使用范式,使之更具科学性和合理性;在此基础之上,从评价目标、评价对象、指标选取和结果检验与评估四个方面,给出主成分综合评价方法的适用性边界,为不同领域研究者对该方法的应用提供参考。
关于多指标综合评价的基本步骤,邱东[23]进行了详细的比较与总结,主成分综合评价也应遵循这一步骤。本文拟以综合评价方法中三个核心步骤(无量纲化、权重确定和指标合成)为主线,对主成分综合评价的基本方法及不同改进思路进行全面梳理,并试图给出一个可行的、完整的标准使用范式。
在多指标综合评价中,无量纲化②是解决可综合性问题的第一步,直接关系到评价能否完成,[23]是指标综合的前提和基础。[24]更应引起注意的是,无量纲化方法的选择及所导致原始数据分布的变化,都会直接影响综合评价的最终结果。因此,应给予无量纲化环节足够的重视。
目前在实践中,线性无量纲化方法的运用较为普遍,如广义指数法、广义线性功效系数法和标准化法等。在综合评价无量纲化方法选取标准的研究中,王晓军[24]、张卫华和赵铭军[25]、郭亚军[26]等学者提出了很多有益思路。各种无量纲化方法本身并无优劣之分,因此在实际运用中如何选取恰当的无量纲化方法就显得尤为重要,很多学者在实际研究中常常会忽视这一问题。笔者以为,无量纲化方法的选取应由评价目标、选取的评价方法及原始数据的分布情况等多种因素共同决定。本文仅就主成分综合评价方法做粗略讨论。
传统主成分综合评价从相关系数矩阵出发,这一过程本身就包含了对原始数据无量纲化(标准化法)的步骤。标准化法在数理统计中是一种常用的同度量化方法,但它作为主成分综合评价的无量纲化方法至少存在两个问题:一方面,标准化法抹杀了原始变量离散程度上的差异,[27-28]而主成分综合评价的赋权机理就是根据数据的离散程度确定权重;另一方面,标准化法需要计算指标的均值与标准差,因此要求具有一定数量的评价对象。
因此,有学者提出主成分综合评价方法应从协方差矩阵出发,以便自主选择无量纲化方法。在此基础之上,均值法作为主成分综合评价的无量纲化方法得到了多数学者的认可。因为它在保持原始变量相对变异信息的同时,指标间相关信息的利用程度与标准化方法一致,[29]同时不改变指标间的相关关系。[27]但这一改进依然未能消除第二个问题的局限。因此这里可以认为主成分综合评价方法本身就要求有一定数量的评价对象。
通过上述分析发现,多指标综合评价无量纲化方法的选择不是随意的。例如在实际问题中,有时需要保留指标的变异信息,有时需要消除指标的变异信息。③因此,无量纲化方法的选择要充分考虑评价方法对数据的要求等多方面因素。主成分综合评价方法的赋权机理就是基于“差异驱动”,因此应选择保留指标的变异信息的无量纲化方法。基于以上信息,本文建议在主成分综合评价中优先考虑均值法作为无量纲化方法。
多指标综合评价中,权重用来测度单个指标在整个评价体系中的相对重要性,是关系到综合评价是否可信的一个核心问题,[26]也是区分不同评价方法的主要标志之一。在根据评价目标和评价对象等因素确定评价方法时,赋权机理是选择的重要依据。邱东较早对多指标综合评价中权重的分类及生成机理等方面进行系统研究。[23]此后,曾宪报[30]、郭亚军[26]等学者也对综合评价权重的构造和分类进行了细致研究。
传统主成分综合评价计算权重的核心思想是确定协方差矩阵的特征值及对应的特征向量,从赋权方法上讲属于客观赋权法的(变异)信息量权重,是一种相对评价。④在数理统计中,信息量通常用离差平方和或方差表示。在主成分综合评价中,无论最终是利用第一主成分加权,还是多个主成分加权,权重都与方差有关。而信息量权重根据指标所含分信息量多少来确定指标重要程度,它强调了单向指标在综合评价中的区分度,却忽视了每一个指标的实际重要性。[31-32]同时,权重的合理性还会受到指标间相关性的影响,即综合评价结果与指标相关性结构十分密切。⑤[28]因此,传统主成分综合评价不能确定指标的重要程度,只能在假设各指标重要性相对一致的前提下,对评价对象进行排序。
但实践中指标之间的相对重要性和相关性往往是有差别的,因此有学者认为有必要在主成分综合评价中引入“功能赋权”的思想。周忠明[31]较早提出了应该在主成分综合评价中体现主观加权的思想,使得既能主观的区分指标间重要程度,也能利用原始数据和数学模型,客观地“拉开档次”以便进行排序。
苏为华[8]对加权主成分综合评价的思想进行了较为全面的归纳,认为加权主成分综合评价大致分为两类:一类是从原始数据开始进行重要性加权,但“二次加权”的问题会导致问题复杂化,最后落实到每一个指标上的重要性权与设定初衷产生偏差;由此产生了另一类方法:在最终的主成分合成时加入重要性权。笔者认为无论是哪一种方法,其实质都期望是构建一种复合权重,使之既能反映信息量表现出的差异性,也能体现出主观赋权的思想,以修正信息量权重可能导致的偏差。
作为一种评价方法,主成分综合评价方法的一大优势就是具备客观赋权功能,权重设定不需人的参与,大大简化了评价过程,避免了主观偏差对结果稳定性的影响。但评价过程的简化不能以牺牲评价效果来实现,赋权过程不能失去人的参与。只有这样,评价结果才能更好地反映评价主体的偏好。因此在主成分赋权基础上加上主观因素是必要的,关键在于如何加入主观因素。实际上,无论是主观赋权还是信息量复权的有效性都是不确定的,把二者融合在一起从表面上看是吸取了两种赋权思想的优势,但实际结果可能在功效上相互抵消,上述第一类加权主成分综合评价方法就是很好的例子。评价方法的选择应主要由评价目标决定。如果评价目标就是排序,就可以用信息量赋权。如果发现结果明显违背常理,则可以通过人工方式进行后期修正。上述第二类加权主成分综合评价实质上就是遵循了这一思路:通过对评价结果可靠性的检验及修正来体现主观因素。
因此,笔者建议首先根据传统加权方法进行评价,然后对评价结果进行再评价。如果有明显违背常识的赋权结果,如重要指标的权重过小,则通过用第二类方法加入主观权重进行修正。
指标合成即构造评价函数。目前关于构造主成分综合评价的评价函数有两种思路。这也是目前该方法中争议最大的地方。
一种思路是只用第一主成分进行指标合成,理由如下:第一主成分是综合水平因子,[9]反映数据变动的总规模,[8]是概括变量变异程度最佳的线性函数;[31]第一主成分方差贡献率低只说明样本数据中的评价信息所占比例低,而不能表示第一主成分的评价价值低;[8]几个主成分综合原始数据信息的能力并没有第一主成分强。[27]同时,由于主成分方向上的样本方差即为相应的特征值(方差未单位化),相应的主成分得分本身已体现了方差的大小,这时再以贡献率加权似不妥当;[34]王学民[15]认为各个主成分的首要价值就在于它们合在一起拥有最大量的信息,这种信息仅是体现在数据的变异性上,把反映数据变异性信息的前几个主成分线性组合,将瓦解主成分在变异性信息上的优势,一旦离开了变异性信息,主成分也就没有价值和意义了。
另一种思路是根据相应的标准选取多个主成分构造综合评价函数,理由如下:第一主成分的方差贡献率常常不到80%,损失的方差信息太多造成代表性不足;[23]只取第一主成分与简单算术加权平均结果差异不大,反而显得主成分方法繁琐;[34]多数情况下,多个主成分包括所有指标的共性与差异性的结合,评价效果比只有指标共性的第一主成分模型要好;[9]利用了主成分分析的核心功能,即每一个主成分都变成了相互独立的,消除了指标间相关对评价对象的重复信息。这是主成分分析进行多指标综合评价的最大特点,也是最主要优点。[23]如果采用第二种思路,还涉及两个问题。第一是关于选取主成分的标准,也存在不同的看法。通常做法是按方差贡献率大小,依次选取累计方差贡献率大于85%或80%的若干主成分。而傅荣林[9]认为主成分的选取不一定按贡献率的大小顺序而定,也不一定要求总贡献率一定达85%以上,并提出了三个条件:满足代表型、独立性和综合性。第二是符号的问题,符号的正负会直接影响到排序结果。傅荣林[9]认为正负号选取可由决策者根据实际情况的偏好而定。
笔者建议采用第一主成分作为主成分综合评价的合成函数。多个主成分包含了二次加权的问题,其权重的含义无法解释。如果第一主成分贡献度不够的问题,说明样本数据不适合使用主成分综合评价方法。毕竟,没有一种评价方法是万能、通用的,在实际运用中都存在局限性。问题的关键在于选取方法的优势是否得到充分发挥。因此对评价方法及结果的再评价也是综合评价工作的重要一环。
综上所述,对于将多元统计的主成分分析方法直接用于多指标综合评价的不合理性,目前已经达成共识,争议在于如何改进。通过文献梳理,笔者给出相应建议:在无量纲化环节优先考虑利用均值法,在权重确定环节加入主观因素,在指标合成环节适宜采取第一主成分作为合成函数。
正如上文所述,任何一种评价方法都有其使用范围,即存在一定的适用性边界。对各种综合评价方法适用性边界的研究,会随着将来评价方法的增多而越发重要。针对某一实际问题,到底采取哪种评价方法更为合适,几乎是所有评价者首先要解决的问题。但目前这方面的研究并不充分。很多文献在选择评价方法时,并没有给出相应的选择依据。
本节从评价目标、评价对象、指标选取和结果检验与评估四个方面,给出主成分综合评价方法的适用性边界。
多指标综合评价的评价目标是一个多重概念。本文仅就评价目的、评价次数和使用阶段三个角度展开分析。
3.1.1 评价目的
评价目的主要指主成分综合评价期望达到得出的最终结果,苏为华[32]根据最终结果将综合评价分为单纯性排序评价、价值排序评价与价值分类评价。评价目的在很大程度上决定评价方法的选取。而主成分综合评价是一种单纯性排序评价(相对评价),其主要目标是将评价对象尽最大限度地区分开来以便进行排序。因此,通过评价目的得出的主成分综合评价适用性边界为:主成分综合评价只能用于评价目的为单纯性排序的任务;评价结果只具有排序意义,不能用于其他诸如回归分析等数据分析领域。
3.1.2 评价次数
评价次数是指整个评价过程需要评价的次数,主要分为一次性评价和多次(纵向连续性或横向重复性)评价。主成分综合评价只适用于对多个评价对象进行一次性评价。因为主成分综合评价的结果源于评价对象在各个指标的取值,评价对象或其指标值的变化会使其平均水平和离差程度发生变化,从而导致评价结果发生变化。因此,主成分综合评价只能用于一次性评价,不同评价对象得出的评价结果之间不可比。
3.1.3 评价阶段
评价阶段主要指主成分综合评价在被用于组合评价或分层评价中所处的阶段。但正如上文所述,主成分综合评价的结果只具有排序意义,如果将该方法用于指标层,就意味着将排序序号作为实际测度结果用于更高层次的评价,后续的高层汇总结果的可靠性有赖于汇总次数及汇总评价方法。
因此,通过评价阶段得出的主成分综合评价适用性边界为:在组合评价或分层评价中慎用主成分综合评价;如必须使用,最好在主成分综合评价结果的基础上仅做一次汇总,且汇总方法中权重的设定不应使用基于“差异驱动”的赋权法。
本文从评价对象的数据形式与个体数量两个方面探讨主成分综合评价方法的适用性边界。
3.2.1 数据形式
首先要确定评价对象所承载的数据是截面数据、时序数据还是面板数据。传统主成分综合评价方法只适合截面数据。因此,主成分综合评价不适合用于动态分析,而是一种静态综合评价方法。
3.2.2 个体数量
主成分综合评价是一种多对象的综合评价方法,具有多个评价对象是利用主成分综合评价方法的基本前提之一。在实践中,评价对象的数量直接关系到评价结果的可靠性。评价对象的数量达到多少才合适,是不是越多越好等问题,目前并没有统一的认识。[29]但是有一点可以确定,即评价对象不能太少,原因至少有以下三点:各个指标的数据应尽可能满足正态分布(这是主成分分析方法的前提假设);无量纲化方法(无论是标准化法还是均值法)的需要(前文已论述原因);主成分综合评价赋权机理(信息量权需要一定数量的样本才能使用)的要求。
结合主成分分析自身特点及综合评价方法的需求,笔者给出关于评价对象数量的两个参考标准:一是评价对象的数量最好在30个以上,最少不能少于10个;二是评价对象与选取指标间的比例最好在1比3以上。如果实际问题无法同时满足上述两个标准,则说明主成分综合评价不适合于该问题的研究。
为了放宽第二个标准,提高主成分综合评价的适用性,本文建议参考苏为华[28]提出的思路⑥:把整个系统分为若干子系统,在每个子系统中分别进行主成分综合评价(每个子系统中的指标数量远远小于整个系统的指标数量),然后将不同子系统的主成分按照重要性权重进行汇总。这样就有效解决了“1比3”的比例问题。
综合评价指标的选取要求尽量兼顾全面和独立。但在主成分综合评价中,指标间的相关性是该方法使用的前提。实践中很多学者也倾向于选用具有相关性的指标,以达到较好的评价效果。但这种做法强化了指标之间的重复信息,会造成评价结果的失真。[34]这成为主成分综合评价在实际运用中一对无法协调的矛盾。因此,在指标选取上,除了要考虑指标本身代表的实际含义,还要对各指标的相关性进行检验。如果出现多个相关系数很高的指标,要考虑替换等方法。
任何一个评价项目完成后都需要对评价结果进行检验与评估。苏为华[8]对此进行了归纳和总结。就主成分综合评价方法而言,除了通用的检验方法,还需注意以下几点:检验第一主成分的方差贡献率,如果过低则说明评价结果不可靠(不适合使用主成分综合评价方法);观察各个指标的权重是否符合基本常识,是否会出现重要指标赋权过低的情况,必要时可以利用主观加权进行修正。
作为一种基本的多指标综合评价方法,主成分综合评价一直以来都受到学术界的重视。文中众多学者对该方法提出的改进思路便是佐证。这些改进也的确在很大程度上提高了这一方法的科学性和适用性。本文在已有成果的基础上,力图归纳出一个关于主成分综合评价方法的使用范式,并界定其适用性边界。但正如苏为华教授所言,不存在“最好的评价方法”,只存在“可行的评价方法”。在解决实际问题中,还需要具体问题具体分析。
与此同时,随着综合评价技术的整体发展,主成分综合评价方法也在不断扩展。这些扩展使得这一方法在适用性更加广泛的同时,合理性也可能进一步得到提高。因此,关于主成分综合评价方法的适用性边界研究也应具有持续性。
注 释:
① 综合评价是一项系统工程,本文仅从三个主要的技术流程角度展开论述,并未涉及理论框架、指标选取及结果检验等方面的问题。
② 与无量纲化相关的还有指标的同趋势化问题。指标按属性可以分为正指标、逆指标和适度指标。适度指标需要在无量纲化之前做同趋势化处理。对于逆指标,无量纲化与同趋势化可同时进行,有时必须先同趋势化再无量纲化,这由选取的无量纲化方法决定。
③ 例如,叶宗裕认为当综合评价的指标值是主观分数时,则用标准化方法更好。
④ 综合评价有绝对与相对之分,而相对评价的目标是将评价对象尽最大限度地区分开来(苏为华),已达到排序等目的。
⑤ 叶宗裕认为权重分配存在一个明显的集结倾向,即权重向相关性较高的指标倾斜,其权重明显大于其它指标的权重。
⑥ 这一思路的初衷可能并非如此,但却为评价数对象与指标比例不足问题提供了一个解决途径。
[1] 苏为华.我国多指标综合评价技术与应用研究的回顾与认识[J].统计研究,2012(8):98-107.
[2] 厉无畏.经济效果指标的主成分分析[J].数理统计与管理,1983(5):1-6.
[3] 邱东.多指标综合评价方法的系统分析[M].北京:中国统计出版社,1991:120-178.
[4] 白雪梅,赵松山.对主成分分析综合评价方法若干问题的探讨[J].统计研究,1995(6):47-51.
[5] 陈述云,张崇莆.对多指标综合评价的主成分分析方法的改进[J].统计研究,1995(1):35-39.
[6] 阎慈琳.关于用主成分分析做综合评价的若干问题[J].数理统计与管理,1998(2):22-25.
[7] 李艳双,曾珍香,张闽,等.主成分分析法在多指标综合评价方法中的应用[J].河北工业大学学报,1999(1):94-97.
[8] 苏为华.多指标综合评价理论与方法问题研究[D].厦门:厦门大学,2000.
[9] 傅荣林.主成分综合评价模型的探讨[J].系统工程理论与实践,2001(11):68-74.
[10]叶双峰.关于主成分分析做综合评价的改进[J].数据统计与管理,2001(2):52-55.
[11]童其慧.主成分分析方法在指标综合评价中的应用[J].北京理工大学学报:社会科学版,2012(1):59-61.
[12]叶宗裕.关于多指标综合评价中指标正向化和无量纲化方法的选择[J].浙江统计,2003(4):24-25.
[13]侯文.对应用主成分法进行综合评价的探讨[J].数理统计与管理,2006(3):211-214.
[14]林海明.对主成分分析法运用中十个问题的解析[J].统计与决策,2007(8):16-18.
[15]王学民.对主成分分析中综合得分方法的质疑[J].统计与决策,2007(4):31-32.
[16]林海明,杜子芳.主成分分析综合评价应该注意的问题[J].统计研究,2013(8):25-31.
[17]王晓鹏.河流水质综合评价之主成分分析方法[J].数理统计与管理,2001(4):49-52.
[18]潘安娥,杨青.基于主成分分析的武汉市经济社会发展综合评价研究 [J].中国软科学,2005(7):118-121.
[19]郑成功,朱祖平.企业技术创新能力综合评价体系及实证[J].科技管理研究,2007(4):75-77.
[20]李晓燕,邓玲.城市低碳经济综合评价探索——以直辖市为例[J].现代经济探讨,2010(2):82-85.
[21]郭馨梅.基于主成分分析法的北京流通业资源利用效率综合评价[J].北京工商大学学报:社会科学版,2012(11):19-24.
[22]安静,夏旭,李海燕.基于主成分分析研究A指数对医学期刊的综合评价效能[J].科技管理研究,2014(11):62-64.
[23]邱东.多指标综合评价:方法论反思[J].经济统计学:季刊,2013(1):39-47.
[24]王晓军.多指标综合评价中指标无量纲化方法的探讨[J].人口研究,1993(4):47-51.
[25]张卫华,赵铭军.指标无量纲化方法对综合评价结果可靠性的影响及其实证分析[J].统计与信息论坛,2005(5):33-36.
[26]郭亚军.综合评价理论、方法及应用[M].北京:科学出版社,2007.
[27]孟生旺.用主成分分析法进行多指标综合评价应注意的问题[J].统计研究,1992(4):67-68.
[28]苏为华.综合评价学[M].北京:中国市场出版社,2005.
[29]孙刘平,钱吴永.基于主成分分析法的综合评价方法的改进[J].数学的实践与认识,2009(9):15-20.
[30]曾宪报.统计权数论[D].大连:东北财经大学,1998.
[31]周忠明.加权主成分分析在多指标综合评价中的运用[J].数理统计与管理,1985(5):16-21.
[32]苏为华.多指标综合评价理论与方法研究[M].北京:中国物价出版社,2001.
[33]叶宗裕.主成分综合评价方法存在的问题及改进[J].统计与信息论坛,2004(3):29-34.
[34]李靖华,郭耀煌.主成分分析用于多指标评价的方法研究——主成分评价[J].管理工程学报,2002(1):39-43.