吴旭东
摘 要:企业在发生破产之前,它的很多财务指标会跟财务良好的企业之间有一定的区别。文章运用多元统计分析中的判别分析,对21家破产企业和25家财务状况良好的企业的几项不同的指标做了分析,用SPSS构造了费希尔线性判别函数,并运用此函数判定企业的财务状况是否良好。
关键词:判别分析;破产企业;财务状况
1 判别分析原理
在生产、科研和日常生活中,经常遇到需要判别的问题。判别分析本质上具有探索性。作为一种分割方法,它通常在因果关系不甚明了的情况下被一次性地用来对所观察到的差别进行调查。例如,在地质勘探中,我们在某地区采集到某种矿物标本,需要判定它是哪种矿物;又如,在医院对一名患者作各种化验检查、获得有关指标和数据、要诊断患者得的是哪一种疾病,等等,这些都属于判别问题。
判别分析是应用性很强的一种多元统计方法,已渗透到各个领域,但不管哪个领域,判别分析问题都可以这样描述:设有k个m维总体G1,G2, …,GK,其分布特征已知(如已知分布函数,或知道来自各个总体的训练样本)。对给定的新样本,我们要判断它来自哪个总体。
常用的判别方法主要有下列几种:
(1)最大似然法
用于变量均为分类变量的情况。该方法建立在独立事件概率乘法原理的基础上,根据训练样本信息求得因变量各种组合情况下样品被分为任何一类的概率。当新样品进入时,则计算它被分到每一类中的条件概率(似然值),概率最大的那一类就是它最终评定的归类。
(2)距离判别
它的方法是由训练样本得出每个分类的重心(中心)坐标,然后对新样品求出它们离各个类别重心的距离远近,从而归入离得最近的分类。最常见的距离是马氏距离,偶尔也采用欧氏距离。
距离判别的特点是直观简单,适合于对因变量均为连续的情况进行分类,且它对变量的分布类型无严格要求。
(3)Fisher判别
亦称典型判别,该方法的基本方法是投影,即将原来在R维空间的因变量组合投影到维度较低的D维空间去,然后在D维空间中再进行分类。投影的原则是使得每一类内的方差尽可能小,而不同类别之间的投影的方差尽可能大。
Fisher判别法的优势在于对分布、方差等都没有什么限制,应用范围较广。另外,用该判别方法建立的判别方程可以直接用手工计算的方法进行新观察对象的判别,这在许多时候是方便的。
(4)Bayes判别
许多时候对各类别的比例分布情况有一定的先验信息,比如说客户对投递广告的反应绝大多数都是无回音,如果进行判别,自然也应当是无回音居多。Bayes判别就可以利用这种先验信息,它的基本方法是认为所有P个类别都是空间中互斥的子体,每个观察都是空间中的一个点。在考虑先验概率的前提下,利用Bayes公式按照一定的准则建构一个判别函数,分别计算该样品落入各个子体的概率,所有概率中最大的一类就是被认为是该样品所属的类别。
Bayes判别的强项是进行多类判别,但是它要求母体呈多元正态分布。
在下面的应用中,主要使用SPSS软件分析输出以Fisher判别为主给出的结果。在指定选项后,也可以给出Bayes判别式的结果。
文章中主要运用Fisher判别。Fisher的想法是将多元观测值x变换成多元观测值y,使得总体?仔1和?仔2导出的y尽可能地分离开。Fisher建议用x的线性组合来建立y,因为它们是x的非常简单的函数,易于掌握。
Fisher的线性判别函数是在假定两个总体有相同协方差的条件下得到的。因此,毫不奇怪Fisher方法与最小错分代价法则这种特殊情况相对应。Fisher分类法则等价于在相同先验概率和相同错分代价下的最小ECM法则。
为具有均值向量?滋i和协方差矩阵?撞i的正态密度函数的情形。若进一步假定c(i|i)=0,c(k|i)=1,k≠i(或等价的,所有错分代价相同),则上述最小ECM分类法则变成:
则将x分配到?仔k。
在上式中,常数(p/2)ln(2?仔)可以略去,因为对所有的总体都相同,因此我们将第i个总体的二次判别得分定义为
实践中?滋i和?撞i兼属未知,但常可获得一组已经正确分类的训练样本,因此可以用样本均值xi来估计总体均值?滋i,以及用样本协方差矩阵Si来估计总体协方差矩阵?撞i。此时二次于是基于样本的分类法则如下:
估计的最小TPM法则(对?撞i不同的多个正态总体)
若二次判别得分
则将x分配到?仔k。
若先验概率未知,通常的做法是令 。
2 多元判别分析法
2.1 判别分析的基本步骤
应用SPSS进行判别分析模型的构建,其过程为:对于分为k组的研究对象,可建立(k-1)个典型判别函数(原始自变量的线性组合),和k个Fisher判别函数,然后将各样本的自变量回代到判别函数中,计算器判别分数或属于各组的概率,根据数值的大小,判别样品所属组别,对样品的原始组别给出错分率。具体步骤如下:
(1)选择自变量和组变量。
(2)计算各组单变量描述统计量,包括组内均值、组内标准差、总均值、总标准差、各组协方差矩阵、组间相关矩阵、并对组间均值相等和协方差矩阵相等的零假设进行检验。
(3)推导判别系数,给出标准或未标準化的典型判别函数系数,并对函数显著性进行检验。
(4)建立Fisher线性判别模型。
(5)按照一定的规则进行分组。
(6)进行样本回判分析,计算错分率。
(7)输出结果。
(8)结合实际情况进行分析。
2.2 建立模型的数据假定和原始数据的选择。
对破产的企业收集它们在破产两年的年度财务数据,对财务良好的企业也收集同一时期的数据,数据涉及四个变量,X1=CF/TD(现金流量/总债务),X2=NI/TA(净收益/总资产),X3=CA/CL(流动资产/流动债务),以及X4=CA/NS(流动资产/净销售额),数据列于表1所示。
表2是独立变量的全部和各组的均值和标准离差。
表3给出了合并类内协方差矩阵和相关矩阵,阵中个元素是各类协方差或相关阵中对应元素的均值。从表中可以看出,X1=CF/TD(现金流量/总债务)和X2=NI/TA(净收益/总资产)的相关系数值(0.758)较大,说明这两个变量有较好的相关性,如果需要剔除这四个变量中的某个变量,通常采取剔除X1=CF/TD(现金流量/总债务)和X2=NI/TA(净收益/总资产)这两个变量中的一个比较好。
表4给出了各类的协方差矩阵和总协方差矩阵。
表5给出了Fisher线性判别方程的系数。利用表中的数据可直接写出判别方程,有几类就有几个分类方程。将某个样品代人方程计算其在各类别上的得分,并根据分值多少判断其所属类别,比较不同类的判别分值,哪个大就属于哪一类。
破产企业的判别函数为:
未破产企业的判别函数为:
例如,第一行的原始数据为(-0.45,-0.41,1.09,0.45)代入上述式中,得
y1=7.40191,y2=2.00561,y1的数值比y2大,所以这个企业属于破产企业。
表6给出了判别分析结果的统计评价。从表中可以看出,它给出了全部样品建立判别方程的正确分类的样品数,错分样品数和错判率;交叉验证建立判别方程的正确分类的样品数,错分样品数和错分率。全部样品建立判别方程的正确分类结果为破产企业的错判率为9.5%,财务状况良好的企业错判率为8%;交叉验证建立判别方程的正确分类结果为破产企业的错判率为14.3%,财务状况良好的企业错判率为16%。如果对判定的结果不满意的话,可以进一步收集数据,或者引入其他的财务指标进行分析。会提高判定的准确性。
参考文献
[1]RichardoA.Johnson、DeanW.Wichern.实用多元统计分析[M].陆璇,叶俊译.北京:清华大学出版社,2008,11.
[2]张润楚.多元统计分析[M].北京:科学出版社,2006,9.
[3]章红波,陈红艳.实用数据统计分析及SPSS12.0应用[M].北京:人民邮电出版社,2006,2.
[4]林杰斌等.统计建模与应用实务[M].北京:中国铁道出版社,2006,
2.
[5]刘晶等.基于多元判别分析的财务预警系统[M].北京:中国管理信息化,2010,2.
[6]衷克定.统计数据分析与实践[M].北京:高等教育出版社,2005,4.
[7]周皓.统计基础和SPSS入门与提高[M].北京:清华大学出版社,2005,10.
[8]何少华,文竹青,等.实验设计与数据处理[M].北京:国防科技大学出版社,2002,10.
[9]高惠璇.應用多元统计分析[M].北京:北京大学出版社,2005,1.
[10]林震岩.多变量分析-SPSS的操作与应用[M].北京:北京大学出版社,2007,8.