杨潇
【摘 要】 文章以中国电力上市公司为研究对象,运用主成分分析方法对预警指标变量进行约简,进而将随机欠抽样不均衡样本处理方法与传统的Logit回归模型相结合,构建了改进的Logit回归模型,即RU-Logit模型,并与其余预警模型进行了性能对比研究。实证结果表明,RU-Logit预警模型不仅具有最高的预测精度,而且具有最为稳定的预测性能。
【关键词】 电力上市公司; 财务危机预警; PCA; RU; Logit
【中图分类号】 F272 【文献标识码】 A 【文章编号】 1004-5937(2017)02-0095-04
一、引言
财务危机一直是企业、投资者乃至政府管理部门重点关注的危机之一。因为企业一旦发生财务危机,不仅会威胁到企业自身的生存与发展,而且会使投资者蒙受损失,甚至对国民经济的稳定发展产生较大影响。因此,只有对企业的财务危机进行预警研究,才能提前识别风险,从而引导企业、投资者和政府管理部门采取防范措施,有效地控制风险,最终降低甚至消除财务危机的影响[ 1 ]。
目前,研究学者主要采用单变量模型、判别分析(Discriminate Analysis,DA)模型、Logit回归模型以及人工神经网络(Artificial Neural Network,ANN)模型等方法进行财务危机预警研究[ 2-5 ]。单变量模型仅依据单个指标进行财务危机判断,但众所周知,诱发财务危机的因素通常不止一个,而是由众多因素共同作用,因此,单变量模型并不适用于企业的财务危机预警;判别分析模型尽管能够克服单变量模型的缺陷,但解释变量服从正态分布的要求过于苛刻,现实中的样本变量很难满足;人工神经网络模型具有智能识别财务危机的功能,也被大量学者运用于财务危机的预警研究中,但却存在运算复杂、对小样本预测精度低以及无法进行模型内部结构分析等诸多缺陷。与上述预警模型相比,Logit回归模型构造简单,能够对小样本进行准确预测,且无严格的前提假设条件,因而被众多学者运用于财务危机预警研究中并取得了良好的预测效果[ 6-8 ]。基于此,本文将运用Logit回归模型对企业财务危机进行预警研究。
值得注意的是,随着国际金融危机的不断扩散与蔓延,经济环境日趋复杂化,从而导致企业爆发财务危机的因子指标变量增加且日益复杂化。如果直接基于众多复杂的因子指标变量建立Logit回归模型进行预警研究,很可能导致预警模型出现“维数灾难”(Curse of Dimensionality),从而削弱模型的预警性能。而主成分分析方法(Principal Components Analysis,PCA)能够对众多复杂的指标变量进行快速降维处理,在克服“维数灾难”的同时,保证模型的预警效果[ 9 ]。因此,本文首先引入PCA方法对财务危机指标变量进行降维处理,其次运用Logit回归模型进行预警研究。
不可忽视的是,就实际的企业样本而言,往往发生财务危机的企业样本较未发生财务危机的企业样本更少,由少数和多数两类样本所构成的样本集被称为不均衡样本集。当对不均衡样本集进行Logit回归建模时,很容易使判别规则倾向于将更多的待判别样本预测为多数类样本,即更容易将发生财务危机的样本预测为未发生财务危机的样本,这将导致企业疏于采取相应的防范措施来应对即将发生的财务危机,投资者则将资金错误地投资于即将发生财务危机的企业,政府管理部门也将错误地认为企业未来的财务状况良好而无所作为,最终使企业经营遭遇困境、投资者蒙受资产损失、国民经济遭受冲击[ 10 ]。因此,如何对不均衡样本集进行处理,从而使构建的Logit回归模型具有准确的预测效果,是学术与实务界需要解决的重要问题。值得庆幸的是,针对不均衡样本集,已有学者提出运用随机欠抽样(Random Under-Sampling,RU)方法对该样本集中的多数类样本进行删除,进而基于新构建的均衡样本集进行建模分析[ 11 ]。基于此,本文将引入RU方法对企业的不均衡样本集进行均衡处理,进而运用Logit回归模型进行预警研究。
此外,电力作为重要的基础性能源之一,不仅与居民的日常生活息息相关,而且对于国民经济的发展具有举足轻重的作用,因而对电力企业的财务危机进行预警研究,有效地控制和防范财务危机,于国于民都具有重要的现实意义。
基于上述分析,本文以中国电力上市公司(指与电力生产与电力供应相关的上市公司)为研究对象,运用PCA方法对预警指标变量进行降维,进而引入RU不均衡样本处理方法与传统的Logit回归模型相结合,构建出改进的Logit回归模型,即RU-Logit模型对训练样本集进行建模,并基于测试样本集运用交叉验证与统计检验方法对构建的模型进行性能测试与评价,从而为电力企业、投资者与政府管理部门进行企业财务危机的防范与控制提供良好的借鉴。
迄今为止,已有学者运用Logit回归模型对企业财务危机预警进行了卓有成效的研究。楊宏峰和陈蔚[ 12 ]、鲜文铎和向锐[ 13 ]、严瑾孟等[ 14 ]、卢永艳和王维国[ 15 ]、余杰和田康乐[ 16 ]、郑玉华和崔晓东[ 6 ]等都以上市公司为研究对象,将研究样本随机划分为训练样本集与测试样本集,并运用Logit方法基于训练样本集进行建模以及基于测试样本集进行模型的测试与评价,结果都证实了Logit方法具有良好的财务危机预警效果。
然而,上述研究文献并未对电力行业上市公司开展财务危机预警研究,也未考虑指标变量存在“维数灾难”问题以及样本存在不均衡问题而分别引入PCA与RU方法,此外,还未发现有文献运用交叉验证方法与统计检验方法对模型的预警性能进行科学地测试与评价。由此可见,本文的创新性是十分明显的。
本文结构如下:第一部分是引言,第二部分是关于改进Logit模型——RU-Logit模型的介绍,第三部分为实证研究部分包括样本指标的选择、训练集与测试集的划分、实证研究结果与分析,第四部分为研究结论。
二、基于改进Logit的财务危机预警模型构建
(一)财务危机预警的Logit回归模型
假设研究样本为n家电力上市公司且每家公司都存在m项财务指标变量,用xi代表每个电力上市公司样本,其中,i=1,2,…,n,xi=(xi1,xi2,…,xim);用yi代表每家公司的财务危机状态,若yi=1表示公司陷入财务危机,若yi=0则表示公司未陷入财务危机。本文对上市公司的财务危机进行预警研究,即使用公司当年的指标变量数据来预测下一年的财务危机状况,于是需要引入时间变量t,以{xti,yt+1i }表示电力上市公司样本集。
同时,假设样本集{xti,yt+1i }中的q家公司被划分为训练样本,用{xtc,yt+1c }表示,其中,c=1,2,…,q;剩余的n-q家公司被划分为测试样本,用{xtd,yt+1d }表示,其中,d=q+1,q+2,…,n。若将样本公司发生财务危机的条件概率记为pi=p(yt+1i =1│xti),则样本公司未发生财务危机的条件概率就为(1-pi),并用pi/(1-pi)表示財务危机发生比率。于是,基于训练样本集所构建的Logit回归模型的表达式如下:
运用极大似然估计方法估计参数?茁,则Logit回归模型构建完毕。于是,就可以基于测试样本集计算公司发生财务危机的条件概率,计算公式如下:
若pd≥0.5,则判定上市公司陷入了财务危机,即yt+1d =1;若pd<0.5,则判定上市公司未陷入财务危机,即yt+1d =0。于是,就可以依据判定结果对所构建的Logit回归模型的预测性能进行测试与评价。
(二)财务危机预警的改进Logit回归模型
对于电力上市公司样本而言,往往陷入财务危机的样本较少,而未陷入财务危机的样本较多,由少数和多数两类样本构成了不均衡样本集,这会使Logit回归模型建模失败。为此,本文引入RU方法对训练样本集{xtc,yt+1c }进行均衡处理。
具体而言,假设训练样本集{xtc,yt+1c }中陷入财务危机的样本数量为N,未陷入财务危机的样本数量为M,且M>N,则以W代表两类样本数量的差异,即W=M-N。从未陷入财务危机的样本集中随机删除W个样本,从而使两类样本的数量一致。最终,新的训练样本集为{xtr,yt+1r },其中,r=1,2,…,q-W,xtr=(xtr1,xtr2,…,xtrm)。
在此基础上,基于新的训练样本集{xtr,yt+1r }进行Logit建模,并基于测试样本集{xtd,yt+1d }对所构建的模型进行性能测试与评价。至此,财务危机预警的改进Logit模型,即RU-Logit模型构建完毕。
(三)预警指标变量的PCA约简方法
对于n家电力上市公司而言,很可能会因其m项财务指标变量过多而引发“维数灾难”问题,因而在构建改进Logit模型前,需要运用PCA方法进行指标变量约简处理。
对于样本xti=(xti1,xti2,…,xtim)而言,用?滋=E(x)、∑=Cov(x)分别代表样本xi的均值与协方差矩阵,针对样本xi的线性变换如下:
其中,向量lk满足lTklk=1,k=1,2,…,m。同时,Var(fk)=
lTk∑lk,Cov(xk,xh)=lk∑lh,其中,k,h=1,2,…,m。式(3)中,f被称为主成分,f1代表第1个主成分,以此类推,fm代表第m个主成分。根据下式计算得到m个主成分的贡献率Gh:
其中λh=Var(fh),累计贡献率LGs计算如下:
其中,v∈N*且1≤v≤m。当前v个主成分的贡献率相加得到的累计贡献率达到85%以上时,则表示前v个主成分可代表原m个主成分的大部分信息,于是就可以选择将前v个主成分的值作为各样本新的指标变量。新样本集为{xti,yt+1i },其中,i=1,2,…,n,xi=(xi1,xi2,…,xiv)。于是,基于新的样本集就能构建改进Logit回归模型。
三、实证研究
(一)样本与指标的选择
本文以中国电力上市公司(共58家)为研究对象,并以这些公司财务报表中净利润为负作为公司当年陷入财务危机的标志。将研究年度定为2012—2014年度,即以中国电力上市公司2012年和2013年的财务指标作为指标变量,以对应的下一个年度,即2013年和2014年公司的净利润正负为标准选择出财务危机与非财务危机样本,故从116个样本中最终划分出46家财务危机样本和70家财务正常样本。为了选择出能够全面而准确地刻画电力上市公司财务危机的指标变量,本文借鉴相关研究文献[ 17-20 ],基于上市公司的盈利能力、偿债能力、营运能力和发展能力四方面选择出共22项财务指标作为指标变量(见表1)。需要说明的是,本文数据来源于国泰安数据库和同花顺炒股软件,实验软件为Matlab2013b。
(二)基于PCA方法的指标变量约简
通过PCA方法,本文从上述22项财务指标中提取出5个主成分因子,其累计贡献率达到85%,由此说明这5个主成分因子涵盖了22项财务指标的大部分信息,能够比较全面地反映电力行业上市公司的财务状况。因此,本文将基于这5个主成分因子进行实证建模分析。
(三)实证结果与分析
为了更为全面而科学地评价改进Logit模型的预警性能,本文采用5折交叉验证(Cross Validation,CV)对Logit回归模型、Fisher判别分析模型(FDA)、人工神经网络模型(ANN)以及RU与上述三类模型相结合的改进模型进行了预测性能对比研究,结果如表2所示。从表2可以发现,基于RU方法的改进预警模型的预测精度高于各单独预警模型的预测精度,同时,在各类改进预警模型中,RU-Logit预警模型较其余模型具有更高的预测精度。
此外,为展示各模型性能的显著性差异,本文还就各模型的预测精度进行了McNemar显著性检验,结果如表3所示。从表3可知,RU-Logit与其余预警模型的检验结果都具有显著性,从而说明RU-Logit预警模型与其余预警模型在预测性能上具有显著差异。
通过表2与表3的实证结果可以得到如下结论:引入不均衡样本集的RU处理方法,能够有效地提升预警模型的预测性能;RU与Logit相结合的改进Logit预警模型具有最为优越的预测性能。
在上述实证基础上,本文还将各模型的5折交叉验证结果进行了图示(见图1)。从图1可以看出,RU-Logit的走势相比其余曲线的走势更为平坦,从而可以说明,RU-Logit的预测性能较其余模型更为稳定,具有良好的预测性能。
综上所述,本文认为,RU-Logit预警模型不仅预测精度高于其余预警模型,而且预测稳定性也强于其余预警模型,对于电力企业、投资者和政府管理部门而言,具有良好的实际应用价值。
四、结论
本文將RU不均衡样本处理方法与传统的Logit回归模型相结合,构建了改进的Logit回归模型,即RU-Logit模型,对中国电力企业的财务危机进行了预警研究。实证研究发现,与RU-FDA、RU-ANN、Logit和FDA模型相比,RU-Logit模型具有最为优越的预测性能,能够最为准确地识别电力企业的财务危机情况,有效地实现财务危机预警。因此,运用RU-Logit模型提前获取电力企业财务危机情况,企业高级管理人员可以提前采取防范措施来维持企业的正常运营,投资者可以制定更为科学合理的投资决策来实现资产增值,政府管理部门可以提前实施监管措施来促进整个电力行业的稳定发展,具有良好的实践价值与社会意义。●
【参考文献】
[1] 张鹏,刘勇波,李明.基于C&R树的上市公司财务危机预警研究[J].会计之友,2015(4):48-51.
[2] BEAVER W H.Financial ratios as predictors of failure,empirical research in accounting:selected studies[J]. Journal of Accounting Research,1966(5):71-111.
[3] ALTMAN E I. Financial ratios, discriminant analysis and the prediction of corporate bankruptcy[J]. Journal of Finance,1968(4):589-609.
[4] OHLON J A. Financial ratios and the probabilistic prediction of bankruptcy[J]. Journal of Accounting Research,1980(1):109-130.
[5] TAM K Y, KIANG M. Predicting bank failures: a neural network approach[J]. Management Science,1992,38(7):927-947.
[6] 郑玉华,崔晓东.公司财务预警LOGIT模型最优分界点实证研究[J].商业研究,2014(6):76-82.
[7] 田中禾,张娇.Logit模型在评估上市公司财务绩效中的应用研究[J].会计之友,2011(30):70-72.
[8] 蒲林霞.上市公司财务预警机制指标选择的实证研究:基于ST与非ST企业的GLM与二元Logit模型分析[J].财会通讯,2011(24):97-99.
[9] 朱连燕,马义中,张金红.基于PCA与偏好强度可调的DEA方法的多响应稳健参数设计[J].数学的实践与认识,2015,45(16):6-15.
[10] 韩芳,孙立民.不平衡样本集分类算法研究[J].计算机应用研究,2015,32(8):2323-2325.
[11] 吴敏,张化朋,李雷.欠抽样和DEC相结合的不平衡数据分类算法[J].计算机技术与发展,2014,24(4):110-113.
[12] 杨宏峰,陈蔚.基于神经网络——Logit回归的混合两阶段财务困境预测模型[J].统计与决策,2006(10):157-159.
[13] 鲜文铎,向锐.基于混合Logit模型的财务困境预测研究[J].数量经济技术经济研究,2007(9):68-76.
[14] 严瑾孟,蒋志海,林信达,等.Logit模型改进及其在财务困境预警中的应用[J].财会通讯,2009(8):28-29.
[15] 卢永艳,王维国.基于面板Logit模型的上市公司财务困境预测[J].数学的实践与认识,2010,40(5):37-43.
[16] 余杰,田康乐.我国制造业上市公司财务危机预警研究[J].会计之友,2014(30):73-75.
[17] 贾炜莹,申贵成.制造业上市公司财务危机预警模型[J].中国流通经济,2013,27(5):116-123.
[18] 郭毅夫,权思勇.基于神经网络的创新型企业财务危机预警研究[J].统计与决策,2013(4):170-172.
[19] 梁明江,庄宇.集成学习方法在企业财务危机预警中的应用[J].软科学,2012,26(4):114-117.
[20] 庞清乐,刘新允.基于蚁群神经网络的财务危机预警方法[J].数理统计与管理,2011,30(3):554-561.