郑玉华+崔晓东
摘要:在利用Logit模型对企业的财务困境或违约进行预测时,现有文献往往将05作为判别财务困境或违约与否的标准,没有考虑最优分界点与样本配比和误判成本之间的联系。最优分界点的选择应当满足使整体错误分类率达到最小,或者使整体错误分类成本达到最小。分界点的设置不仅取决于两类错误的成本,还取决于模型构建者在样本选择时所设置的样本配比比例。本文给出了在误判成本最小化基础上最优分界点的理论推导过程和计算步骤,并对1:1和1:3样本配比情况下的最优分界点进行比较研究,发现无论是1:1还是1:3样本配比,第一类错误相对于第二类错误的成本越大,最优分界点就应该选择较小的值;在设定的1/1、1/5、1/10这三种成本比值下,两种样本配比情况下的最优分界点都小于05;在1:3的样本配比下,适当的分界点不仅能保证分类的准确性,还能更好地控制第一类错误,减小分类错误成本,而样本配比比例进一步提高可能会出现分界点过小的情况。
关键词:Logit模型;财务预警;样本配比;误判成本;最优分界点
中图分类号:F83文献标识码:A
收稿日期:2014-03-20
作者简介:郑玉华(1976-),男,湖北潜江人,南京信息工程大学经济管理学院教师,经济学博士,研究方向:金融计量与风险管理;崔晓东(1972-),女,河南巩义人,南京晓庄学院经济与管理学院教师,管理学博士,研究方向:金融工程与投资管理。
基金项目:江苏高校优势学科建设工程项目,项目编号:PAPD,ysxk2010;教育部人文社会科学基金项目“内部公司治理对银行风险承担行为影响研究”,项目编号:10YJC790149。公司财务预警主要基于两类计量方法,一是基于Black-Scholes(1973)[1]和Merton(1974)[2]期权技术的结构化模型,二是基于统计技术的二分模型。二分模型是比较常用的财务预警模型,基本原理是选取合适的财务指标作为解释变量,建立二项回归方程预测公司的财务困境或违约概率。由于二项回归中的Logit模型并不严格要求财务指标服从多元正态分布,因而在实践中得到广泛运用[3-5]。
值得注意的是,虽然相当多的学者利用Logit模型对违约率进行研究或对公司财务困境进行预测,但文献大多没有深入研究如何确定适用于我国的模型最优分界点。Logit回归模型并不存在理论上的最优分界点,大多数文献往往将05作为判别财务困境或违约与否的标准,这种作法存在较大的缺陷。事实上,最优分界点的选择与样本配比和误判成本问题联系在一起,如果把05作为财务困境或违约分界点,则意味着模型假定一家公司破产与不破产的先验概率一样,并且第一类错误和第二类错误这两类错误的成本相等,这与现实情况严重背离。因此,在利用Logit模型对企业的财务困境或违约进行预测时,最优分界点的选择与样本配比和误判成本问题联系在一起。结合这两方面对模型的最优分界点进行研究和分析,不仅能够保证模型的分类能力,而且可以控制犯两类错误的成本。
一、Logit模型最优分界点选择的理论研究
(一)Logit模型基本原理
对于公司i,用于违约预测的k个财务指标集合设为xi=(x1i,x2i,…xki),令yi为公司i实际观察的是否违约的指示变量。如果将事件发生的条件概率记为pi=p(yi=1|xi),则(1-pi)为客户不违约的概率,而pi/(1-pi)称为事件的发生比。因此,在logistic分布假设下, Logit回归模型的表达式为:
logit(pi)=ln(pi1-pi)=β0+∑kk=1βkxki(1)
事件发生的概率可写作:
p(yi=1xi)=11+e-(β0+∑kk=1βkxki)(2)
估计模型的参数后,根据式(2)计算企业陷入财务困境或违约的概率pi。判定企业是否陷入财务困境或违约的标准是确定一个分界点,并根据pi与该分界点的大小关系来判定。在分界点选定为05时,如果pi≥05,则认为企业陷入财务困境,出现违约;如果pi<05,则认为财务状况正常,不会出现违约。一旦所有观测被分为预测发生或不发生两类,则模型的分类准确性可以通过预测情况和实际观测情况的对比来体现。由于Logit模型在预测方面并不存在理论的最优分界点,不同的分界点选择也会影响模型的分类准确性,导致结果出现较大偏差,因此将概率05作为判别标准的这种作法存在较大的缺陷。
(二)最优分界点的确定
最优分界点的确定应该考虑两个因素:一是分界点与第一类错误、第二类错误的关系;二是分界点与样本配比之间的关系。第一类错误是指样本企业实际上是财务困境(或违约)企业,但模型错误地将其分类为财务状况正常(或不违约)企业的概率;第二类错误是指样本企业实际上财务状况正常(或不违约),但模型错误地将其分类为财务困境(或违约)企业的概率。第一类错误的成本远远大于第二类错误的成本。对于Logit模型,违约分界点取不同的数值时,模型犯第一类错误和第二类错误的概率也不相同,一类错误的减少就意味着另一类错误的增加。最优分界点的选择应当使整体错误分类率达到最小,或者使整体错误分类成本达到最小。
总第446期郑玉华:公司财务预警LOGIT模型最优分界点实证研究····商 业 研 究2014/06对于正常组(即非违约组)G0和财务困境组(违约组)G1,设母体G0和G1分别具有k维联合分布密度f0(x)和f1(x),其中,x为公司的财务指标矢量。令D0和D1是Rk的一个划分,建立多元判别分析的判别规则为:
如果x落入Di,则x∈Gi, i=0,1(3)
令π0和π1分别为母体G0和G1的先验概率;p(01)、p(10)分别为第一类错误和第二类错误,则:
p(01)=p(x∈D0G1)=∫D0f1(x)dx
p(10)=p(x∈D1G0)=∫D1f0(x)dx(4)
根据贝叶斯判别思想,整体错误分类率e应达到极小:
e=p(10)·π0+p(01)·π1
=π0∫D1f0(x)dx+π1(1-∫D1f1(x)dx)
=π1+∫D1(π0f0(x)-π1f1(x))dx(5)
最小化e,等价于:
D1=xπ0f0(x)-π1f1(x)≤0
D0=xπ0f0(x)-π1f1(x)>0(6)
即最优分界点的设置为:π0f0(x)-π1f1(x)=0,且当π0f0(x)-π1f1(x)≤0时,公司被分类至财务困境组(违约组)。或者说,对于财务困境组(违约组),分界点的设置应满足:
f1(x)f0(x)≥π0π1(7)
如果考虑决策者对两类错误的态度和预期控制程度,则分界点的设置应使整体错误分类成本达到极小。令C为错误分类的总成本,C(01)、C(10)分别为第一类错误和第二类错误的成本,则:
C=p(10)·π0C(10)+p(01)·π1C(01)=π1C(01)+∫D1(π0C(10)f0(x)-π1C(01)f1(x))dx(8)
最小化C,则对于财务困境组(违约组),分界点的设置应满足:
f1(x)f0(x)≥π0C(10)π1C(01)(9)
从式(9)可以看出分界点的设置不仅取决于两类错误的成本,还取决于财务困境和财务状况正常(即违约和不违约)的先验概率。事实上,先验概率是无法获得的,不过在选取财务困境样本和正常样本时,样本配比比例体现了模型构建者对于先验概率的理解。如果样本配比为1:1,则可以认为陷入财务困境(即违约)的先验概率为05;而样本配比为1:3,则可以认为先验概率为025。大多数文献实证分析中采用1:1配比,即默认陷入财务困境与财务状况正常的发生概率是相等的,这一点可能不符合事实。虽然要准确地配比比较困难,但根据实际经营中陷入财务困境的企业相对较少的事实,考虑其它配比,例如1:3配比的情况,有助于减小抽样偏误并提高模型的精度。
endprint
(三)确定模型最优分界点的计算步骤
实际应用中往往并不直接通过财务指标采用多元判别分析,而是通过Logit模型计算概率来预测财务状况是否陷入困境,因此可以通过分析违约率的分布来确定Logit模型的最优分界点,计算步骤为:
1.根据公式(2)计算各样本公司陷入财务困境或违约的概率p。
2.对于实际陷入财务困境的公司和正常公司,通过核密度方法分别获得违约率的概率密度f1(p)和f0(p)。
3.对于给定的先验概率和两类错误成本比值,计算下列函数式:
f(p)=f1(p)-π0C(10)π1C(01)·f0(p)(10)
4.最优分界点c就是使上式等于0的p值。如果模型计算出的概率大于c,则样本被预测为财务困境公司;如果计算的概率小于c,则样本被预测为财务状况正常的公司。
二、实证分析
(一)样本选择与财务指标筛选
从财务困境的角度看,被证监会实行特别处理(ST或*ST)的公司至少在一定程度上陷入财务困境,面临着资金短缺、资不抵债和破产等风险。因此,本研究选取的财务困境公司样本是2001年1月1日至2011年12月31日期间沪深两市A股中被ST或被*ST的200家公司(不包含由于非财务原因被ST或被*ST的公司)。确定了该样本后,再根据研究期间一致、行业类型相同或相近、上市地点尽可能一致的原则,按1:1 的比例选择非ST 的上市公司作为配对样本,数量为200家;同时按1:3的比例形成配对样本600家,以便于对比研究样本配比与违约分界点之间的关系。样本涉及《中国上市公司分类指引》中除金融保险行业外的12个大类,具有较强的代表性,样本数据来源于CCER数据库和CSMAR数据库。
在财务指标选择方面,先在借鉴中外众多文献的基础上,初选影响公司财务状况的25个备选财务指标,这些指标涵盖公司的盈利能力(指标为净资产收益率,资产收益率,净利润率)、发展潜力(指标为净资产增长率,总资产增长率,营业收入增长率,营业利润增长率,税后利润增长率)、偿债能力(指标为流动比率,速动比率,存货流动负债比率,现金流动负债比率,资本充足率,现金负债比率,债务资本比率,债务资产比率)、营运能力(指标为存货周转率,应收账款周转率,流动资产周转率,资产周转率,固定资产周转率)、投资价值(指标为市盈率,市净率,每股收益,每股净资产)等方面,然后基于单变量分析、相关分析、共线性分析、符号分析等一系列步骤确定最有影响力的财务指标,最终筛选出最具有解释能力的几项指标,具体筛选方法详见郑玉华、崔晓东(2013)[6]。
最终确定的指标名称分别为:X1-资产收益率;X2-净资产增长率;X3-资本充足率;X4-应收账款周转率;X5-市盈率。各项指标对预测具有显著的解释能力,也符合经济上的认识:资产收益率可以反映盈利能力,盈利能力越强,企业在较长时期内的资金来源就越有保障;净资产增长率可以反映发展潜力,代表着企业规模增长的能力,资产规模扩张能使企业具有更强的实力,也可能带来更高的收益,事实上,企业在较长时期内的盈利能力主要是由企业的发展潜力所决定的;资本充足率可以反映偿债能力,它直接反映借款企业还本付息的能力;应收账款周转率反映企业的营运能力与企业保持资金流动性的能力;市盈率反映投资价值,也反映公司的盈利能力,业务增长能力以及未来的市场潜力。
(二)Logit模型构建
由于行业特征、行业政策、行业前景不同,处于不同行业的公司在生产因素、生命周期、竞争能力、发展潜力、受宏观经济环境影响的程度等很多方面具有不同的特点,在上述5个变量的基础上实证分析,针对行业差别引入行业指示变量I。考虑到除制造业外,其它各行业样本数量有限,本文粗略地将样本公司划分为制造业和非制造业,当公司属于制造业时,令I=1;当公司属于非制造业时,令I=0。利用1:1配比的样本集合数据构建财务困境预测模型,模型表达式为:
ln(p/(1-p))=-1432X1-286X2-092X3-001X5-1231IX1-010IX4+001IX5(11)
利用1:3配比情况下的样本集合数据构建的财务困境预测模型表达式为:
ln(p/(1-p))=-1034X1-379X2-145X3-001X5-543IX1-009IX4+001IX5 (12)
模型(11)、(12)的系数显著性通过Wald检验,拟合优度值R2分别达到074和076,表明模型拟合样本数据的效果较好。通过模型(11)、(12)以及两者的对比还可以看出:(1)资产收益率X1表现为显著的行业特性,对于制造业和非制造业,指标对预测的影响程度并不相同;(2)净资产增长率X2和资本充足率X3对财务困境或违约的影响程度与行业无关;(3)应收账款周转率X4和市盈率X5具有极强的行业特性,应收账款周转率X4只表现在制造业,对于非制造业并无显著的解释能力,市盈率X5只表现在非制造业,对于制造业并无显著的解释能力;(4)分行业模型不仅反映了不同行业财务指标对预测影响程度的差异性,而且对于两个行业都具有较高的预测准确性。图11:1样本配比下违约率的概率密度
(三) 1:1样本配比下的最优分界点
按最优分界点的计算步骤,对于1:1配比情况下的样本集合,实际财务困境公司和正常公司违约率的概率密度见图1。在先验概率比π0/π1=05/05=1时,图2给出了函数f(p)在三种错误成本比值假设下的图形。从图2可以看出当第二类错误与第一类错误的成本比值设定为1:1,即认为两类错误的成本相同时,违约分界点应选择在04左右;当成本比值设定为1:5时,分界点应选择在03-04之间;当成本比值设定为1:10时,分界点应选择在025-04之间。这说明第一类错误相对于第二类错误码的成本越大,最优分界点就应该选择较小的值,使得犯第一类错误的概率变小,从而减小总成本,这与预期结论是一致的。另外,在三种成本比值设定下,分界点都应小于04,不同于通常将分界点选择为05的做法。
为了更好地说明上述结论,表1进一步列出了分界点分别设置为02、03、04、05、06时,模型的第一类错误、第二类错误,以及在两类错误成本比值假设下的总成本。从表1可以得出以下结论:(1)随着分界点从低到高,模型的第一类错误逐渐增加,而第二类错误逐渐降低;(2)对于同一分界点,如果第一类错误的成本相对越大,即错误成本比值越小,则总成本越大,要控制总成本,必须降低分界点,减小犯第一类错误的概率;(3)在不同的成本比值下,分界点的选择与根据式(10)计算得到的结果基本一致。图21:1样本配比时函数f(p) 在三种错误成本比值假设下的图形图31:3样本配比下违约率的概率密度
表11:1样本配比下不同分界点取值对应的两类错误及总成本违约
分界点两类错误两类错误成本比值下
的分类错误总成本第一类错误第二类错误1/11/51/10备注0.23.00%8.25%11.2523.2538.25(1)两类错误成本比值指第二类错误的成本除以第0.33.50%4.75%8.2522.2539.75一类错误的成本;(2)两类错误成本比值为1:1时,0.43.50%4.50%8.0022.0039.50则两类错误的成本分别取100个单位计算总成本,0.54.50%4.50%9.0027.0049.50对于其它比值采用类似处理。0.66.25%4.25%10.5035.5066.75
endprint
(四) 1:3样本配比下的最优分界点
进一步考虑1:3配比情况下的样本集合,实际财务困境公司和正常公司违约率的概率密度见图3。在先验概率比π0/π1=075/025=3时,图4给出了函数f(p)在三种错误成本比值假设下的图形;表2进一步列出了分界点分别取01、02、03、04、05时模型的第一类错误、第二类错误以及在两类错误成本比值假设下的总成本。结合图4和表2可以看出:当第二类错误与第一类错误的成本比值设定为1:1时,分界点应选择在02-04之间;而当成本比值设定为1:5或1:10时,分界点的设置应低于02,具体可取017或018。在不同的成本比值下,从图4以及从表2中得到的结果基本一致。从表2也可以看出在1:3样本配比下,随着分界点从低到高,模型的第一类错误逐渐增加,而第二类错误逐渐降低;对于同一分界点,如果第一类错误的成本相对越大,即错误成本比值越小,则总成本越大,要控制总成本,必须降低分界点,减小犯第一类错误的概率,这与预期结论一致,也与1:1样本配比下的结论相同。图41:3样本配比时函数f(p) 在三种错误成本比假设下的图形
表21:3样本配比下不同分界点取值对应的两类错误及总成本违约
分界点两类错误两类错误成本比值下
的分类错误总成本第一类错误第二类错误1/11/51/10备注0.11.50%12.78%14.2820.3027.82(1)两类错误成本比值指第二类错误的成本除以第0.21.75%7.14%8.8915.8924.64一类错误的成本;(2)两类错误成本比值为1:1时,0.32.26%7.02%9.2818.3229.62则两类错误的成本分别取100个单位计算总成本,0.43.88%5.76%9.6425.1644.56对于其它比值采用类似处理。0.55.64%5.01%10.6533.2161.41
三、结论
在利用Logit模型对企业的财务困境或违约进行预测时,最优分界点的选择与样本配比和误判成本这两大问题联系在一起,结合这两方面对模型的最优分界点进行研究和分析,不仅能够保证模型的分类能力,而且可以控制犯两类错误的成本。最优分界点的选择应当满足的基本原则是使整体错误分类率达到最小,或者使整体错误分类成本达到最小,这一原则包括的含义是分界点的设置不仅取决于两类错误的成本,还取决于财务困境和财务状况正常(或违约和不违约)的先验概率,而样本配比比例体现了模型构建者对于先验概率的理解。本文给出了确定最优分界点的理论推导和计算步骤,并通过两种配比情况下的比较,得出关于最优分界点的一些有益结论:(1)样本配比采用1:1配比,即默认陷入财务困境与财务状况正常的发生概率相等的做法可能不符合事实。虽然要准确地配比比较困难,但根据实际经营中陷入财务困境的企业相对较少的事实,考虑其它配比,例如1:3配比的情况,有助于减小抽样偏误并提高模型的精度。(2)无论是1:1还是1:3样本配比,随着分界点从低到高,模型的第一类错误逐渐增加,而第二类错误逐渐降低;第一类错误相对于第二类错误码的成本越大,最优分界点就应该选择较小的值,使得犯第一类错误的概率变小,从而减小总成本,这与预期结论一致。(3)在1:1样本配比下,本文的三种成本比值设定的分界点都应小于04;而在1:3样本配比下的分界点更小,这不同于通常将分界点选择为05的做法。(4)对于1:3样本配比,如果选择适当的分界点,则模型不仅能保证分类的准确性,还能更好地控制第一类错误,减小分类错误成本。(5)1:3配比模型的分界点大致界于02-04之间,如果配比比例再提高,即正常公司的数目超出困境公司数目的3倍以上,可能会出现分界点过小的情况。过度抽样正常公司必然要求对模型算法进一步研究或对模型结构进行分析,因此在不考虑模型修正的前提下,本文认为1:3的样本配比比较合适。
参考文献:
[1]Black F., M. Scholes, The Pricing of Options and Corporate Liabilities[J].Journal of Political Economy,1973(81): 637-659.
[2]Merton, R.On the pricing of corporate debt: the risk structure of interest rates[J].The Journal of Finance,1974(29):449-470.
[3]Martin D.Early warning of bank failure: a logit regression approach[J].Journal of Banking and Finance,1977,1:249-276.
[4]Ohlson J.M.Financial Ratios and the Probabilistic Prediction of Bankruptcy[J].Journal of Accounting Research,1980,18(1):109-131.
[5]石晓军.Logistic违约率模型最优样本配比与分界点的模拟分析[J].数理统计与管理,2006(6):675-682.
[6]郑玉华,崔晓东. 公司财务预警Logit模型指标选择与实证分析[J].财会月刊,2013(24):15-18.
An Empirical Study on the Optimal Critical Value of Logit Model for Company
Financial Early WarningZHENG Yu-hua1, CUI Xiao-dong2
(1. School of Economics and Management, Nanjing University of Information Science & Technology,
Nanjing 210044, China; 2. School of Economics and Management, Nanjing Xiaozhuang
University, Nanjing 211171, China)
Abstract:When Logit model is applied to predict company financial early warning or default probability, most literatures use 0.5 as critical value to forecast financial distress, however, this practice overlooks the relationship between the optimal critical value and sample pairing proportion or misclassification cost. The choice of the optimal critical value of Logit model shall meet the requirements to minimize the overall misclassification rate or integral misclassification cost, that is, the optimal critical value not only depends on the cost of two types of misclassification, but also depends on the sample pairing proportion that reflects the prior probability. Based on minimizing the integral misclassification cost, the theoretical analysis, formula deduction and practical calculation procedures of the optimal critical value are given and the comparative study in different setting of sample pairing proportion (1:1 and 1:3) are also presented in this paper. The results show that, either 1:1 or 1:3 sample pairing proportion, the larger the cost of the first type of error is, the smaller optimal critical value should be chosen; when cost ratio is set to 1/1, 1/5 and 1/10, the optimal critical value is less than 0.5 on either 1:1 or 1:3 sample pairing proportion; when sample pairing proportion is 1:3, a proper optimal critical value not only can ensure the accuracy of the classification, but also can control the first type of error and reduce the misclassification cost; further increases on sample pairing proportion may cause a much smaller optimal critical value.
Key words:Logit model; financial early warning; sample pairing; misclassification cost; optimal critical value
endprint