制造业上市公司财务困境预测-Logit模型

2023-02-21 07:38朴莲花
智库时代 2023年4期
关键词:财务指标困境概率

朴莲花

(上海大学悉尼工商学院)

一、引言

破产是企业经营的一种结果,达到这一结果的过程是一系列可识别的环节:稳健经营—不稳健经营—财务困境—破产。财务困境又称财务危机(Financial crisis):指现金流量不足以补偿现有债务。

在当前激烈的市场竞争下,构建科学、合理的财务风险预警模型,正确地预测企业财务困境,不仅可以保护投资者和债权人的利益,而且还有利于经营者防范财务危机、政府管理部门监控上市公司质量和证券市场风险。

Logit模型因具有不严格要求指标服从多元正态分布的优势,选取合适的财务指标作为解释变量,即可做到预测公司陷入财务困境的概率的用途,目前已经得到广泛运用。

国外研究方面,Ali Mansouri等(2016)采用了三层人工神经网络模型和logistic回归模型,来比较两种模型在基于提前3、2、1年的指标预测破产的效果。研究结果显示,两种模型都由较强的预测能力;Sami Ben Jabeur(2017)基于弥补传统预测模型缺点的角度,用偏最小二乘逻辑回归(PLS-LR)模型整合大量比率,同时考虑了矩阵中的缺失数据。这种方法优于传统方法,可以考虑预测财务困境的所有指标、环境不确定性的减少、控制变量的改进以及不同公司利益相关者之间的协调。

在国内,吴世农、卢贤义(2001) 对 比 了LPM模 型、Fisher二类线性判定模型、Logistics模型的预测效果,结果表明Logistic模型的判定准确性最高;黄子罡(2020)、方圆(2021)将研究进一步延伸至采用KMV-Logit模型来研究违约模型的实际应用。

近几年,国内外学者采用Logit模型预测财务困境或违约的研究越来越多,且多集中于模型上的拓展。基于其他学者的研究,本文将研究视角转移至选取对公司财务状况最具有解释能力的财务指标,以提高预测模型的准确性和可靠性。

二、Logit模型介绍

Logit函数的曲线,是一个单调上升的函数,不存在断点,但具有良好的连续性。而后衍生出的Logit回归函数,更常使用二分类的因变量,利用变量与变量的之间关系,对预测结果做出分类判断。因为函数更常解决一个问题会发生或不会发生,所以随后模型在完善应用中,常常解决各个领域中的概率问题。

本文将Logit模型与财务数据相结合,使用财务困境Logit预测模型对公司未来是否会发生财务问题进行预测。

假设公司i用于财务困境预测的k个财务指标集合为xi=(x1i,x2i,…,xki) ,则事件发生的条件概率记为pi=p(yi=1|xi)为客户不违约的概率,称为事件的发生比。在Logit分布下,Logit回归模型的表达式为:

事件发生的概率可写作:

估计模型的参数后,根据式(2)计算企业陷入财务困境概率pi。

在企业财务危机判定和预测中,更多会关心危机的发生与否,Logit模型把预测一个公司是否发生财务危机的概率问题转化为预测一个公司是否发生财务危机的机会比问题。根据Logit回归模型计算结果,通过P的分割值0.5为界限,衡量企业发生财务风险的概率有多大,是否接近临界值而造成后续财务危机。

表1 原始参数值描述性统计

表2 处理后参数值描述性统计

三、数据来源及财务指标的选择

本文选取的财务困境预测样本是2017年-2019年的沪深两市A股中正常经营的公司和被ST或ST的1739家制造业公司,其中正常公司为1608家、ST或*ST公司为131家。对于样本公司,预测其财务困境的财务指标数据均来自于公司被ST或ST年度前一年度的财务指标,也即利用t-1年的财务指标来预测其在第t年是否会处于财务困境或违约。样本数据来源于CSMAR和Wind数据库。

在借鉴数据可获得性的基础上,选择反映公司财务状况的5个财务指标。各项指标的名称分别为:X1:资产收益率;X2:每股净资产增长率;X3:流动比率;X4:应收账款周转率;X5:托宾Q比率。这些指标涵盖了公司的盈利能力、发展潜力、偿债能力、营运能力、投资价值等五个方面,具有一定的全面性。为分析简便,将t年被st的值表示为1,未被st的值表示为0。另外,本文使用R(3.5.1)对数据进行实证分析。

四、实证分析

(一)数据清洗

将初试数据导入R后进行描述性统计分析,可见部分数据存在空值,因此使用na.omit()进行空值删除处理,从原有的4900条数据缩减至4816条数据。

(二)多元Logit回归模型的选择

Logit回归是研究因变量为二分类或多分类变量与影响因素之间关系的一种多变量分析方法,是一种概率性非线性回归。一个随机事件是否发生常常受到多个因素的影响,Logit回归分析可以在多种多样的影响事件的潜在因素中选出其中对事件发生概率影响较大的因素,并根据这些因素建立该事件在特定时间内发生的概率预估模型。

本文初步筛选5个变量后,将结果显示为不显著的变量删除,来确保所得自变量子集中每一个变量都是显著的。

1.首先将st和5个参数值进行多元回归后发现,X1和X5的回归系数显著性最明显,其他项的显著性并不明显。

随后为检验所有因素是否确实有用,计算自由度为7的卡方统计量和p值,结果p值<0.001,说明拒绝H0,也即βi都为0的概率非常小,至少有一项对st的预测有贡献。

表3 Logit回归结果(X1X5)

表3 Logit回归结果(X1X5)

变量 参数值 标准差 显著程度常数项 -3.06E+00 1.24E-01 ***X1 -1.19E+01 6.72E-01 ***X2 -6.70E-03 1.09E-02 X3 -3.29E-02 3.51E-02 X4 -3.15E-05 2.27E-04 X5 1.44E-01 2.95E-02 ***

表4 Logit回归结果(X1、X5)

表5 Logit回归结果(X1、X5、X1*X5)

图1 Logit回归分类作图

2.由于前一步骤发现X1和X5的显著性最明显,因此对st和X1、X5进行多元回归,结果发现两个变量的显著度未出现大变动,且所有变量的显著度都非常明显。

为检验所有因素是否确实有用,计算自由度为2的卡方统计量和p值,结果p值=0.67非常大,无法拒绝H0,也即无法认为βi不都为0。

3.X1和X5的显著性最明显,但仅用这两项进行回归后进行卡方分布的结果不理想,因此这一步引入X1和X5的乘积,即对st和X1、X5和X1*X5进行回归,结果三个变量都非常明显。

再计算自由度为3的卡方统计量和p值,结果p值=0.0138<0.05,在5%的置信度拒绝原假设。

(三)多元Logit回归模型的分类器

分类器是为了从数据特征中学习出一个0/1分类模型,这个模型以样本特征的线性组合作为自变量,应用Logit函数将自变量映射到(0,1)上。因此分类器的解是求解一组权值θ0,θ1,…,θn,并代入 Logit 函数构造出预测函数:

函数所得出的值表示是特征属于y=1的概率。也即,对于输入x分类结果为y=1和y=0的概率分别为:

当我们要判别一个新来的特征属于哪个类时,按照下式求出一个z值:

x1,x2,...,xn是样本的各个特征,维度为n。然后求出hθ(x),若大于0.5则y=1,反之属于y=0。分类器的这一组权值需要涉及到极大似然估计MLE。

根据前文分析,以下使用X1和X5选择分类器,将估计概率作为预测器的函数进行阈值化。

当估计概率为2/3时,X5>85.606513X1+ 27.114954 则st=1

当估计概率为1/2时,X5>85.606513X1+ 22.186433 则st=1

将两种概率阈值的图像画出,无法从图中获得明显的结论,因此我们以0.5的概率作为预测阈值。

(四)最终模型

为确定最终模型,引入ROC曲线和AUC来判断最优模型。

ROC曲线又称接收者操作特征,ROC曲线上每个点反映着对同一信号刺激的感受性。横轴为FPR特异度,划分实例中所有负例占所有负例的比例,也即1-Specificity。纵轴则是TPR灵敏度,也即Sensitivity。

AUC是ROC曲线下的面积,介于0.1和1之间。AUC作为数值可以直观的评价分类器的好坏,值越大越好。AUC值是一个概率值,当随机挑选一个正样本以及负样本,当前的分类算法根据计算得到的值将这个正样本排在负样本前面的概率就是AUC值,AUC值越大,当前分类算法越有可能将正样本排在负样本前面,从而能够更好地分类。

表6 模型预测效果

图2 Logit回归ROC曲线作图

对于前文分析的3种Logit模型画图,可以看出第3个模型的AUC值最高,达到0.853,因此最终选用第三个模型作为最终财务风险预测模型。

(五)模型检验

使用第三个模型对样本值进行预测检验,在概率P值设置为0.5的情况下,结果综合正确率可以达到95.35%。其中对非ST公司的预测准确率可以达到95.89%,对ST公司的预测准确率达到68.75%。综合正确率虽然比较高,但对于ST公司的预测正确率提高还有较大的发展空间,总体上该模型的预测结果是可信赖的。

(六)小结

根据实证分析,最终确定的制造业企业财务风险预测模型的表达式为:

发生财务风险的概率可写成:

根据上式计算公司发生财务风险概率,若p≥0.5,则认为公司预计下一年发生财务风险,股票被ST;若p<0.5,则认为公司下一年财务状况将处于正常状态。

五、结论

通过对财务数据的Logit回归分析,可以得出我国制造业上市公司股票戴上ST,也即公司出现财务问题,与公司前期的资产收益率和托宾Q比率有较大的关系,也即公司的盈利能力和投资价值对公司财务预警的影响较大。当然,其他指标虽然在该模型中没有显著性关联,但这并不意味着这些指标对公司未来价值没有影响,优秀上市公司的财务指标应当得到全面发展,使得我国证券市场得到良好的发展。

本文聚焦制造行业数据构建模型,样本数据越多,提取的财务指标种类越复杂,Logit模型的精确度会越高。但制造业整体数目虽然庞大,内部个体企业间差异较大,业务细分企业的数目又太少,总体结果虽达到研究目的,但由于作者学术能力的不足以及数据的不完善,因此得出的Logit模型准确性依旧有所局限。

猜你喜欢
财务指标困境概率
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
困境
我国金融机构股价和主要财务指标的相关性分析
探讨医院财务分析中财务指标体系的应用
全国国有企业主要财务指标
“邻避”困境化解之策
必须正视的理论困境