基于PCA-Rprop神经网络的建筑业上市公司退市风险预警研究

2020-10-21 07:49:54虞文美方扶星

山西师范大学学报(自然科学版) 2020年3期

虞文美，方扶星

安徽财经大学金融学院，安徽蚌埠 233030

0 引言

进入21世纪以来，中国特色社会主义改革已经迈入了新时代，我国GDP增速逐渐回落至合理稳定水平，这标志着我国经济增长已经由“量”转向为“质”，由粗放的高速增长逐步转变为环保的绿色增长.建筑行业作为支撑我国经济高速增长的重要力量，因此在追求绿色GDP的大环境下，如何帮助建筑行业实现有效平稳的转型是关键环节.在改革的路程上，前有万达集团出售百货开启轻资产转型经验，后有万科集团重构员工薪资体系以平衡区域差异的做法，这些案例无一不说明公司集团的发展与改革能否取得相应成效息息相关，而建筑行业上市公司的退市风险也直接影响到GDP是否可以继续实现稳步增长，因此本文认为研究建筑行业上市公司的退市风险预警研究显得尤为重要，它可以为建筑业上市公司的改革风险及时做出一个合理的定量评价.目前国内外针对退市风险预警模型的研究已有很多，主要包括三个方面：变量指标的选取、变量指标的降维方法和用于对比的预测模型，具体文献如下所示：

(1)预警指标的选取

退市风险预警指标的选取是退市风险预警模型建立的基础，从上个世纪70年代以来，学者们对于预警指标的选取逐渐从财务指标转向衡量上市公司各项发展能力的财务比率以及具有重要指导意义的非财务指标.例如，鲍新中和杨宜(2013)[1]指出外部审计师出具的审计意见是判断公司是否陷入退市风险的重要指标.黄宏运等(2017)[2]提出了从债偿能力、盈利能力和发展能力三个方面对财务指标进行分类.王佳新等(2010)[3]立足于公司财务报表的指标融合角度对企业财务危机预警测度体系的研究.M Ma'aji等(2018)[4]将非财务指标股权结构、董事人数和性别列入评价体系.Charalambakis和Garrett(2019)[5]在正常财务指标体系的基础上提出了流动性比率、杠杆率和利息保障比率等财务比率指标.

(2)预警指标降维的方法

目前关于公司的多个预警指标进行降维的方法主要由两种：主成分分析和因子分析.主成分分析的基本思想是将原来的指标线性组合成几个新的不相关的综合指标，同时根据实际需要，从这些新的指标中一次选取能够提取信息最多的线性组合.因子分析则是通过研究众多变量之间的内部数量关系探求数据中的基本结构，找出影响原始变量的少数几个不相关的潜在的公共因素，并用它们来表示数据的基本结构，因此，相对于只能解释部分变异的因子分析，主成分分析有着更好的降维效果.例如，张莉芳和历丽(2015)[6]基于主成分分析法研究了上市公司资金链断裂风险预警问题.杜建菊和林鑫(2019)[7]运用改进的主成分分析法对上市银行的财务状况进行综合评价.Tang等(2018)[8]运用主成分分析法建立了具备财务时序预测能力的最领近回归模型.

(3)退市风险预警模型的建立

国内外的研究成果主要分为参数模型和非参数模型两大类.早期研究主要集中在参数模型上，Altman(1968)[9]首次将多元判别分析(MDA)引入企业风险预警领域，提出了著名的Z分数模型.周首华等(1996)[10]基于Altman的Z分数模型提出了更适合我国A股市场的F分数模型；杨淑娥和徐伟刚(2003)[11]基于主成分分析法提出了Y分数模型.近些年来，随着机器学习算法被引入到退市风险预警的方法中，一些学者开始探索了非参数模型，秦秀秀(2015)[12]以2010年～2012年创业板上市公司为研究对象构建了BPNN预警模型.Le和Viviani(2018)[13]通过两种传统的统计方法(区分分析和逻辑回归)和三种机器学习方法(神经网络、支持向量机、K-最邻近法)试图预测美国银行的财务风险，实证结果表明神经网路是最准确的.谢阿红等(2019)[14]基于熵权-BP神经网络研究了涉农类上市公司的融资风险.李佳佳和李田(2018)[15]基于BP-Adaboost模型从公司管理视角下对我国企业的信用风险进行评估.Fallahshojaei和Sadeghzadeh(2019)[16]通过调整隐藏层中神经元个数提出了一种基于和谐搜索的神经网络算法预测财务序列.

综上所述，在退市风险的研究领域，有神经网络(NN)、支持向量机(SVM)、Logistic回归、随机森林等模型，但Rprop神经网络的所具有的非线性映射能力使它相较于其他模型几乎没有任何假设条件，同时神经网络普遍具有的强大学习能力以及容错能力让Rprop神经网络的泛化能力显著优于其他模型.因此，本文尝试通过建立PCA-Rprop神经网络对我国建筑业上市公司的退市风险做出合理预测.

1 研究设计

1.1 研究样本的选取

本文选取的样本来自我国A股市场建筑业板块，其中被交易所处以退市风险警示(ST)的公司50家，非ST公司145家.本文所搜集的数据均来自样本195家建筑业上市公司2018年第四季度财务报表，并将ST和非ST公司的数据随机分为两个子集：75 %的数据用于训练模型；剩余25 %的数据用于交叉验证.本文所有数据均来自CSMAR数据库.

1.2 预警指标的选取

上市公司退市风险的影响因素众多，目前国内外学者的研究并无一致的结论.早期学者对于预警指标的选取主要是集中在二十几个常用财务指标之间，目前学者们不在从财务指标中直接选择预警指标，而更倾向于从债偿能力、盈利能力、营运能力、发展能力和每股指标等不同维度选取财务比率指标以及衡量公司将来发展能力的非财务指标.本文结合我国建筑业上市公司的实际发展状况，初步选取了20项财务比率指标以及2项非财务指标，初选指标体系如表1所示.

表1 初选指标体系Tab.1 Initial selection of indicator systems

由于初步确定的22项指标偏多，部分指标可能不够显著并且包含着交叉重复的内容.本文通过显著性检验进行预警指标的分辨能力筛选，并利用主成分分析法对显著性预警指标进行降维处理，将多个指标合并成少数相互独立的主成分，确保预警指标的显著性以及评价体系的简洁性.

1.3 显著性检验

因为Kolmogorov-Smirnov检验能定量地检验一个数据集是否服从正态分布，所以本文采用Kolmogor-ov-Smirnov检验验证预警指标是否服从正态分布.按照显著性水平为0.05的标准，如果渐近显著性双尾大于0.05，表明预警指标通过正态性检验，可以对其进行参数检验；反之则违背正态性假设前提，需要对预警指标进行非参数检验.实证结果显示所有预警指标的渐近显著性双尾均小于0.05，不服从正态分布，需要对其进行非参数检验验证其显著性.

对Kolmogorov-Smirnov检验中不服从正态性假设的预警指标应该对其进行非参数检验，实证研究中常用的非参数检验为Kruskal-Wallis(H检验)，它可以很好地验证多个独立样本是否具有显著性差异.因此，对不服从正态分布的预警指标进行Kruskal-Wallis非参数检验验证其是否能够显著性区分ST公司和非ST公司的能力，检验结果得出预警指标X4、X6、X15、X19、X20没有通过Kruskal-Wallis非参数检验,表明这些指标对于上市公司是否具有退市风险不具有显著的区分能力.综合Kolmogorov-Smirnov正态性检验和Kruskal-Wallis非参数检验结果可知，对上市公司退市风险具有显著区分能力的变量指标为X1、X2、X3、X5、X7、X8、X9、X10、X11、X12、X13、X14、X16、X17、X18、X21和X22.

1.4 主成分分析

经过显著性检验后的指标虽然保证了较高的分辨能力，但如果直接用来训练神经网络会导致系统信息冗余，而且输入变量过多会导致训练神经网络时产生维度灾难问题，所以本文运用主成分分析法对上述17项指标进行降维处理，主成分分析结果如表2所示.

表2 主成分分析结果Tab.2 Results of the principal component analysis

由表2可以看出，前6个特征根的累计贡献率达到了86.26 %，主成分分析效果较好，所以本文选取前6个主成分进行综合评价，前6个特征根对应的特征向量见表3.

表3 6个主成分对应的特征向量Tab.3 Feature vectors for 6 principal components

由表3中的6个主成分对应的特征向量可以看出，第1主成分PT主要反映了上市公司的盈利能力；第2主成分NT主要反映了上市公司的债偿能力；第3主成分OT主要反映了上市公司的发展能力；第4主成分RT主要反映了上市公司的利息保障倍数和资本累计率；第5主成分AT主要反映了上市公司的非财务指标；第6主成分TT主要反映了上市公司的每股收益和每股净资产.

2 PCA-Rprop神经网络退市风险预警模型

Rprop神经网络相较于传统BP神经网络不考虑梯度值的大小而是根据梯度方向来决定网络的权重的调整方向，因此不会受到不可预见的干扰导致梯度坏值的影响.除了梯度的计算以外，权重的计算也只依赖弹性更新值的计算，而弹性更新值的计算相较于权重值的计算更为简单，所以Rprop神经网络的计算量显著小于传统BP神经网络，而且各层网络都具有相同的学习能力，而不受与输出层距离的影响.

2.1 研究方法

第一部分，调整step-size:

(1)

这里，0<η-<1<η+,通常取η-=0.5，η+=1.2，步长是有限的，上下界分别记作Δmin和Δmax.

第二部分，调整权重.

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

第三部分，训练函数的选取.

Rprop神经网络一般选取Sigmoid函数作为神经网络的激活函数.

(10)

式中，En(t)为误差函数，tdk为输出层各节点的目标期望输出，k=1,2,…,n.

2.2 结果分析

对建筑业上市公司是否被ST进行二分类时，以预警指标合成的主成分作为输入层，因此输入层的节点为6，输出层的节点为1.经过多次尝试，在本次实验中选择隐藏层的结构如图1所示.

图1 Rprop神经网络结构图Fig.1 Rprop neural network structure diagram

图2 Rprop神经网络训练过程图Fig.2 Rprop neural network training process diagram

由图2可知，Rprop神经网络在运行了13次后，网络训练误差达到了预定精度17.228 5.

通过图3可以知道Rprop神经网络的训练集拟合度高达95.043 %，测试集拟合度也达到了84.157 %，195家建筑业上市公司退市风险正确预测率达到了93.527 %，实证结果表明表明Rprop神经网络的预测性能十分优秀，具有良好的应用潜力.接下来本文将通过BP神经网络模型和支持向量机模型对Rprop神经网络的预测性能进行对比验证.

图3 Rprop神经网络的回归拟合Fig.3 Regression fitting of Rprop Neural Networks

2.3 模型对比

2.3.1 基于主成分分析的BP神经网络模型

图4 BP神经网络的回归拟合Fig.4 Regression fit of BP neural network

通过对比Rprop神经网络和BP神经网络的Regression拟合图，可以发现Rprop神经网络输出和期望输出之间的拟合效果明显优于BP神经网络的拟合效果.2.3.2 基于主成分分析的支持向量机模型

支持向量机(Support Vector Machine，SVM)是一种能够同时用于分类和回归的统计方法.SVM的原理是将低维特征空间投影到高维中，从而在高维特征空间中实现线性可分.在分类问题上，它通过寻求将特征空间的最优超平面来将其一分为二.本文随机选取数据集75 %的样本进行拟合支持向量分类器训练，基于线性核函数找出特征空间的最优超平面，建立最优支持向量分类器并使用剩余25 %的样本进行交叉验证.

主成分PT与主成分OT分别反映了上市公司的盈利能力和发展能力，此时使用最优线性模型对测试集进行测试，结果显示，分类正确率为83.24 %.可见支持向量机模型的分类效果还是没有Rprop神经网络好.

图5 支持向量分类器Fig.5 Support vector classifier

表4 3种模型的正确分类率Tab.4 Correct classification rates for 3 models

3 结论与建议

建筑业作为我国经济增长的主要助推器之一，行业的转型发展深刻的影响我国的经济活力，因此必须对潜在退市风险的公司进行诊断，从而对冲处于退市风险中公司可能造成的经济损失.本文提出了一种结合主成分分析的Rprop神经网络预警模型，通过对我国195家上建筑业上市公司的财务数据进行实证分析，结果表明Rprop神经网络的正确分类率优于BP神经网络和支持向量机模型,对我国建筑业上市公司的退市风险具有良好的预测性能.基于上述分析对我国建筑业上市公司的转型发展提供以下参考建议：

首先，公司应该树立与时俱进的退市风险预警意识.虽然现在大多数公司都意识到了退市风险预警对公司发展的重要性并开展了相关预警工作，但相当一部分公司的预测模型和方法过于陈旧，直接照搬几十年前提出的Z分数模型、F分数模型等，这无疑降低了公司退市风险预警的准确性.其次，公司应正确定位自身发展阶段，在退市风险预警模型中引入合适的非财务指标建立更加完善的预警体系，以更加广阔的视角分析当前公司的发展状况从而提高预测模型的准确率.最后，公司应该顺应国家经济转型发展的趋势，在转型的过程中不断激发公司的创新活力，为公司未来的腾飞打下坚实的基础.