姜凤珍 李毛 王骏
摘要:以中国房地产上市企业为研究对象,选取了反映企业偿债能力、盈利能力、营运能力和杠杆比率在内的20个指标,收集了137家企业在1991~2021年期间的财务数据,构建了基于软投票的集成模型来预测中国房地产上市企业一年期和两年期的财务困境。结果显示,集成模型提前一年期和两年期预测的AUC值分别为0.946和0.880,与性能最好的单一分类器相比预测性能更高。然后通过SHAP解释模型对集成模型中输入变量的解释能力进行分析。无论提前一年期还是两年期,预测准确率在很大程度上受销售净利率、净资产收益率、应收账款周转率、利息保障倍数和总资产收益率的影响。提出的模型通过对房地产企业财务困境高准确率的预测,识别与预测相关的主要变量,有望帮助房地产企业和其他相关利益者通过早期预警防止破产。
关键词:房地产企业;财务困境;集成模型;软投票;Shapley值
中图分类号:F275;TP391 文献标志码:A 文章编号:1008-4657(2024)02-0043-10
0 引言
根据中国国家统计局的数据,中国房地产行业的GDP已经从1998年的3 425亿元人民币(占GDP总量的4.02%)增加到2021年的77 216亿元人民币(占GDP总量的6.78%)。这样的增长是由中国银行业的深度支持推动的,并依赖于房地产行业内的高杠杆和长周转的商业模式[ 1 ]。尽管这种商业模式带来了快速增长,但它也使中国的房地产行业特别容易受到金融危机的影响,对经济周期也很敏感。为了防止房地产债务危机,维护金融系统的稳定和安全,中国政府实施了国家“去杠杆化”政策,并提出了“三条红线”政策来收紧房地产行业业务[ 1-2 ]。以中国最大的民营房地产企业——中国恒大集团为例,近期,恒大被曝出巨额债务,存在巨大的偿债违约风险。作为一个拥有2.38万亿元资产的大型企业,恒大见证了金融公司的爆发、商业票据的失效、房地产的停工和员工的辞职。同时,恒大还背负着1.97万亿元的债务[ 3 ]。这让人们注意到房地产行业长期存在的过度融资问题。房地产业的融资渠道非常单一,大多依靠银行贷款。根据中国经济金融研究(China Stock Market & Accounting Research Database, CSMAR)数据库,房地产企业的资产负债率普遍较高,达到了65.2%。因此,对房地产行业财务困境的预测是一个非常重要的研究课题。
然而,大多数研究者只关注所有上市公司的财务困境预测,而专注于房地产行业的研究却很少[ 4 ]。而建立房地产行业预测模型的论文对不平衡数据集的处理过于简单,采用人工逐一匹配的方法[ 5-6 ],不具有随机性,得到的结果不具有遍历性。相关研究大多预测了1年内企业遭遇财务困境的概率,从短期角度看是有意义的。然而房地产项目一般需要一年以上的时间来完成。更重要的是,机器学习模型的“黑箱”问题使得其对模型预测结果的解释性较差,很多研究将重点放在确定具有高预测性能的输入变量组合,没有明确哪个输入变量对预测精度影响最大[ 7 ]。
1 文献综述
长期以来,研究人员和从业人员利用许多不同的技术来构建财务困境的预测模型传统的破产预测模型是利用统计技术构建的。研究人员开发了MRA(Multivariate Regression Analysis)模型[ 8 ]、MDA(Multivariate Discriminant Analysis)模型[ 9 ]和LR(Logistic Regression)模型[ 10 ]。然而,这些统计技术有一个缺点,就是受到假设的限制。在过去的二十年里,破产预测方法的流行已经从统计方法转向人工智能方法。Kumar P R等[ 11 ]比较了采用这两组方法的论文,并得出结论,人工智能方法优于统计方法。人工智能方法能够考虑到大量的属性并评估它们之间更复杂的关系。尽管人工智能技术的种类越来越多,但有三种技术是最常使用的,神经网络(Neural Network,NN)、决策树(Decision Tree,DT)和支持向量机(Support Vector Machine,SVM)。但它们在房地产行业的应用是有限的。Dong Yuanxiang等[ 12 ]利用逻辑回归、支持向量机和神经网络来预测2005~2009年期间107家中国房地产企业的违约情况。近年来,集成分类器通过结合多个单一分类器产生比单一分类器更好的假设,从而产生比单一分类器更优的结果[ 13 ]。Liao Bangxiong等[ 14 ]以反向传播神经网络(Back Propagation Neural Network, BPNN)为基础学习器,构建了两个集成分类器,即BPNN-AdaBoost和BPNN-Bagging,来预测中国建筑和房地产企业的财务困境。
房地产行业的大多数相关研究都集中在提高財务困境的预测精度上。除了预测的准确性,识别输入变量和预测结果之间的关系也是至关重要的,它可以为这些模型的改进提供见解,支持对被建模过程的理解,以及帮助输入变量的选择。Nohara Y等[ 15 ]提出了基于沙普利值可加性解释模型,其在博弈论中具有坚实的理论基础,能够显著提高机器学习模型的可解释性,迅速在各个领域得到广泛应用[ 16-17 ]。以往关于企业财务困境预测的研究通常采用样本匹配法,即将一组违约企业与相同数量或一定倍数的健康企业进行匹配[ 6,18 ]。然而,样本匹配法可能会导致有偏见的预测结果[ 19 ]。为了避免这种偏差,一些研究放弃了样本匹配方法,而把所有可用的公司年数据用来代表公司的财务状况[ 20 ]。然而,这种方法会导致非违约样本的数量大大超过违约样本的数量。这种情况被广泛地称为类不平衡问题。为了处理这个问题,人们提出了两种不同的取样方法,欠采样技术(RUS)[ 20 ]和过采样技术(SMOTE)[ 21 ]。
2 模型构建
在数据集被分割成训练集和测试集之后,欠采样旨在减少多数类成员的数量,而过采样则旨在增加训练集中少数类成员的数量。过采样的优点是不会丢失原始训练集的信息,因为所有的原始成员都保留了下来,但是过采样会增加训练集的大小,从而相应地增加训练时间和内存量[ 21 ]。过去的研究没有就哪种技术比另一种技术更好达成一致结论,冲突的结果可能是由于不同的数据集和分类算法的结合[ 22 ]。因此,本研究分别使用RUS和SMOTE算法来处理不平衡数据,得到2个数据集。此外,本研究添加高斯噪声扩大原始数据集的规模,这是一种数据增强的形式,它可以减少由样本少引起的网络过拟合问题。
2.1 单一分类器的训练
对于从上一步得到的数据集,分别采用模型池中的6种常见的单一分类器进预测:逻辑回归(Logistic Regression,LR)、人工神经网络(Artificial Neural Networks,ANN)、支持向量机(Support Vector Machine,SVM)、K近邻(K-Nearest Neighbors,KNN)、分类回归树(Classification and Regression Tree,CART)和朴素贝叶斯(Naive Bayes,NB)。2个数据集在提前一年和两年的预测点上分别建立了6个不同的单一分类器。根据不同模型的特点,本文基于测试集用网格搜索算法对模型进行参数调优,每个分类器需要调整的参数及其候选值如表1所示。通过循环遍历给定的参数组合来优化模型,以达到最佳预测性能,参数是用交叉验证法确定的。
2.2 集成分类器的构建
以前的研究提出了诸如Q统计量[ 23 ]用加权计数值(Weighted Count of Errors and Correct results,WCEC)[ 13 ]等不同的指标来计算单一分类器的成对多样性,具有较高多样性的组合是首选。然而,选择多样性最高的单一分类器组合并不能保证是表现最好的集成分类器。本研究没有计算单一分类器的成对多样性并从最多样化的组合中选择最佳的集成分类器,而是采用了一种基于软投票的集成分类器。
投票分类器使用两种类型的投票技术,即硬投票和软投票。在硬投票中,最终的预测是通过多数投票完成的,在这种情况下,聚合器会选择在基础模型中反复出现的类别预测。在软投票中,基础模型应该有Predict_proba方法。投票分类器呈现出比其他基础模型更好的整体结果,因为它结合了不同模型的预测。构建软投票集成分类器如图1所示。
由图1可知,逻辑回归(LR)、人工神经网络(ANN)、支持向量机(SVM)、K近邻(KNN)、分类回归树(CART)和朴素贝叶斯(NB)分类器被组合在一起。其中的决定是在单个决定的基础上做出的,这些决定根据概率值进行组合,以指定数据属于某个特定类别。在软投票集成方法中,预测根据分类器的重要性进行加权,并将其合并以获得加权概率和。具有最大加权概率之和的目标标签被选中,因为它具有最大的投票值,定制的权重也可以用来计算加权概率。通过列举所有单一分类器的组合来创建不同的集成分类器,计算AUC(Area Under The Curve, AUC)值,根据一年期和两年期预测的最高AUC值来选择表现最佳的集成分类器。
3 实证分析
3.1 数据获取和处理
图2是本研究的研究方法流程图。
由图2可知,研究方法流程包含三个部分:数据获取和处理,单一分类器的训练,以及集成分类器的构建和可解释性分析。本文的数据处理和建模和以及解释性分析都是在Python程序中完成的。
在数据获取和处理部分,本研究的数据收集自Choice金融终端数据库,根据全球行业分类标准(Global Industry Classification Standard,GICS)选择了137家房地产企业。根据中国上海证券交易所和深圳证券交易所的上市规则,对财务状况异常的上市企业股票交易实行特别处理(Special Treatment,ST),其股票名称也会被标记上“ST”,作为未来可能发生的财务危机的预警,这是我国资本市场特有的一个制度。在国内,由于破产或者退市的企业数量较少,普遍采用是否被特殊处理(ST)作为企业陷入财务困境的标志[ 24 ],本研究采用同样的方法来区分财务困境企业(y = 1)和正常健康企业(y = 0)。每家企业和每一年的数据被视为一个样本,构建的数据集是一个(4110,21)矩阵,其中4110代表样本的数量,21代表20个自变量和y因变量。
一旦选择了适当的样本,那么就必须确定相关的变量来进行模型开发。破产发生的原因有很多,其中之一是財务困难或所谓的财务困境。当一个公司不能满足其预定的付款,或者当现金流预测表明公司无法支付时,财务困境就开始了。预测财务困境对公司来说是一件非常重要的事情,以预测未来会发生的破产风险。财务比率反映了从财务报表或其他财务信息来源中得出的两个数字之间的关系,潜在财务困境的迹象一般在公司经历失败之前很长时间就会在财务比率中显现出来,在企业失败预测中占绝对优势[25]。本文的输入变量是从企业失败预测模型的综述文献中选出的[7,11,26]。我们确定的20个财务比率变量被用于三个或更多的预测模型,因此我们认为这些变量具有很好的预测能力,在构建新模型时应考虑它们的应用。这些输入变量涵盖了房地产企业的财务特征和业绩,被分为以下四类:偿债能力、盈利能力、营运能力和杠杆比率。表2概述了具体的输入变量,对于每个变量,表3报告了4 110个可用观测值的样本平均值、中位数、标准差、最小值和最大值。
由于本文研究的是财务困境预警,我们关心的是企业何时发生财务困境。那么对于每个企业来说,它收到ST标记后的数据被删除,因为如果企业陷入财务困境的事实已经公开,继续预测就不是本研究的目的。对于那些收到多次标记为ST的企业,从ST戴帽到摘帽之间的数据被删除。原始数据集被处理成两个数据集,用于提前一年预测(N1 = 83,N0 = 3672,其中N1代表财务困境样本的数量,N0代表正常健康样本的数量)和提前两年预测(N1 = 83,N0 = 3535)。假设公司被ST年份为第i年,分别选取第i-1和第i-2年,也就是用其发生财务危机前一年和前两年的财务数据构建预警模型,对公司第i年的财务危机状况进行预测。
为了从数据挖掘中获得更好的结果,处理缺失值是一个必要的程序。首先对于每个数据集,有三个以上缺失变量的样本被剔除,剩下的样本中的缺失值用链式方程的多重插补(Multiple Imputation by Chained Equations,MICE)方法来填充[ 4 ],最后得到两个数据集:提前一年预测(N1 = 83,N0 = 3032)和提前两年预测(N1 = 83,N0 = 2897)数据集。
3.2 評价指标
本研究采用AUC(Area Under The Curve, AUC)来评估分类器的性能。AUC是接收操作特征(Receiver Operating Characteristics,ROC)曲线中最常见的定量指标,被广泛用于企业财务困境预测模型的比较[ 7 ],它是检查任何分类模型性能的最重要的评估指标之一,也被写为AUROC。ROC是一条概率曲线,AUC代表分类器区分类别的能力,AUC越高,说明该模型在区分正负类方面的表现越好。
为了评估集成分类器和六个单一分类器的分类性能,我们进行了k倍交叉验证。这种方法比其他验证方法更有效地减少偏差和变异[ 13 ],可以在一定程度上避免过拟合问题。如前所述,通过RUS和SMOTE算法对原始数据集进行重新采样。重新采样的数据集被分为训练和测试数据集,本文采用了五倍交叉验证的方法,训练数据集被随机分割为五份互不相干的子集,每次随机选择4份作为训练集训练模型,剩下的1份做测试集。当这一轮完成后,重新随机选择4份来训练数据。若干轮(小于5)之后,选择损失函数评估最优的模型和参数。分类器的总体性能是通过5个子集的平均性能来计算的。
3.3 模型对比分析
图3和图4分别显示了这些模型提前一年和提前两年预测房地产企业财务困境的表现,左边的图显示了使用RUS时的各模型性能,右边的图显示了使用SMOTE时的各模型性能。每个分类器的结果都是通过对每个预测年份的数据集进行5倍交叉验证产生的。软投票算法通过六个单一分类器的分类结果,计算出多数投票,得出最终预测结果。根据软投票的结果,为提前一年和提前两年的两个数据集分别选择具有最好性能的集成分类器。
由图3可知,对于提前一年的预测,使用RUS时的集成分类器由ANN和KNN组成,使用SMOTE时的集成分类器由ANN和LR组成。使用RUS时的集成分类器(AUC = 0.946)比使用SMOTE时的集成分类器(AUC = 0.936)有更好的性能,而且使用RUS时的集成分类器的表现超过了每一个单一分类器。
由图4可知,对于提前两年的预测,使用RUS时的集成分类器由ANN、KNN、LR和CART组成,而使用SMOTE时的集成分类器由ANN和LR组成。使用RUS时的集成分类器(AUC = 0.880)也比使用SMOTE时的集成分类器(AUC = 0.874)有更好的表现,而且它的表现也超过了任何单一分类器。本研究结果表明,与六个单一分类器相比,在预测房地产企业的财务困境时,所提出的软投票集成分类器可以在预测点提前一年和两年的情况下取得更优异的性能,而且当使用RUS方法进行抽样时,性能总是更好。
此外,本文的目标之一是确定财务困境预测的最关键时间段,因此,我们根据提前一年和提前两年的两个数据集,然后参考1991年到2021年的数据组合(i-1和i-2),分别评估分类器的AUC值。无论单一分类器还是集成分类器,随着预测期的延长,以AUC值计算的房地产企业的财务困境预测性能明显下降。在使用提前一年的数据集预测时,预测性能达到最高。在预测时间提前两年的情况下,分类器的AUC值明显下降,最高预测性能低于0.9。众所周知,AUC值大于0.9的分类器具有出色的识别性能[ 19 ]。这意味着,对于房地产行业的数据来说,提前一年的数据最能说明即将发生的财务问题。本文使用1991年到2021年多年的组合也并没有提高预测。这可以解释为,要么分类器不能利用多年的数据多样性,要么更有可能的是,关于财务困境的主要信息包含在i-1年的数据中,以前的数据对分类器贡献的信息很有限。
3.4 变量重要性分析
为了增强模型的可解释性,本研究进一步采用SHAP解释模型对使用RUS方法进行抽样的两个软投票集成模型的结果进行分析。SHAP解释模型的基础是Lundberg S于1953年提出的Shapley值法,该方法将模型中所有特征变量都定义为对模型结果的贡献者,某一个特征变量Shapley值就是该特征对模型预测结果的边际贡献[ 15 ]。使用RUS后提前一年(左)和提前两年(右)软投票集成模型的Shapley值如图5所示。
从图5可以看出,对于提前1年的预测模型,ROS的Shapley值最高,其次是ROE和ART。对于提前2年的预测模型,结果显示ROE的Shapley值最高,其次是ART和ROE。
结果还说明了两个模型之间的输入变量影响的比较。与在提前一年的预测模型一致,提前两年的预测模型中排名前五的变量也是ROS、ROE、ART、TIE和ROA,这表明,无论短期还是长期预测,ROS、ROE、ART、TIE和ROA对预测准确率都有明显影响。
同时,随着预测期的延长,有两个变量,即ROS和ART,对预测准确性的影响有所下降。其余18个变量的Shapley值随着预测期的增加而增加,表明随着预测期的延长,他们对预测准确性的影响增加。
4 结论与展望
本研究构建包含四个方面财务指标的房地产上市企业财务困境预警指标体系,利用欠采样(RUS)和过采样技术(SMOTE)对非平衡数据集进行处理,并通过6种单一分类器(LR, ANN, SVM, KNN, CART, NB)和软投票集成分类器建立财务困境预警模型。结论如下:所提出的集成模型在提前一年和两年的预测中都取得了最高的性能,而且当使用RUS方法处理非平衡数据集时,性能总是更好;无论单一分类器还是集成分类器,随着预测期的延长,以AUC值计算的房地产企业的财务困境预测性能明显下降;所提供的基于SHAP解释模型比较两个预测模型中输入变量对预测准确性的影响,无论短期还是长期预测,ROS、ROE、ART、TIE和ROA对模型预测准确率都有明显影响。
本研究在以下三个方面对知识体系有所贡献。首先,本研究提出的模型是基于比以往大多数研究更广泛的时间范围建立的,增加了模型的通用性和对不同经济周期的稳健性。第二,本研究提出了预测中国房地产上市企业财务困境的集成学习方法,以往大多数研究只利用单一分类器,而集成分类器显示出比单一分类器更好的性能。最后,本研究采用了SHAP解释模型用于衡量输入变量对集成分类器预测性能的影响,提高了模型的分析能力。
未来的研究方向包括:(1)收集更多的变量,涵盖除偿债能力、盈利能力、营运能力和杠杆比率之外的其他企业特征;(2)在输入变量之前进行特征选择程序;(3)延长输入变量的时间段,从而纳入更多以前时期的变量;(4)纳入其他单一分类器,如深度学习算法;(5)实施不同的加权机制以创建集成分类器。
参考文献:
[1]郭菲,冯长春.宏观调控政策下我国住房市场周期变化的影响分析[J].地域研究与开发,2020,39(6):18-23.
[2]王建勇,李艾琳.警惕“利用资本市场赚钱”的商业模式——恒大应对危机引发的思考[J].财会通讯,2021(22):3-9.
[3]张强.大型企业集团财务危机预警研究——以海航和恒大为例[J].审计研究,2023(1):48-56.
[4]Azur M J,Stuart E A,Frangakis C,et al. Multiple imputation by chained equations: what is it and how does it work?[J]. International Journal of Methods in Psychiatric Research,2011,20(1): 40.
[5]Cheng Minyuan,Hoang Nhat-Duc, Limanto Lisayuri,et al. A novel hybrid intelligent approach for contractor default status prediction[J].Knowledge-Based Systems,2014,71:314-321.
[6]Han Yang,Zhang Haotian,Zhao Yong. Structural evolution of real estate industry in China: 2002-2017[J]. Structural Change and Economic Dynamics,2021,57:45-56.
[7]Veganzones D,Séverin E. Corporate failure prediction models in the twenty-first century:a review[J] . European Business Review,2020(ahead-of-print):204-226.
[8]Roozbeh Kangari, Foad Farid, Elgharib Hesham M. Elgharib. Financial performance analysis for construction industry[J]. Journal of Construction Engineering & Management,1992,118(2):349-361.
[9]Abidali A F,Harris F. A methodology for predicting company failure in the construction industry[J]. Construction Management & Economics,1995,13(3):189-196.
[10]陳欣欣,郭洪涛.因子分析和Logistic回归在农业上市公司财务预警中的联合运用[J].数理统计与管理,2022,41(1):11-24.
[11]Kumar P R,Ravi V. Bankruptcy prediction in banks and firms via statistical and intelligent techniques: a review[J]. European Journal of Operational Research,2007,180(1):1-28.
[12]Dong Yuanxiang,Xiao Zhi,Xiao Xue. Default prediction for real estate companies with imbalanced dataset[J]. Journal of Information Processing Systems,2014,10(2):314-333.
[13]Choi Hyunchul,Son Hyojoo,Kim Changwan. Predicting financial distress of contractors in the construction industry using ensemble learning[J]. Expert Systems with Applications,2018,110:1-10.
[14]Liao Bangxiong,Li Hui,Sun Jie. AdaBoost and bagging ensemble approaches with neural network as base learner for financial distress prediction of Chinese construction and real estate companies[J]. Recent Patents on Computer Science,2013,6(1): 47-59.
[15]Nohara Y, Matsumoto K, Soejima H, et al. Explanation of machine learning models using improved shapley additive explanation[C]//Proceedings of the 10th ACM international conference on bioinformatics, computational biology and health informatics,2019: 546.
[16]王达,周映雪.随机森林模型在宏观审慎监管中的应用——基于18个国家数据的实证研究[J].国际金融研究,2020(11):45-54.
[17]肖艳丽,向有涛.企业债券违约风险预警——基于GWO-XGBoost方法[J].上海金融,2021(10):44-54.
[18]He Hongliang,Zhang Wenyu,Zhang Shuai. A novel ensemble method for credit scoring: adaption of different imbalance ratios[J]. Expert Systems with Applications,2018,98:105-117.
[19]Tserng H P,Lin G F,Tsai L K, et al. An enforced support vector machine model for construction contractor default prediction[J]. Automation in Construction,2011,20(8):1242-1249.
[20]李艳霞,柴毅,胡友强,等.不平衡数据分类方法综述[J].控制与决策,2019,34(4):673-688.
[21]张忠林,冯宜邦,赵中恺.一种基于SVM的非均衡数据集过采样方法[J].计算机工程与应用,2020,56(23):220-228.
[22]Mohammed R,Rawashdeh J,Abdullah M. Machine learning with oversampling and undersampling techniques: overview study and experimental results[C]//2020 11th International conference on information and communication systems (ICICS),2020.
[23]曹振田.基于Q统计量的选择性集成学习研究[D].合肥:安徽大学,2010.
[24]张金昌,王大伟.财务困境预警:概念界定与理论辨析[J].财经论丛,2020(12):61-69.
Research on Financial Distress Predicting of Listed Real
Estate Companies using Soft Voting Ensemble Learning
JIANG Fengzhen, LI Mao, WANG Jun
(School of Management Engineering, Qingdao University of Technology, Qingdao 266520, China)
Abstract: In this study, taking Chinese listed real estate companies as research objects, 20 financial indicators reflecting solvency, profitability, operating capacity and leverage ratios are selected, and the financial data of 137 companies are collected for the period of 1991-2021, and a ensemble models based on soft voting is constructed to predict the financial distress of Chinese listed real estate companies in the one-year and two-year periods. The results show that the AUC value of the ensemble models are 0.946 and 0.880 for one-year and two-year advance prediction, respectively, which are higher compared with the best-performing single classifier. The explanatory power of the input variables in the ensemble models are analyzed by the SHAP explanatory model. Prediction accuracy is heavily influenced by ROS、ROE、ART、TIE and ROA, irrespective of the one-year or two-year advance period. The models proposed in this study predict the financial distress of real estate companies with high accuracy and identify the main variables related to forecasting. The study is intended to assist real estate companies and other relevant stakeholders to prevent financial failures through early warning.
Key words:Real Estate Companies; Financial Distress; Ensemble Learning; Soft Voting; Shapley Value
[責任编辑:许立群]