姜慜喆,赵盛喆,黄雅荷
(1.武汉理工大学 安全科学与应急管理学院,湖北 武汉 430070;2.华中师范大学 信息管理学院, 湖北 武汉 430079)
2008年,美国的金融危机升级为经济危机,并将影响范围扩展至全球,造成金融系统紊乱、金融机构倒闭以及金融资产萎缩等一系列连锁反应,引发了政府和学者对金融风险领域的广泛关注。党的十九大报告把防范化解重大风险摆在三大攻坚战之首,要求保持对重大风险普遍性和客观性的清醒认识。在经济全球化的背景下,任何国家或地区都不可能成为有风险的孤岛,地区的风险乃至国家的风险会迅速地传递到其他的国家或地区。因此,监控金融风险出现的征兆,预防可能会发生的金融风险,是国家获得长远发展的关键和难题。
随着大数据时代的到来,海量的金融数据对传统的金融风险管理体系造成巨大的冲击,金融风险管理问题日益突出,传统的分析方法已经不能满足如今的金融风险管理需求。在各类计算机技术的快速进步以及经济社会发展的协同作用下,机器学习算法开始逐步应用于金融风险预测领域。上市公司财务困境预警以及信用风险评估是金融风险预测领域中典型和热点的研究对象。由于金融风险数据具有样本复杂性、指标多样性等特征,因此通过机器学习模型对其进行分析和预测,研究机器学习在金融风险预测领域中应用,有助于加强金融风险管理效率和推进社会良好发展。综上,笔者以上市公司财务困境预警和信用风险评估为例,围绕这两个金融风险预测问题展开综述,从金融风险预测度量指标、机器学习分析方法和机器学习在金融风险预测领域中的应用3个方面出发,进一步梳理了金融风险预测领域的相关研究,并最终展望了该领域的研究趋势。
建立合适的金融风险度量预警指标体系是建立预测模型的基石,对于模型的预测效果至关重要。在财务困境预警领域中,大多数的传统研究使用财务指标作为分析依据,而MERWIN[1]首次运用流动比率、营运能力与负债权益比例等财务指标预测公司财务困境。此后,财务指标在财务困境预警中得到广泛运用。鲍新中等[2]利用粗糙理论对33个财务指标进行筛选,最终得到流动比率、资产周转率和营业收入增长率等9个能够更好阐述公司财务状况的财务指标进行财务困境预警研究。PAVLICKO等[3]选取27个财务指标对中欧550 000家公司的财务困境进行预测,结果表明流动比率、股本回报率、资产回报率、债务比率和净营运资本等5个指标对财务困境预警的贡献最突出。
然而,财务指标属于定量指标,忽视了企业内部治理等定性因素对财务状况的影响,在一定程度上影响了财务困境预警模型的准确性。为解决此问题,有学者提出引入考虑定性信息的非财务指标完善财务困境预警指标体系。国内对于非财务指标的研究相对比较晚。国外对于非财务指标的运用最早可以追溯至1960年[4],国内在2000年以后才有人陆续将非财务指标引进财务困境预警指标体系中。早年引用较多的非财务指标大多为管理指标,如WANG等[5]在预警模型中加入了股权集中度指标,曹德芳等[6]在研究中加入了股权结构变量。非结构化的文本数据也引起了学者们的关注,文本数据包含规范性文本和非规范性文本。规范性文本是指上市公司年报等拥有高度标准化特征的数据,能够反映公司经营情况和发展趋势。李诗轩等[7]探究了上市公司年报中的非结构化数据对于企业财务困境的影响,研究发现来源于上市公司年报的文本数据,能够辅助传统的财务指标实现更高效率的财务困境预警。非规范性文本则是指来源于网络媒体的数据,如财经新闻、股吧评论等,能够体现文本的多样性。边海容等[8]利用财务指标和从中证网中的收集文本数据进行财务困境预警,证明了网络媒体文本数据对于提高财务困境预警模型性能的重要性。杨扬等[9]综合运用了规范性的上市公司年报数据以及非规范性的网民评论的文本数据,发现非规范性文本信息在预测企业信用风险方面的准确性更高。
在信用风险评估领域中,传统的评估方法为专家打分法,即信贷行业专家通过自身的专业知识和行业经验对信用风险要素进行主观评估,如5C、5P和5W要素法等。随着金融全球化的发展,金融界对信用风险的关注逐渐增加,信用风险评估方法也不断推陈出新,定量化的硬信息和定型化的软信息均被广泛运用于信用风险评估领域。由于银行和投资者所面临的信用风险往往来自借款企业的财务困境,因此发现和收集一些反映企业经营状况的指标,能够确定企业信用风险评级,为银行和投资者进行贷款或投资行为提供依据。基于这一逻辑,金融机构通常将企业出现信用风险的信号转化为企业陷入财务困境。财务困境是指财务情况出现严重恶化,导致企业或个人资金链无法偿还债务或支付日常开销。国内学者通常将获得特殊处理(ST)标签的公司视为财务困境公司,如陈辉远等[10]在不同时期的研究大多都以ST标签为判定方法,判断上市公司是否陷入财务困境。此外,周颖等[11-12]同样以ST标签作为判定方法,判断上市公司是否出现信用风险。因此,部分信用风险评估领域中所采用的度量指标与财务困境预警领域中的度量指标高度重合。在财务困境预警领域所广泛采用的指标体系之外,有学者进一步考虑了其他非财务指标对借款企业进行信用风险分析。王鑫等[13]从守信意愿、守信能力和守信表现3个方面评估企业信用风险情况,具体包含公司价值理念、制度规范、财务能力、管理能力和公益支持等9个方面二级指标,以及19个三级指标,构建了包含88个指标的信用风险评估体系,以期能够更全面、客观地反映中小企业信用风险。
除了将信用风险测度转化为企业财务困境研究,也有学者以融资企业是否有违约记录判断企业是否存在信用风险。如胡海青等[14]将企业的信用风险历史分类数据作为机器学习模型的输出,从供应链金融视角下对中小型企业进行信用风险评估,从行业状况、融资企业自身状况、核心企业资信状况以及供应链关系状况4个角度出发,构建包含宏观经济状况、法律政策因素、行业竞争强度、产品价格优势等31个指标的信用风险评估指标体系。基于上述文献,笔者对金融风险预测度量指标做了进一步梳理,结果如图1所示。
图1 金融风险预测度量指标
机器学习是一类算法的总称,这些算法通过对输入的样本数据进行反复多次的学习和训练,并最终输出算法的分类或预测结果,其基本运行框架如图2所示。机器学习是当代人工智能的核心,通过模拟人脑或者采用人类的方法,使计算机具备自动学习能力。研究者期望通过机器学习算法从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类当中。
图2 机器学习基本运行框架
目前,机器学习方法已广泛应用于多个领域。
按照任务目标的不同可将机器学习算法分为以下3类:回归算法、分类算法和聚类算法。①回归算法能够建立变量之间的回归模型,通过给定一个训练集,根据该训练集进行学习得到一个线性函数,并利用学习(训练)过程得到自变量与因变量之间的相关关系,用于模型预测或者分类。杨青龙等[15]运用LASSO回归模型预测企业财务困境,并证明了该模型预测的有效性。②分类算法是一种对离散型随机变量进行预测的监督学习方法,通过训练集对某个分类模型进行训练,并最终达到对新的数据进行预测的目的,被广泛地应用于企业财务危机预警、信用风险评估等金融风险领域中。常见的分类算法包括决策树(DT)、逻辑回归(LR)以及支持向量机(SVM)等。CHEN[16]利用DT和LR对上市公司财务困境进行预警,发现LR能比DT发现更长时期的财务困境隐含信号。③聚类是机器学习中一种重要的无监督算法,它可以将数据点归结为一系列特定的组合。理论上归为一类的数据点具有相同的特性,而不同类别的数据点则具有各不相同的属性,常用的聚类算法包括K-均值聚类、层次聚类和线性判别分析。如陈茜等[17]运用聚类分析法对上市公司进行财务风险预警,为企业控制可能会发生的财务风险提供理论依据。
无论是在早期的财务困境预警研究还是信用风险评估研究中,大多数学者选择将企业出现财务困境或信用违约风险视为平衡问题,即认为出现金融风险的公司数量等同于金融状况正常的公司数量。然而,在现实情况中,前者的数目要远小于后者。若基于平衡数据集进行金融风险预测,会致使模型无法贴合现实情况,使研究结果缺乏可信度。然而,如果使用非平衡的数据进行建模,会导致模型偏向多数类样本,即金融状况正常公司,从而大幅降低判断准确率。目前解决非平衡问题对研究结果的影响主要从数据层和算法层两个层面展开。
在数据层面,学者们通常采用不同形式的重采样方法平衡数据集中的类别分布,通过增加少数类的数量或减少多数类的数量以消除类不平衡问题。包括欠采样、过采样以及混合采样3类方法。文献[11]通过随机欠采样方法平衡违约公司和非违约公司的数量,通过企业历史数据预测企业未来的信用违约风险。ZHOU[18]运用2种过采样方法和4种欠采样方法解决企业破产预测的类不平衡问题,发现训练样本集中少数类样本的数量会影响不同采样方法的性能,少数类样本数量较少的时候应选取过采样方法,少数类样本较多时欠采样方法更优。过采样方法是目前面向不平衡问题中应用最为广泛的采样方法,相对随机过采样方法,合成少数类过采样技术(SMOTE)能够降低过拟合的风险,增加模型的泛化能力,目前已被广泛应用于财务困境预警领域。
在算法层面,通常不会对训练数据集做过多的预处理,而是通过考虑各种误分类情况的成本差异,对传统分类器进行改进和重设计,提高其对不平衡数据集特殊分类需求的适用性。代表性的方法有代价敏感学习算法和集成学习算法。张悦等[19]基于代价敏感学习对国内上市公司展开财务造假识别研究,构建财务造假识别模型,实验结果表明,该算法能够有效提升财务造假公司的识别正确率。集成学习是指利用特定规则集成多个基分类器,从而提高模型的泛化能力。TAO等[20]综合应用了上述两种学习方法,提出了一种以代价敏感SVM模型为基分类器的Adaboost集成学习模型,该方法在G-Mean和F-Measure两个评估指标上表现出更好的泛化性能。
1968年,ALTMAN在文献[4]中使用多元判别分析(MDA)预测公司破产的概率,并开创性地提出了Z-score模型的概念,为使用统计学方法进行金融风险预测开创了先河。此后,线性判别分析(LDA)、因子分析(FA)等统计学模型被广泛应用于金融风险预测领域。尽管统计学算法拥有易于计算、利用便捷等优点,但其依赖于限制性假设,在一定程度上限制了统计学模型的准确性与适用性。随着信息技术的发展,限制较少的机器学习方法已经成为金融风险预测领域的主流预测模型。
机器学习方法的应用过程通常分为两个阶段:指标筛选阶段和模型构建阶段。由于机器学习模型容易受到冗余特征的影响,因此通过指标选择算法消除冗余特征,能够防止模型过拟合,对提高预测模型的准确性有积极效果。特征选择方法可以被大致分为3类:过滤法,包裹法和嵌入法。文献[10]~文献[11]及文献[15]分别使用过滤法、包裹法和嵌入法对上市公司金融风险预测指标体系进行筛选,提高了模型的可读性与准确性。
机器学习模型在财务困境预警问题中的应用主要分为两个模块:单分类器和集成分类器。单分类器包含决策树(DT)、支持向量机(SVM)和逻辑回归(LR)等,而集成分类器集成算法按照个体学习器之间的关系,可以分为Bagging、Boosting、Stacking共3类,其中,使用的较为广泛的为Bagging法与Boosting法。谢纪刚等[21]对比了两种单分类器和集成分类器在财务困境预警问题上的预测效果,发现集成分类器能够提高模型的预测性能。随后,越来越多的学者应用集成分类器进行金融风险预测研究,如文献[2]、文献[12]和文献[14]。
在金融风险预测领域,虽然机器学习算法相较传统的统计方法能够提供更准确的预测结果,但算法复杂度的增加会造成模型的可解释性降低,无法判别模型结果的合理性,导致难以给出具有可解释性和说服力的风控结论,大幅降低了模型的实际效益。为提高模型的可解释性和透明性,建立用户和决策模型之间的信任关系,学术界主要从两个角度来寻找解决方法:①将解释方法与模型进行结合的内在解释法和事后解释法。内在解释法即建立本身就具备可解释性的模型(决策树、线性回归、logistic回归等),利用模型所具备的特性为解释模型提供支持;事后解释方法即针对特定的黑盒模型(集合算法或神经网络等),并在训练后利用某些方法对其进行分析,如特征重要性、梯度积分等。②分离解释方法和模型的模型无关法,能够增加解释方法的灵活性和可用性,包含部分依赖图、个体条件期望图以及局部可解释性描述算法等。
随着互联网、人工智能等技术的飞速发展,针对金融风险预测模型的研究也进一步深化,经历了从定性到定量,从简单到复杂,从单一算法到集成算法的发展路线,引起了国内外学者广泛关注。从研究结果上来看,基于机器学习的金融风险预测模型比基于传统统计方法的金融预测模型拥有更突出的预测性能,能够为现实中的金融决策提供理论支撑。
(1)从金融风险预测度量指标、机器学习分析方法以及机器学习在金融风险预测领域中的应用3个方面出发,对金融风险预测领域的文献进行比较和总结。研究发现:①在构建金融风险预测指标体系时,早期的研究多采用财务指标,近年来有学者开始陆续引入非财务指标作为财务信息的补充;②机器学习在金融风险预测领域拥有广泛应用,其不仅可以解决金融风险预测中的非平衡问题,还可以构建金融风险模型以评估上市公司出现金融风险的概率;③讨论了金融风险预测领域中度量指标,总结了机器学习在财务困境预警领域的应用,有助于梳理国内研究现状,为金融风险预测研究提供更为全面的视角。
(2)未来研究应从如下角度进行切入:①建立更加多源的金融风险预测指标体系,更进一步讨论宏观外部因素在金融风险预测中的作用,结合财务指标与多种非财务指标(如宏观环境、行业发展前景)建立更加多源的财务金融风险预测指标体系;②进一步考虑模型的可解释性,对模型从整体和个体上进行决策解释,以扩大机器学习在金融风险领域中的应用;③考虑深度学习算法在金融风险预测中的应用,随着时间的推移,上市公司的数量会逐步增加,学者们建立的金融风险预测指标体系会更加多样化,将导致样本数据量增加,深度学习算法相比机器学习算法会拥有更好的性能。