基于机器学习技术的系统性金融风险监测预警

2023-02-01 01:29李红权
运筹与管理 2023年11期
关键词:系统性金融风险机器

李红权, 周 亮,2

(1.湖南师范大学 商学院,湖南 长沙 410081; 2.湖南财政经济学院 财政金融学院,湖南 长沙 410205)

0 引言

近年来,人工智能技术尤其是机器学习给很多行业带来了深刻变革,助推了相关领域的创新和发展。金融行业也不例外,随着金融科技的不断发展,金融业在许多层面都经历了或者正在发生重大的变革。具体到金融风险管理领域,由于现代金融体系愈加复杂化,传统的风险建模手段的局限性也日益凸显,而机器学习方法善于捕捉变量间的复杂非线性关系,相对于传统的经济分析和预测技术而言具有诸多内在优势,能够更好地满足人们对于经济金融这一典型的复杂开放巨系统的建模要求和分析预测诉求。鉴于机器学习方法的优势,学术界有关人工智能和机器学习的研究也越来越多。在顶级经济和金融学期刊上,也出现了越来越多应用机器学习模型来解决经济金融学问题的论文,如BIANCHI等[1]和LEIPPOLD等[2]研究了机器学习模型对债券风险溢价预测时的有效性;EASLEY等[3]研究了机器学习在微观市场结构测量中的应用情况;AKEY等[4]用机器学习研究了知情投资者在私人信号中的选择问题。

具体到金融风险的监测和预警上,初步的研究表明机器学习在预测货币危机、银行危机及经济衰退等领域有着用武之地[5-7]。不过,金融危机或系统性金融风险事件的发生频率并不高,在实际建模过程中样本量偏少会限制机器学习模型的学习能力和预警能力,利用系统性金融风险量化指标作为预测对象有助于克服这一局限性。目前我国学者开发的系统性金融风险预警模型,大部分是采用线性分析方法选择相关指标对金融风险预测[8],也有学者构造指标体系并利用马尔科夫区制转换等模型确定风险的高低区制[9,10],仅有少部分学者尝试利用特定的机器学习模型来对系统性金融风险进行预测[11-14]。

现有文献主要选择宏观经济及金融市场指标来对系统性金融风险进行预测,可以进一步细分为宏观经济指标(如经济增长、通货膨胀、利率、货币等)、银行部门指标(社会融资总额、资本充足率、不良贷款率等)、股市相关指标(收益率、波动率、流动性等)、债市相关指标(利率曲线、信用利差、期限利差等)以及外汇市场相关指标(如外汇储备、汇率等)等。如美联储圣路易斯联邦储备银行采用包括利率、利差、股市波动率等18个金融变量编制了金融压力指数[15]。CHAKRABARTI和ZEAITER[16]研究了包括经济增长、外汇储备、货币、利率等在内的三十多个金融指标对主权债务违约的预测能力。DAWOOD等[17]从债务敞口、对外部门、宏观经济形势及银行部门四个方面选取金融指标,构造了系统性金融风险的早期预警体系。丁岚等[18]构造了银行、债券、股票、外汇、地产和衍生品六大体系的金融压力子指数,在此基础上合成静态和动态权重的中国金融压力指数。李绍芳和刘晓星[19]从信贷市场、资本市场、外汇市场、债券市场和货币市场等五个金融子市场选取指标衡量金融系统所受到的压力。王达和周映雪[20]从银行部门、证券市场、国际储备、国际贸易、国际收支、经济增长、货币供给和居民生活等方面选取指标预测系统性金融风险。

基于此,本文从系统性风险的全局性和内生性出发,拟从经济-金融体系全局层面构建指标体系,重点在于比较分析和优化选择合适的机器学习方法来构建更有效的系统性金融风险非线性监测预警模型,具体而言拟比较研究Lasso回归、支持向量机(SVM)、随机森林(RandomForest)、极限梯度提升树(Xgboost)、神经网络等主流机器学习模型及其集成模型等建模方法。相对于已有的金融风险预测预警文献,本文的增量贡献和创新点在于:第一,大部分文献采用机器学习模型预测系统性金融风险时均是采用单一模型,本文的系统性金融风险非线性预测预警体系,既是对多种机器学习模型的比较分析,同时也是将不同模型优化组合的结果,研究结果证实该系统能够对金融风险实现更准确的估计和预警;第二,因为机器学习的黑箱属性,很少有文献对机器学习模型中的变量重要性进行全面有效的分析,本文利用多种解构模型尝试打开机器学习的内部黑箱,提升机器学习模型的经济可解释性和稳健性。具体手段是利用特征重要性(包括SDT)和PDP等算法对变量相对重要性进行评估,部分打开了机器学习的“黑箱”,实现了对预测模型内部结构的考察,提升了模型的可信度和可靠性。

1 模型与方法

机器学习主流模型包括惩罚性因子回归、支持向量机、基于决策树的模型(如单棵决策树、随机森林、Boosting模型等)以及神经网络等。并不存在某种机器学习模型在所有预测问题上均优于其他模型,因此针对特定的预测问题,需要根据实际情况选择最合适的模型。本文选择了Lasso回归、支持向量机(SVM)、随机森林、极限梯度提升树、神经网络以及集成模型等多种机器学习建模手段,并识别或利用集成方法构建最优模型用于系统性金融风险的预测及预警。

1.1 机器学习模型

典型的机器学习模型包括惩罚性回归(具体包括Lasso回归、岭回归以及弹性网络三种形式)、支持向量机(SVM)、随机森林和极限梯度提升树(RF,Xgboost等)、神经网络与深度学习等。每种方法各有相对优势及其局限性。本文将采用多种模型进行回归分析。

单一模型可能在某个方面具有优良的性能,但集成模型在鲁棒性和模型可靠性上更胜一筹。常见的集成模型包括两种:一种是赋权法,即对不同机器学习模型的结果赋予不同的权重,等权重法是赋权法的一种特殊情况,其基本思想简单易懂,即单一算法不会总是有效,而取一系列算法的预测均值可以平滑不同算法的误差,进而得到更有效的预测;另一种是进一步建立模型,如将不同机器学习模型的回归结果再一次针对实际值进行建模,从而得到一个双层模型,一般为了防止模型过拟合,第二层模型仅考虑较为简单的模型,如最简单的线性回归。实际上,我们除了建立等权集成模型,还建立了基于DAR大小进行赋权的集成模型,以及第二层采用线性回归的双层集成模型,在样本外检验中,等权重集成模型效果最佳,DAR赋权模型第二,双层集成模型效果最差(限于篇幅,结果未列出)。说明由于机器学习模型本身的复杂性,其预测能力很强,复杂的集成模型(尤其是双层)很容易导致过拟合,从而导致样本外效果较差,算数平均优化组合由于平滑了不同算法的误差,效果反而更优。

1.2 模型评价指标

为了对模型预测绩效进行评估,本文除选择了常见的RMSE,MAE及Theil-U进行评估外,还选择了方向预测准确度DAR及可决系数R2,计算公式分别如式(1)至(5)所示:

(1)

(2)

(3)

(4)

(5)

1.3 变量重要性分析方法

常见的机器学习解释模型包括特征重要性(Feature Importance)、替代决策树(Surrogate Decision Trees,SDT)、部分依赖图(Partial Dependence Plot,PDP)、夏普利值(ShapleyValue)等。考虑到PDP不仅可以识别变量的相对重要性,而且可以考察变量的非线性影响,我们选用部分依赖图对变量的重要性进行分析。其核心思想是考察某项特征的不同取值对模型输出值的影响:将某项特征Xj全部设为常数c,其余特征保持不变,可得到一组新的模型输入X′,再利用原模型进行预测,比较预测值与初始预测值的差异,从而可以观察到每个变量的相对重要性。本文针对随机森林、Xgboost和SVM均同时利用PDP进行特征分析。

2 变量选取及说明

2.1 风险预测预警指标体系

目前文献在对系统性金融风险进行预测时,选择的宏观经济及金融市场指标主要包括宏观经济指标、银行部门指标、股市相关指标、债市相关指标以及外汇市场相关指标等。借鉴王达和周映雪[20]等学者的研究,结合数据可得性及及时性,本文从经济基本面、货币供给面、财政状况、证券和利率市场、价格指数、外汇和汇率市场、杠杆率及银行体系8个层面选取了42个指标作为系统性金融风险的预测预警指标体系(初始集合),具体如表1所示。

表1 系统性金融风险的预测预警指标体系

2.2 系统性金融风险

系统性金融风险采用CoVaR及MES进行衡量,根据计算出的所有金融机构CoVaR和MES,在横截面上取平均值,得到宏观的系统性金融风险指标。按照申万二级行业分类,截至2020年底,我国共有上市金融机构(包括银行、保险和证券三个子行业)94家,其中银行38家、保险7家、证券49家。由于部分指标只有2005年后才有数据,我们最终选取所有指标自2005年的数据进行分析,其中计算CoVaR和MES采用的是日度数据,市场指标采用Wind全A指数,再将每月的日数据平均为月数据;所有预警指标的数据均是月度数据。对于部分缺失数据采用线性平滑方法补充,由于机器学习模型对数据量纲要求较高,因此我们对所有数据进行了95%缩尾以及标准化处理。所有原始数据来自于Wind数据库。

图1展示了2005年1月至2020年12月系统性金融风险的动态走势,可以看到,CoVaR和MES的走势相关性很强(相关系数高达0.83),且两者均在2009年初和2015年末达到了阶段性高点。

图1 系统性金融风险走势

3 实证分析

3.1 对CoVaR的预测效果

由于CoVaR和MES走势报为相似,我们主要针对CoVaR进行研究,对MES的研究作为稳健性检验。我们将2005年1月至2017年12月的数据作为样本内调参建模,2018年1月至2020年12月的数据作为样本外检验分析。被解释变量为t+1期的CoVaR,解释变量包括CoVaR及42个预警指标t-11期至t期的数据,即用过去一年的数据来预测未来一个月的系统性金融风险。

采用调优后的参数进行建模,并分别对样本内数据和样本外数据进行拟合分析。表2报告了模型预测结果,其中第1至5列分别表示Xgboost、随机森林、SVM、Lasso以及神经网络模型的预测效果;第6列和第7列为2种集成模型,其中Ensemble为Xgboost、随机森林、SVM三种模型集成的预测结果,Ensemble2为Xgboost、随机森林、SVM和Lasso四种模型集成预测结果;作为对比,第8列展示了OLS线性回归的预测结果。

表2 CoVaR样本内外拟合结果

值得说明的是,我们这里的集成模型采用的是对多个个体学习器的结果计算算术平均值作为最终结果,类似于随机森林的Bagging方法。相对于单个模型的预测结果,集成模型往往能同时获得模型在计算能力和计算准确度两个方面的突破,预测结果往往更为稳健。本文比较考察了2个模型、3个模型及4个模型的多种集成方法(不包含神经网络),总体而言,集成4个模型的预测效果及稳健性最佳。为了展示集成模型的优势,我们在后续分析中同样列出了集成Xgboost、随机森林、SVM三种模型的预测效果。

从Panel A样本内拟合结果来看,所有模型拟合效果均较好,尤其是Xgboost模型,其RMSE仅为0.0028,方向正确率DAR高达0.99,拟合R2接近于1;OLS回归拟合效果虽然差于各机器学习模型,但是其R2仍然高达0.88。但是从Panel B样本外拟合效果来看,Lasso模型的预测效果最好,其RMSE,MAE及Theil-U均小于其他模型,而DAR及R2均优于其他模型;SVM模型的预测效果仅次于Lasso;ANN模型的样本外预测能力非常差,表现为较高的RMSE,MAE及Theil-U,以及极低的R2,仅为0.0222,甚至不及OLS模型的0.1484,说明神经网络在样本内出现了严重的过拟合,这主要是由于我们样本容量过小,出现了维度灾难,因此我们在后续分析中不考虑神经网络。

从2个集成模型来看,Ensemble的预测效果要优于SVM,说明虽然Xgboost和随机森林在样本外表现出较差的预测能力,但是将这两个模型与SVM进行简单集成,可以提高SVM模型的预测能力;Ensemble2由于集成了Lasso模型,其预测能力比Ensemble更优。

因此综合来看,利用特定的机器学习模型(如SVM和Lasso)可以对下一期的系统性金融风险进行有效预测,且相对于单个模型(除Lasso外)而言,集成模型的预测能力更为稳健。

图2展示了3个模型(Lasso,Ensemble2和OLS)的样本外拟合曲线,其中实线为系统性金融风险的实际值。可以看到机器学习模型的拟合曲线与实际曲线的走势极为相似,Lasso拟合曲线与实际曲线的相关系数高达0.95,Ensemble2拟合曲线与实际曲线的相关系数高达0.93;而OLS模型的拟合曲线与实际曲线相差甚远。充分说明了机器学习模型在预测系统性金融风险时的有效性,而传统线性模型几乎没有样本外的预测能力。

图2 CoVaR样本外拟合结果

3.2 变量重要性分析

Lasso模型可以直接通过变量系数来判断变量相对重要性,在拟合的Lasso模型中只有5个变量的系数非零,分别是股市日均成交金额当月同比增幅(滞后2期,系数为0.0406)、PPI当月同比(滞后1期,系数为-0.002)、中债国债1年期到期收益率(滞后1期,系数为-0.0036)、中债国债10年期到期收益率(滞后12期,系数为0.0002)、CoVaR(滞后1期,系数为0.8973)。说明系统性金融风险具有较强的自相关性,而股市成交额、PPI及国债收益率对风险的影响较大。随机森林、Xgboost和SVM模型的特征重要性不能直接得到,本文采用PDP方法来对这三个机器学习模型解构,以打开机器学习的“黑箱”属性。

PDP算法的原理是对特定变量取固定数值,观察它对原拟合模型预测能力的影响。由于我们在建模前已经对变量进行了标准化处理,因此这里我们将所有变量依次分别设定为(-1.5,-1,-0.5,0,0.5,1,1.5),观察不同取值对模型拟合能力(这里我们用RMSE来衡量)的影响,如果模型RMSE上升很快,就说明该变量的重要性相对较高,反之如果模型RMSE上升幅度很小,则说明变量重要性相对较低。PDP除了可以观察到变量的相对重要性外,还可以通过对不同取值下变量对模型的影响程度来观察变量的非线性作用。图3报告了2个变量(人民币实际有效汇率和1年期企业债到期收益率)的PDP曲线,可以看到两个变量在SVM模型上具有显著的非线性,当变量取值在0附近时,模型RMSE相对较低,说明变量的影响较低,但是当变量取值远离0,尤其是往左侧偏离时,变量的重要性越来越高;两变量在Xgboost上也具有较强的非线性,人民币汇率在小于0.5时对模型的影响能力微弱,但是一旦超过1后,就会对模型拟合能力产生显著影响,而1年期企业债到期收益率的影响主要发生在(-0.5,0)之间;两变量在随机森林上也具有一定的非线性性,只是相对另外两个模型显著性较低。从图3可以清楚地看到,各变量对系统性金融风险预测时并不是简单的线性关系,而是存在着显著的非线性性。

图3 部分变量的PDP曲线

我们对变量在不同取值下的影响取平均,以对不同变量间的相对重要性进行分析,图4报告了除CoVaR外影响程度最高的10个变量。PPI、人民币汇率、1年期企业债到期收益率、1年期国债到期收益率仍然对所有模型均有较强影响,国外资产、企业景气指数和CPI在Xgboost模型中的重要性同样较高,消费者信心指数、银行存贷比在SVM模型中的重要性相对较高。

图4 基于PDP算法的变量相对重要性

3.3 基于MES的分析

我们将CoVaR替换为MES,采用同样的流程再次进行分析(表略)。可以得到与表2相类似的结果,机器学习模型和OLS模型在样本内均能取得较好的预测结果,表现最好的依然是Xgboost,其RMSE低至0.0038,DAR高达0.97,R2接近于1。但是在样本外,Xgboost,SVM和OLS预测能力相对较差,而随机森林和Lasso模型的预测能力较强,尤其是Lasso模型。集成模型的预测效果较好,Ensemble模型的预测能力显著好于随机森林,Ensemble2模型的预测能力仅次于Lasso,同样说明模型集成是提高模型预测能力和稳健性的有效途径。综合来看,机器学习模型(尤其是Lasso和集成模型)能够对系统性金融风险进行较好的预测,传统的线性模型虽然在样本内能够实现较好的拟合,但是样本外的预测能力很差。

采用PDP算法研究MES预测模型的变量相对重要程度(图略),与图4相似,人民币汇率、M1、1年期企业债到期收益率对三个模型的重要性均较高;但是与CoVaR预测不同的是,PPI的影响程度较小,而OECD领先指数和银行贷款的影响程度非常高。差异可能来自于两者的定义不同,CoVaR模型主要计算极端风险损失,MES在CoVaR计算极端损失的基础上,计算了极端风险之外的损失平均值。但是综合来看,不论是用CoVaR还是用MES衡量系统性金融风险,机器学习模型的预测能力都很强,模型重要性特征也存在着相似性,因此在构建早期的预警机制时,应该将多个指标的预测结果综合来看,以通过对预警指标更细致的监测,实现对系统性金融风险的提前防范和化解。

3.4 中长期预测

鉴于机器学习模型在预测上的突出表现,我们将预测期拉长,考察机器学习模型对中长期系统性金融风险的预测能力。如对3个月后的系统性金融风险进行预测,我们采用t-11期至t期的CoVaR及所有预警指标对t+3期的系统性金融风险建模预测;对6个月后的系统性金融风险进行预测,我们采用t-11期至t期的CoVaR及所有预警指标对t+6期的系统性金融风险建模预测;依次类推。表3报告了模型的样本外拟合结果,与表2结果相比发现,大部分模型在中长期预测时效果更差,表现为更高的RMSE,MAE,Theil-U,以及更低的DAR和R2,但是SVM模型表现相对向前一期预测时反而更好;2个集成模型的表现同样稳健,尤其是集成了四种不同模型的Ensemble2,无论是向前几期预测,表现均极为稳健。

4 总结

本文提出了一个利用机器学习技术构建的系统性金融风险监测预警体系,并从理论依据和实证检验双重角度给出了解释和验证。具体而言,利用2005年1月至2020年12月的宏观经济数据,从经济基本面、货币供给面、财政状况、证券和利率市场、价格指数、外汇和汇率市场、杠杆率及银行体系8个层面选取预警指标,并采用线性回归模型及5种典型的机器学习模型对系统性金融风险进行预测,实证结果表明:第一,相对于OLS模型,能够捕捉到非线性关系的机器学习模型,无论在样本内还是样本外,均表现得更为突出;第二,无论是对CoVaR还是MES进行预测,Lasso模型的预测能力均较强,Xgboost、随机森林和神经网络虽然在样本内表现极为突出,但是样本外的表现却并不稳健,说明在样本量不大的情况下,越复杂的机器学习模型越容易导致样本内的过拟合,从而导致样本外的表现越差;第三,SVM模型在向前多期预测时表现最佳,同时相对于单一机器学习模型(除SVM外),集成模型的预测能力能够超过大部分预测模型,保证了研究结论及预测结果的稳健性;第四, PDP可以有效打开机器学习的黑箱属性,还能对特定变量的非线性预测能力进行分析,在所有预警变量中,汇率、货币供给量、市场利率以及工业品价格是影响系统性金融风险最关键的因素,可以通过加强这些变量的监测实现对系统性金融风险的早期防范。

猜你喜欢
系统性金融风险机器
机器狗
机器狗
对于单身的偏见系统性地入侵了我们的生活?
金融风险防范宣传教育
构建防控金融风险“防火墙”
未来机器城
大力增强忧患意识 进一步防范金融风险
超声引导经直肠“10+X”点系统性穿刺前列腺的诊疗体会
关于当前互联网金融风险的若干思考
无敌机器蛛