周丽莉,丁东洋
(南昌大学a.经管学院;b.公共管理学院,江西 南昌 330031)
基于MCMC模拟的贝叶斯分层信用风险评估模型
周丽莉a,丁东洋b
(南昌大学a.经管学院;b.公共管理学院,江西 南昌 330031)
缺少违约数据与债务人异质性是度量信用风险时面临的重要问题。贝叶斯模型中分层先验信息和马尔可夫链蒙特卡罗(MCMC)模拟方法的应用可以有效缓解数据缺失和测量误差问题,并能对债务人异质性进行评价和比较,从而避免低估风险。针对银行数据的模型拟合与模型诊断均展现了分层估计的适应性和灵活性,相关方法简洁清晰,利于国内风险分析人员采用。同时,涵盖宏观经济协变量的贝叶斯分层模型可以用于更加复杂的风险分析。
信用风险;贝叶斯方法;分层模型;马尔可夫链蒙特卡罗模拟
2008年金融危机的爆发使得金融机构及金融环境的稳定性更加引人关注,而信用风险转化为市场风险是引发危机的内在原因。信用风险遍及所有的金融交易,包括从信用等级的下降到无力偿还债务到最后清算等一系列事件。它是金融机构面临的最主要的风险之一。违约概率是信用风险管理的基本依据,也是定价、资产管理及资本分配的核心变量。随着巴塞尔协议的逐步实施,国内金融机构如何将内部评级系统与市场动态紧密关联的分析工具结合,以有效度量信用风险,加强风险管理,这是当前迫切需要解决的重要问题。
国外已有大量文献研究了信用风险度量中的数据缺失及异质性问题。Christensen、Hansen和Lando着重论述了连续时间状态下,使用时齐马尔科夫链矩阵对违约概率的点估计和区间估计;Truck、Rachev、Hanson、Schuermann等认为久期方法的估计区间过于苛刻,但是他们无法对投资等级内的违约概率加以区分;Frydman和Schuermann采用混合马尔科夫模型处理异质性以及描述等级转移的动态变化[1];Spiegelhalter等提出了使用离差信息准则(DIC)校验模型预测力的贝叶斯方法;Kadam和Lenk基于贝叶斯方法构建了转移概率模型并提出了定量分析债务人异质性的方法[2];Stefanescu等提倡使用贝叶斯方法校验转移概率模型,并认为贝叶斯方法能够给出更可靠的推断[3];Kiefer探讨了缺少实际数据情况下的违约概率估计方法,同样指出了贝叶斯推断的优越性[4]。
国内对违约概率的度量研究基本以比较分析传统频率论方法框架下的结构模型(Structure Model)和强度模型(Intensity Model)为主[5]。王春峰、方洪全、程功等的研究主要是各种评估方法的比较,尚未有效解决异质性问题[6-8]。采用贝叶斯方法进行信用风险分析文献也不多见,而已有的相关文献中,仍以应用基本的贝叶斯法则为主,实际上模型仍为传统形式,如程建等采用贝叶斯方法改善传统模型的预测力[9];钟波和汪青松初步研究了用贝叶斯方法估算金融风险值的问题[10];谭德俊和吕宝华研究了信用风险损失分布标准方差的后验分布推断[11]。
本文在已有文献的研究基础上,构建贝叶斯分层模型,重点关注在缺少违约数据的情况下债务人异质性的分析,并基于MCMC模拟技术对相关数据进行实证分析,同时应用后验分布诊断方法对模型进行校验。通过比较联合估计与分层方法的推断结果,表明运用分层模型可以有效解决数据缺失及异质性问题。
从微观经济学的角度来看,信用风险度量旨在评估特定公司的违约风险,而考虑资产组合的信用风险则要从宏观经济学的角度研究,关键问题是联合违约的分析。很明显,违约概率本身无法决定联合违约概率,除非个体违约之间相互独立,而违约存在相关性已是公认的观点。首先,表现在违约强度与时间因素相关,原因是与影响所有公司的共同或相关的风险因素具有协动(Co-movement)效应;其次,相关性来源于债务人之间的商业活动,如果主要客户违约将导致公司本身面临更高的信用风险,这种现象就是风险蔓延(Contagion),已有很多文献讨论了这个问题(Davis和Lo;Egloff,Leippold和Vanini)。考虑一个包含n个债务人的资产组合,每个债务人具有特定的违约概率,这些特定的违约概率之间存在一定的相似性,根据单个债务人的特征评估该资产组合的信用风险需要构建分层模型。
在贝叶斯框架下,首先需要设定数据分布:
先验向量θ的分布以超参数(Hyperparameter)①数据分布以一定参数为条件,而参数的分布又以额外的参数为条件,这些额外的参数称为超参数。λ为条件:
而超参数λ未知,设定其分布为:
由式(1)、(2)、(3)三个表达式共同构成的模型称为分层模型(Hierarchical Model)。参数θ中主要包含了单个债务人的违约概率等信息,在分层模型中常以可交换性(Exchangeability)描述,也就是说,分析人员对该资产组合中第j个债务人的参数θj与第h个债务人的参数θh给出的先验分布是相同的。模型构建的过程是首先依据θ的成份θ1,θ2,…,θk从g1分布中随机抽取的假设构建可交换性先验分布,然后把超参数指定一个已知的分布形式,即在式(3)中指定g2的分布形式[12]125-138。
贝叶斯方法普遍面临的计算问题是对后验分布中多种积分函数的计算。这些积分可以表示为参数的期望分布函数,一般采用模拟方法对其估算。除了使用简单的i.i.d.推断外,还可以对后验的静态或均衡分布构建马尔科夫链,也就是通过设定转移密度模拟生成包含θ的序列进行推断,其中θ为在给定数据y时所有未知参数向量。这种方法最终形成了马尔科夫链蒙特卡罗(MCMC)技术。MCMC方法已经可以处理多种类型的模型,尤其适用于当前常用的条件分布是分层模型的情况。更重要的是分层模型与MCMC方法的吻合程度非常好,使得在信用风险评估中可以使用更多类型的似然函数和先验分布。
Metropolis-Hastings算法是构建马尔科夫链的常见方法,吉布斯(Gibbs)抽样是 Metropolis-Hastings算法的一个特例,其有效性依赖于对联合后验分布模拟不同条件分布的能力。令向量θ为θ′= (θ′1,θ′2,…,θ′K),条件分布为p k(θ′k|θ′-k,y),其中θ′-k表示除去第k个参数之外的所有向量。如果可以对这些条件分布进行推断,则后验分布可表示为一个固定的分布。为了得出θr|θr-1,可以循环使用条件分布:
使其收敛于模型参数的联合后验分布p(θ1,θ2,…,θK|y),进而可以对模型任何一个参数进行推断:
在信用风险评估中,许多模型都可以表示为这种闭合的条件分布形式,且分布往往为熟悉的形式(如泊松分布、伽马分布、贝塔分布等),常见的线性回归模型也属于该类型。另外,即使在数据扩增时,也可以通过吉布斯抽样构建标准的Probit模型。随着信用风险评估技术的不断发展,很多学者已不再使用简单的吉布斯抽样方法,但是吉布斯抽样的核心思想及构建框架仍被频繁使用。Gilks等引入了舍选抽样(Adaptive Rejection Sampling)方法构建MCMC算法,即对参变量的每个元素依次抽样,并依据该思想开发了贝叶斯建模软件——BUGS,可以监测MCMC模拟过程,并测定自相关程度,从而使得处理非标准的似然函数和先验分布族成为可能。如果模拟结果存在高度自相关,可以通过对参数向量的元素分组,应用自定义的Metropolis或混合Gibbs-Metropolis程序继续模拟推断。本文基于Gibbs-Metropolis算法应用统计软件R(2.8.1)进行 MCMC模拟[13]28-95。
违约事件具有不可复制性,即贷款企业一旦发生违约,其信用质量将进入吸收状态。因而评估信用风险往往需要根据相同类型债务人的历史记录进行分析。为了说明应用贝叶斯分层模型处理缺少违约数据和债务人异质性的问题,以某商业银行的贷款违约记录为依据,选取信用等级在A以上的债务人作为分析对象。这些债务人的违约频率均低于0.004,部分记录中历史违约数量为0,即无违约经验数据。为了进一步分析债务人异质性,按照债务人的地区及行业背景等差异分为60个不同类型的债务人。银行传统的分析方法是根据信用等级确定违约概率波动范围,也就是认为这些信用质量较高的债务人违约概率无差异,对那些无历史违约记录的债务人无法指定其违约概率,导致低估信用风险。
令d i和N i分别表示第i类债务人中观测得到的违约数量和债务人总数,λi表示对应的违约概率。图1给出了贷款分类数据中违约频率与债务人总数对数形式的散点图,其中每一点采用违约实际数值d i表示。从图1中可以看到,违约数量d i的变化范围是从0到5。如果采用个别估计的方法,d i/N i实际就是传统频率方法下给出每个债务人违约概率的估计结果,不仅违约概率的波动范围较大,无法解释引发波动的不确定性,而且将那些d i为0的债务人违约概率认定为0时,会严重低估风险。
图1 违约频率的散点图
如果实际观测值d i位于上述分布的中心,则表示模型拟合较好,如果位于上述分布的尾部,则表示模型拟合不充分。由于联合估计认定所有债务人具有相同的违约概率,可能导致低估发生违约次数较多的债务人的违约概率。以样本中d52=5为例,其违约次数和违约频率均相对较高,因而需要检验是否该债务人确实具有较高的违约概率,而非与所有债务人相同。图2给出了后验预测分布的检验结果,具体检验过程:首先以伽马分布Γ(111,106 526)对后验密度λ模拟1 000个数值,然后以泊松分布B(N52λ)对d52模拟1 000个数值。通过后验密度分布的柱状图及实际值所处位置判断拟合优度。
图2 联合估计后验预测分布的直方图
图2中垂直的黑线表示实际观测值d52=5所处位置,接近于后验预测分布的尾部,也就是在设定所有债务人违约概率相同的情形下,第52个债务人出现违约次数为5的可能较低,表明该债务人实际上应具有较高的违约概率,而非与所有债务人相同的违约概率。利用同样的方法可以对所有已观测数据进行检测,结果可以发现债务人的违约概率之间确实有所差异,因而采用联合估计没有区分债务人异质性,可能低估部分债务人的风险。
以上设定意味着不同债务人之间的违约概率存在着正相关关系。例如设定超参数μ服从伽马分布Γ(10,10),α为一常量α0,从而可以根据先验分布对λ进行数值模拟:先从伽马分布Γ(a,b)模拟μ值,从g(α)模拟α值;再依据模拟的(μ,α),从伽马分布Γ(α,α/μ)模拟λ值。
以第5和第6个债务人为例,对先验分布(λ5,λ6)模拟500个数值,α值分别取8、40、120和600。超参数实际上是控制债务人违约概率之间相关性的精度,图3给出了模拟分布的散点图。
图3 同精度下可交换先验的模拟值
可见随着α值的扩大,(λ5,λ6)趋于集中直线λ5=λ6附近,也就是相关性不断提高,当α趋于无穷大时,意味着λ1=λ2=…=λ60。由于给出的先验分布存在共轭形式,因而后验分布的计算比较简单。由共轭原理可知λi的后验分布为Γ(d i+α,Ni+α/μ),λi的后验均值为:
其中α0是α的中位数,从而μ和α的边际后验密度为:
K为一比例常数,以保证对p的积分值为单位1。根据超参数μ和α的后验密度,可以进一步模拟参数λ的值,步骤如下:先从式(11)的边际后验分布模拟(μ,α);再以(μ,α)的模拟值为条件模拟λ。在模拟(μ,α)值时常用的方法是取对数,也就是转换为实值,θ1=log(α),θ2=log(μ)。由于认为债务人的违约概率之间存在相关性,取中位数α0=0.6,首先采用牛顿迭代法模拟(θ1,θ2),相应的后验密度见图4。从图4可以看出密度曲线并非正态分布,尤其θ1较为明显,因而不能采用正态近似估计,而Metropolis-Gibbs混合算法是较好的选择。生成1 000个模拟值,模拟结果见图5,即在轮廓图4给出相应的模拟值的散点图。
图4 超参数的后验密度轮廓图
从图5可以看出所有模拟值都位于轮廓线内,而且大多数的模拟值都落在第一个轮廓线内,说明该算法给出的超参数边际后验分布样本比较有代表性,因而可以根据λ的后验分布可以模拟任意一个债务人的违约概率λi。根据λi后验分布为Γ(di+α,Ni+α/μ),图6以图1为基础,给出违约概率的区间估计,每个垂线上端和下端分别为95%和5%分位数,垂线的长度为每个债务人违约概率的90%区间。
图5 超参数的后验密度模拟值
图6 分层模型的违约概率估计区间
4.模型校验与诊断。在采用联合估计时,模型检验表明拟合不够充分,下面在分层模型下重新检验d52,检验过程同上,模拟结果见图7。图7中垂直的黑线表示实际观测值d52=5所处位置,可见该债务人发生的违约次数的波动区间为0到11,而实际违约次数5位于后验预测分布的中间,表明模型拟合已经比较充分。
图7 分层模型后验预测分布的直方图
通过比较实际观测值与所有债务人后验预测分布可以对分层模型进行诊断,也就是计算未来观测值至少与当前的d i一样大的概率,采用极值方法比较两种模型的拟合程度。图8中横轴代表联合估计的模型,纵轴代表分层模型,散点为未来观测值至少与当前的d i一样大的概率,斜线为x=y,可见极值概率更偏向分层模型,表明分层模型的拟合程度优于等概率的联合估计。
分层模型在缺少实际违约数据的条件下,对债务人异质性的解释更加充分,而且模型校验和诊断结果均优于联合估计方法。贝叶斯模型的适应性和灵活性使其能够处理更加复杂的系统风险扰动问题,如允许在模型构建中同时考虑可观测宏观经济协变量及特定的行业和地区经济环境等影响因素,可以对式(3)中的g2指定更加准确的分布函数。本文给出的方法不仅是纯理论上的估计讨论,MCMC模拟技术与统计软件R的结合应用,更加利于风险分析人员运用贝叶斯框架下的分析方法,有效提高估计精度以避免低估风险。虽然目前国内对金融风险分析人员还没有要求必须掌握贝叶斯统计方法,但其从事分析工作的基本知识结构和归纳逻辑却属于贝叶斯方法的范畴,哈佛大学Feldstein教授指出:“处理不确定性是风险分析的本质,而风险管理方法的关键是决策中贝叶斯统计方法的应用”[15]。
值得注意的是贝叶斯方法对半参数(Semiparametrics)问题的处理仍有待深入研究,尤其在利用动态模型构建信用风险分析框架时,由于模型本身的复杂性,分析人员往往需要加入一定前提假设,以使模型符合违约概率等的动态变化,如宏观经济影响的滞后性和随机影响的分布等,证明这些假设并有效解释其影响是今后需要关注的问题。
[1] Frydman H,Schuermann T.Credit Rating Dynamics and Markov Mixture Models[J].Journal of Banking and Finance,2008,32(6).
[2] Kadam A,Lenk P.Bayesian Inference for Issuer Heterogeneity in Credit Rating Migration[J].Journal of Banking and Finance,2008,32(10).
[3] Stefanescu C,Tunaru R,Turnbull S.The Credit Rating Process and Estimation of Transition Probabilities:A Bayesian Approach[J].Journal of Empirical Finance,2009,16(2).
[4] Kiefer N M.Default Estimation for Low-Default Portfolios[J].Journal of Empirical Finance,2009,16(1).
[5] 丁东洋,周丽莉.基于贝叶斯方法的信用评级模型构建与违约概率估计[J].统计与信息论坛,2010(9).
[6] 王春峰,等.商业银行信用风险评估及其实证研究[J].管理科学学报,1998,1(1).
[7] 方洪全,曾勇.多标准等级判别模型在银行信用风险评估中的应用研究[J].金融研究,2004(9).
[8] 程功,等.信息噪音、结构化模型与银行违约概率度量[J].管理科学学报,2007,10(4).
[9] 程建,连玉君,刘奋军.信用风险模型的贝叶斯改进研究[J].国际金融研究,2009(1).
[10]钟波,汪青松.基于Bayes估计的金融风险值——VaR计算[J].数理统计与管理,2007(9).
[11]谭德俊,吕宝华.基于贝叶斯方法的信用风险损失分布研究[J].统计与信息论坛,2008(11).
[12]Gelman A,等.Bayesian Data Analysis[M].2nd ed.London:Chapman and Hall,2003.
[13]Albert J.Bayesian Computation with R[M].New York:Springer,2007.
[14]Koopman S,Lucas A,Klaassen P.Empirical Credit Cycles and Capital Buffer Formation[J].Journal of Banking and Finance,2005,29(12).
[15]Feldstein M.Innovation and Issues in Monetary Policy:Panel Discussion[J].American Economic Review,2004(2).
Bayesian Hierarchical Credit Risk Model Based on MCMC Method
ZHOU Li-lia,DING Dong-yangb
(a.School of Economics and Management;b.School of Public Administration,Nanchang University,Nanchang 330031,China)
Lacking of default data and debtor's heterogeneity are important issues in the credit risk measurement.The incorporation of hierarchical prior information and Markov Chain Mont Carlo simulation in Bayesian models mitigate the problems of sparse data and measurement error effectively,can also evaluate and compare the heterogeneity of debtors,thereby avoid underestimating the risk.The examples of model fitting and diagnostics utilizing the bank data show the adaptability and flexibility of hierarchical estimating,the relative methods are so clear that internal risk analyzer can adopt easily.And the Bayesian hierarchical model which contains macroeconomic covariate can be used for more complex risk analysis.
credit risk;Bayesian methods;hierarchical model;MCMC simulation
(责任编辑:张治国)
O212.8
A
1007-3116(2011)12-0026-06
2011-07-30;修复日期:2011-10-15
江西省高校人文社会科学研究规划项目《开放经济下信用风险转移对金融稳定的影响研究》(JJ1138);天津社科规划项目《宏观统计数据可靠性评估方法研究》(TJTJ10-651);全国统计科研计划项目《小域估计理论及其在我国统计调查中的应用》(2009LZ020)
周丽莉,女,江西临川人,经济学博士,讲师,研究方向:国际金融理论与实践;
丁东洋,男,满族,辽宁抚顺人,经济学博士,讲师,研究方向:统计模型应用与贝叶斯数据分析。
【统计调查与分析】