马 薇,张淑娟(天津财经大学理工学院,天津 300222)
基于非参数分位数方法对金融风险的研究
马 薇,张淑娟
(天津财经大学理工学院,天津 300222)
文章提出了使用非参数密度分位数方法来计算VaR模型。此方法完全由数据驱动,不需要设定新息项的分布,并同新息项服从正态分布、T分布和GED分布计算的VaR进行对比,得到了比较理想的结果,从而为金融风险研究提供了较有效的参考方法。
非参数;分位数;风险预测
近年来,我国经济正处于结构调整和转型升级的阶段,金融市场在支持这项重任的同时还需要注意防范和化解金融风险。而VaR(Value at Risk)作为一种金融风险管理工具,已经得到了广泛的应用。VaR方法是20世纪80年代美国金融机构提出的金融风险测度方法[1],现在已经成为金融市场的一种主流的、能够广泛应用的风险度量方法。估计VaR的主要方法有:历史模拟方法、方差协方差方法、蒙特卡洛模拟方法等,利用GARCH类模型计算波动率进而估计VaR也是一种计算方法。为了解决金融时间序列的波动问题,Engle于1982年开创性的引入了ARCH模型。由于ARCH模型如果阶数太大就会降低参数估计的效率,还有可能导致多重共线性的发生,Bollerslev[2]为了弥补这一点,于1986年引入GARCH(p,q)模型,可以用相对简单的低阶GARCH模型来替代一个高阶ARCH模型,从而减少需要估计的参数,使得模型的估计与识别问题都变得容易一些,而又由于GARCH模型不能够捕捉金融市场中的非对称因子,对于这样的局限性,后又有一些新的GARCH类模型的衍生,如EGARCH[3]、TGARCH[4,5]、GARCH-M、FI-GARCH等。由于(G)ARCH类模型受新息项分布函数的限制,后又有不设定分布函数形式的非参数GARCH模型[6-8]的产生。
在GARCH类模型的基础上,国内外对于股市VaR估计已有较多研究[9-13],传统的模型在运用波动率方法计算VaR时,通常假设新息项服从某一分布,具有一定的局限性,而在真实的金融市场中这一条件有时很难满足,当不满足时,利用参数方法计算分位数的过程就会产生一定误差,而非参数方法由于完全由数据驱动,不受分布限制,受约束条件少,因此本文采取非参数核密度的方法来估计新息项的分布,进而得到其非参数条件分位数来计算VaR的值,通过研究对比发现,在大部分情况下非参数估计优于参数估计,所以对非参数分位数的研究具有一定的理论与应用价值。
1.1 VaR估计
VaR就是“在险价值”,它是由J.P.Morgan公司首先提出的用来计算市场风险的产物。它与传统的度量风险手段不同,是完全基于统计分析基础上的风险度量技术。VaR是指在金融市场正常波动下,在一定概率水平(置信度)下,某一金融资产或证券组合价值在未来特定一段时期内的可能承受的最大损失,VaR的数学表示为:
设随机变量rt表示某一金融资产t时刻的收益率,当rt≥0时表示收益,当rt<0时表示损失,风险度量关注的随机变量rt分布的左尾,设Frt(x)为随机变量rt的累积分布函数,对给定的置信水平1-α,α∈(0 ,1),VaR可表示为:
或者:
令rt=ut+σtεt,VaR可以表示为:
ut=E()
rt为预期收益率;σt为当期资产收益序列的波动率,因此VaR的计算与预期收益率ut、当期波动率σt、收益率的新息项所服从的分布及所选用的置信水平有关。
本文VaR的检验方法采用Kupiec(1995)[14]提出的似然比率检验法,假定置信水平为1-α,实际考察天数为T,失败天数为N,则失败率记为期望概率为p*=1-α,零假设为H0:p=p*,备择假设为H1:p≠p*,检验失败率是否拒绝零假设。似然比方程为:
在原假设条件下,统计量LR服从自由度为1的χ2分布,LR越小,P值越大,失败率越接近α,表明模型越精确,可信度越高。
1.2 非参数核密度分位数
由式(3)可知,计算VaR需要计算新息项的分位数,传统的方法假设新息项服从某个固定的分布,通常假设服从正态分布、t分布或者GED分布,但是这样的分布不一定适合我国现阶段的股票市场,因此文中提出不受分布函数形式限制的非参数分位数方法,下面是对其简单的介绍:
从随机变量X的总体抽取样本估计总体密度函数,当密度函数形式未知时,采用参数估计可能产生一定的误差,并且这种误差通过增加样本量也是无法弥补的。当密度函数未知时,最简单的方式是采用直方图估计,但是直方图估计是阶梯函数,会使得对每个小区间中心部分精确,但是端点附近估计精度会较差,不具有光滑性,Rosenblatt(1955)和Emanuel Parzen(1962)提出非参数核密度估计不需要假设密度函数,完全由数据驱动确定密度函数,并且具有光滑性和相合性的特点,其形式[15]为:
令X1,X2,...,Xn为随机变量X的一组独立同分布样本,用来估计随机变量X的总体密度函数:
K为核函数,Epanechnikov核在理论上使得积分均方误差最小,具有较好的性质,所以文中核函数采用Epanechnikov核,h为光滑参数带宽,运用À错鉴定法确定带宽h的最优值。
通过密度函数的积分可得到分布函数,进而可计算其反函数求出非参数分位数。
非参数核分布函数为:
非参数核密度分位数为:
由于非参数分位数方法不受密度函数形式的限制,受约束条件较少,具有一定的稳健性,因此是一种可以广泛应用的方法。
由式(3)可知,计算VaR还需要计算平均收益率及波动率,对于这个问题一般用GARCH、EGARCH、TGARCH、GARCH-M、FI-GARCH等来解决,对于常用的GARCH模型,在理论上若假定了新息项的分布,如正态分布、t分布、GED分布等,GARCH模型可以利用极大似然法求得,当新息项的分布选择不符合实际情况时,Bollerslev、Wooldridge与Jeantheau也已经证实了即使不是正态分布,利用拟极大似然估计法计算得到的参数估计也仍然是相合的。
对于式(3)给出的VaR的计算形式,本文利用非参数分位数方法结合GARCH类模型来计算VaR,为了验证此方法的可行性,下面利用真实的股指数据进行实证分析,并同时与假设新息项服从正态分布、t分布和GED分布计算分位数的方法进行比较,通过检验发现非参数方法具有较理想的效果。
2.1 数据选取及处理
本文采用的样本为具有代表性的沪深的三个指数,样本区间是2006年1月4日至2015年10月21日,数据涵盖了2008年与2015年两个大的波动时段,能较好地反应当今中国股市的特征,共计2379组数据,数据从同花顺下载,运用R软件进行分析和计算,收益率计算采用对数收益率,其公式为:pt为日收盘价。
2.2 GARCH模型参数估计
上述数据均通过平稳性检验——ADF检验,同时由ARCH效应检验结果知道收益率具有异方差,因此可以应用GARCH类模型。应用EGARCH和TGARCH模型做出的参数估计结果不是很理想,说明在2006年1月4日至2015年10月21日这段时间不存在显著的杠杆效应,所以本文采用GARCH模型,并且从估计结果来看较为显著。以下为利用R软件计算出的新息项分别服从正态分布、t分布及GED分布的GARCH模型的参数估计及其对应的P值。
下面为沪深各指数新息项服从正态分布的GARCH模型(简记为(N)GARCH模型)的参数估计及对应的P值:
下面为新息项服从t分布的GARCH模型(简记为(t) GARCH模型)的参数估计及对应的P值:
下面为新息项服从GED分布的GARCH模型(简记为(G)GARCH模型)的参数估计及对应的P值:
从上面的参数估计值及概率P值可以看出(N)GARCH与(t)GARCH和(G)GARCH波动模型中各项系数均显著,并对新息项项进行了ARCH效应检验,检验结果通过,说明不存在异方差,所以可用此三种模型描述沪深三种指数在2006年1月4日至2015年10月21日的波动情况,进而来估计VaR的值。
2.3 VaR计算结果的检验:Kupiec检验
利用上述三种模型计算收益率的波动率之后,计算VaR还需要估计新息项的分位数,计算分位数分别应用:假设新息项服从标准正态分布、t分布、GED分布及利用非参数分位数方法,这样结合GARCH模型可得到六种计算VaR的模型,(N)GARCH-N,(t)GARCH-t,(G)GARCH-GED,(N) GARCH-NON,(t)GARCH-NON,(G)GARCH-NON,置信水平为1-α,分别令α=0.05,α=0.025,α=0.01三种情况下,估计VaR值,并对应得到Kupiec检验结果:P值和失败率。表1、表2和表3给出上述六种模型在三种置信度下的VaR的Kupiec检验结果:每种股指的第一行为检验的P值,第二行为对应的失败率,标注*的数值为每种股指检验的最高P值。
表1 Kupiec检验:α=0.05
由表1可以看出,当α=0.05时,在三个股票指数的检验结果中,三种参数方法均通过检验,并且N-N与G-G方法要稍好于t-t方法,三种非参数方法也均通过检验,并且P值几乎都在0.9以上,同时t-NON与G-NON方法较为稳定,N-NON方法对应的检验P值有1个最高,t-NON方法对应的检验P值有1个最高,G-G方法对应的检验P值有1个最高。
表2 Kupiec检验:α=0.025
由表2可以看出,当α=0.025时,在三个股票指数的检验结果中,G-G方法要好于N-N与G-G方法,N-N方法检验结果较差,P值较低,而三种非参数方法均通过检验,t-NON方法对应的检验P值有3个最高。
表3 Kupiec检验α=0.01
由表3可以看出,当α=0.01时,在三个股票指数对应的检验结果中,N-N参数方法没有通过检验,所以假设新息项服从正态分布不能很好地捕捉尾部风险,而G-G方法要好一些,t-t方法是参数方法中最好的,而三种非参数方法均通过检验,N-NON与G-NON方法对应的检验P值各有1个最高,t-NON方法对应的检验P值有3个最高。
结合表1至表3对应的Kupiec检验结果可以看到,在三种参数方法中,当α=0.05时,t-t方法不是很稳定,并且对应的P值要比另两种参数方法差一些,当α=0.025时,G-G方法检验结果要稍好一些,但是当α=0.01分位数比较小时,正态分布对于尾部风险捕捉不够,对于尾部风险的捕捉,t分布要稍好些。总体分析本文选择的三种股指在所给的区间段中,参数方法检验的P值一般比非参数方法的P值要小,同时对不同的数据与不同的置信度,参数方法没有非参数方法稳定。对于不同的置信区间,采用非参数核密度分布来估计新息项分位数方法对风险的捕捉都较好,尤其当GARCH模型中假设新息项服从t分布,Kupiec检验的P值都较高,几乎都在0.85以上,失败率也与α较为接近,效果比较理想,说明非参数方法能较好地描述新息项的分布情况,因此,应用此方法来计算VaR不失为一种值得信赖的方法。
关于VaR的估计,进年来诸多学者做了大量的研究,方法也越来越成熟,本文通过对沪深主要的三种指数的研究发现,在使用GARCH模型结合参数分位教方法计算VaR时,新息项假设为正态分布或者t分布与GED分布时,很难同时捕捉不同置信水平下的风险,由于不能准确刻画新息项的分布,因此在这样的假设下计算VaR,结果会不太理想。而利用非参数分位数方法,对新息项的分布不做任何假设,完全由数据驱动方法计算新息项的分位数来估计VaR,通过Kupiec检验结果可以看到,此方法可以在不同置信水平下都表现较好,而且比较稳健,具有较高的可信度,因此在目前众多计算VaR的方法中可以作为一种值得参考的选择。
[1]Morgan J P.RiskMetrics-Technica Document[M].New York:[s.n.], 1996.
[2]Bollerslev T.A Conditionally Heteroskedastic Time Series Model for Speculative Prices and Rates of Return[J].The Review of Economics and Statistics,1987,69(3).
[3]Nelson D B.Conditional Heteroscedasticity in Asset Returns:A New Approach[J].Economet Rica,1990,59(2).
[4]Glosten L R,Jagannathan R,Runkle D E.On the Relation Between the Expected Value and the Volatility of the Nominal Excess Return⁃on Stocks.[J].The Journal of Finance,1993,48(5).
[5]Rabemananjara R,Zakoian J M.Threshold ARCH Models and Asym⁃met Ries in Volatility[J].Journal of Applied Econometrics 1993,8(1).
[6]Robert F E.Gonzalez-River Semiparametric ARCH Models[J].Jour⁃nal of Business&Economic Statistics,1991,(4).
[7]Hastie T J,Tibshirani R.Generalized Additive Models[M].London: Chapman and Hall,1990.
[8]Bǜhlmann P,McNeil A J.An Algorithm for Nonparametric GARCH Modelling[J].Computational Statistics&Data Analysis,2002,(40).
[9]Beckers B,Herwartz H,Seidel M.Risk.Forecasting in(T)GARCH Models with Uncorrelated Dependent Innovations[C].IAAE 2014 An⁃nual Conference London,Großbritannien,2014,(6).
[10]郑文通.金融风险管理的VAR方法及其应用[J].国际金融研究, 1997,(9).
[11]周爱民,陈远.我国中小板市场在险价值量的实证研究——基于GARCH-VaR模型[J].南开大学学报:自然科学版,2013,(6).
[12]杨继平,袁璐,张春会.基于结构转换非参数GARCH模型的VaR估计[J].管理科学学报,2014,(2).
[13]马薇,卢英,刘月月.大数据条件下金融风险测度的方法[J].统计与决策,2015,(9).
[14]Kupiec P.Techniques Forverifying the Accuracy of Risk Manage⁃ment Models[J].Journal of Derivatives,1995,3(2).
[15]Li Q,Racine J S.Nonparametric Econometrics:Theory and Practice [M].Princeton:Princeton University Press,2007.
(责任编辑/刘柳青)
F830.9
A
1002-6487(2016)24-0152-03
全国统计科学研究项目(2014LY003);天津市哲学社会科学规划项目(TJYY10-1-310)
马 薇(1958—),女,天津人,教授,博士生导师,研究方向:数量经济学。
张淑娟(1982—)女,黑龙江绥化人,博士研究生,讲师,研究方向:数量经济学。