摘要:文章对随机波动模型的MCMC估计方法进行了比较研究,通过对SV0模型的四种不同的波动率抽样方式下的MCMC结果的比较发现,单步Gibbs抽样时波动率的自相关性非常大,而有限正态混合逼近和FFBS方法能够在一定程度上改变其单步Gibbs抽样的缺点,文章还应用SV0模型和ASV模型分别对外汇市场和证券市场进行研究,研究发现汇率数据不存在明显的杠杆效应,而证券市场具有杠杆效应,但是对于中国的证券市场来说并不是特别明显,和他成强烈对比的是S&P500;指数的杠杆效应参数的值达到了0.7以上,这与Ait-Sahalia等(2013)的结果吻合,中国的证券市场的这种现象可能和“羊群效应”有关。
关键词:随机波动;杠杆效应;后向滤波前向抽样;马尔科夫链蒙特卡洛
一、 引言
随机波动模型的参数估计在金融计量经济学中十分重要,而SV模型的似然推断严重依赖高维积分,这导致实际中随机波动模型的参数估计面临诸多挑战,本文首先对SV0和ASV 的估计方法进行方法比较分析与模拟,然后针对我们获得的国内外金融数据进行实证分析;最后是小结。
二、 随机波动模型的贝叶斯MCMC估计
本文的参数估计主要借助于蒙特卡洛模拟方法,该方法通过一定策略产生平稳马尔科夫链,该马氏链的平稳分布是我们所感兴趣的分布,这样就可以利用该马氏链来进行参数推断,该方法通常称为马尔科夫链蒙特卡洛(Markov chain Monte Carlo, MCMC)方法,MCMC方法被称为20世纪的十大算法之一,给工程与实践科学带来了巨大影响并推动其向前发展。简单来说:假设p(y|?兹)为抽样概率密度函数,?仔(?兹)是先验概率密度, 其中y是观测向量,?兹=(?兹1,…,?兹d)是未知参数,则后验概率密度为:
?仔(?兹|y)=■?兹∝p(y|?兹)?仔(?兹)(1)
但是在实际问题中,上述后验密度(1)通常是比较复杂未知的形式。所以,利用直接的分析方法或者数值积分的方法甚至是传统的蒙特卡洛方法来对后验分布进行分析,一般来说是不可行的。然而这些困难可以使用MCMC 方法解决。MCMC方法主要是模拟产生一个马氏链:{?兹(0),?兹(1),…,?兹(g),…}.并保证该马氏链的平稳分布就是后验分布(1),那么问题的关键就是如何生成这样的马氏链并保证它能的平稳分布恰好是(1)。构建这样的马氏链的一般方法是Metropolis-Hastings(M-H)方法,M-H方法是其他形式MCMC 抽样方法的基础,比如由Geman和Geman (1984)提出来的Gibbs抽样就是一种特殊的M-H 抽样方法,MCMC方法被广泛的应用到贝叶斯统计和经济计量领域。
1. 对称随机波动模型的MCMC估计。对于对称SV0模型(1),扰动项?缀t和?浊t服从标准正态分布,满足E(?缀t?浊t+h)=0对所有的h,并且对所有的l≠0有E(?缀t?缀t+l)=E(?浊t?浊t+l)=0,其中?滓2是对数波动的波动率,|?准|<1,所以ht是平稳过程。令yn=(y1,…,yn)′,hn=(h1,…,hn)′以及ha∶b=(ha,…,hb)′.Taylor(1986)首先给出拟极大似然估计(QML),Jacquier等(1994)首先给出SV0模型的单步MCMC参数估计算法,Kim等(1998) 基于Carter和Kohn(1994)和Fruhwirth(1994)的FFBS算法给出了波动率后验分布的联合抽样。
设h0~N(m0,C0)是最开始的对数波动,(?滋,?准,?滓2)的先验分布设为Normal-Inverse Gamma(NIG)分布。当v0=10,s20=0.018,可以得到E(?滓2)=0.022 5,Var(?滓2)=(0.013)2,m0,C0,?滋0,?准0,V0,v0和s20称为超参数。然后进行后验推断,设h-t=(h0:t-1,ht+1:n)对于t=1,…,n-1和h-n=h1:n-1,通过MCMC方法对潜变量对数波动状态{ht}进行的抽样至少有单个逐一抽取ht和分块抽取hn两种方法。单步抽取顺序如下:
(1)抽样p(?滋,?准,?滓2|hn,yn);
(2)抽样p(h0|?滋,?准,?滓2,h1);
(3)抽样p(ht|ht-1,ht+1,?滋,?准,?滓2)。
其中第(3)步中ht的抽样方法主要有3种:随机游走Metropolis算法、独立M-H算法、正态逼近和FFBS算法。通过正态混合逼近和FFBS算法分块抽取hn。
2. 非对称随机波动模型的MCMC估计。目前已有大量学者的理论研究与实证结果证明了波动存在非对称性质,其中Black(1976)、Christie(1982)是最早开始研究波动的非对称性质,他们研究发现股票的当期收益率与未来波动率存在着负相关关系,将此现象称之为杠杆效应(即在其它条件不变的情況下,当利空消息出现时,公司的股价下跌,从而增加债务与权益比率,也就是所谓的财务杠杆,这就加剧了收益的波动性和持股风险;而当利好消息发生时,股票价格的上升会降低债务与权益的比率,从而减少波动性和持股风险,因此股票当前收益和未来波动之间存在着负相关关系,这也从一定程度上反应了投资者的风险厌恶特性)。杠杆效应已成为刻画金融资产收益分布的一个非常重要的特征,Hull和White(1987)指出若随机波动模型不考虑非对称特征,期权定价可能是有偏的。从近20年标准普尔500(Standard & Poors 500,S & P 500)指数曲线和收益曲线,我们可以清晰的看到股票市场的这种非对称波动行为。目前有连续时间和离散时间两个范畴下分别对随机波动模型进行研究。在连续时间框架下的研究的首要问题是非对称的存在性检验与参数估计:
(1)对于杠杆效应的存在性,Bollerslev和Zhou(2006)用股指高频数据研究了高频收益的绝对值与当期和过去高频收益之间显著负相关;Andersen等(2007)给出了一种序贯检验方法来检验收益分布服从带杠杆和微观噪声的跳扩散模型,实证结果支持无套利半鞅限制下非对称随机波动假定,研究发现当股票市场采用规模、账面市值比和动力指标进行排序时,规模和动力指标投资组合具有较强的非对称性。
(2)对于杠杆参数的估计,一个自然直观的方法是基于高频数据的波动率估计,直接计算日收益与日波动之间的相关系数,以此来检验收益和波动的相关性。由于高频数据可视为连续时间模型的良好逼近,高频数据下用非参数方法对非对称的度量已经引起关注,杠杆参数的估计等价于计算收益和波动的相关性主要依赖波动率的定义和计算,Ait-Sahalia等(2013)用这种自然的想法,采用单因子Heston随机波动模型,用非参数的方法估计杠杆参数时发现其接近于零,他们将估计的偏差进行分解得到杠杆参数的估计。Wang和Mykland(2014)考虑金融资产的对数价格过程服连续半鞅过程下的杠杆效应参数的非参数估计方法主要利用资产价格和波动之间的二次协变差作为杠杆效应值的度量,证明了该统计量渐近混合正态。Bandi和Reno(2012)发现了非对称波动的时变性质,将Wang和Mykland(2014) 的结果推广到带跳的时变杠杆非对称SV模型,研究结果表明相当比例的资产收益的跳同时伴随着波动的跳(称为同跳,co-jump),且收益的负跳往往伴随着波动的正跳。Bi等(2013)研究了已实现半方差(RSV)及其在测度下方风险中的应用,该工具可为进一步研究精确测度波动的非对称奠定了理论基础。
对模型(1),通常杠杆参数?籽<0,这时模型(1)称为离散时间非对称随机波动模型(ASV)。ASV模型的参数估计在金融计量经济学中十分重要,但实际中模型的参数估计面临诸多挑战。一方面,基本对称SV模型的似然推断严重依赖高维积分;另一方面,引入非对称后更加大了似然函数的复杂性。ASV模型最先由Harvey和Shephard(1996)给出QML估计,Artigas和Tsay(2004)基于Carter和Kohn(1994) 的非线性状态空间转移方程的一阶Taylor近似对该模型进行MCMC估计; Yu(2005)借助于贝叶斯MCMC 抽样软件Winbugs对ASV进行研究,Yu(2005)的结果与Jacquier等(2004)的非对称随机波动模型ASV1相比,能更清晰的解释杠杆效应,同时基于MCMC的估计结果也优于Harvey和Shephard(1996) 的QML估计。除此之外还有EMM以及一类依赖于极大似然的估计方法。目前使用最为广泛的方法为Omori等(2007)的快速MCMC方法,该方法基于Kim等(1998)的混合正态近似和Carter和Kohn(1994)的FFBS技术,给出了模型(8)的贝叶斯MCMC方法,该混合抽样的方法的优点是抽样速度、抽样序列混合效果好,目前基于该方法有大量的应用,例如国内的研究有张欣和崔日明(2013)、方国斌和张波(2014)、吴鑫育等(2014)以及张波和蒋远营(2017)等。具体来说,类似前面处理方法对测量方程两边平方取对数有yt*=logy2t=ht+?缀t*,?缀t*=log?缀t2,令dt=I(?缀t?叟0)-I(?缀t<0),则有yt=dtexp(yt*/2)。可以看到{yt*}是{ht}的线性函数,误差项?缀t为独立同log?字12分布, 非正态项log?字12可由K个正态混和近似,
g(?缀t*)=■pjN(?缀t*;mj,?棕2j),?缀t*∈R(2)
Kim等(1998)使用了K=7个正态混和近似,而Omori 等(2007)使用K=10个更逼近的正态混和近似。然后考虑?浊t的条件分布:
p(?浊t|dt,?缀t*,?籽,?滓)~N(dt?籽?滓exp(?缀t*/2),?滓2(1-?籽2))(3)
下面考虑用二元正态混合近似f(?缀t*,?浊t;dt,?籽,?滓),首先由边际条件分布公式,
f(?缀t*,?浊t|dt,?籽,?滓)=f(?缀t*|dt)f(?浊t|?缀t*,dt,?籽,?滓)=f(?缀t*)f(?浊t;?缀t*,dt,?籽,?滓)
其中f(?缀t*)可由(2)近似,则f(?缀t*,?浊t;dt,?籽,?滓)可由下面的形式近似
g(?缀t*,?浊t|dt,?籽,?滓)=■pjN(?缀t*;mj,?棕2j)N(?浊t;dt?籽?滓e■{aj+bj(?缀t*-mj)},?滓2(1-?籽2))(4)
而式(4)右端第二部分的第j项
N(?浊t;dt,?籽?滓exp(mj/2){aj+bj(?缀t*-mj)},?滓2(1-?籽2))
用来近似由(3)给出的密度p(?浊t|dt,?缀t*,?籽,?滓),即当?缀t*~N(mj,v2j) 时,则由exp(mj/2){aj+bj(?缀t*-mj)}逼近exp(mj/2),(aj,bj)可由均方誤差最小来确定。这时ASV可表示成:
yt*ht+1=ht?滋+?准(ht-?滋)+?缀t*?浊t
利用p(?缀t*,?浊t|dt,?籽,?滓)的上述混合逼近(4),可得:
?缀t*?浊t|dt,st=j,?籽,?滓d=
mj+?棕j?着tdt?籽?滓exp(mj/2)(aj+bj?棕j?着t+?滓■zt
?着t,zti.i.d.N(0,1)。记?兹=(?准,?籽,?滓),在给定先验?仔(?兹)和 ?滋~N(?滋0,?滓20),可以通过MCMC技术对后验分布g(sn,hn,?滋,?兹|yn*,dn)进行简单快速有效抽样。
三、 随机波动模型的模拟研究
1. 对称随机波动模型SV0的模拟分析。SV0模型的数据生成过程参数设定为n= 800,h0=0,?滋=-0.006 25,?准=0.98, ?滓2=0.22,先验分布h0~N(0,102),?滋~N(0,102),?准~N(0,102), ?滓2~IG(5,0.140 6);MCMC中前面M0=2 000为预迭代过程,使用后面的M=5 000进行推断。
我们很容易可以获得以上四种抽样方法下ht的自相关函数对比图、参数的估计对比图和波动率估计对比图,比较发现单步Gibbs抽样方法下波动率的自相关性非常大,而有限正态混合逼近和FFBS方法能够在一定程度上改变其单步Gibbs抽样的缺点。
从对比图可以看到,参数估计结果都比较接近真值,并且潜在的波动率拟合的也比较好,特别是在波动不大的时间范围内结果非常接近,正态混合逼近和FFBS方法下的参数估计结果达到了单步Gibbs抽样的估计精度,同时能显著提高抽样效率节约了时间花销成本。而对于第三种抽样方式,由于正态近似比较粗糙,导致其参数估计效果没有其他三种的效果好。同时,四种抽样方式下参数?滋,?准的抽样路径显示其混合的较好,自相关函数很快衰减到接近于0,其概率密度估计图也显示呈正态分布,相对来说,从?滓2的抽样路径来看,该链混合的稍微差一些,自相关函数衰减也较慢,其概率密度估计图呈逆伽马分布,其主要原因在于参数?滓2属于深层的参数,对于这样的参数的MCMC估计就偏难一些。
2. 非对称随机波动模型ASV模拟分析。根据模型(8)生成数据{yt}1000t=1,其中模型参数设定为?茁=0.01,?滓=0.2,?准=0.98,?籽=-0.7.先验分布的选取如下:?滋~N(0,1),(?准+1)/2~Beta(20,1.5);?籽~U(-1,1),?滓2~IG(2.5,0.025).开始的预迭代(Burn in)次数M0=2 000,最终使用的推断次数M=20 000。
表1为MCMC估计结果,?酌的接受率为 76.0%;另外我们可以获得MCMC参数估计图和MCMC估计的波动率与潜在波动率变量exp{ht/2}的对比图。从模拟结果可以看到10个成分的正态混合逼近抽样结果很好,非有效因子Ineff的值非常小,说明生成的马氏链混合的很好、抽样很有效率。从真实波动与估计的波动率对比可以看到该方法有一点不足之处就是对极端波动的扑捉还不充分,也就是对尾部风险的估计欠佳,没有能够完全捕获尖峰厚尾性。
四、 随机波动模型在金融市场的实证研究
SV模型在国内外金融市场具有广泛的应用,其中具有代表性的有郑挺国和宋涛(2011)、张欣和崔日明(2013)和吴鑫育等(2014),本节利用上面的随机波动模型进行实证分析研究。在外汇市场,我们研究了多组外汇数据,其中报告了澳元兑美元和欧元兑美元两组结果;在证券市场,我们同样研究了多个证券市场的指数数据,这里给出了S&P500;指数、上证综合指数以及中国上市银行指数的拟合结果。
1. 汇率市场的实证结果。我们对汇率市场中的两组有代表性的数据进行实证分析:第1组数据是从2000年1月3日~2014年12月29日共3 910天的澳元兑美元日收益率数据;第2组数据是从2000年1月3 日~ 2014年12月29日共3 910天的欧元兑美元日收益率数据。设定为预迭代3 000次,后面迭代30 000次作为参数估计,表1和表2分别为两组数据SV0模型的MCMC参数估计结果。
2. 证券市场的实证结果。本文选取了3组股指数据进行实证分析。对于国外市场本节选取了被认为是国际上最重要的资本市场的研究了S&P500;指数,(下转第120页)然后选取了我国的上证综合指数,也是我国比较成熟和比较具有代表性的数据,最后还选取了我国上市银行的综合指数数据进行研究,这为研究银行系统金融风险提供了一些理论依据,它也属于比较新的行业板块指数:第1组数据:从2010年1月4日~2014年5月8日共1 094天的S&P500;指数日收益率数据;第2组数据:从2001年1月4日~2015年1月8 日共3 631 天的上证综合指数日收益率数据;第3组数据:从2010年1月4日~2015年1月8日的1 215天的我国上市银行综合指数日收益率数据。预迭代2 000 次,后面迭代20 000次作为参数估计。表4~表6分别为3组数据的MCMC估计结果;?酌的接收率分别为: 79.6%、89.3%75.3%;另外我们可以获得上证综合指数的MCMC参数自相关函数、路径、概率密度图以及上证综合指数的收益率和对应的波动率估计图,本处略去。
通过实证分析发现证券市场比汇率市场具有更强的杠杆效应,S&P500;指数数据的杠杆效应参数的值達到了0.7 以上,这与Sahalia(2013)的结果是吻合的。相对来说,中国的证券市场并不是特别明显,中国的证券市场的这种现象可能和所谓的“羊群效应”有关。
五、 小结
本文对SV0和ASV模型的MCMC方法进行了比较分析,本文应用SV0模型和ASV模型分别对外汇市场和证券市场进行研究,我研究发现汇率数据不存在明显的杠杆效应,而证券市场具有杠杆效应,但是对于中国的证券市场来说,并不是特别明显,和他成强烈对比的是S&P500;指数的杠杆效应参数的值达到了0.7以上,这与Ait-Sahalia 等(2013)的结果一致,中国的证券市场的这种现象可能和所谓的“羊群效应”有关,关于这一点的对比研究值得进一步进行考虑,比如某个证券市场的杠杆参数是否为零的贝叶斯假设检验问题,同时关于高频金融数据的随机波动模型建模问题还亟待进一步研究。
参考文献:
[1] Ait-Sahalia, Y., Fan,J.Q., and Li,Y.Y., The leverage effect puzzle: Disentangling sources of bias at high frequency, Journal of Financial Economics,2013,(109):224-249.
[2] Wang, D.,C., Mykland, Per A., The Estimation of Leverage Effect with High Frequency Data, Journal of the American Statistical Association,2014,25(2-3):361-384.
[3] 张波,蒋远营.基于中国股票高频交易数据的随机波动建模与应用[J].统计研究,2017,34(3): 107-117.
[4] 吴鑫育,马超群,汪寿阳.随机波动率模型的参数估计及对中国股市的实证[J].系统工程理论与实践,2014,(1):35-44.
基金项目:国家自然科学基金(项目号:714711730);教育部人文社科基地重大项目(项目号:14JJD910002);广西高校科研重点项目(项目号:KY2015ZD054)。
作者简介:蒋远营(1980-),男,汉族,河南省信阳市人,中国人民大学经济学博士,桂林理工大学理学院副教授、副院长,研究方向为金融风险管理与随机波动建模。
收稿日期:2018-04-20。