葛亮(福建中医药大学 人文与管理学院,福州 350122)
基于Copula-GARCH模型的新兴产业与上证指数相依性研究
葛亮
(福建中医药大学 人文与管理学院,福州 350122)
文章利用Copula-GARCH模型对2005年1月1日至2014年4月30日上证交易所新兴产业指数和上证综合指数进行建模,然后运用ARMA(1,1)-GARCH(1,1)-t模型,将边缘分布概率积分变化后的2个服从均匀分布的序列作为Copula模型的边缘分布,得到了较好的拟合效果。通过建立正态Normal Copula函数、t-Copula函数、Gumbel Copula函数、Clayton Copula函数和Frank Copula函数的5个二元Copula模型,并采用AIC法、BIC法、切比雪夫距离和欧式距离4种检验拟合优度的方法选择最优的t-Copula模型。同时利用GPD法对2个指数做了尾部相关性分析,发现下尾比上尾具有更好的相依性,说明极端情形(如金融危机)下两指数的涨跌幅度较大。
Copula-GARCH模型;新兴产业指数;上证指数;相依性
在转变经济增长方式、加快产业转型升级的目标下,新兴产业成为实现国民经济又好又快发展道路中的重要角色。新兴产业的发展离不开国家与金融业的参与和支持,同时新兴产业的发展也促进了金融业的良好发展。因此对战略性新兴产业发展与金融业的政策支持和创新研究受到各界人士的广泛关注。本文主要针对现有文献从新兴产业市场与金融市场间的相依因素来展开研究[1-3],目前对两个市场的股票收益率之间的相依性问题研究还比较少[4,5],本文以新兴产业市场与上证市场的股票指数收益率,运用Archimedean Copulas簇、Archiman Copulas簇和广义Pareto分布(GPD)为边缘分布函数。对单变量的边缘分布构建GARCH(1,1)-t模型,运用Copula模型研究新兴产业市场和证券市场(以上证综合指数为例)的相依性。
Copula理论是可以分解为多个边缘累积分布和一个连接Copula函数的多维度联合累积分布函数,通过将单变量分布特征转化为其边缘分布,并由Copula函数来阐述多变量之间的相依性。由于本文旨在研究新兴产业市场与上证综合指数日收益率之间的二元相关性,下面就针对二元Copula函数作一个简要的介绍。
1.1 Sklar定理
Sklar定理:假设两个边缘分布分别为F(x)、G(y)的联合分布函数为H(x,y),则可以找到一个连接Copula函数C,满足:
如果u=F(x)、ν=G(y)是连续的,则存在唯一的函数C(u,ν)。
1.2 相依性
假设X和Y是两指数收益率序列,每个收益率分别由其边缘分布u=F(x)和ν=G(y)来描述其特性。由Copula函数C(u,ν)来刻画两市场收益率之间的相关性,常用的相依性的测度方法有Kendall的τ和Spearman的ρ,可分别表示为:
除了研究两市场收益率序列的相依关系外,研究单个收益率序列的突涨(或暴跌)是否会引起另一个收益率序列的相应或相反的变化,从而对证券或金融市场产生更大的影响。这就是金融中的尾部效应,即研究尾部相关性。其Copula函数C(u,ν)的上尾、下尾相依系数分别为:
可见,上尾、下尾部相依系数刻画了两市场收益率在突发事件下的相依程度,这对于证券或金融市场的波动性分析是极其有用的。
1.3 Copula模型参数估计
通过采用含参数的Copula函数估计,可以很好地显示多个时间序列数据的非对称性和厚尾特性[6],因此选取Normal Copula函数、t-Copula函数、Gumbel Copula函数、Clayton Copula函数和Frank Copula函数,来拟合新兴产业指数与上证综合指数收益率的相关性。
采用两阶段的极大似然法进行Copula模型的参数估计,其极大似然方程为:
其中,θ=(θ1,…,θN;α)。
第一步,对单变量的边缘分布进行参数估计:
其中,n=1,2,…,N。
第二步,在完成单变量参数估计后,对α进行估计:
1.4 拟合优度评价
选取合适的Copula函数来度量变量间的相关结构尤其关键。拟合优度评价(Goodness of Fit)是选取与观测值配合最优Copula函数的一个重要标准,本文采用AIC法则、BIC法则、切比雪夫距离和欧氏距离来评价Copula方法的有效性。具体方法如下:
(1)AIC法则
式中:PC(i),PE(i)分别为联合分布(Copula)频率值和经验分布(Empirical)频率值;FC(i),FE(i)分别为联合分布值和经验值;n为实测样本序列的长度,k为参数的个数。
(2)BIC法则
(3)切比雪夫距离
(4)欧氏距离
指数收益率之间相关的非对称在市场处于下降的趋势时(熊市),尤其是急剧下降时,比正常时或上升时(牛市)的相关性大[7]。因此市场趋于下降时,分析股票指数收益率尾部的相关性将会导致高估金融资产分散化降低风险的作用。
2.1 样本选取
本文的目标在于分析我国新兴产业市场和金融市场之间的关系,因此选取新兴产业指数和上证指数的市场日收益率为主要研究对象,由于新兴产业起步较晚,故选定2005年1月1日至2014年4月30日为样本区间,共计2261个观测值。数据来源于雅虎财经网。根据证券/金融市场日收盘价计算对数收益率rt计算公式为:
其中,Pt为第t个À易日的指数收盘价格。
2.2 描述性分析
本文对选取的样本数据采用R3.1.0和Matlab2014a软件分析。表1给出了新兴产业指数与上证综合指数对数日收益率的描述性统计结果。
表1 新兴产业指数和上证综合指数收益率描述性统计
从均值来看,两序列对数收益率均呈现正的平均收益率,其中新兴产业收益率高达0.0706;与上证综合指数日收益率的中位数值相比,新兴产业收益率达到0.226,接近其3倍,表明新兴产业指数对我国证券市场指数收益率具有正向效应。
从偏度和峰度看,两序列对数收益率的偏度均为负,表明均有较长的左偏现象;新兴产业指数的峰度值小于3,而上证综合指数的峰度值大于3,且具有尖峰厚尾性,因此两序列都拒绝正态分布的假设。从ADF检验统计量结果可知,两序列拒绝平稳性的假设,即存在单位根。
从Jauque-Bera统计量看,P值均为0,说明均拒绝服从正态分布的假设。因此,可以通过ARMA-GARCH模型对收益率残差序列进行过滤,得到无序列相关和无异方差的平稳的残差序列。图1反映了收益率的波动情形。
图1新兴产业指数和上证综合指数收益率时序图
图2 新兴产业指数和上证综合指数收益率直方图
从图1可以看出收益率呈集聚效应,即大的波动之后出现大波动的可能性更大,反之亦然。图2反映了收益率序列的左偏特性和厚尾效应。
从收益率分布和正态分布的图形可以看出,新兴产业指数和上证综合指数的收益无论是在上尾还是下尾都比正态分布的上、下尾部更厚,即风险更大。
2.3 Copula-GARCH-t模型
根据Copula理论,选择合适的Copula函数描述金融产品的相依结构,只要能够确定每个市场或资产收益率的边际分布,即可获得整个市场或资产组合的联合分布[8]。大量实证表明金融时间序列具有明显的尖峰厚尾性、波动聚集性及其杠杆效应;而且具有序列自相关性和异方差性,可以通过GARCH族模型很好地消除这些特征,因此GARCH族模型被认为是目前较优的刻画金融时间序列波动的模型。通过GARCH模型可以对原时间序列进行残差分析,将得到的残差序列标准化为[0,1]区间上的均匀分布,就可以进行Copula参数估计了。
本文采用t-Copula函数来度量两指数收益率的相依性。t连接函数能够反映尾部的相关程度,而高斯连接函数不能反映尾部的相关程度。因此假设收益率序列的随机误差项服从t分布,选择ARMA(1,1)-GARCH(1,1)分布模型作为收益率的边际分布,其模型形式如下:
式中,n=1表示上证综合指数;n=2表示新兴产业指数;C为二元学生t分布Copula函数;It-1为初始时刻t=1到t-1时刻的信息集。TVn(…)表示均值为0,方差为1,自由度为参数νn的标准化t分布函数。
2.4 边缘分布及参数估计
由于二元Copula函数是两变量的边际分布为[0,1]区间的均匀分布所构成的二维联合分布函数,必须先进行分布形式检验,使得残差项序列服从独立的[0,1]均匀分布。检验独立均匀分布的主要步骤如下:
①确定随机变量在ARMA(1,1)-GARCH(1,1)-t模型下的相应参数,将残差序列(Innovations)除以对应时间的条件标准差序列(Sigmas)得到标准化的残差序列(Residuals);
②通过Ljung-Box Q统计量对第①步过滤后的残差序列进行序列自相关检验,以确保序列独立性;
③通过概率积分转换获得标准化的残差序列的累积概率分布,并对标准化残差序列的累积概率分布进行KS检验(概率P值接近于1),结果显示无法拒绝原假设,累积概率分布服从均匀分布。
ARMA(1,1)-GARCH(1,1)-t模型的参数估计如表2所示。
表2 ARMA(1,1)-GARCH(1,1)-t模型的参数估计
本文选择的ARMA(1,1)-GARCH(1,1)-t模型对新兴产业指数和上证综合指数的收益率序列进行残差过滤,估计结果如表3所示。通过对边际分布检验,消除了原序列中存在的自回归和异方差问题,得到独立同分布的序列,并关注过滤后的收益率序列是否存在自相关性及其分布特性。
从表3可以发现,两指数收益率序列的残差序列存在左偏、厚尾现象;从JB统计值看,标准残差序列{} ξnt不接受正态分布;Ljung-Box检验表明,两序列拒绝自相关性;ADF检验表明残差序列不存在单位根。因此,通过ARMA-GARCH-t模型对两指数收益率序列过滤得到了不相关和无异方差的平稳残差序列。
表3 ARMA(1,1)-GARCH(1,1)-t模型的标准残差分析
研究两指数收益率序列{ξnt}间的相依性,可以通过MLE对ARMA-GARCH-t模型进行参数估计后,转变为标准残差序列{ξnt}下的相依性。Copula函数的相依性如表4所示。
表4 Copula函数的相依性
从相依系数的分析结果发现,t-Copula函数的相依性与原观测值的相依性最接近,因此采用学生t分布的Copula函数来拟合二者之间的相依性最佳。
2.5 尾部相依性
从图3可以看出,对样本数据经过ARMA-GARCH-t模型的标准后的残差序列平方不存在自相关性;同时残差滞后30阶Q检验概率P值均小于0.05,说明残差序列不存在自相关,即标准化残差服从独立同分布,这恰恰满足Copula-GARCH模型的条件。
图3新兴产业指数和上证综合指数标准化误差平方自相关函数图
图4新兴产业指数和上证综合指数标准化误差QQ图
从图4可以看出,学生t分布可以很好地展现样本数据中间部分的尖峰厚尾性,而对其尾部数据拟合效果不太好。通过采用GPD方法来拟合数据的尾部特征就显得尤为重要,从拟合效果图(图略)中可以看出,基于内部核函数的累积分布和帕累托分布对尾部的拟合效果较好。
对于帕累托分布分析尾部特性一般要选取合适的阈值,而GPD参数估计通常采用极大似然估计。通过研究发现,阈值设定越高,超过阈值数据越少,则参数方差较大;相反,不能得到收敛的数据,同样估计的偏差也较大。可以确定新兴产业指数的上尾门限为1.13,下尾门限为-1.35。这样可以保证每个尾部都有超过25%的数据即约有600个样本值用来进行尾部拟合。同样也可以确定上证综合指数的上尾门限为1.15,下尾门限为-1.22。确定两个指数的各自门限后,就可以通过GPD分布对数据的尾部进行估计建模,估计结果如表5所示。
表5 GPD估计的相关参数
2.6 拟合优度检验
基于不同Copula函数的拟合优度检验法,可以确定模型的拟合效果程度,其参数估计结果如表6所示。
表6 Copula函数的参数估计
从表6可以看出,AIC及BIC值越小,说明Copula函数拟合得越好。通过切比雪夫距离和欧式距离的计算,t-Copula函数拟合二者的分布模型最好,因此采用t-Copula函数构建模型来模拟二者之间的相依结构。
本文以2005年1月1日至2014年4月30日上证À易所新兴产业指数和上证综合指数的数据采用Copula-GARCH-t模型进行建模分析。首先对两个对数收益率的时间序列建立ARMA(1,1)-GARCH(1,1)-t模型。作为Copula模型的边缘分布,利用t-Copula函数可以很好地描述新兴产业指数和上证综合指数之间的相依关系,反映了两个指数在宏观政策反应和投资者心态等的趋同性。在静态分析中,两者的相关结构具有一定的对称性,也说明新兴产业指数和上证综合指数的收益率相关性较强;同时发现下尾相关系数比上尾相关系数要大,说明两指数同时下跌的可能性较大。也说明了新兴产业的快速发展极大地影响了国家证券金融市场的发展,而且我国新兴产业的发展也急需良好的金融服务和政策支持。
[1]熊广勤.战略性新兴产业发展的金融支持国际比较研究[J].现代管理科学,2010,(11).
[2]熊正德,林雪.战略性新兴产业上市公司金融支持效率及其影响因素研究[J].经济管理,2012,(14).
[3]Nelsen R B.An Introduction to Copulas[M].New York:Springer,1999.
[4]Patton A J.Modeling Time-Varing Exchange Rate De⁃pendence Using the Conditional Copula[R].San Di⁃ego:Department of Economics,University of Califo⁃mia,2003,(5).
[5]韦艳华,张世英.Copula理论及其在金融分析上的应用[M].北京:清华大学出版社,2008.
[6]伦敦(Justin London),郭梁,黄茜等.金融衍生品建模:基于Matlab、C++和Excel工具[M].北京:机械工业出版社, 2011.
[7]蔡瑞胸,李洪成,尚秀芬,郝瑞雨.金融数据分析导论:基于R语言[M].北京:机械工业出版社,2013.
[8]吴庆晓,刘海龙.基于Copula模型的风险相关性度量方法[J].系统管理学报,2011,6(20).
(责任编辑刘柳青)
F830
A
1002-6487(2016)24-0170-04
国家社会科学基金资助项目(12CZZ051);福建省教育厅A类社会科学基金资助项目(JAS150284)
葛 亮(1981—),男,江苏南通人,博士研究生,讲师,研究方向:经济计量分析、卫生政策评价。