孙文凤
摘要: VaR是使投资风险数量化的工具,旨在估计给定金融资产或组合在正常的资产价格波动下未来可能的或潜在的最大损失。支持向量机是一种基于传统统计学习理论的机器学习算法。波动率作为金融风险的度量,是风险管理中的重要指标。在对VaR的计算中,本文将最小二乘支持向量机与传统的蒙特卡罗模拟法结合,对波动率进行估计。实证分析表明,该方法可行有效。
Abstract: VaR is a tool making the investment risk quantification, which aims at estimating the possible or potential maximum loss in the future of a given financial asset or portfolio under the normal asset price fluctuations. Support vector machine is a kind of machine learning algorithm based on traditional statistical learning theory. As a measure of financial risk, volatility is the important indicator of risk management. In this paper, when calculating VaR, the least squares support vector machine is combined with the traditional monte carlo simulation method to estimate volatility. The empirical analysis shows that the method is feasible and effective.
关键词: VaR;支持向量机;最小二乘支持向量机;蒙特卡罗模拟
Key words: VaR;support vector machine;least squares support vector machine;monte carlo simulation
中图分类号:F224;F832.5 文献标识码:A 文章编号:1006-4311(2017)06-0212-04
0 引言
在近几年,基于统计学习理论的支持向量机学习方法[1]备受关注。遵循“结构风险最小化”目标建立起来的支持向量机(SVM)具有较强的泛化能力。最小二乘支持向量机(LS-SVM)[2]的原理是通过等式约束取代以往的不等式约束,使优化课题转换为对某个线性方程组求解的课题,从而进一步提升算法的运算速度。
波动率作为金融风险的度量,是风险管理中的重要指标[3]。考虑到支持向量机在处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题有着成功的应用,在对VaR进行计算时,本文将最小二乘支持向量机与传统的蒙特卡罗模拟法结合对波动率进行估计,最后对上证指数进行实证分析,说明本文所给方法的有效性。
1 最小二乘支持向量机
2.1 VaR的概念
VaR[4,5]即“处于风险中的价值”,其含义最早出自
J.P.Morgan的理论学说,它是指某一金融资产或证券组合在正常波动的市场环境的最大可能损失。从严格意义上讲,VaR实际是在一定的概率水平下,某一金融资产或证券组合在未来特定时间段内的最大可能损失,其表达式为:P=(?驻P>VaR)=1-?琢(10)
在上式中,?驻P表示“持有期?驻t内证券组合的损失”,VaR则表示“置信水平?琢下处于风险中的价值”。
2.2 基于蒙特卡罗模拟法的VaR计算方法
蒙特卡罗模拟方法[6]的原理是反復模拟支配我们感兴趣的金融工具的价格或回报的随机过程。禾祺夫,董丽娟[7],基于该原理的计算和分析在学者张玉[8]和郭繁[9]的相关文献中都有涉及,综合四人的文献和理论学说可总结出基于蒙特卡罗模拟法的VaR计算步骤:
①选择能够体现价格调整的随机模型和分布,估算出相关参数。假设选择股票价格调整模型服从几何布朗运动(GBM),不考虑资产价值的变动时间,则可通过下列公式来表达其离散形式:
3 基于最小二乘支持向量机的实证分析
本文选取上海证券交易所的日收盘指数作为样本,选取的样本期间为2012年1月4日到2016年8月25日,共得到1130个交易日的收盘指数数据。其中,选取2012年1月4日-2015年8月10日共874天上证指数收盘价数据作为训练样本,用于波动模型的构建以及参数的确定,而2015年8月12日-2016年8月25日共255天的数据则作为测试样本用于预测检验,验证模型的有效性。其中,日收益率的计算方法为:?滋t=lnSt-lnSt-1(13)
其中,St表示上证指数第t个交易日收盘价。
3.1 统计学检验
其中,N为样本容量,S和K分别为偏度和峰度。在正态分布原假设下,Jarque-Bera证明了上述JB统计量渐进地(大样本情况下)服从自由度为2的?字2分布。故根据样本序列计算JB统计值,然后与?字2分布临界值对比,可推断收益序列是否服从正态分布。
用Eviews软件对训练样本数据收益率进行
Jarque-Bera检验,其Jarque-Bera检验结果如图1。
在95%的显著水平上,JB统计量的临界值是5.99,JB统计量的值大于该临界值则表明拒绝正态分布的原假设。从Jarque-Bera检验结果可以看出,训练样本数据日收益率的JB统计量为1283.060,远大于临界值5.99,表明训练样本数据的收益率不服从正态分布。
②上证指数对数收益率时间序列分析及异方差检验。
如果一个时间序列无明显的上升或下降趋势,各观测值围绕其均值上下波动,这个均值相对于时间来说是一个常数,则该时间序列为平稳序列。从表1中可以看出t统计量的值为-12.81567,对应p值接近于零,表明收益序列是平稳的。根据表2中自相关函数和偏自相关函数的数值,可以判定?滋t与?滋t-4的相关性较大,因此可对上证指数收盘价的对数收益率序列建立AR(4)模型。模型的参数估计结果如表3所示。估计模型可以表示为:
4阶滞后项的系数的检验p值小于0.05,说明在0.05的置信水平下,系数显著不为0,即上述模型是有效的。
进一步对上述模型的残差项进行ARCH检验,考察残差项是否存在自回归条件异方差。检验结果如表4所示。
由表4可知,ARCH检验得到F和LM统计量对应的概率均小于0.05,即落入原假设(残差项不存在自相关)的拒绝域,可认为模型的残差序列存在自回归条件异方差。
3.2 基于最小二乘支持向量机的蒙特卡罗模拟法
上证指数收益率的异方差性已通过上文的模型进行了分析和验证,并且得到一个初步的结论:收益率的条件方差不是固定不变的,并且呈现出集聚性波动的现象。而通常情况下,蒙特卡罗模拟法主要通过样本数据标准差来衡量波动性,这种集聚性波动现象在基于蒙特卡罗模拟法的分析过程中表现并不明显,因此并不能作为分析收益率序列的尖峰厚尾特性的依据。接下来,我们将最小二乘支持向量机对波动率的估计引入到蒙特卡罗模拟法中且用t分布代替正态分布,以提高基于模型预测集聚性损失和分布尾部损失的准确度。
在金融波动率模型中,GARCH类模型是一种统计类模型。一般都采用最大似然法(MLE)或准最大似然法(QMLE)来估计GARCH类模型。其中应用较广的是GARCH(1,1)模型:[10]
②参数选择。本文选择高斯核函数作为最小二乘支持向量机的核函数,参数的确定主要就是选择高斯核函数的核宽?滓和支持向量机的正则化参数r的过程。本文选取2012年1月4日到2015年8月10日共874天上证指数收盘价作为训练样本,使用网格搜索法确定最优参数:?酌=922.7212,?滓2=92.94345。
③模型训练。选取2012年1月4日到2015年8月10日共874天上证指数收盘价作为训练样本,可以得到2012年1月5日到2015年8月10日共873天的收益率,以及2012年1月11日到2015年8月10日共869天的波动率。选取2012年1月12日到2015年8月10日共868天的波动率作为输出向量y,2012年1月11日到2015年8月7日共868天的收益率平方及波动率作为输入向量x,根据上文中对最小二乘支持向量机的介绍,对模型进行训练。
④波动率估计。选取2015年8月4日到2016年8月24日共260天的收盘价,可计算得到2015年8月11日到2016年8月24日共255天的收益率及波动率,根据上一步训练的模型我们可估计出2015年8月12日到2016年8月25日共255天的波动率。如图2所示。
⑤计算VaR。估计出波动率之后,将最小二乘支持向量机估计出的条件方差?滓t代入到上一节用一般的蒙特卡罗模拟法计算VaR 的步骤中,取代用标准差计算的?滓,即可计算出VaR。利用最小二乘支持向量机计算2016年8月12日上证指数VaR的具体步骤如下:
1)估计均值和标准差。
本文选取考察天数为255天,即考察2015年8月12日到2016年8月25日共255个交易日。在上一部分的基础上,将窗口向后推 255次,即用Matlab软件重复计算255次,即可得到2015年8月12日到2016年8月25日这255个交易日每日 的VaR。然后,我们又分别对97.5%和99%的置信水平进行计算,将95%置信水平得到的结果绘于图3中。
计算出VaR之后,将VaR与实际损失进行比较,得到VaR模型的检验结果,如表5所示。
从表5中可以看出,改进后的基于最小二乘支持向量机的蒙特卡罗模拟法预测的VaR在95%、97.5%、99%的置信水平上模型预测的失败天数均落在了非拒绝域,表明在这三个置信水平上该模型是可以接受的。
4 结论
通过统计学检验的方法验证了我国上证指数收益率数据是不服从正态分布的,存在明显的尖峰厚尾和波动性的集聚性现象。而一般的蒙特卡罗模拟法使用样本数据的标准差来衡量波动性,故不能反映出波动的集聚性现象,也无法解释收益率序列的尖峰厚尾的特性,故一般的蒙特卡罗模拟法在计算VaR时就存在一定的局限性。本文将最小二乘支持向量机与传统的蒙特卡罗模拟法结合对波动率进行估计且用t分布代替正态分布,从模拟结果中可以看出,在95%、97.5%、99%的置信水平上模型预测的失败天数均落在了非拒绝域,表明在这三个置信水平上该模型可以接受,说明本文所给方法有效。
参考文献:
[1]Vapnik V N, Vapnik V. Statistical learning theory[M]. New York: Wiley, 1998.
[2]Suykens J A K, Vandewalle J. Least squares support vector machine classifiers[J]. Neural processing letters, 1999, 9(3): 293-300.
[3]Chen S, Hardle W K, Jeong K. Forecasting volatility with support vector machine-based GARCH model[J]. Journal of Forecasting, 2010, 29(4): 406-433.
[4]Fernandez V.Risk Management Under Extreme Events[J].International Review of Financial Analysis,2005( 14) : 113-148.
[5]Jorion P. Value at risk: the new benchmark for controlling market risk[M]. Irwin Professional Pub, 1997.
[6]王春峰,萬海晖,张维.金融市场风险测量模型——VaR[J]. 系统工程学报,2000,15(1): 67-75.
[7]禾祺夫,董立娟.基于蒙特卡罗模拟的 VaR 对香港恒生指数期货的实证研究[J].内蒙古科技与经济,2010(1):13-15.
[8]张玉.基于蒙特卡罗模拟的几种 VaR 模型度量效果比较[J].统计与决策,2009(7):54-55.
[9]郭繁.基于蒙特卡罗模拟法的风险价值(VAR)及其在中国股票市场中的运用[D].山东大学,2006.
[10]Perez-Cruz F, Afonso-Rodriguez J A, Giner J. Estimating GARCH models using support vector machines[J]. Quantitative Finance, 2003, 3(3): 163-172.
[11]Ou P, Wang H. Financial volatility forecasting by least square support vector machine based on GARCH, EGARCH and GJR models: evidence from ASEAN stock markets[J]. International Journal of Economics and Finance, 2010, 2(1): 51.