【摘要】探讨灰色系统与最小二乘支持向量机组合预测模型在波动率上的应用的可行性,通过对灰色模型进行残差修正和背景值修正以及对最小二乘支持向量机进行参数寻优,来提高组合预测模型的预测精度和推广泛化能力。经波动率预测的实证分析得出建立的组合模型比支持向量机模型有较好的预测效果。
【关键词】灰色系统 最小二乘支持向量机 波动率预测
目前国内外有关基金波动预测方法主要可以分为两类:第一,统计方法[James D.,Parvez Ahmed.Chiang et al]。第二,人工智能方法[Carhart,M.and 0.Karaali.傅东升,潘海峰,耿立艳]。统计方法有自回归(AR)、移动平均(MA)、自回归条件异方差(ARCH)。传统方法是一种参数方法,首先要定义模型的具体形式,根据历史数据找出最优参数,模型精度容易遭到模型定义错误的影响,导致模型不匹配问题。人工智能方法主要是神经网络方法和支持向量机,和传统的统计模型不同,神经网络是数据驱动的非参数模型,它们让“数据自己说话”。与传统的统计模型相比,神经网络在描述基金的动态性方面具有更大的潜力。Chiang比较了神经网络和传统的线性回归方法来预测基金的年末净值(NAV)方面的表现,发现神经网络有着更好的预测精度。Carhart and Karaali也用同样的方法来预测基金业绩上的效果,得到近似的结论。Indro et al.也发现在预测股票共同基金业绩方面,神经网络比传统计量方法有更好的预测精度,支持向量机具有良好的预测性能,不存在局部最小值、解的稀疏性。R.Muller,J.A.Smola and B.Scholkopf将支持向量机从模式识别中的应用拓展到回归估计中。
灰色预测方法是由邓聚龙教授于1982年提出的,具有独特的数据处理方式较好的削弱原始数据的随机性,在数据量较小的情况下既可以得到较高的预测精度。考虑支持向量机和灰色预测方法的优点,耿立艳等采用灰色预测方法和支持向量机结合,建立了灰色支持向量机模型,并以极差替代收益率的标准差度量了波动率。但是,神经网络和支持向量机均易陷入过度学习,灰色预测方法也存在一定程度的不稳定性且一般只做短期预测,为进一步优化灰色预测与支持向量机模型的组合理论,丛玉良,李晓雷[6]等提出了一种基于灰色系统与最小二乘支持向量机组合预测的方法,并成功应用于短时交通流量预测中,本文尝试通过该方法来对基金波动率进行预测并分析其可行性及优点。
一、理论模型
灰色系统与最小二乘支持向量机组合预测包含改进的灰色GM(1,1)和最小二乘支持向量机两个方面的理论。
(一)改进的GM(1,1)理论
关于基本GM(1,1)的理论,此处不再赘述,详见文献[7],此处主要介绍改进的理论。
二、灰色最小二乘支持向量机模型(GSVM)
具体GSVM模型[6]的建模步骤简述如下:
第一,对原始数据进行预处理,进行灰色预测,得到残差序列,然后用最小二乘支持向量机模型(LSSVM)对残差序列进行预测,得到新的残差值;
第二,进行最小二乘支持向量机(LSSVM)训练之前,对训练的数据进行数据归一化预处理,生成数据集并分组,即把样本数据转化为0~1之间的数据;
第三,选择核函数,采用交叉验证的方法确定最小二乘支持向量机的回归参数:得到数
据集之后,选择径向基函数作为核函数,包含宽度参数、二次规划的优化参数;
第四,构造组合预测模型;
第五,输入数据集,生成预测函数;
第六,进行预测误差评价分析,如果误差较大,重新调整参数,再次进行预测。
三、实例分析
(一)数据的选取
本文选取上证基金指数(基金代码:000011)2013年6月13日~2017年6月30日的数据作为样本,共989个观测值,其中原始价格数据来源于Wind资讯的基金数据复权收盘价。在该样本期内,我国股票市场经历了较为完成的牛熊市周期,使得我们得到的结果更有说服力。
历史波动率是用金融资产的历史数据来估算其波动率,基本假设是相信过去所实现的波动率会延续到未来,且不会产生大幅变动[2]。因此,可将用过去数据所计算而得的波动率视为未来的波动率。Parkinson[8]已证明,利用极差估计波动率的效率要高于通常的样本标准差。这里采用极差来度量金融资产的波动率,即
GSVM模型的输入变量由四阶滞后波动率组成,输出变量为当期的波动率。即利用前四期的波动率来预测当期的波动率。
(三)预测模型最优参数
(四)预测性能评价指标
选用如下三个评价指标进行误差分析即
(五)结果分析
为详细比较两个模型的预测效果,将预测区间分成几个子区间,分别计算各自区间的预测性能指标的值,计算结果见表1
由表1分析可得,10步-50步,GSVM和ε-SVR的效果相当,但在100-289步GSVM与ε-SVR相比在MAPE和EC指标上占优,但是在MSE指标上,GSVM均不占劣势,具体原因可能是GSVM中对原始数据采用了累加处理方式,导致一部分信息丢失,总体而言,在短期及200步以上长期预测上,GSVM稍微优于ε-SVR,100-200步以内的中期的预测上ε-SVR稍优于GSVM。
四、结论
支持向量机模型综合考虑结构风险和经验风险,具有良好的鲁棒性和较高的预测精度。而灰色模型中的累加生成方式可以削弱数据序列的随机性,增强数据的规律性。本文将灰色预测方法引入到ε-SVR模型中,充分利用两者的优势对上证基金的极差波动率进行了预测。通过GSVM和ε-SVR的对比,证明了新模型是一种有效的波动率预测方法,在短期预测方面比较突出。
参考文献
[1]傅东升,曹丽娟.SVM与BP网络对基金波动的预测效果比较分析[J].世界经济情况,2007,(8):45-50.
[2]耿立艳,马军海.基于灰色支持向量机的基金波动率预测研究[J].计算机应用研究,2009,26(7):2471-2473.
[3]潘海峰.VAR和GARCH类模型在证券投资基金风险计量中的应用研究[J].统计教育,2008(10):28-31.
[4]江红莉,姚洪兴.基于MRS-GARCH的社保基金投资风险测度研究[J].西安电子科技大学学报(社会科学版),2013,23(2):84-91.
[5]庞丽艳,李文凯,黄娜.开放式基金绩效评价研究[J].经济纵横,2014(7):91-95.
[6]丛玉良,李晓雷等.一种短时交通流量的组合预测方法[p].中国:103730006,2014.04.
[7]肖新平,毛樹华.灰预测与决策方法[M]. 北京:科学出版社,2013:165-170.
[8]PARKINSON M.The extreme value method for estimating the variance of the rate of return[J].Joumal of Business,1980,53(1):61-65.
[9]李洋,王小川,郁磊.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.
作者简介:范献胜(1987-),男,河南信阳人,硕士,助教,研究方向:灰色预测建模。