耿立艳 祁召华 于建立
[摘 要]为了提高金融波动率的预测精度及建模速度,文章提出一种基于粒子群算法优化最小二乘支持向量机(LSSVM-PSO)的波动率预测方法,利用LSSVM优良的非线性逼近能力预测波动率,通过PSO算法的全局快速优化特点选择LSSVM最优参数。以中国股市实际交易数据为样本,通过样本内预测和样本外预测验证了该方法的有效性。结果表明,LSSVM-PSO模型具有较高的预测精度和计算效率,是一种有效的股指波动率预测方法。
[关键词]波动率预测;最小二乘支持向量机;粒子群优化算法
[中图分类号]F830;TP183
1 引 言
股指波动率是衡量金融资产风险的重要指标之一。金融资产的投资组合、测度与管理均依赖于股指波动率的准确估计和预测。多年来,国内外研究者不断提出各种模型与方法预测股指波动率,以GARCH模型[1]为代表的计量经济学模型在波动率预测方面获得了广泛的应用和认可。
为进一步提高股指波动率的预测精度,近些年来,以神经网络为代表的智能预测方法被大量应用于股指波动率的预测研究。作为一种非参数的数据驱动方法,神经网络在未知数据先验信息的情况下,通过良好的非线性映射能力,即可描述波动率的非线性特征,从而在一定程度上改善了波动率预测效果[2-3]。但神经网络以经验风险最小化为计算标准,在应用中难以确定隐含层节点数,容易陷入局部最优解、泛化能力也受到限制。支持向量机(SVM)[4]以统计学习理论为基础,很好地避免了神经网络的缺陷在股指波动率预测方面的性能优于神经网络[5-6]。以SVM為基础发展起来的最小二乘支持向量机[7](LSSVM)将SVM中求解二次规划问题转化为求解线性方程组,提高了相应算法的收敛速度,因而更适应于波动率的预测研究。文献[8]、[9]将LSSVM应用于股指波动率预测中,并证实了LSSVM的有效性。
在核函数确定的情况下,如何准确选取参数是提高LSSVM预测精度的关键,目前对LSSVM参数选取尚无统一的方法,主要通过反复试算来获得。粒子群优化(PSO)算法是一种群集智能优化算法,良好的鲁棒性和简易的计算可快速解决多目标约束优化问题。为实现LSSVM参数的自动选取及预测精度的提高,文章利用PSO算法优化选择LSSVM参数,建立基于PSO算法的LSSVM波动率预测模型。以中国股市的实际数据为例,分别对数据样本的训练集和测试集进行预测,并将预测结果与基于交叉验证法的LSSVM的预测结果进行比较。
3 实证研究
3.1 数据的选取
以上证综指(SHCI)、深证成指(SZCI)和沪深300指数(HS300)的每日收盘价数据作为样本选取对象,时间跨度从2011年1月4日到2013年3月15日,剔除非交易日,共有533个数据。按下式计算连续复合对数收益yt:
3.2 网络学习与预测
为加快模型收敛速度,先将数据样本归一化到[0,1] 区间,然后将整个数据样本分为两组,前331个数据作为训练样本,其后200个数据作为测试样本。LSSVM-PSO模型中,PSO算法的自身参数设置如下:粒子群的群体规模m取作10,学习因子c1和c2都取作2,最大、最小惯性权重分别取作0.9和0.4,最大迭代次数取作20。为减少随机性的影响,利用PSO算法对LSSVM连续优化10次,选择其中的最优参数γ*和σ*建立LSSVM模型,进行向前一步波动率预测,最后再反归一化得到原始波动率预测值。
为方便比较PSO算法优化选择LSSVM参数的有效性,同时利用10折交叉验证法选择LSSVM参数γ*和σ*,记为LSSVM-CV模型,并向前一步预测波动率。
3.3 预测性能评价指标
采用以下指标评价模型的预测性能:对数误差统计量(LL)、线性-指数损失函数(LINEX)、正则均方误差(NMSE)、正则均值绝对误差(NMAE)和搜索最优参数花费的时间(TIME),各指标定义如下:
3.4 结果分析与比较
表1给出了LSSVM-PSO和LSSVM-CV两模型基于训练样本的样本内预测结果。在三种股指中,LSSVM-PSO模型的LL、LINEX、NMSE和NMAE均小于LSSVM-CV模型的对应值,即LSSVM-PSO模型对训练样本的预测精度优于LSSVM-CV模型。此外,从TIME可看出,LSSVM-PSO模型在三种股指中的收敛速度远远快于LSSVM-CV模型。这主要是由于PSO算法通过出色的全局快速优化性能提高了LSSVM最优参数的搜寻速度,而交叉验证法因存在大量的重复计算,降低了最优参数的搜寻速度。
表2给出了LSSVM-PSO和LSSVM-CV两模型基于测试样本的预测结果。从表2可以看出,在SZCI和HS300中,LSSVM-PSO模型的LL、LINEX、NMSE、NMAE均小于LSSVM-CV模型的对应值;对SHCI,除了LSSVM-PSO模型的LL大于LSSVM-CV模型外,LINEX、NMSE和NMAE均小于LSSVM-CV模型。从整体上看,LSSVM-PSO模型对测试样本的预测精度优于LSSVM-CV模型。由此,从预测性能和建模速度来看,LSSVM-PSO是一种有效的波动率预测模型。
4 结 论
将PSO算法和LSSVM模型相融合预测股指波动率,PSO算法用于选择LSSVM的最优参数,通过对中国股市的实证分析验证了该方法的有效性。结果表明,基于PSO算法的LSSVM模型样本内预测和样本外预测性能均优于基于交叉验证法的LSSVM,而且PSO算法明显提高了LSSVM的建模速度。
参考文献:
[1]BOLLERSLEV TIM. Generalized autoregressive conditional heteroscedasticity[J].Journal of Econometrics, 1986,31(3):307-327.
[2]DONALDSON R G, KAMSTRA M. An artificial neural network-GARCH model for international stock return volatility[J]. Journal of Empirical Finance, 1997(4): 17-46.
[3]TAYLOR J W. A quantile regression neural network approach to estimating the conditional density of multiperiod returns[J]. Journal of Forecasting, 2000(19): 299-311.
[4]VAPNIK V. N. An overview of statistical learning theory[J]. IEEE Transactions on Neural Networks, 1999,10(5): 988-999.
[5]CHEN S Y, HARDLE W K, JEONG K. Forecasting volatility with support vector machine-based GARCH model[J]. Journal of Forecasting, 2010, 29(4):406-433.
[6]WANG B H, HUANG H J, WANG X L. A support vector machine based MSM model for financial short-term volatility forecasting[J]. Neural Computing & Applications, 2013(22): 21-28.
[7]SUYKENS J A K, VANDEVALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300.
[8]LIYAN GENG, ZHAN FU ZHANG. CARRX model based on LSSVR optimized by adaptive PSO[C].Guilin:Proceedings of 2th International Conference on Computer and Management, 2012:268-271.
[9]LIYAN GENG, YIGANG LIANG. Prediction on Fund Volatility based on SVRGM-GARCH model[J]. Advanced Material Research, 2012: 3763-3768.
[10]KENNEDY J, EBERHART R.C. Particle Swarm Optimization[C].Perth :Proceedings of IEEE International Conference on Neutral Networks, 1995: 1942-1948.
[作者簡介]通讯作者:耿立艳(1979—),女,天津宝坻人,博士后,教授,硕士生导师,研究方向:金融工程。