股票价格预测模型研究

2009-10-12 07:15
财经问题研究 2009年7期
关键词:GARCH模型支持向量机神经网络

沈 巍

摘要:依据建模理论的不同,可将股票价格预测模型分为两大类,:一类是以统计理论为基础的传统型的价格波动预测模型;另一类是以神经网络、灰色理论、支持向量机等为理论基础的创新型预测模型。运用这两类模型对股票价格进行预测时各有特点。本文对这两类模型及其研究现状进行系统研究,将两类模型的特点进行比较分析,探讨股票价格预测模型在我国应用中存在的问题,并对未来发展方向提出建议。

关键词:股票价格预测;GARCH模型;SV模型;神经网络;灰色模型;支持向量机

中图分类号:F830.9

文献标识码:A

文章编号:1000-176X(2009)07-0089-05

股票作为金融市场最主要的金融工具之一,其价格波动能否预测、以及用何种方法进行预测,一直以来都是金融领域研究的焦点问题之一。

20世纪80年代以前,Markowitz的资产组合理论、Sharpe的资本资产定价理论、Fama的有效市场假说等传统的金融理论在金融领域占主导地位。传统金融理论认为:投资人是完全理性的;金融资产收益具有独立、同分布和正态分布三个最为本质的特征;股票价格波动是鞅(Martingale)过程,无法预测。但是,20世纪80年代初非线性理论、行为金融理论和人工智能方法的出现与发展,对传统金融理论所持的上述观点产生了颠覆性冲击。

非线性理论中最具影响力的是Mandelbrot于1977年创立的分形(Fractal)理论,其中提出“自相似”和“分数维”两个重要概念。分形在价格波动特征研究中的应用是:将“自相似”概念引入到统计学的“分形统计学”,即研究一个时间序列中局部与整体之间是否存在统计的自相似性。1982年Engle正是在分形理论的基础上,对股票价格波动特征进行研究,开创性地提出了自回归条件异方差模型((Autoregressive Conditional Heteroskedasticity,简称ARCH模型)。GARCH模型说明:股票收益不像传统金融理论描述的那样属于正态分布,而是有波动性和丛聚性,存在尖峰厚尾现象;GARCH模型较好地模拟了股票波动中存在的这种丛聚性和时变性,由于股票价格波动在统计上存在“自相似”,因此,股票价格波动是可以预测的。

行为金融理论着重分析金融市场中由于心理因素引起的投资者的失误偏差和市场的反常。1985年,Werner De Bondt, Richard H.Thaler发表了《股票市场过度反应了吗?》一文,从而引发了行为金融理论研究的热潮,被视为金融学行为金融研究的正式开端。行为金融学研究的一系列成果表明;金融市场存在反应过度和反应不足;存在许多异常现象:例如小公司现象、规模现象等;存在羊群效应、流行效应等。行为金融学研究表明:投资人不是完全理性,而是部分理性。股票价格波动是有一定规律可寻的,是可以部分预测的。

分形理论和行为金融理论,在理论上支持了股票价格波动的可预测性,同时,在20世纪80年代,计算机智能算法大量涌现,神经网络、支持向量机、遗传算法、信号理论,粗集算法等,在计算技术层面上对股票预测给予了强有力的支持,解决了预测过程中许多实际的技术问题。这种理论和技术的相互支撑和相互印证,使得对股票价格波动预测方面的研究产生了前所未有的爆发力。20世纪90年代至今20年左右的时间里,涌现出大量的对股票进行预测的研究文献。国内外许多学者运用各类预测模型和方法对股票价格波动进行实证分析和预测,希望能够从中得到有益的启示和可以遵循的规律,从而为政府对股市进行调控与管理、投资者回避投资风险等提供借鉴与依据。

从国内外对股票价格波动进行预测的模型种类很多。但依据其建模理论不同,可将这些预测模型划分为两个大类:一类是以统计原理为基础的传统型波动率预测模型,目前较为流行且具有代表性的模型包括ARCH模型和SV模型;另一类是以神经网络、灰色理论、支持向量机等为基础的创新型预测模型。这两类模型在对股票价格波动性进行预测时各有特点,但同时也存在至今难以解决的一些问题。比如:如何提高股票价格波动率的预测精准度,如何将影响股票价格波动的非量化因素加入到数量化模型之中等等。对这些问题的进一步研究以及提出相应的解决方法,成为股票价格波动预测方法研究的前沿问题。

一、国内外研究动态

1.基于统计原理的预测模型的研究情况

(1)GARCH模型

1982年Engle开创性地提出了自回归条件异方差模型(简称ARCH模型)[1],较好地模拟了股票波动中存在的丛聚性和时变性。

国外研究者利用GARCH模型进行了大量的研究,表明GARCH模型及其扩展形式对描述金融时间序列的波动性具有非常好的效果。French、Schwert 和 Stambaugh(1987)用GARCH模型估计美国股市预期收益和波动的关系,发现预期收益与股票的可预测波动成正相关。同年Engle等运用GARCH-M模型进行研究发现,条件方差可以较好地解释标准普尔500指数预期收益的变动情况。1991年Bollerslev和Engle的研究也发现风险溢价和波动性之间存在正相关关系。股价波动的杠杆效应在Nelson(1991),Glosten、Jagannathan and Runkle(1993),Engle and Ng(1993)以及 Fornari and Mele(1997)的论文中得到多次证实。此外,很多实证应用等都证实GARCH能够提供较理想的数据模拟与预测效果。

国内也有不少学者对GARCH模型进行研究和应用。魏巍贤、周小明(1999)运用GARCH模型对中国股市波动性进行了预测。丁华(1999),周哲芳和李子奈(2000),唐齐鸣和陈健(2001)等对我国股市的ARCH效应进行了分析,并进行了股指波动的拟合。岳朝龙(2001)、陈千里(2002)、周少甫(2002) 利用GARCH模型对我国股市收益的波动集簇性和不对称性进行了实证研究。张世英和柯珂对ARCH模型体系做了系统的评述 [2]。李胜利(2002) 、楼迎军(2003) 探讨了我国股票市场的杠杆效应。张永东、毕秋香做了上海股市波动性预测模型的实证比较[3]。

(2)SV模型

1986年,Taylor提出了随机波动模型(Stochastic Volatility Model,简记为SV模型)。随机波动性模型的提出是与金融资产中定价的扩散过程直接相关的,认为不仅标的资产的价格可以用维纳过程来描述,而且波动率也可以用维纳过程来描述,SV模型是一类极具应用前景的金融波动模型。

国外学者对SV模型研究也比较多。例如,Ghysels,Harvey和Renault(1995)对资产市场随机波动模型的起源、估计方法、模型扩展及波动持续性的相关研究文献进行了详细的综述。So、Lam、Li和Smith把马尔可夫结构转换机制引入到SV模型中,得到具有马尔可夫结构转换机制的随机波动模型(MRS-SV模型)。Kalimipalli、Susmel提出了与So、Lam、Li不同的马尔可夫结构转换随机波动模型来刻画短期利率的水平和波动。Jun、Yu利用基本SV模型对新西兰股市进行了预测分析,发现基本SV模型具有很好的预测能力[4]。G..B.Durham(2007)利用SV-mix 模型对标准普尔500指数做了预测,认为预测效果较好。

国内学者白幌和张世英(2001)利用扩展的SV模型对深圳股票市场的波动性进行了实证研究,指出扩展的SV模型比标准的SV模型在描述金融波动性方面更有优越性。杨克磊、毛明来等用SV模型对上证和深证波动性进行分析,结果表明上海股市风险大于深圳[5]。王春峰(2005)对均值条件分布为正态分布的SV模型与条件厚尾分布的SV模型进行比较,实证结果表明厚尾分布的SV模型能够更好地描述我国股市波动特征。钱浩韵(2006)采用SV和A-SV模型对上证综合指数、深圳成份指数和香港恒生指数的日收益率进行拟合,结果表明A-SV要优于SV。吴启权等(2006)运用SV模型研究我国股票市场政策效应现象。毛明来等(2006)对SV类模型体系进行了全面探讨。周彦、张世英(2007)利用基于Markov 链的Monte Carb模拟积分方法对连续时间的SV模型进行估计,选取上海股市的日综合指数进行实证研究,结果证明了模型与方法的有效性。

比较国内外学者的研究结果可以发现国外学者采用美国或其它西方国家股市的相关数据带入GARCH模型或SV模型进行数据拟合或预测,其效果普遍要好于国内学者采用国内股市相关数据进行的同类研究。

2.基于非统计原理的预测模型的研究情况

(1)灰色模型

由我国学者邓聚龙教授提出的灰色预测模型,已经被广泛应用于多种领域的短期预测,如粮食产量预测、电力负荷预测等。灰色〨M(1,1)模型是最常用的一种灰色模型,它是由只包含单变量的一阶微分方程构成的模型,是GM(1,n)模型的特例。

国外运用灰色模型进行短期股票波动率方面的相关预测文献较少。而在国内,很多研究者已将灰色模型应用到股票预测领域中。

陈海明、段进东(2002)将GM(1,1)模型和马尔可夫模型结合起来,建立灰色-马尔可夫预测模型,对上证综合指数进行预测,得出灰色-马尔可夫模型精度高于GM(1,1)的结论。施久玉等(2004)运用GM(1,1)模型建立了上海证券指数65日平均值运行轨道的最高点预测模型,其预测值与市场值非常吻合。覃思乾(2006)应用灰色GM(1,1)模型对股票价格进行短期预测,并与ARIMA模型进行拟合比较,得出灰色模型精度高于ARIMA的结论。

(2)神经网络

人工神经网络的理论是一门新兴的边缘和交叉学科。它有表示任意非线性关系和学习等能力,给解决很多具有复杂的不确定性和时变性的实际问题提供了新思想和新方法。在预测领域,1987年Lapeds和Farber首先应用神经网络进行预测,开创了人工神经网络预测的先河。

Matsuba(1991)率先将神经网络引入股票市场的价格预测上。此后,许多研究者运用神经网络模型对股市进行了预测。Hill等将神经网络与六种传统的统计预测方法进行对比,他们用111个时间序列进行预测,其结果表明采用短期(月度、季度)数据预测时,神经网络明显优于传统统计模型;采用长期(年度)数据预测时,结果相差不多[6]。

我国运用神经网络进行股市预测的学者也相对较多。李敏强、孟祥泽(1997)在模糊神经网络基础上采用遗传学算法对股市投资策略进行了研究。吴微等利用多层前馈BP网络较好的分类能力,结合国内股票市场的特征,对股票涨跌进行了预测[7]。吴成东、王长涛(2002)运用人工神经元BP网络对股市进行了预测。刘永福、伍海华(2003)等建立BP神经网络预测模型,对上证指数进行了预测,发现模型收敛速度快,学习能力强,预测精度高,误差率较小,对股指的短期预测十分有效。尚俊松(2004)、龙建成(2005)、胡静(2007)等都运用神经网络模型进行了股市预测研究。我国学者的实证研究表明,人工神经网络应用于我国股票市场的预测是可行和有效的,有良好的前景。

(3)支持向量机(SVM)

Vapnik等(1995,1998)根据统计学习原理提出支持向量机(简称SVM)学习方法。这种方法通过寻求结构风险化最小、实现经验风险和置信范围的最小,从而达到在统计样本较少的情况下,亦能获得良好统计规律的目的。SVM算法是一个凸优化问题,因此局部最优解一定是全局最优解。SVM算法将原空间中线性不可分的数据变换到线性可分的高维特征空间,再用核函数映射到原空间来求解,巧妙地解决了维数灾问题,算法的复杂度与输入样本的维数无关。但核函数的选取在SVM算法中是一个较为困难的问题。

H.Nakayama(2003)等介绍了SVM中的递增学习和遗弃数据方法,并将其应用于股票价格预测。W.Huang(2005)等用支持向量机预测股票市场运动方向。P.Pai(2005)等将ARIMA模型和SVM模型结合起来,提出一种组合模型来进行股票价格预测,得出该组合模型优于单个ARIMA或SVM的结论。

从国内相关研究看,杨一文等(2005)利用SVM对上海证券综合指数序列趋势做较准确的多步预测。李立辉(2005)等将SMV应用到我国上证180指数预测中。周万隆、姚艳(2006)将SVM模型用于股票价格短期预测,取得良好效果。张晨希、周万隆等(2006)利用支持向量机对股票进行短期预测。赵金晶(2007)实验结果表明,该方法比神经网络方法以及时间序列方法的预测精度更高。

总体上看,我国学者运用创新型预测模型进行股市方面预测的文献多于传统的统计模型,而且从预测效果上看,创新型预测模型的预测精确度要高于传统型统计类预测模型。在创新型的三个模型中,神经网络模型被运用得最多,支持向量机被认为预测效果最为精准,而运用灰色模型进行短期预测其方法则最简便。

二、基于统计原理的预测模型与创新型预测模型的比较分析

1.建模的理论基础不同

传统的基于统计原理的股票价格波动预测模型是建立在统计分析理论基础之上的。而处理基于概率统计的随机过程要求样本量越大越好,原始数据越完整、越明确越好。但事实上,在实际中,即使有了大样本量,也不一定找到规律,即使有了统计规律也不一定是典型的。创新型预测模型则是完全脱离统计理论的基础,以一种创新型的建模思维来建立预测模型。例如灰色模型是建立在灰色理论基础之上的,依据广义能量变化规律,对历史资料进行累加处理,使其呈现出指数变化规律,然后建模。而人工神经网络模型是建立在神经网络理论基础之上的,它通过模仿人脑神经系统的结构及信息处理和检索等功能,建立神经网络模型进行预测。支持向量机则依据的是统计学习的机器学习理论,通过凸优化,使得局部解一定是最优解,克服了神经网络收敛速度慢和局部极小点等缺陷。

2.对数据的要求与处理不同

基于统计原理的预测模型要求样本量大并有很好的分布规律,无论是GARCH模型还是SV模型,只有在样本量足够大、且分布较好的情况下,其预测效果才会比较理想。例如,运用GARCH模型对美国股指进行预测要比对国内股指进行预测效果理想,原因是我国股市发展的时间相对较短,期间由于宏观调控和股改等原因,造成股指大起大落,导致数据分布规律性不强,因此我国运用这类模型存在一定局限。而创新型预测模型对样本量的要求和分布程度的要求均较低。例如灰色模型,只要拥有七八个数据就可对下数据进行预测。在处理技术上,灰色模型要对原始数据进行累加处理,使表面杂乱无章的数据呈现出明显的指数规律,建模计算之后,再进行累减还原。神经网络模型则采用数据驱动,黑箱建模,无需先验信息,能够在信息资源不完整、不准确等复杂的数据环境下,通过自身结构的调整,提取数据特征,并对未来进行有效预测。

3.模型结构的稳定性与适应性不同

基于统计原理的预测模型一经建立,其模型结构具有较强的稳定性,模型变量之间存在一个稳定的内在关系。无论是GARCH模型还是SV模型,模型结构都相对稳定、简单,而且都是单因素模型。但在实际中,预测环境复杂多变,一旦系统变量之间出现新的关系,该类模型则无法调整和适应。创新型预测模型则是一种或者多因素、或者可以变结构的模型,其计算相对复杂,但其适应能力要好于基于统计原理的预测模型。如灰色模型,除了有基本的GM(1,1)模型,对于高阶系统,灰色理论通过〨M(1,n)模型群解决,并且可以综合考虑多种因素的影响。而神经网络和支持向量机都是变结构模型,通过网络对新样本的学习,调整其内部结构,从而适应系统变量的变化。对于非线性高维、高阶问题神经网络和支持向量机会发挥得更好。

4.预测精准度与外推性强弱不同

比较而言,基于统计原理的预测模型误差较大,外推性差。因为基于统计原理的预测模型对数据样本没有再处理或学习的过程,对样本的拟合性较低,由此导致其外推性也较差。而创新型预测模型相对而言精确度较高,外推性强。因为创新型预测模型对数据具有再处理或学习的过程。灰色模型是对数据进行了累加处理;而神经网络模型和支持向量机是对数据进行了学习,然后进行推理、优化。因此,创新型预测模型的拟合度和外推能力都要高于统计类模型。

5.预测难度与预测时间长度不同

基于统计原理的预测模型技术比较成熟,预测过程相对简单。无论是GARCH模型还是SV模型,其建立模型依据的理论基础坚实,模型构造相对简单,计算难度相对较低。由于这类模型采用的数据是较长时间的历史数据,因此可以对未来进行较长时间的预测。而创新型预测模型预测技术还有改进的余地,且预测难度较大。如利用神经网络进行股票价格波动预测,其过程相对较难,因为神经网络需要设定隐层和权重。用支持向量机方法进行预测,涉及到核函数的确定。核函数的确定难度较大。由于创新型预测模型对数据要求不高,一般是小样本量预测,因此,适用于对预测对象进行短期预测。

三、我国运用股票价格预测模型存在的问题

1.我国运用股票价格预测模型进行股票预测方面的研究成果十分有限,研究难度很大,预测的精准度有待提高

从中国期刊全文数据库检索的结果看,1998—2007年10年间我国公开发表的期刊类文献中,运用GARCH模型进行股票预测的文章有4篇,运用SV模型进行预测的文章有7篇,两类文章合计有11篇。而运用灰色模型进行预测的文章有5篇,运用神经网络进行预测的文章有67篇,运用支持向量机进行预测的文章有9篇,三类文章合计有81篇。

将统计类与创新类预测模型方面的文章全部加总,10年间相关文章也不超过100篇。这个数字至少说明两个问题:一是我国在这个领域的研究还没有广泛深入开展起来,相关研究人才和研究成果都十分有限,现有的研究只是处在一个起步的阶段。二是对股票价格波动进行预测难度非常大,预测的精准度很难达到研究者的预期水平,因此不排除有相当部分的研究成果因预测失败而没有公开发表。

2.运用创新型预测模型对我国股市进行预测的效果要好于基于统计原理的预测模型

从我国目前公开发表的预测类文章的预测结果看,创新型模型预测效果要好于传统的统计类预测模型。造成这种情况的原因主要是由于基于统计原理的预测模型对原始数据的要求比较严格,只有在原始数据分布比较好、资料完整、样本量大的前提下,其拟合与预测的效果才会比较理想。而我国股市从1990年上证交易所成立并开始交易算起,至今仅有18年的历史。在这18年中,由于政策、监管、股改等原因影响我国股市经历了几次大起大落,加之上市公司数量有限并不断变化,造成原始数据在分布、样本量、数据完整性等方面均不理想,因此,在我国,用基于统计原理的预测模型对股票收益率波动情况进行预测效果大都不太理想。而创新型预测模型大都是小样本、短期预测,对数据要求不像统计类模型那样严格,因此,在我国目前阶段,这类模型的预测效果要好于统计类预测模型。

3.我国股票价格预测模型采用的大都是单一预测模型

从现有研究文献上看,对我国股票价格波动进行预测的预测模型无论是基于统计原理的预测模型还是基于非统计原理的创新型预测模型都采用单一预测模型。运用单一预测模型进行预测的优点是:模型结构相对简单,影响因素少,预测难度相对较低。但其缺点也是显而易见的:单一预测模型不可能将所有影响因素全部包含在一个模型中,任何一种单一预测模型都只利用了部分有用信息,同时也抛弃了其它有用的信息。而股市的影响因素是很多的。只用单一模型对股市波动进行预测,其所包含和反映的信息量显然是不充分的,因此也就不可能较好地对股市的未来走势进行有效预测。

4.缺乏对非量化因素进行有效处理的技术与方法

影响股票价格波动的因素很复杂。除了受基本面和技术指标等数量性因素影响之外,还要受政策、心理波动、国际突发事件等非量化因素的影响。目前,我们的股票价格波动预测模型大都是纯数量化模型,即只将数量化信息带入模型进行计算,据此得出预测结果。而那些对股票收益波动率影响很大的非量化信息由于受到模型本身处理方法和处理技术的限制,无法被加入到数量模型之中,从而无法达到与实际情况十分吻合的精准预测。

四、我国股票价格预测模型发展方向

1.创新型的智能化预测模型将成为我国股票价格预测的一个发展方向

首先,创新型预测模型能够克服我国股市数据不完整、波动大、分布不合理等缺点,采用小样本数据对股市进行短期预测,预测的精准度相对高于传统的统计类预测模型。其次,创新类模型中的智能化模型,能够模仿或部分模仿人工智能,对影响股市的多种因素进行复杂的非线性变结构处理,既能克服单因素模型包含信息不充分的缺点,也能克服固定结构模型无法处理突发性事件的缺点,尽量充分地反映影响股市的多种信息和复杂变化,从而增加预测的准确度。

2.组合预测模型将成为我国股票价格预测模型发展的另一个方向

每一种预测模型都有其优点,但同时也存在预测信息获取方面的局限性。如何发挥不同的预测模型的优点,克服其缺点,提高预测的准确度,也是目前预测理论与技术亟待解决的问题。组合预测是将不同预测模型的预测结果依据一定的原则赋予不同的权重,然后进行加权平均,得出最终的预测结果。这种预测方法可以克服单一预测模型信息量不充分的缺点,充分发挥不同预测模型的优势,最大限度获取不同角度的信息量,提高股票收益率预测水平。

3.包含各种非量化信息的预测模型将成为我国股票价格预测模型的一个重要发展方向

目前股票价格预测模型都属于数量化预测模型,非量化的因素无法融入到模型之中,这就导致预测中丢失了大量的非量化信息,预测的精准度受到很大影响。如何能将各种影响股市的非定量化信息进行技术处理后转变成量化信息,使之能够被加入到股票价格预测的模型当中,从而充分反映政策因素、心理因素、突发事件等非量化因素对股票收益率的影响,提高预测的精准度,是股票价格预测模型的一个重要发展方向。

4.新的预测理论和技术的不断吸收和应用,是我国股票价格预测模型发展的必然趋势

纵观股票价格预测模型的发展过程,不难看出,这个过程其实就是新的预测理论和新的预测技术不断被引入、吸收、消化、应用、完善的一个过程。GARCH模型和SV模型依据的分形理论、灰色模型依据的灰色理论及技术、神经网络模型依据的神经网络理论及技术等,无一不经历了这样一个被引入、消化与利用的过程。新的预测理论与技术不断给股票价格预测提供新视角和更完善与全面的技术,使得股票收益波动率预测模型的预测效果更加趋于完美和精准。目前,混沌理论和小波信号技术也开始在股票价格预测中被初步运用,相信随着这方面研究的深入,会给股票价格预测方面的发展带来新的思路。

参考文献:

[1] Engle R F.Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of U.K.Inflation[J].狤conometrica,1982,(50):987-1008.

[2] 张世英,柯珂.ARCH模型体系[J].系统工程学报,2002,(6):236-245.

[3] 张永东,毕秋香.上海股市波动性预测模型的实证比较[J].管理工程学,2003,(2):16-19.

[4] Jun,Yu.Forecasting Volatility in the New Zealand Stock Market[J].Journal of Financial Economics,2002,(12):193-202.

[5] 杨克磊,毛明来,徐正国.随机波动模型的沪深股市比较研究[J].天津大学学报(社会科学版),2004,(10):334-338.

[7] Matsuba,I.Application of Neural Network Sequential Associator to Long-term Stock Price Prediction,IJCNN91,Singarporee,1991:1196-1202.

[6] Hill T,OConnor M , Remus W.Neural Network Models for Time Series Forecasts [J].狹anagement Science,1996,42(7):1082-1092.

[7] 吴微,陈维强,刘波.用BP神经网络预测股票市场涨跌[J].大连理工大学学报,2001,(1):9-12.

[8] 何问陶,赵建群.AR(g)模型的应用研究[J].云南财经大学学报,2008,(3).

[8] W.猈uang,Y.Nakamori,S.Wang.Forecasting Stock Market Movement Direction with Support Vector Machine[J].狢omputers and Operations Research, 2005,32(10):2513-2522.

[9] Pai,C.Lin.A Hybrid ARIMA and Support Vector Machines Model in Stock Price Forecasting[J].狾mega.2005,33(6):497-505.

[10] 杨一文,杨朝军.基于支持向量机的金融时间序列预测[J].系统工程理论方法应用,2005,14(2): 176-181.

[11] Ghada Abdelmouez et al.Neural Network Vs.Linear Models for Stock Market Sectors Forecasting. Proceedings of international joint conference on neural networks(2007).1-5

猜你喜欢
GARCH模型支持向量机神经网络
神经网络抑制无线通信干扰探究
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
人民币汇率波动对我国国际贸易的传导效应分析
人民币汇率波动对我国国际贸易的传导效应分析
铜期货市场风险变异性实证研究
基于熵技术的公共事业费最优组合预测
基于HP滤波和Garch模型的股票价格波动研究
“沪港通”对中国内地、香港股市波动影响的研究
基于支持向量机的金融数据分析研究