徐颢华 顾海峰
摘 要:本文构建的短期股指期货预测模型,是采用导数分析首先判断其走势方向,再通过一阶差分BP神经网络模型预测波动幅度,进而得到预测日期指价格。以沪深300股指期货为例进行的实证表明,该方法的符号正确率达到75%以上,平均绝对误差也只有20多个点。该方法可用于研究我国股指期货市场的短期定价机制和指导股指期货短期套利。
关 键 词:差分BP神经网络;股指期货;短期价格;预测模型;沪深300指数
中图分类号:F830.9 文献标识码:A 文章编号:1006-3544(2014)03-0027-06
一、引言
中国证监会于2010年宣布HS300指数期货正式上市交易,为中国的金融市场增加了新的投资工具,如何对其价格进行预测也成为众多投资者关注的焦点。股票、期货、外汇的预测一直是热门的话题,其预测的方法有各式各样。在上个世纪六七十年代,关于基本面分析与技术分析的争论达到一个高峰。对于技术分析的反驳,主要原因在于技术分析认为价格可以预测,而这与有效市场假说是背道而驰的 [1] 。Fama(1970) [2] 指出,在一个“有效”市场中,价格能够“充分反映”可获得的信息。但是后来的金融学者,如Brown和Jennings(1989) [3] 提出一个两阶段噪音理性预期模型,以及一些行为经济学家提出的正反馈模型,证明了技术分析的有效性。在对价格变动预测研究中, 一般的预测方法可以大概分为两类:一类是利用统计学、计量经济学模型;另一类是利用神经网络、模糊集合等人工智能方法。由于股票指数期货市场是一个不稳定的、开放的、非线性动态变化的复杂系统。 市场上股指期货合约价格的变动受到金融、经济、政治、社会以及投资者心理等众多因素的影响,其变化过程具有非线性、混沌性、长期记忆等特点 [4] 。 神经网络模型强大的非线性映射能力被一些学者用来研究市场的预测分析。
基于人工神经网络的股票价格预测模型中的第一个模型是由White(1988) [5] 开发的,是使用前馈网络的股票价格变化检测未知的规律性。Kolarik and Rudorfer(1994) [6] 提出了使用单变量时间序列的神经网络预测系统。Skabar和 Cloete(2002) [7] 开发使用了受过训练的神经网络方法,一种基于权重优化的遗传算法被用来确定在股票交易所交易的金融产品的买卖点。Kim、Han and Chandler(1998) [8] 用了周期性的 Elman神经网络来预测日本股票交易所的股票价格。Zhang et al(1998) [9] 证明,神经网络作为一种时间序列预测方法的使用得到了有趣和令人满意的结果,是一个有前途的替代传统模型的方法。
探讨股指期货短期价格预测问题,对规范我国股指期货定价机制, 具有重要的理论与现实意义。 本文在分析差分BP神经网络的理论与方法的基础上, 构建了基于差分BP神经网络的股指期货短期价格预测模型,并选取沪深300股指期货作为样本数据进行了实证分析。
二、差分BP神经网络理论与方法分析
(一)BP神经网络模型 [10]
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出, 是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP神经网络一般由输入层、隐层和输出层构成。如图1,隐层和输出层的节点均可对输入的信息进行计算处理。X=(x1,x2,…,xn)T为输入向量,Y=(y1,y2,…,ym)T为隐层的输出向量。V=(v1,v2,…,vm)T为输入层到隐层的权值矩阵,输出层W=(w1,w2,…,wl)T,为了对隐层神经元引入阀值,令x0=-1,y0=-1。
(二)差分BP神经网络模型
三、股指期货短期价格预测模型的构建
传统的BP神经网络模型在股市/股指期货市场的应用常常使用预测日前几日的收盘价, 或者预测日之前的技术指标作为神经元输入, 预测日的收盘价直接作为神经元输出,来训练网络。虽然这种网络模型有着十分强大的非线性映射能力, 但仍然存在许多不足。通过较少的输入变量进行预测,往往会使得预测的效果不好。 而用较多的变量作为输入变量去训练,会导致训练的精度下降。虽然增加隐层节点数能够使模型覆盖任意凸域形状, 根据Kolmogorov理论,双隐层能解决任意复杂的问题,但是这些拟合效果又会出现另一个问题,即过度拟合,泛化能力差。另一方面,隐层的学习规则还不可知,它没有期望输出值,因此前述的权值调整量方法,即期望输出减实际输出的函数,在此并不适用。
短期策略的关键是预测的方向与预测的大小,利用传统的BP神经网络直接预测期指价格, 会造成高精度预测与过度拟合的矛盾,进而使得预测方向以及预测大小与实际情况不一致。因此,本文利用导数办法,研究出市场主流的拓扑结构,再利用这种拓扑结构预测出未来期指发展的方向,最后利用BP神经网络预测未来期指价格的变化量。本文将以沪深300股指期货的历史数据进行实证分析。
(一)市场拓扑结构分析
1. 数据预处理
由于日线是由每日收盘价所构成的折线图,因此它并不是光滑的。为了构建精度较高的指标,首先对日线进行插值处理,使得日线图尽量逼近光滑。
本文采用三阶样条插值,其方法如下:
对于平面上从左至右三个点,A(x1,y1),B(x2,y2),C(x3,y3),要对其构造光滑的曲线进行插值,首先分别定义AB与BC的样条函数:
其中,xA,xB,xC分别表示A、B、C三点的横坐标,及A、B、C三个交易日,di表示i点的一阶导数,ddi表示i点的二阶导数。这也可以视为此拓扑结构存在的充要条件。
由于期指市场是一个复杂的动态变化系统,其K线走势并不一定完全符合上图的拓扑结构,也许会存在如下四种图形,本文称之为奇异结构。图5的情形可描述为:期指经历了一波涨势以后趋于平缓,之后又拉起一波涨势。图6的情形可描述为:期指在一波急剧的涨势中,突然转向暴跌。图7的情形可描述为:期指经历了一波跌势以后趋于平缓,之后又展开一波跌势。图8的情形可描述为:期指在一波急剧的跌势中,突然转向暴涨。endprint
对于这些拓扑结构,本文接下来将会进行实证分析,以判断市场上主要是以哪种拓扑结构存在。
不妨假设市场均以图4的拓扑结构存在,根据此拓扑结构存在的充要条件,本文通过优化一阶导数指标(di)来对每个交易日类别进行分类。
对di指标的构建加入模糊规则:
当di×ddi<0,di=-di。 (21)
因此如果根据di的正负性分类,可以很方便地将拐点分入期望的类别。即
根据di的分类方式,每个交易日均被分为理论多头交易日或者理论空头交易日, 但其实际类别也许会有出入,为了评价图4拓扑结构假设的好坏,本文构建如下CSR指标以衡量理论分类与实际分类是否吻合,CSR为Zi的加权平均。如:交易日i被分为A类,则如果交易日i符合A类的描述,Zi为1,否则Zi为0。用数学公式表示如下:
其中,若i∈A,Pi+1-Pi<0,或者i∈B,Pi+1-Pi>0,则Zi=1。其他情况Zi=0。
因此如果CSR越大,说明分类效果越好,证明市场的主流拓扑结构为图4所示。
综合上述分析,算法步骤如下:
第一步,按(17)、(18)式计算每个交易日的一阶导数指标di与二阶导数指标ddi。
第二步,按(21)式所述模糊规则优化di。
第三步。如果di>0,将第i个交易日分为A类;如果di<0,将第i个交易日分为B类(A类可记为多头交易日类,B类可记为空头交易日类)。
第四步,计算每个交易日的Zi,将Zi加权平均求得CSR。
将此算法在MATLAB 7.0中予以实现,通过对2010年4月16日至2014年4月18日的沪深300股指期货收盘价进行实证分析, 得到CSR指标为74.87%。说明分类效果优秀,市场的主流拓扑结构为图4所示。
(二)期指短期波动方向预测分析
根据上述结论,可以利用市场主流拓扑结构存在的充要条件来预测期指波动方向。 上面根据图4拓扑结构的充要条件优化了一阶导数指标di, 因此可利用di的正负性来预测期指将会向上波动还是向下波动。预测方法如下:
当di>0,Pi+1>Pi,期指波动方向向上;当di<0,Pi+1 (三)差分BP神经网络模型的构建 1. 数据预处理 这里采用神经网络来预测每日期指波动幅度,因此在建模之前,首先需要对期指历史数据采用差分取绝对值处理。处理公式如下: dPi=|Pi-Pi-1| (i≥2) (25) 其中,dPi为第i个交易日的一阶差分绝对值。 2. BP神经网络参数设置 根据上述构建的BP神经网络模型,本文选用3层网络模型。本文采用预测日前4天的每日波幅数据来预测预测日的波幅,即网络有4个输入节点,分别输入前4天的dPi。隐层节点数选择4,隐层节点的变换函数选择正切S型函数,输出节点的变换函数选择线性传递函数。 网络的最大迭代次数设为15000,学习目标值设为0.001,学习速率设为0.1。 四、股指期货短期价格预测模型的实证分析 (一)收盘价预测步骤 根据上述提供的期指波动方向与波动幅度的预测模型,我们可以预测期指的价格大小。将数据分为训练组和测试组,其中训练组占数据的2/3,测试组占数据的1/3。预测步骤如下: 第一步,利用训练组数据(前644个交易日收盘价)来训练神经网络。 第二步,计算出预测日的优化一阶导数指标di。 第三步,预测交易日的波动方向。 第四步,根据训练出来的神经网络预测交易日期指波幅。使用预测日前一日的期指,根据预测的波动方向加/减预测波幅。并返回第二步预测接下来的期指价格,循环进行,直到测试组最后一个交易日为止。 (二)评价指标的构建 图9中,实线代表原始测试组数据,虚线代表预测数据。可见虚线和实线基本吻合。另一方面,平均绝对误差MAE只有23.9044。 图10为每个预测日的误差绝对值,其中最大误差绝对值为136.576,最小误差绝对值为0.218。CSR为75.38%,说明有超过75%的交易日预测方向是准确的。 为了突出这个预测的优势,本文利用传统的BP神经网络预测与本预测做对比分析, 利用前述的神经网络参数设置, 以预测日前4天的收盘价作为神经元输入,通过MATLAB 7.0,得出以下结果: MAE=51.8992 (30) CSR=51.69% (31) 在图11中,实线代表原始测试组数据,虚线代表预测数据。与图9对比,预测值与原始值的吻合度明显偏低。从平均绝对误差MAE看,与本文提出的预测方法得出的MAE高近28(51.8992-23.9044)。 图12为传统的BP神经网络预测的每日误差绝对值,其中最大误差绝对值为329.6426,大大超过本文预测方法的最大误差绝对值。另外传统的BP神经网络预测的符号正确率仅为51.69%,效果很差,对于短期操作是致命的,而本文预测方法符号正确率高达75%以上,可以用于短期套利。 综上所述,本文提出的期指短期波动预测方法是可行的,也是比较优秀的。 五、结论与展望 参考文献: [1]Brown,David P and Robert H Jennings. “On technical analysis.”Review of Financial Studies 2. 4 (1989):527-551.
[2]Malkiel,Burton G,and Eugene F. Fama. “Efficient capital markets: A review of theory and empirical work*.” The journal of Finance 25. 2(1970): 383-417.
[3]LONG,J BRADFORD,et al. “Positive feedback investment strategies and destabilizing rational speculation.” the Journal of Finance 45. 2(1990):379-395.
[4]李聪. 基于 BP 神经网络的股票指数期货价格预测[D]. 青岛:青岛大学,2012.
[5]White,H. Economic prediction using neural networks: The case of IBM daily stock returns. In Neural Networks,1988. ,IEEE International Conference on (pp. 451-458). IEEE.
[6]Kolarik,T & Rudorfer,G. (1994,August). Time series forecasting using neural networks. In ACM Sigapl Apl Quote Quad(Vol. 25,No. 1,pp. 86-94). ACM.
[7]Skabar,A. ,& Cloete,I. (2002,January). Neural networks,financial trading and the efficient markets hypothesis. In Australian Computer Science Communications(Vol. 24,No. 1,pp. 241-249). Australian Computer Society,Inc.
[8]Kim,Kyoung-jae,Ingoo Han and John S. Chandler. “Extracting trading rules from the multiple classifiers and technical indicators in stock market.” Proceedings of KMIS98 International Conference. 1998.
[9]PALIT,Ajoy K. and Dobrivoje POPOVIC. “Computational Intelligence in Time Series Forecasting.” (2006).
[10]韩力群. 人工神经网络教程[M]. 北京:北京邮电大学出版社,2006:29-67.
(责任编辑:李丹;校对:郄彦平)endprint
[2]Malkiel,Burton G,and Eugene F. Fama. “Efficient capital markets: A review of theory and empirical work*.” The journal of Finance 25. 2(1970): 383-417.
[3]LONG,J BRADFORD,et al. “Positive feedback investment strategies and destabilizing rational speculation.” the Journal of Finance 45. 2(1990):379-395.
[4]李聪. 基于 BP 神经网络的股票指数期货价格预测[D]. 青岛:青岛大学,2012.
[5]White,H. Economic prediction using neural networks: The case of IBM daily stock returns. In Neural Networks,1988. ,IEEE International Conference on (pp. 451-458). IEEE.
[6]Kolarik,T & Rudorfer,G. (1994,August). Time series forecasting using neural networks. In ACM Sigapl Apl Quote Quad(Vol. 25,No. 1,pp. 86-94). ACM.
[7]Skabar,A. ,& Cloete,I. (2002,January). Neural networks,financial trading and the efficient markets hypothesis. In Australian Computer Science Communications(Vol. 24,No. 1,pp. 241-249). Australian Computer Society,Inc.
[8]Kim,Kyoung-jae,Ingoo Han and John S. Chandler. “Extracting trading rules from the multiple classifiers and technical indicators in stock market.” Proceedings of KMIS98 International Conference. 1998.
[9]PALIT,Ajoy K. and Dobrivoje POPOVIC. “Computational Intelligence in Time Series Forecasting.” (2006).
[10]韩力群. 人工神经网络教程[M]. 北京:北京邮电大学出版社,2006:29-67.
(责任编辑:李丹;校对:郄彦平)endprint
[2]Malkiel,Burton G,and Eugene F. Fama. “Efficient capital markets: A review of theory and empirical work*.” The journal of Finance 25. 2(1970): 383-417.
[3]LONG,J BRADFORD,et al. “Positive feedback investment strategies and destabilizing rational speculation.” the Journal of Finance 45. 2(1990):379-395.
[4]李聪. 基于 BP 神经网络的股票指数期货价格预测[D]. 青岛:青岛大学,2012.
[5]White,H. Economic prediction using neural networks: The case of IBM daily stock returns. In Neural Networks,1988. ,IEEE International Conference on (pp. 451-458). IEEE.
[6]Kolarik,T & Rudorfer,G. (1994,August). Time series forecasting using neural networks. In ACM Sigapl Apl Quote Quad(Vol. 25,No. 1,pp. 86-94). ACM.
[7]Skabar,A. ,& Cloete,I. (2002,January). Neural networks,financial trading and the efficient markets hypothesis. In Australian Computer Science Communications(Vol. 24,No. 1,pp. 241-249). Australian Computer Society,Inc.
[8]Kim,Kyoung-jae,Ingoo Han and John S. Chandler. “Extracting trading rules from the multiple classifiers and technical indicators in stock market.” Proceedings of KMIS98 International Conference. 1998.
[9]PALIT,Ajoy K. and Dobrivoje POPOVIC. “Computational Intelligence in Time Series Forecasting.” (2006).
[10]韩力群. 人工神经网络教程[M]. 北京:北京邮电大学出版社,2006:29-67.
(责任编辑:李丹;校对:郄彦平)endprint