基于奇异谱分析的GRNN模型在金融时间序列中的应用

2011-03-06 09:36刘遵雄周天清
华东交通大学学报 2011年2期
关键词:成份谱分析广义

刘遵雄,周天清

(华东交通大学信息工程学院,江西南昌 330013)

在过去几十年里,各种线性与非线性的时间序列建模预测方法被提出,包括自回归移动平均(ARMA)、求和自回归移动平均(ARIMA)、自回归条件异方差(ARCH)、人工神经网络(ANN)[1]、遗传算法(GA)[2]、支持向量机(SVM)[3]、门限自回归(TAR)、自适应回归(AAR)和泛函数自回归(FAR)等,其中许多方法已成功地应用到金融时间序列分析中,并且获得了较为理想的结果。然而,其中有些方法须以在一定假设条件(如线性、平稳性、标准性假设等)为前提,而另一些方法则无法直接适用于高维、高噪声数据的建模。奇异谱分析(singular spectrum analysis,SSA)技术的提出是时间序列分析研究的重大变革,它结合典型时间序列分析、多元统计、多元几何、动态系统、信号处理及奇异值分解(SVD)等技术[4],破除了许多传统方法的假设前提,是一类元参数、独立于模型的时间序列分析技术[5]。

奇异谱分析通过将原始序列延时地排列成一矩阵形式,然后应用奇异值分解将原始序列分解成少数可解释、独立的成份之和,如缓慢变化趋势、摆动成份和随机噪声[6]。奇异谱分析技术主要用于解决趋势或准周期成分的检测与提取、降噪、预测、异常点检测等问题,广泛应用于气候、环境、地理、社会科学及金融等多方领域。

常见的奇异谱分析预测技术通常以传统神经网络或线性递归公式(linear recurrent formula,LRF)[7]为模型进行预测,但是基于奇异谱分析的传统神经网络模型训练速度缓慢,而基于奇异谱分析的线性递归预测效果有待改进。基于此,本文将广义回归神经网络(general regression neural network,GRNN)与奇异谱分析技术相结合形成基于奇异谱分析的广义回归神经网络预测模型,以同方股份收盘价格为测试对象验证其预测效果。

1 奇异谱分析

奇异谱分析算法包含分解与重构两个阶段。前者将原始序列延时地排列成一矩阵形式,进行奇异值分解;后者利用求得的主成份进行分组并对组成份所形成的矩阵对角平均化。

1.1 分解

1.2 重构

2 预测模型

2.1 线性递归公式

2.2 广义回归神经网络

广义回归神经网络[8-9]是径向前馈神经网络RBF的一个分支,它以数理统计为基础进行非线性(核)回归分析。GRNN与传统的神经网络一样,具有很强的非线性建模能力、较高的容错性及鲁棒性,其逼近能力和学习速度较传统的RBF网络有着较强的优势,且当样本数据较少时,预测效果不受影响。

对应网络p维输入向量X={},x2,…,xp,其输出为Y={y1,y2,…,yp},网络结构如图1。

如果GRNN神经网络的隐含层的传递函数以高斯函数为概率密度函数,那么网络的输出为

3 实验结果与分析

以同方股份1997年6月至1998年5月收盘价格共204个数据作为测试数据。根据奇异谱分析的步骤,首先将序列以80为窗口长度(一般小于等于序列长度的一半)组织成一延时矩阵,然后采用SVD对延时矩阵进行分解,得80个特征值(按非增序排列)。首5个特征值的贡献率分别为98.765 66%,0.411 16%,0.363 15%,0.252 86%,0.005 481%,其中98.765 66%的特征值对应的重构序列代表原始序列的趋势,见图2,后四项则指示着序列的波动情况,见图3。特征值中最后75项由于贡献率极小,可被视为序列噪声数据。最后由前5个成份重构成降噪后的序列,见图4,该序列将用于预测。

图2中,原始序列呈现出较为复杂的波动变化,而由贡献率98.765 66%的特征向量重构序列拟合曲线近似于一上升直线。可以发现,由首个成份形成的重构序列能够较好地捕捉原始序列的趋势。

图3中,由前2-5个成份形成的重构序列拟合曲线波动变化比较平缓,没有出现锐角变化情况,而且基本上反映了原始序列的波动变化。由于金融时间序列中普遍存在噪声,噪声点通常呈现出较大的波动变化(表现为较为尖锐的齿状),因此,可将由前2-5个成份形成的重构序列近似地看成原始序列的波动成份,其很好刻画了原始序列的波动变化。

图4中,由前5个成份形成的重构序列拟合曲线波动变化相对于原始序列较平缓,其较好地过滤了噪声数据,实现了对原始序列的逼近。该文用该5个成份形成的降噪重构序列作为广义神经网络预测模型的输入。

该文提出了一种基于奇异谱分析的广义神经网络预测方法,其基本工作原理:首先对原始序列进行奇异谱分析得到降噪后的重构序列,然后将广义神经网络应用于该重构序列。相比传统的奇异谱分析预测(如caterpillar SSA3.3[10])主要采用线性递归函数为预测模型。

对于广义神经网络的预测方法,最为关键的参数为前面所提的平滑因子σ,考虑到广义神经网络是一类训练速度快,非线性映射能力强,能以任意速度逼近任意连续函数的网络模型。该文通过考虑预测误差(绝对值形式)试探性地在[ ]0.01,0.5间选择平滑因子σ。

对原始序列和重构序列进行广义回归神经网络预测的平滑因子与预测误差的关系见图5。从图中可知,两曲线均呈现出先减后增的趋势,其中前者在平滑因子为0.12时取得最小误差均值0.005 004,后者在平滑因子为0.07时取得最小误差均值0.002 877。故对于原始序列应用GRNN时,平滑因子取0.12;对于重构序列则取0.07。

由于影响股票价格难以进行长期预测,往往只能进行短期的预测。该文使用GRNN,LRF+SSA和GRNN+SSA三种方法对同方股份的收盘价格进行未来一天的预测。GRNN直接将原始数据为其输入进行预测;LRF+SSA先利用SSA获得降噪成份,后以LRF为模型进行预测;GRNN+SSA同样先利用SSA获取降噪成份,再使用GRNN进行预测。各类方法的预测值及其预测误差见表1,从表中可以发现,采用LRF+SSA方法进行预测的误差值最大,GRNN次之,而GRNN+SSA预测误差最小,原因在于GRNN+SSA方法既能有效利用SSA技术降噪能力,又能摄取GRNN强大的非线性映射能力及任意逼近能力,从而使其达到了较两者更优的预测效果。

表1 各类预测值及误差Tab.1 Various predicted values and error

4 结论

提出了基于奇异谱分析的广义神经网络预测方法GRNN+SSA,并将其应用于同方股份收盘价格的短期预测,实验结果表明,GRNN+SSA预测效果明显好于传统的LRF+SSA及GRNN方法,原因在于,GRNN+SSA方法同时兼有SSA和GRNN方法的优点,即集成了SSA降噪能力及GRNN的强大非线性映射与任意逼近能力。因此,可试将其推广用于回归复杂多噪声时间序列的分析建模。

[1]BODYANSKIYY,POPOV S.Neural network approach to forecasting of quasiperiodic financial time series[J].European Journal of Operational Research,2006,175(3):1357-1366.

[2]MAHFOUD S,MANI G.Financial forecasting using genetic algorithms[J].Applied Artificial Intelligence,1996,10(6):543-565.

[3]KIM K.Financial time series forecasting using support vector machines[J].Neurocomputing,2003,55(1/2):307-319.

[4]HASSANI H,HERAVI S,ZHIGLJAVSKY A.Forecasting European industrial production with singular spectrum analysis[J].International Journal of Forecasting,2008,25(1):103-118.

[5]GOLYANDINA V N A Z.Analysis of Time Series Structure:SSA and Related Techniques[M].London:Chapman&CRC ,2001.

[6]HASSANI H.Singular spectrum analysis based on the minimum variance estimator[J].Nonlinear Analysis:Real World Applications,2010,11(3):2065-2077.

[7]HASSANI H,SOOFI A S,ZHIGLJAVSKY AA.Predicting daily exchange rate with singular spectrum analysis[J].Nonlinear Analysis:Real WorldApplications.2010,11(3):2023-2034.

[8]梁凤国,李帅莹,于淼,等.基于GRNN神经网络的参考作物腾发量预测[J].人民长江,2009,40(05):58-59.

[9]冯志鹏,宋希庚,薛冬新,等.基于广义回归神经网络的时间序列预测研究[J].振动、测试与诊断,2003,23(2):105-109.

猜你喜欢
成份谱分析广义
Rn中的广义逆Bonnesen型不等式
纳谱分析技术(苏州)有限公司
从广义心肾不交论治慢性心力衰竭
王夫之《说文广义》考订《说文》析论
绩优指数成份变更与一周表现
两市主要成份指数中期成份股调整
Variational Mode Decomposition for Rotating Machinery Condition Monitoring Using Vibration Signals
Cr12MoV冷作模具钢渗铬层界面能谱分析
沉香GC-MS指纹图谱分析
基于AR双谱分析的电梯运行质量研究