刘智
[摘要]金融时间序列是金融市场这个复杂系统在演化过程中产生的离散输出,根据观测点的数量,金融时间序列可以分为单变量时间序列和多变量时间序列。在多维时间序列中,有些维度的时间序列之间存在较大的演化差异,从众多的时间序列中挑选出这些对重构相空间提供贡献较大的时间序列并完成重构则可以得到较好的重构和预测效果。采用多维金融时间序列重构金融市场这个复杂系统可能会得到更好的效果,此外使用多维时间序列也可以有效地减少噪声对重构过程的影响。
[关键词]金融时间序列;相空间重构;预测
[中图分类号]TP311[文献标识码]A[文章编号]1005-6432(2014)43-0100-02
1引言
时间序列的预测问题已在各个领域得到广泛关注,如生物信息学、神经信息学、金融工程、经济学等。时间序列的最优预测非常重要,它会为决策者进行决策提供重要的参考信息。
行业指数与综合指数都是证券市场这个复杂系统产生的时间序列,这些时间序列之间相互作用影响,一段时间内会出现相同趋势的演化而另一时刻则会产生相互背离的演化。这种演化中的背离现象说明多个时间序列中所包含的复杂系统演化信息不同,因此利用多个行业指数时间序列进行证券市场的复杂系统重构应比简单采用单一观测量的重构更加贴近真实系统。
2多元时间序列的定义
现实中,多元时间序列以各种形式广泛存在,现首先给出多元时间序列的数学定义。
一系列按照时间先后顺序记录的值S={vi(1), vi(2), …, vi(t), …, vi(n)}称为时间序列。其中t(t=1,2,…,n)表示时刻,i(i=1,2,…,m)表示变量,vi(t)表示第i个变量在t时刻上的记录值当m>1时,S为多元时间序列(MTS);此多元时间序列为确定性的数值类型的数据,可以用m×n矩阵表示,m为变量数,n为时间点数。
在多元时间序列中由于各变量间量纲等方面的差异,因此需先将数据正则化,以减少随机波动干扰、降低算法计算复杂度。同时,为保证MTS相似的有效性和准确性对MTS数据集也有一定的初始要求,因此这里给出同构的MTS的定义,以限定研究对象范围。
同构的MTS需要满足以下三个要求:①对于MTS数据集,各序列的变量维数相同,变量之间一一对应且表示相同的含义;②对于某一MTS样本,各变量数值的记录时刻对应,且具有相同的时间粒度;③MTS需经正则化处理。
3多变量相空间重构参数的选取方法
在非线性多变量数据分析中,采用虚假邻点法进行相空间重构是一种简单易行的常用方法。该算法具有计算过程简单、计算速度快等特点。虚假邻点法是由 Kennel 等人提出的算法,该方法的基本思想是当嵌入维数m变成m+1时,考察信号xn的邻点中哪些是真实的,哪些是虚假的邻点,当没有虚假邻点时,可以认为几何结构完全被打开,此时的m即为所求的最佳嵌入维数。设xn的最近邻点为xη(n),当m1增大到m1+1时,重新计算两个信号之间的距离并求与原距离之间的比值:
xη(n)+xn(m1…ml+1…mL)-xη(n)-xn(m1…ml…ML)xη(n)-xn(m1…ml…mL)≥σ0
如果距离变化的比值大于σ0,则xη(n)是xn的虚假邻点。对于多维信号(m1,…,ml,…mL)从(1,…,1,…,1)开始,每次ml增加1,直到虚假邻点的比例小于δ,则可以认为吸引子的几何机构完全打开,此时的(m1,…,ml,…mL)为最佳嵌入维数。根据经验通常预定义σ0=10,δ=5%。
4相空间重构
相空间重构理论是研究混沌理论的基础。Takens和Packard 等人认为系统中任意一分量的演化都是由与之相互作用的其他分量所决定的。因此,这些相关分量的信息隐含在任意一个分量的发展过程中,重构系统相空间只需考察一个分量。
设X表示观测到的混沌时间序列,x(t),t=1,2,…,n,根据Takens定理,进行相空间重构,则在状态空间中重构后的状态矢量可以表示为:Xi=(xi,xi+1,…,xi+(m-1)t)T(i=1,2,…,i+(m-1)t),其中i+(m-1)是重构相空间中的相点个数,t是延迟时间,m是嵌入维数。Takens 证明了可以找到一个合适的嵌入维数,即如果延迟坐标的维数m≥2d+1,d是动力系统的维数,在这个嵌入维空间里就可以把吸引子恢复出来。
5复杂非线性时间序列预测
结构复杂的非线性数据,不适宜从数据特性出发分析建模,而唯象预测方法就不关心数据本身所具有的特性,只是利用现存历史数据去逼近模型进而预测未来。1989 年 Billings 等人提出的非线性自回归滑动平均(NARMA)模型,具有形式简洁、高度概括等特点。
主要建模步骤如下:
(1)对时间序列进行零均值平稳化处理。时间序列一般可分为平稳时间序列和趋势性序列。时间序列的趋势又分为线性趋势和非线性趋势。若时间序列为非平稳序列,具有向下或向上的趋势,建模之前需要进行序列平稳化处理,即零均值化、平稳化处理。
(2)逐渐增加模型阶数,拟合ARMA(n,n-1)模型。即一阶、一阶增加模型阶数,模型参数采用非线性最小二乘法估计,具体算法采用最速下降法。选择残差序列最小方差对应的模型作为初选模型。
(3)模型适应性检验。
(4)求最优模型。系统意义上的最优模型不仅是一个适应模型,而且是一个经济的模型。因此还需要检验模型是否包含小参数,若有,可用F检验判断是否可以删去,拟合较低阶模型,进而得到系统意义上的最优模型。
(5)时间序列预测。
6问题与展望
基于非线性动力学的时间序列分析和预测技术的主要支撑理论是20世纪80年代初PTakens和RMane提出的相空间延迟重构技术,这一方法后来由 TSaner等作了完善和推广。实际环境中,对复杂系统的观测时间序列通常是有限长的,甚至很短,具有噪声,而另一方面观测时间序列是同时产生的多维时间序列,这些时间序列中可能包含大量的冗余信息也可能包含着十分有用的复杂系统演化信息。本文研究无疑能为金融机构与投资者深入认识金融市场规律、有效地进行金融管理、提高金融投融资效率等提供新的数量技术支撑,对促进金融市场技术分析理论与方法的创新和发展具有重要的理论与现实意义。
参考文献:
[1]杨璐,高自友基于神经网络的时序预测模型研究[J].北方交通大学学报,1998,22(3):53-56
[2]李爱国,覃征大规模时间序列数据库降维及相似搜索[J].计算机学报,2005,1(9):1447-1475.
[3]王达,荣冈时间序列的模式距离[J].浙江大学学报(工学版),2004,39(7):795-798.
[4]李军,刘君华一种新型广义RBF神经网络在混沌时间序列预测中的研究[J].物理学 报,2005,54(10):4569-4957
[5]张勇,关伟基于最大Lyapunov指数的多变量混沌时间序列预测[J].物理学报,2009,58(02):756-763
(上接P99)
根据上图,该体系框架自上而下共分为目标层、准则层、方案层和指标层四个层次。其中,最高层是企业战略目标层,即追求企业EVA最大化;第二层是准则层,以BSC的财务、顾客、内部业务流程、学习与成长四个维度作为实现战略目标的准则;第三层是方案层,通过具体措施的事实保证四个维度策略的执行;最后一层是指标层,利用具体的业绩评价指标对措施执行的效果进行衡量。在实施过程中,企业可以结合自身实际情况,对具体指标进行挑选和组合,并对相应指标进行权重设计,从而能够有效的实现企业战略业绩评价。