李苗在,杨建强
[摘 要] 在实际生活中,根据事件发生的顺序把过程记录下来就形成了时间序列,对它进行观测分析,寻找时间序列过去的规律,预测序列未来的发展方向,这就是时间序列分析。
[关 键 词] 时间序列;序列相关性;序列检验
[中图分类号] G712 [文献标志码] A [文章编号] 2096-0603(2017)31-0190-01
一、时间序列
(一)时间序列的定义
在实际生活中,根据事件发生的顺序把过程记录下来就形成了时间序列,对它进行观测分析,寻找时间序列过去的规律,预测序列未来的发展方向,这就是时间序列分析。
在统计研究中,常用按时间顺序排列的一组随机变量
…,X1,X2,…,X3,…
来表示一个随机事件的时间序列,简记Xt,t∈T为或Xt。
时间序列分析的方法主要有两种:频域分析方法和地域分析方法,时间序列分析常用的软件很多,本文研究所用的为Eviews。
(二)平稳时间序列
在得到一组观测数据后,要对它们进行预处理,预处理分为平稳性检验和纯随机性检验。
定义1(严平稳序列)
对任意的正整数m和t,F■(x1,x2,…,xm)=F■(x1,x2,…,xm),?坌ti,ti+?子∈T,i=1,2,3,…m。
符合以上要求的序列被称为严平稳序列。而在实际的实验中想要得到一个随机序列的联合分布是一件十分不容易的事,同时,即使知道了联合分布,实践起来难度还是很大。所以严平稳时间序列往往只具有理论意义,在实践中用的更多的是条件比较宽松的宽平稳时间序列。
定义2(宽平稳序列)
满足以下条件:
(1)EXt2<∞,?坌t∈T,T为时间集合;(2)EXt2=μ,μ为常数,?坌t∈T,
T为时间集合;(3)?酌t,s=?酌k,k+s-t,?坌t,s,k+s+t∈T;也就是?酌t,s与t,s无关,只与其他时间间隔为t-s有关,记为?酌t,s=?酌(t-s)
称序列?酌是宽平稳序列。
显然严平稳比宽平稳的条件严格。严平稳是对序列联合分布的要求,以保證序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对高于二阶的矩没有任何要求。因此一般情况下,前者是符合后者的,而后者不能违反前者的成立。在实际应用中,研究最多的是宽平稳随机序列。
(三)白噪声序列
如果一个序列中的值彼此之间不存在任何相关性,也就是说明了这个时间序列已经发生的行为对将来的进展情况是没有任何干扰的,这样序列被称为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。因此想要继续了解这个平稳序列应不应该继续研究,就要对平稳序列采取纯随机性检验。
定义3:如果时间序列Xt满足如下性质:
(1)任取t∈T,有EXt=μ;
(2)任取t,s∈T,有?酌(t,s)=σ2,t=s0,t≠s
称序列Xt为纯时间序列,也称白噪声序列。
如果随机过程Xt(t=1,2,3…)是一个不相关的随机变量序列,即随机变量Xt和Xs互不相关,这样的随机过程就是一个纯随机过程。
二、序列相关及检验方法
(一)序列相关的定义
对线性模型yt=β0+β1x1t+β2x2t+…+βkxkt+μt,t=1,2,…,T
随机扰动项之间不相关,即无序列相关性的基本假设为
cov(μt,μt-s)=0,s≠0,t=1,2,…,T
如果扰动项序列表现为
cov(μt,μt-s)≠0,s≠0,t=1,2,…,T
当样本点不同时,随机扰动项之间是相关的,就称为存在了序列相关性。而序列相关性也会带来检验参数显著水平的t统计量不再有效等后果。
(二)序列相关的检验方法
在实际建模过程中,扰动项的序列相关性可能由于在建模过程中遗漏了重要的解释变量,所以建立合适的模型十分的重要,而常见的检验序列相关性的方法有:
1.D.W.统计检验
它用于检验一阶序列相关,对扰动项ut建立一阶自回归方程
ut=ρut-1+ε,t=1,2,…,T
D.W.统计量检验的原假设为:ρ=0,备选假设为:ρ≠0。
如果序列不相关,D.W.值在2附近;如果存在序列正相关,D.W.值将小于2,最小为0;如果存在负相关,D.W.值将在2和4之间。
2.相关图
这里需要引入自相关系数和偏自相关系数:
(1)自相关系数
时间序列ut滞后k阶上午自相关系数由下式估计
rk=■
rk表示相距k期值的相关系数,它刻画的是一个随机过程的性质。它告诉我们在序列ut的临近数据之间存在的相关性。通过自相关系数可以清楚地看出扰动项ut存在多大程度的高阶序列相关。
(2)偏自相关系数
偏自相关系数是指在给定ut-1,ut-2,…,ut-k-1的条件下,ut与ut-k之间的条件相关性,而滞后k阶的偏自相关系数是当ut对ut-1,ut-2,…,ut-k作回归时ut-k的系数。之所以叫做偏自相关是由于它度量的是k期相关而没有考虑到k-1期的相关。
三、时间序列分析的应用
时间序列分析是统计学研究的一个重要分支,它直接以事物在不同时间的状态所形成的数据为研究对象,通过对时间序列数据的特征进行分析和研究,发现并揭示事物的发展变化规律。“人类正被信息淹没,却渴于知识。”时间序列数据存在于社会各个领域,如科学研究、金融商业交易、股市、医疗病历、病情记录等。随着科学技术的不断发展,计算机以及存储设备容量日益增大,时间序列分析数据库非常庞大,如何对其进行挖掘分析,已引起国内外很多学者的兴趣和关注。将时间序列分析法与数据挖掘技术相结合,一方面有利于提高传统分析方法的分析能力,另一方面,还可以使数据挖掘技术在时间序列分析领域的应用更具有针对性,对实现快速、自动、智能化发现各种有价值的规律具有重要意义。
参考文献:
[1]王黎明,王连,杨楠.应用时间序列分析[M].北京:复旦大学出版社,2009.
[2]易丹辉.数据分析与Eviews应用[M].北京:中国统计出版社,2002.
[3]魏武雄.时间序列分析单变量和多变量方法北京[M].中国人民大学出版社,2005.
[4]郑彩萍,单锐.非线性时间序列ARMA模型的优化估计法[J].佳木斯大学(自然科学版),2008,26(1).