张庆春,张 黎,范晓东
(1.吉林化工学院 理学院,吉林 吉林 132022;2.鞍山师范学院 数学与信息科学学院,辽宁 鞍山 114007)
对整数值时间序列模型进行参数估计[5-7]也是统计学者研究的热点问题.拟似然(Quasi Likelihood,QL)方法是由Wedderburn (1974)[8]提出的一种非参数估计方法,可以看作是最小二乘估计法的一种推广.拟似然方法最大的优势在于:不需要借助分布信息,只需要在二阶矩存在的条件下,就可以对参数进行类似于 “似然” 的推断,并且拟似然估计比极大似然估计具有稳健性.正因如此,拟似然方法一经提出便受到广泛关注,先后被学者们应用于包括整数值时间序列模型在内的很多模型中.本文基于推广的负二项稀疏算子利用预设新息过程分布法构造一元 INAR(1) 模型并用拟似然方法估计该模型的未知参数,具有一定的创新性和实际应用价值.
把满足迭代方程(1)的过程称为基于推广的负二项稀疏算子的INAR(1)过程,记作ENBINAR(1)过程.
Xt=α*Xt-1+εt,t∈Z,
(1)
其中“*”表示推广的负二项稀疏算子,其定义如下:
(2)
设{Xt)是由(1)式定义的一个ENBINAR(1)过程,其条件矩和矩分别为:
E(Xt|Xt-1)=α(Xt-1+1)+λ,
(3)
Var(Xt|Xt-1)=(1+α)α(Xt-1+1)+Vλ,
(4)
(5)
(6)
设θ=(α(1+α),Vλ)T,模型的未知参数是β=(α,λ)T,记(4)式的一步条件方差为Wθ=(1+α)α(Xt-1+1)+Vλ.根据拟似然方法(Wedderbrun,1974)可以建立下面的标准估计方程:
(7)
首先设θ值已知,若θ值未知则利用其他方法估计出θ的值,带入上面的方程组得到修正的拟似然估计方程组,若该方程组的解存在则可以解得未知数β的拟似然估计值为:
(8)
利用条件最小二乘估计法可以得到未知参数β的估计值为:
(9)
先给出模型的条件概率密度如下:
(10)
(11)
表1 Geo-ENBINAR(1)模型的CLS、MQL和MLE估计结果
从表1可以看出,随着样本量的增大,3种估计法的经验误差和标准误差都在减小,说明3种估计量都具有一致性,都可以得到可靠的估计结果;MQL估计的经验误差和标准误差比最小二乘估计的小,但没有极大似然估计法的经验误差和标准误差小,说明在非参数估计中,拟似然估计优于最小二乘估计,但稍逊于极大似然估计.
为阐明模型的应用,我们选用匹斯堡警察署所统计的每月毒品犯罪案件数量的数据集,时间为1990年1月至2011年12月,共计264个月度观测值.下面判断该序列的平稳性并建立模型.利用R软件画出该序列的时序图,ACF图和PACF,见图1.
从图1中的时序图可以看到该序列大致是平稳的,并且从ACF图和PACF图可以看出,ACF呈拖尾状,PACF为一阶截尾,一阶偏自相关系数为0.45.初步判断模型为INAR(1)类型.
number(a)时序图
下面考虑新息过程分别为泊松分布和几何分布的ENBINAR(1)模型,分别记为P-ENBINAR(1)模型和Geo-ENBINAR(1)模型,并与基于二项稀疏算子,新息过程分别为泊松分布和几何分布的两个BINAR(1)模型,分别记为P-BINAR(1)模型和Geo-BINAR(1)模型,相比较得出最优模型.利用MQL和MLE两种方法来对4种模型中的参数进行估计,结果见表2.
表2 毒品犯罪数据的模型及估计结果
通过对比,4个模型中AIC值最小的是Geo-ENBINAR(1)模型,即基于推广的负二项稀疏算子的几何新息过程的INAR(1)模型是更适合该毒品犯罪数据的模型.
基于推广的负二项稀疏算子建立整数值一阶自回归(INAR(1))模型,推导出了模型概率性质,对模型的未知参数进行拟似然推断,得到了未知参数的修正的拟似然估计量,同时也针对模型中的未知参数给出了最小二乘和极大似然估计方法,通过数值模拟对模型的估计方法的有效性进行了评估.模拟结果表明,随着样本量的增大,3种估计法的估计误差都在减小,说明3种估计量都可靠,修正的拟似然估计的误差比最小二乘估计的小,但没有极大似然估计法的误差小,说明在非参数估计中,拟似然估计具有很大优势,但稍微劣于参数估计法的极大似然估计.通过给出实际数据展示了模型的实用性,通过对比4个模型的AIC值,得出更适合数据的模型是基于推广的负二项稀疏算子的几何新息过程的INAR(1)模型.