(新疆财经大学应用数学学院,乌鲁木齐市,830012) 文 静
(新疆财经大学应用数学学院,乌鲁木齐市,830012) 韩露露
分析的数据为2015 年的新疆喀什地区的百日咳月发病数量(单位:人)和月日照小时数(单位:小时)。数据均来源于2015年的中国疾病预防控制中心及国家疾病监测信息报告管理系统。新疆喀什百日咳2015年的月发病总量用Y代表,新疆喀什地区2015 年月日照时数用X 代表。分别取这两个变量所构成的两个时间序列,先来判断这两个时间序列的平稳性来确定两者之间的关系。首先,用MATLAB作出这两个序列的时序图,见图1和图2。
图1 新疆喀什地区2015年每月发病人数
图2 新疆喀什地区2015年月日照时数
由时序图能直观看出新疆喀什地区百日咳2015年的月发病总量和和月日照时数序列不平稳。所以为保正此序列的平稳性判断是否是正确的,本文对这两个序列分别进行序列的自相关-偏相关分析和序列的单位根检验的两种判别方法。
构成时间序列的序列值分别是yt,yt-1,…,yt-k,它们之间的简单相关关系叫作自相关,并且自相关系数的表达式为;其中n表示样本容量,k 表示滞后期;yˉ是样本数据的算术平均值。偏自相关是在所确定的yt-1,yt-2,…yt-k+1的条件下对于此个时间序列yt之中的yt和yt-k之间的条件相关关系。偏自相关的系数中ηk,j=ηk-1,j-ηkk。自相关-偏相关图见图3和图4。
图3 2015年新疆喀什地区月发病人数时间序列自相关-偏自相关分析图
图4 2015年新疆喀什地区每月日照小时数时间序列自相关-偏自相关分析图
上图的右半部分有5 列数据,第一列数据表示自然数,是滞后期k,AC 表示自相关系数rk,PAC 表示偏自相关系数ηkk。最后两列分别表示Q 统计量和相伴概率,它们可对序列进行独立性检验。图3和图4 可以看出新疆喀什地区百日咳2015 年的月发病总量和月日照时数序的时间序列不平稳。所以要对它们进行差分处理。
对时间序列进行平稳的方法有自然对数变换处理或者差分处理,而本文是将2015年新疆喀什地区每月发病人数和新疆喀什地区2015 年月日照时数时间序列分别进行一阶差分之后实现了平稳,如图5和图6所示。
图5 2015年新疆喀什地区每月发病人数一阶差分自相关-偏自相关分析图
图6 2015年新疆喀什地区每月日照小时数一阶差分自相关-偏自相关分析图
由图可知疆喀什地区2015 年每月发病人数和新疆喀什地区2015 年月日照时数序列的自相关系数很快的趋于0,所以落入随机区域,时序为平稳的。
由于前面利用序列的自相关-偏自相关图来判断时间序列的平稳性,但是这种方法较为粗略。所以为了能够更加精确的判断这两个时间序列的平稳性,则引入了单位根检验。单位根检验的方法有多种,其中常见的有:DF检验、ADF检验和PP检验。原假设为序列存在单位根,对参数γ 的估计值进行显著性检验,检验的t统计量不服从常规t分布。因为是由前人DF(Dickey&Fuller)给出的用来检验的模拟临界值,所以称为DF检验,ADF检验其中的一个特例就是DF 检验。PP 检验则是在1988 年由Phillips 和Perron 两位学者提出的一种用非参数来控制序列中的高阶序列相关的方法。检验假定序列服从AR( p)。检验方程为:
其中∇yt=yt-yt-1,ϵt为白噪声。假设检验是:H0:γ=0 H1:γ <0。但是在实际的操作中,检验方程的参数也可以依照具体情况来定,一般选择是要保证最小p值的ϵt为白噪声。(见表1)
由上表的ADF 检验结果可看出,Y 序列和X 序列的序列进行一阶差分后是非平稳序列,而Y 序列和X序列的序列进行二阶差分后在5%的显著水平下通过ADF 单位根检验均是平稳的序列。对于平稳的序列可进一步分析两个序列之间的一些关系。
表1 ADF单位根检验结果
表2 Granger因果关系检验结果
格兰杰因果检验是2003 年的诺贝尔经济学家奖的得主克莱夫·格兰杰(Clive W.J.Granger)创立的一种用分析变量之间因果关系的方法。在所需分析的时间序列下,两个变量X、Y 之间的格兰杰因果关系的定义是:如果在包含变量X、Y过去的信息条件下,对变量Y 的预测效果是优于只有Y 的过去信息对Y的预测效果,也就是说,变量X是有助于解释变量Y 的将来的变化的值,那么就可认为变量X是变量Y的格兰杰原因。但是经济的变量之间很可能会出现伪回归,所以格兰杰因果检验的前提条件必须为:①时间序列数据模型:格兰杰因果检验的局限性是不能对横截面数据进行检验的;②时间序列必须具有平稳性。
由前面可知,新疆喀什地区2015年每月发病人数和新疆喀什地区2015 年月日照时数的二阶差分的时间序列是平稳的,所以分析的变量是满足格兰杰因果检验的前提条件的。(见表2)
由表2可以看出:在滞后二阶的情况下,新疆喀什地区的月日照时数仅是能引起百日咳的月患病总数的单项变化原因,而在滞后三阶的情况下,新疆喀什地区的月日照时数是百日咳的月患病总数的单项因果关系。
(1)百日咳是一种可以预防的疾病,且它有传染性。可以通过接种疫苗来预防,但是接种过疫苗之后的免疫力也有一定的期限,超过特定的期限之后会回到易感的人群。
(2)通过格兰杰检验可知:新疆喀什地区的月日照时数是百日咳的月患病总数的单项因果关系。即新疆喀什地区的月日照时数能引起百日咳的月患病总数的单项变化。
根据新疆喀什地区的月日照时数与百日咳的月患病总数的分析,提出建议如下:
(1)百日咳是一种可以传染的疾病,但是是可以预防的,严重时还会导致死亡,新生儿可以通过接种疫苗来预防这种疾病的发生。目前接种百日咳疫苗是预防百日咳最有效最经济的方法[10],所以可以通过提高全疆地区的百日咳疫苗接种率和全程接种率,然后通过适当的开展疫苗的查漏补种工作,来降低百日咳的发病。
(2)根据格兰杰检验,既然疆喀什地区的月日照时数能引起百日咳的月患病总数的单项变化。新疆是温带大陆性气候,环境干燥,加之南僵的日照少,而喀什就处在南疆,那么可以通过适当的外出活动来提高免疫力,减少患百日咳的几率,但是不可过多的日照或过少的日照。
(3)新疆的喀什地区是全疆的百日咳高发地[11],由此可见,喀什的百日咳发病水平对与全疆的疫情来说都将会产生较大影响力,所以有关部门应该时刻关注喀什地区百日咳的传播与流行情况,并且适当扩大检测的对象,做好相应的预防措施,才能有效防止百日咳疫情的进一步扩大。