应用ARIMA模型预测麻疹发病率的可行性研究

2015-03-09 06:52波闵思韬闵红星岳晓玲郭忠琴
中国卫生统计 2015年1期
关键词:卫生统计麻疹银川市

陆 波闵思韬闵红星△岳晓玲郭忠琴

应用ARIMA模型预测麻疹发病率的可行性研究

陆 波1闵思韬2闵红星1△岳晓玲1郭忠琴1

目的探讨应用时间序列ARIMA模型对麻疹发病预测的可行性,为银川市传染病发病预测提供科学依据。方法采用Eviews6.0对银川市2004-2008年麻疹月发病数的资料建立ARIMA模型,用单位根检验法对模型的适应性进行检验,并回代验证其有效。结果建立模型ARIMA(1,2,0)×(1,2,0)12是合适的,R2=0.625,其预测值与实际值相吻合程度高。结论ARIMA模型能很好地模拟银川市麻疹发病率的变动趋势,预测效果满意。

麻疹 预测 时间序列分析 ARIMA模型

我国自1965年使用麻疹疫苗以来,麻疹发病率和病死率明显降低,但与国家消除麻疹时发病率达到1/100万的目标相距甚远。ARlMA模型[1-2],即求和自回归滑动平均(autoregressive integrated moving average)模型,被广泛应用于人口、经济、环境卫生及疾病发病或死亡等研究领域[3]。为此,本研究运用ARIMA模型对银川市2004-2008年的麻疹月发病数建立数学模型,探讨该模型的可行性,为麻疹的预防控制工作提供依据。

资料和方法

1.资料来源

银川市2004-2008年麻疹月发病数通过国家疾病报告管理系统进行收集,包括我市三区三县所有医疗机构的临床诊断病例和实验室确诊病例,用2004年1月至2008年12月麻疹月发病数建立预测模型,用2008年各月发病数进行组外回代和组内回代,以检验模型的预测精度。最后,用2004-2008年所有的发病数资料建立预测模型,对2009年麻疹的发病情况进行预测。

2.研究方法

采用Eviews6.0统计软件进行ARIMA模型的建模。ARIMA模型由两个特殊模型发展而来,一个是自回归或称为AR模型,另一个是移动平滑模型,所以ARIMA模型应该是AR(p)模型和MA(q)模型的组合,这个模型有p+q个参数需要估计。ARIMA建模法分为三个阶段进行:(1)模型识别,此阶段的输出结果通常会建议拟合一个或多个ARIMA模型;(2)参数估计和模型检验,此阶段用以判断该模型的适用性;(3)预测应用,预测时间序列的未来值及可信区间。通过这3个步骤的反复进行,最终确定一个用于预报的“最优”模型。

结 果

1.2004-2008年银川市麻疹发病情况

绘制2004-2008年银川市麻疹月发病资料的时间序列图,可以看出:麻疹月发病数呈现明显波动,每年均出现发病高峰月,且发病高峰出现的时间一致,发现有相对固定的季节性或周期性波动(每年4月出现高峰),见图1。

图1 2004-2008年银川市麻疹月发病数时序图

2.建立预测模型

(1)模型识别

对银川市2004-2008年麻疹发病的时间序列进行分析后发现,该序列的ACF呈拖尾衰减缓慢,为非平稳序列,PACF二步截尾,尚无法识别,需要将序列平稳化处理后再做一阶季节差分,序列的ACF呈两步截尾,而PACF呈一步截尾,所以,原始序列识别为ARIMA(1,2,0)。初步选定麻疹预测模型为取值p=1,d=2,q=0的ARIMA(1,2,0)。用2004年1月至2008年12月的麻疹月发病数建立预测模型,结果见表1。

表1 2004-2008年银川市麻疹月发病数预测模型相关参数

(2)参数估计和模型检验

麻疹发病预测模型ARIMA(1,2,0)×(1,2,0)12的参数估计,模型误差在任何时滞上P值都大于0.05,显示该模型用于预测是合适的,可用于麻疹发病的预测。

(3)预测应用

①建立数学模型yt=13.877+0.867159tt-1-0.346245tt-2+at,用该模型对我市2009年麻疹发病情况进行预测。

②数据内与数据外预测 从图2可以看出,实际值与预测值相对较为吻合。

图2 2004-2009年银川市麻疹发病的数据内与数据外预测

讨 论

国内曾对多种不同的预测方法进行研究,诸如回归分析法、时间序列法、灰色模型等等。有研究显示,各种模型在疾病的预测中及医院管理等方面均取得了较好的效果[4-6]。ARIMA模型研究对象为季节特点较为明显的资料,涉及医院管理、预防医学及经济等领域[7]。本研究应用ARIMA模型法预测麻疹发病率,是用疾病的过去值和现在值,预测未来值,收集资料所花费的成本很低,其过程简便、适用。另外,可参照预测数据有目的地开展传染病的预防和控制工作。

麻疹是呼吸道传染病,通过2004-2008年银川市麻疹月发病数的时间序列图可以看出:麻疹月发病数呈现明显波动,每年4月为发病高峰月,且季节性比较明显。本文在充分考虑麻疹季节性的情况下,对其进行建模,获得了比较满意的预测模型ARIMA(1,2,0)×(1,2,0)12。麻疹月发病数时间序列的ACF分析图显示:序列数据不平稳,经一阶差分后,建立ARIMA(1,2,0),进行检验说明有统计学意义,用2004年1月-2008年12月的麻疹月发病数用建模,运用Eviews6.0拟合模型,对残差序列进行白噪声检验,结果显示,该序列数据的五年预测效果的拟合度R2为0.625,相关系数为0.7905,通过预测实际值与预测相吻合程度高,说明用ARIMA(1,2,0)×(1,2,0)12模型能很好的预测麻疹发病情况。

本研究证实了ARIMA模型能够较好的用于麻疹发病的预测,该模型在其他传染病发病预测中的应用也值得进一步探讨。但是,ARIMA模型预测只有以足够多的时间序列数据为依据,才能得到较满意的预测效果,本研究在处理序列数据中发现,序列太短会导致建模困难,取较长的序列则可保证拟合模型的可靠性,通常认为ARIMA模型法至少需要50个以上数据建模,而本次研究采用60个数据建模,预测效果较好。

1.孟蕾,王玉明.ARIMA模型在肺结核发病预测中的应用.中国卫生统计,2010,27(5):507-509.

2.胡建利,梁祁,吴莹,等.季节时间序列模型在菌痢发病预测中的应用.中国卫生统计,2012,29(1):34-39.

3.Poddar SK.Influenza Virus Types and Subtypes Detection by Single StepSingle Tube Multiplex Reverse Transcription-polymerase China Reaction(RT-PCR)And Agarose Gel-Electrophoresis.Journal of Virology Methods,2002,99:63-70.

4.尹志英,缪明正.指数曲线模型在预测甲肝流行趋势中的应用.中国卫生统计,2007,24(5):555.

5.肖玉霞,张颖.用线性趋势季节模型预测出院人次.中国卫生统计,2008,25(3):213-215.

6.胡兴,胡锡健.新疆H1N1甲型流感疫情预测模型的比较研究.中国卫生统计,2011,28(3):342-343.

7.冯丹,曹秀堂,董军,等.综合性医院收容量预测的ARIMA模型构建研究.解放军医院管理杂志,2007,14(2):101-103.

(责任编辑:丁海龙)

陆波,闵思韬为并列第一作者

1.宁夏医科大学总医院(750004)

2.浙江大学物理系

△通信作者:闵红星,E-mail:minhongxing@126.com

猜你喜欢
卫生统计麻疹银川市
新医疗背景下卫生统计工作的实践与发展思考
浅谈加强卫生统计工作的作用及措施
美国新增60例麻疹病例
无 非
我国卫生统计的深化与改革探讨
周围的人没有患麻疹,为什么还要给儿童接种麻疹疫苗呢?
银川市放疗许可证发放现状分析
Trouble in Disneyland
干扰素α-1b治疗成人麻疹疗效初步观察
储备肉成走俏年货