武汉市江汉区细菌性痢疾发病率的ARIMA模型预测应用

2015-01-07 03:29冰,张艳,周
重庆医学 2015年29期
关键词:江汉区细菌性痢疾武汉市

冯 冰,张 艳,周 方

(武汉市江汉区疾病预防控制中心,武汉 430015)

·调查报告·

武汉市江汉区细菌性痢疾发病率的ARIMA模型预测应用

冯 冰,张 艳,周 方△

(武汉市江汉区疾病预防控制中心,武汉 430015)

目的探讨ARIMA模型在武汉市江汉区细菌性痢疾月发病率预测应用的可行性,为该区细菌性痢疾的防控提供科学参考依据。方法使用SAS9.2软件对2005~2013年该区菌痢月发病资料拟合ARIMA模型,利用建立的模型对2014年1~6月菌痢月发病率资料进行预测和效果评价。结果建立ARIMA(0,1,1)X(0,1,1)12模型拟合效果较好,预测2014年上半年疫情将呈缓慢上升趋势,预测值与实际值拟合趋势基本一致。结论ARIMA模型可以作为该区菌痢月发病水平的短期预测模型。

细菌性痢疾;ARIMA模型;预测

细菌性痢疾(菌痢)是一种由痢疾杆菌引起的常见消化系统传染病(乙类),人群普遍易感,尤其儿童居多[1]。江汉区是武汉市7个中心城区中人口密度最大的地区,菌痢发病率一直占据法定报告传染病的前5位,被细菌污染的食物和水是造成突发公共卫生事件的潜在威胁。研究发现监测资料的分析与预警是预防控制并减少传染病危害的关键举措[2-5],而时间序列分析ARIMA模型作为传染病发病预测的重要工具已得到广泛应用[6-9],为此本文利用江汉区菌痢发病资料建立时间序列模型,探讨该模型预测菌痢发病率的可行性,为该区菌痢的防控提供科学依据。

1 资料与方法

1.1 一般资料 2005~2013年江汉区细菌性痢疾月发病数资料来自中国疾病预防控制信息系统,2005~2013年江汉区常住人口数来自武汉市统计局发布的人口统计年鉴。

1.2 方法 以2005年1月至2013年12月的发病率数据建立模型,用2014年1~6月发病率数据用于检验模型的预测效果。

1.3 统计学处理 应用SAS9.2软件进行ARIMA建模:主要有序列的平稳性检验、平稳化处理;平稳序列的白噪声检验拟合ARIMA模型;模型诊断、评价;预测检验,以P<0.05为差异有统计学意义。

2 结 果

2.1 序列平稳化 根据月发病数资料和人口统计资料计算得到2005~2014年菌痢月发病率数据,菌痢发病每年都有明显的季节趋势,每年6~8月为发病高峰期,2011~2013年发病率较之前有下降的趋势。故对原始时间序列进行一阶差分和一次季节性差分后,消除季节性的趋势影响,使得序列平稳。

图1 1阶12步差分后自相关图

2.2 模型识别与定阶 根据差分后的时间序列自相关(ACF)图的性质(图1),样本自相关系数滞后12阶显著在2倍标准差之外,说明差分后仍有显著的季节效应,在滞后1阶自相关和偏自相关系数值都在2倍标准差之外,说明序列还具有短期相关性,当滞后阶数大于1时,自相关系数出现了骤减,显示1阶截尾,偏自相关系数基本都在95%CI内,呈现一定的衰减。因此,根据Box-Jenkins理论[6,10-11],初步尝试拟合乘积季节模型SARIMA(0,1,1)X(0,1,1)12,SARIMA(1,1,1)X(1,1,1)12,SARIMA(1,1,1)X(0,1,1)12。

表1 备选SARIMA模型检验结果

2.3 模型参数估计与诊断 比较3种模型的拟合效果,结果显示ARIMA(0,1,1)X(0,1,1)12模型最优,参数检验均有统计学意义(P<0.01),对该模型的残差进行白噪声检验,结果在多阶延迟后,P>0.05,说明序列信息提取充分,模型拟合良好,见表1、2。

表2 SARIMA(0,1,1)X(0,1,1)12残差检验结果

2.4 预测检验模型效果 根据建立的SARIMA模型对2005年1月至2013年12月的菌痢月发病率资料进行拟合,结果显示该模型对2005年1月至2013年12月菌痢月发病率的预测值与实际值时序曲线基本一致(图2)。模型预测2014年1~6月的发病率数据,实际值均在95%CI范围之内,预测2014年上半年疫情呈现缓慢上升趋势,与实际情况一致。预测值与实际值的平均相对误差(MAPE)为19%,根据预测模型理论[11-13],MAPE<20%,表示预测效果良好。

图2 武汉市江汉区2005年1月至2014年6月菌痢预测月发病率

3 讨 论

2005年1月至2013年12月江汉区菌痢月发病率时间序列每一期的数值,都是由许多不同因素共同作用的结果,诸如人口密度、经济状况、气候及环境流行的变化往往错综复杂,因此针对单一因素的分析难以全面把握传染病的流行规律与变化趋势。然而,上述因素与时间单位(年、月、天、周)紧密关联,而时间序列模型可以在不考虑预测变量的影响因素及其关系的条件,对未来的变化进行预测,具有较高的应用价值[13-16]。其中ARIMA模型综合考虑趋势变化、季节和周期变动以及随机干扰的影响,是一种短期预测精确度较高的方法[7,10,13,18]。

本文利用2005~2013年江汉区细菌性痢疾月发病率资料,建立ARIMA(0,1,1)X(0,1,1)12预测模型,各月发病率预测值的变化趋势和实际情况基本一致,效果良好,具有可行性。模型计算出的2014年1月到6月的发病率数据与实际值均在95%的可信区间内,且疫情趋势走向基本相同,表示该模型对未来的情况进行了较好的跟踪与预测。疾病监测工作中,通过预测数据95%CI的上下限值可以判断疫情的变化规律,如果超出预测值95%CI的上限值,则应警惕菌痢暴发或流行的可能[7,11]。综上,通过建立合适的ARIMA模型预测对菌痢的风险评估具有一定的应用价值。然而,值得注意的是,一方面,影响菌痢发病的因素复杂众多,不同时间、地区的发病率存在差异,建构的模型也会存在差异,如本次研究建立模型不同于孙小宇等[16]对北京市西城区构建的ARIMA(1,0,0)X(0,1,1)12模型和向伦辉等[17]对上海市宝山区构建的ARIMA(1,1,1)模型与;另一方面,ARIMA模型只能用于短期预测,因此,随着时间的延伸,应不断加入新的实际值用以修正或拟合新的预测模型,以提高预测精度,为尽早采取针对性的防控干预措施提供科学依据[10,13,18-19]。

[1]齐小秋,王宇,卫生部疾病预防控制局,等.痢疾防治手册[M].北京:人民卫生出版社,2006:10-15.

[2]陈曦,洪希成,徐兴建,等.ARIMA与ARIMAX模型在钉螺密度预测中的应用[J].公共卫生与预防医学,2014,25(2):6-9.

[3]杨培荣,田辉,严钏元.自回归移动平均模型在宝鸡市细菌性痢疾月发病率预测中的应用[J].公共卫生与预防医学,2012,23(1):16-19.

[4]古万曦.谈建立疾病预防,疫情监测控制系统[J].中国现代医院管理杂志,2004,2(3):71-72.

[5]王振家,马继胜.新形势下公共卫生监测及其意义[J].地方病通报,2007,22(5):78,80.

[6]肖枝洪,郭明月.时间序列分析与SAS应用[M].武汉:武汉大学出版社,2009:1-41.

[7]吴家兵,叶临湘,尤尔科.ARIMA模型在传染病发病率预测中的应用[J].数理医药学杂志,2007,20(1):90-92.

[8]谭姣,雷静.ARIMA模型在乙型病毒性肝炎发病率预测中的应用[J].公共卫生与预防医学,2013,24(4):8-10.

[9]陈超,田鑫,周剑惠,等.流行性腮腺炎疫情时间序列模型建立与应用[J].中国公共卫生,2012,28(2):252-253.

[10]王燕.应用时间序列分析[M].3版.北京:中国人民大学出版社,2012:1-75.

[11]GeogeEP,GwilymM.时间序列分析预测与控制[M].顾岚,译.北京:中国统计出版社,1997:75-80.

[12]Khashei M,Bijari M,Hejazi SR.Combining seasonal ARIMA models with computational intelligence techniques for time series forecasting[J].Soft Computing,2012,16(6):1091-1105.

[13]高蕙璇.SAS/ETS软件使用手册[M].北京:中国统计出版社,1998:65-106.

[14]杨小兵,汪鹏,江高峰.ARIMA乘积季节模型在流行性腮腺炎发病率预测中的应用[J].公共卫生与预防医学,2013,24(6):39-42.

[15]张泽武,曾耀明,卢展鹏,等.ARIMA模型在东莞市细菌性痢疾预测中的应用[J].中国热带医学,2013,13(3):327-329.

[16]孙小宇,初艳慧,张震,等.3种预测模型在北京市西城区痢疾发病数预测中的应用与比较[J].现代预防医学,2014,41(19):3470-3474.

[17]向伦辉,袁国平,茅俭英.上海市宝山区细菌性痢疾发病率的ARIMA模型研究[J].中华疾病控制杂志,2011,15(11):990-992.

[18]张文彤.SPSS11统计分析教程(高级篇)[M].北京:北京希望电子出版社,2002:250-285.

[19]汪鹏,陈邦华,孔德广,等.求和自回归移动平均模型在武汉市手足口病疫情预测预警中的应用[J].公共卫生与预防医学,2015,26(1):26-29.

Application of ARIMA model to forecasting bacillary dysentery in Jianghan District of Wuhan City

FengBing,ZhangYan,ZhouFang△

(CenterofDiseaseControlandPreventionofJianghanDistrict,Wuhan,Hubei430015,China)

ObjectiveTo explore the feasibility of the application of autoregressive integrated moving average(ARIMA)model to forcast the monthly incidence rate of bacillary dysentery in Jianghan District of Wuhan,and to provide scientific references for prevention and control.MethodsSAS 9.2 software was used to fit the ARIMA model for the monthly incidence rate of bacillary dysentery from 2005 to 2013.Thereafter,the fitted model was used to forecast the data from January to June in 2014,and was evaluated by comparing the actual incidence.ResultsThe ARIMA(0,1,1)X(0,1,1)12 model had a better fitted effect,it was predicted that the incidence of bacillary dysentery of Jianghan District of Wuhan City from January to June 2014 would increase slightly,and the forecast data of bacillary dysentery from January 2005 to December 2013 consisted with the actual situation.ConclusionARIMA model can be used as short-term forecasting model to predict the monthly incidence rate of bacillary dysentery in Jianghan District of Wuhan.

bacillary dysentery;ARIMA;forecasting

10.3969/j.issn.1671-8348.2015.29.030

冯冰(1989-),硕士,公卫医师,主要从事公共卫生的研究。△

,Tel:13387511876;E-mail:358466584@qq.com。

R516.4

A

1671-8348(2015)29-4123-02

2015-04-18

2015-06-06)

猜你喜欢
江汉区细菌性痢疾武汉市
武汉市勘察设计有限公司
武汉市中小学优秀自制教具评选活动成功举办
湖北省武汉市江汉区建立社区工作者发展机制研究
武汉市勘察设计有限公司
图片新闻
某市暴雨洪涝对细菌性痢疾发病影响的时间序列分析*
武汉市江汉区 举办幼儿养成教育高峰论坛
头孢哌酮治疗细菌性痢疾的临床效果分析
血清白细胞介素及急性时相反应蛋白在细菌性痢疾患者中的变化研究
2008~2012年龙城区细菌性痢疾和其他感染性腹泻病流行特征对比分析