重庆市沙坪坝区手足口病发病数预测模型的构建与评价

2018-10-26 00:37段清浩李廷荣杨连建
西南国防医药 2018年10期
关键词:沙坪坝区阶数口病

段清浩,李廷荣,杨连建

手足口病是一种儿童多发性传染病。2009~2016年,重庆市沙坪坝区报告手足口病发病率连续8年均位居重庆市各区县前5位,防控形势十分严峻。若能对发病趋势进行早期预测,则对防控策略的制定具有重要意义。目前用于手足口病发病趋势预测较多是采用时间序列方法,如指数平滑法、移动平均法、自回归模型、差分自回归移动平均模型等,但预测精度均不太理想,波动较大[1-3]。诸多研究显示,气象因素与传染疾病的发生具有相关性[1],而在模型中加入短期气象因素等自变量是否能提高模型预测精度,相关研究却很少。因此,本研究根据当地实际情况,考虑气象因素,建立沙坪坝区手足口病的季节性ARIMA模型,并对模型预测效果进行评价。

1 资料与方法

1.1 数据来源 2009年1月1日~2016年12月31日每日手足口病病例数据来源于重庆市沙坪坝区疾病预防控制中心 “疾病监测信息报告管理系统”,剔除了疑似病例卡、已删除病例卡和重复病例卡[2]。同期人口数据来源于2009~2016年《沙坪坝区统计年鉴》,同期气象数据来源于重庆市沙坪坝区气象局。

1.2 建模步骤 将该区2009~2015年每周手足口病病例数作为建模数据,构建乘积季节模型ARIMA(p,d,q)(P,D,Q)s,其中p、q分别为自回归和移动平均阶数,d为平稳化过程中差分的阶数,P、Q为季节性的自回归和移动平均阶数,D为季节差分的阶数,s为季节周期。建模步骤如下[3-5]:(1)序列的平稳性判定:根据该区2009~2015年每周报告手足口病病例数序列图、自相关图(ACF)和偏自相关图(PACF)判定序列平稳性,采用季节差分或差分变换使序列趋于平稳。(2)模型识别:通过ACF图和PACF图确定相应ARIMA模型的阶数及p、q、P和Q的取值。(3)参数估计和模型诊断:采用极大似然估计法计算参数,模型阶数由AIC和BIC函数取最小值准则来定,同时对残差序列进行白噪声检验,最终确定拟合的最佳模型,(4)预测:用上述构建的模型预测2016年周发病数,与实际数据进行比较,验证模型的预测效果。

1.3 统计学方法 应用Excel 2007软件对该区2009~2016年每周手足口病病例数进行整理,绘制时间序列图;应用IBMSPSS 22.0软件的预测模块中差分自回归移动平均(ARIMA)模型分析法构建本研究模型,并对残差序列进行白噪声检验;sR2和BIC用于比较各模型间的优劣,sR2越大,BIC越小,模型越优;用均方根误差RMSE衡量预测值与实际值的吻合度,RMSE越小,模型预测精度越高。

2 结果

2.1 病例数分布 如图1所示,2009年1月~2016年12月,沙坪坝区手足口病报告病例数呈明显的周期性波动,且每隔12个月(52 w)为1个周期。每年度发病时间均呈双峰现象,2009年主峰位于5~7月,占该年度发病总数的60.43%;次峰位于10~12月,占该病发病总数的21.52%;其余年份主峰均位于4~6月,次峰位于10~12月。由于手足口病有周期性发病特点,因此,建立乘积季节模型,s=52。经1阶差分和1次季节差分处理后,序列基本平稳,模型取 d=1,D=1。

2.2 模型构建与评价 由上述分析结果,初步建立 ARIMA(p,1,q)(P,1,Q)52模型。 采用该区 2009~2015年每周手足口病病例数据拟合,最终选择最优模型为 ARIMA(0,1,1)(1,l,1)52。 对模型残差进行自相关检验,符合白噪声序列,且残差序列值基本都在置信区间内(图2),可认为所选模型合适。再根据人群特点分男性、女性、幼托儿童和散居儿童分别建模(表1)。由于手足口病一般潜伏期为1 w以内[1-2],因此,上述模型中加入报告病例的前1 w平均气温作为自变量,再次建模。从表2可见,加入平均气温因素后,Model_2的各组sR2值均大于 Model_1,且各组BIC值均小于Model_1,模型有了很大改善。

2.3 模型预测验证 进一步对该区2016年52周报告的手足口病病例数进行预测,结果提示,病例依然集中于4~7月和10~12月,与实际值吻合较好(图2),均方根误差RMSE为15.84。

图1 重庆市沙坪坝2009年1月~2016年12月报告手足口病病例数分布

图2 2016年重庆市沙坪坝区手足口病周发病数的实际值和预测值

3 讨论

手足口病传播途径多样,传染力强,速度快,特别是学龄前儿童,易在托幼机构中造成暴发或流行,因此,对该病的发病趋势进行预测有利于及早采取措施,防止疫情的暴发和流行。气温是重要的气象因素,对传染病的流行传播具有很大的影响,有研究发现,气温可影响病原携带者或宿主的移动[1-5]。但是在以往研究中,大多关注气象因素与手足口病发生的相关性及效应,很少将气温等气象因素纳入构建预测手足口病发病趋势模型[6]。本研究采用季节性ARIMA模型,同时考虑到手足口病一般潜伏期为1 w以内[1],因此,将报告发病的前1 w平均气温作为自变量纳入建立手足口病周发病数预测模型。最终选择最优模型 ARIMA(0,1,1)(1,1,1)52,对模型残差进行自相关检验,序列满足白噪声序列标准[3],且残差序列值基本都落入置信区间内,表明所选模型是合适的。

表1 根据手足口病周发病数且不考虑天气因素构建的不同组sARIMA模型(ModeI-1)

表2 根据手足口病周发病数且考虑平均气温因素构建的不同组sARIMA模型(ModeI-2)

本研究还根据人群特点分男性、女性、幼托儿童和散居儿童分别建模,加入周平均气温因素后,总的模型sR2为0.80,高于以往其他地区仅仅采用时间序列方法而不考虑气温因素构建模型的预测精度[7]。再次说明气温与手足口病发生具有密切关系,建模时纳入可显著增加模型预测精度。本研究建模纳入报告发病的前1 w平均气温后,各组模型的sR2值均高于普通ARIMA模型,且各组BIC值均小于普通ARIMA模型,使得模型有了很大改善。根据各组模型sR2、BIC值还可发现,除了幼托儿童组外,其余组模型表现均较好,这可能与样本量大小有关,需要进一步收集数据深入分析。

采用本研究构建的模型对该区2016年52 w手足口病病例数进行预测,并与实际值比较,结果显示,2016年前两个季度(1~6月),手足口病预测值略高于实际值,第四季度(10~12月)预测值略低于实际值,总体吻合度较好,均方根误差RMSE仅为15.84。

综上所述,本研究将报告发病前1 w平均气温纳入自变量,构建的沙坪坝区手足口病周病例数sARIMA模型具有较高的预测精度。该模型有助于沙坪坝区卫生部门进行手足口病的早期监测与预警,及早部署防控措施,有效遏制暴发或流行,同时该模型也值得在其他区借鉴采用。

猜你喜欢
沙坪坝区阶数口病
确定有限级数解的阶数上界的一种n阶展开方法
手足口病那些事
警惕手足口病
在抗疫中发展的重庆市沙坪坝区中医院
《碎》设计素描
一个含有五项的分数阶混沌系统的动力学分析
创甲路上奋力前行的沙坪坝区中医院
复变函数中孤立奇点的判别
城市园林绿化管理存在的问题及对策——以沙坪坝区为例
肠道病毒71型感染所致危重症手足口病的诊治分析