张宪策,曹艳,尹晔
鞍山市疾病预防控制中心传染病防制科,辽宁鞍山114000
手足口病(hand-foot-mouth disease,HFMD)是由肠道病毒[以柯萨奇病毒A 组16 型(Coxsackievirus group A 16,CV-A16)、肠道病毒71 型(enterovirus A71,EV-A71)多见]引起的急性传染病,多发生于5 岁以下儿童。自从2008 年HFMD 被列为丙类法定传染病以来,辽宁省鞍山市HFMD 一直呈高发[1]。HFMD发病强度高,传播途径广,影响因素多,发病机制复杂,疾病负担较重,其预防控制一直备受社会关注[2-4]。国内多采用短期季节性自回归移动平均模型(auto regressive integrated moving average model,ARIMA model)对HFMD 进行预测分析,本研究采用近10 年数据对鞍山市HFMD 发病情况进行分析,探讨采用长期数据应用季节性ARIMA 模型进行预测的可行性,为建立鞍山市HFMD 发病预测模型提供依据。
1.1 资料来源 HFMD 月发病数流行病学数据来源于“中国疾病预防控制信息系统”,选取发病日期2009 — 2019 年鞍山市HFMD 临床病例和实验室确诊病例;人口学数据资料来源于鞍山市年鉴;病原学监测数据来源于鞍山市疾病预防控制中心检测报告。
1.2 分析方法 HFMD 有很强的季节性,应用ARIMA模型中的复合季节ARIMA 乘积模型(p,d,q)(P,D,Q)S建模,其中p 和P 分别为自回归阶数和季节自回归阶数,q 和Q 分别为移动平均项数和季节移动平均项数,d 和D 分别为差分阶数和季节差分阶数,s为季节周期。
季节性ARIMA 模型建模:①序列平稳性:建立2009 年1 月— 2019 年6 月时间序列图,通过数据变换或差分,使原序列满足ARIMA 模型平稳可逆;②模型识别:通过自相关函数(auto correlation function,ACF)和偏自相关函数(partial autocorrelation function,PACF)时间序列定阶;③参数估计和模型诊断:用最小二乘法估计模型参数,检验未知参数是否有统计学意义,对实际观测值和拟合值的残差序列进行Ljung-Box Q白噪声检验,P>0.05 为表面残差白噪声;④模型预测:使用构建的季节性ARIMA模型预测2019 年7 — 12 月鞍山市HFMD 月发病例数,并评估预测效果。
1.3 统计学分析 利用Excel 2010 建立2009 —2018 年鞍山市HFMD 月发病数时间序列数据库,描述性分析鞍山市HFMD 流行病学基本情况;应用SPSS 19.0 统计学软件,采用卡方检验法分析HFMD发病趋势和病原学监测情况,并建立季节性ARIMA模型预测2019 年7 — 12 月HFMD 月发病例数,采用Ljung-Box Q检验法检验序列残差白噪声,水准以P<0.05 为差异有统计学意义。
2.1 流行病学概况 2009 — 2018 年鞍山市HFMD总报告数32 863 例,年均发病率为90.55 / 10 万,发病周期为2 年,发病率总体呈递减趋势,趋势性卡方比较差异有统计学意义(χ2=2 234.798,P= 0.000)。2009 — 2018 年HFMD 临床病例数31 072 例,实验室确诊病例1 791 例。不同年份病原优势菌株交替流行,2012 和2016 年的优势株为CV-A16,2009、2010 和2014 年的优势株为EV-A71,2011、2013、2015 和2018 年病原学分型以其他肠道病毒为主。1 791 例实验室确诊病例中,包括CV-A16 683 例(38.13%),EV-A71 435 例(24.29%),其他肠道病毒673 例(37.58%),不同型别阳性检出率比较,差异有统计学意义(χ2= 99.035,P= 0.000)。见表1。
2.2 时间序列分析 利用鞍山市2009 年1 月—2019 年6 月HFMD 月发病数绘制时间序列图,发病周期为2 年,在6 — 9 月单峰高发,属于非平稳序列,见图1。对原始数据进行平方根转化和一阶季节性差分,ACF 图呈拖尾衰减,PACF 呈一步截尾,转换后时间序列平稳,见图2。
表1 2009 — 2018 年鞍山市HFMD 发病情况Tab.1 HFMD incidence in Anshan City from 2009 to 2018
图1 鞍山市2009 — 2019 年HFMD 发病数时间序列图Fig.1 Time series chart of HFMD incidence in Anshan City from 2009 to 2019
图2 平方根转换和一阶季节差分后的ACF(A)和PACF(B)图Fig.2 ACF(A)and PACF(B)diagrams after square root transformation and first order seasonal difference
2.3 季节性 ARIMA 预测模型建立对原始数据进行平方根转换和季节一阶差分,因此确定d = 0,D =1,根据HFMD 存在季节性特征,制作以12 个月为时间周期的季节模型ARIMA(p,0,q)(P,1,Q)12。使用SPSS 19.0 软件模型中预测模块的专家建模,条件选择仅限ARIMA 模型,确定最优模型为ARIMA(1,0,1)(0,1,1)12。经检验,Ljung-Box Q= 12.129,P= 0.669 >0.05,提示残差序列无相关性,残差为白噪声,见图3。模型拟合R2= 0.857,标准化BIC = 2.979,表明模型拟合度较好,可用来进行预测分析。
2.4 预测结果和评估 经ARIMA(1,0,1)(0,1,1)12模型对鞍山市HFMD 月发病数进行预测,均方根误差为4.16,平均绝对误差为2.99,平均绝对误差百分比为42.73%,2019 年7 — 12 月预测值分别为169、314、226、159、81 和26,见表2。实际观测值与拟合值波动较一致,均在拟合值95%可信区间内,见图4。对2019 年7 — 12 月的实际值与预测值进行比较,结果显示,两组差异无统计学意义(t= 0.220,P= 0.830)。
图3 ARIMA(1,0,1)(0,1,1)12 残差序列的ACF 和PACFFig.3 ACF and PACF of ARIMA(1,0,1)(0,1,1)12 residual sequences
表2 鞍山市2019 年7 — 12 月HFMD 月发病数实际值与预测值的比较Tab.2 Comparison of actual and predicted values of monthly incidences of HFMD from July to December in 2019 in Anshan City
图4 鞍山市2009 — 2019 年HFMD 月发病数ARIMA 预测模型Fig.4 ARIMA model for prediction of monthly incidence of HFMD in Anshan from 2009 to 2019
2009 — 2018 年鞍山市HFMD 平均发病率为90.55 / 10 万,高于辽宁省(66.56 / 10 万)[5],低于全国HFMD 报告发病率(134.59 / 10 万)[6],这可能与HFMD 受气象因素、预防意识、人口密度等因素影响有关[2,7-9]。不同年份病原体的优势株不同,2009 — 2016 年鞍山市HFMD 病原EV-A71 构成比有减少趋势,其他肠道病毒感染构成比逐渐增加,2017 年EV-A71 成为优势株,2018 年其他肠道病毒再次成为优势株。国内多地报道[10-12],重症和死亡病例中,EV-A71 型感染占绝对优势,提示病原学监测可对HFMD 疫情研判和预测预警提供科学依据。
本研究结果显示,2009—2018 年鞍山市HFMD疫情呈总体下降趋势,流行周期为2 年,2016 年后下降趋势较明显,每年6 — 9 月单峰高发,其流行具有明显的季节性,这与辽宁地区的发病模式相同[5,13]。首先,HFMD 发病率的时间异质性可能与平均温度、累积降水、相对湿度和气压等气象因素相关[2,13-14];其次,2015 年12 月HFMD EV-A71 疫苗获准上市[15],随着EV-A71 疫苗接种率的上升,EV-A71 所致HFMD的发病率呈明显下降趋势。
通过对鞍山市2009 年1 月—2019 年6 月126个HFMD 逐月发病数进行分析,经检验评估,建立季节性ARIMA(1,0,1)(0,1,1)12模型,从预测结果看,平均相对误差较低(9.97%)[16-17],对2019 年7 —12 月的实际值与预测值进行t检验比较显示,两组数据拟合较好,可认为应用长期数据建立季节性ARIMA模型对HFMD 预测效果较好。但也应注意在对2019年7 —12 月HFMD 逐月发病数进行预测时,可信区间在逐渐变宽,提示应用季节性ARIMA 模型适合对鞍山市HFMD 的月发病数进行短期预测。
ARIMA 模型在拟合时,只需考虑时间序列变量,且SPSS 19.0 软件专家建模器构建乘积季节性模型拟合效果较好,高效简便[17-18],适合基层专业技术人员用于疫情分析。同时也应注意,模型作为处理数据的一种方法,发映的是疾病发展的变化趋势,在风险评估中,还要考虑HFMD 会受到病原学、气象、环境和社会发展程度等因素的影响[2,7,18]。因此,在对HFMD 进行预测时,需在对已建立的模型不断加入新的修订值的同时,考虑病原学检测结果和气象等因素对HFMD 发病数的影响。