基于ARIMA模型对广州市5岁以下儿童死亡率的预测研究

2020-07-08 00:50
中国医院统计 2020年3期
关键词:置信区间差分残差

刘 涛

广东药科大学附属第一医院病案统计科,510080 广东 广州

5岁以下儿童死亡率(under-five mortality rate,U5MR)是反映儿童健康状况的敏感指标之一[1],同时也是衡量一个国家或地区的儿童健康水平、社会经济发展水平、环境状况、医疗水平、妇幼保健水平的重要综合指标之一。根据联合国千年宣言,从2000年到2015年的15年内,U5MR要减少三分之二,2000年我国的U5MR为35.70‰,在2015年减少至10.70‰,U5MR减少了70%,达到了联合国千年宣言的目标。U5MR的计算公式可表示为:(同年5岁以下儿童死亡数/同年5岁以下儿童总数)×1 000‰。根据2001年到2017年共17年间广州市的U5MR数据,建立ARIMA时间序列模型,通过建立的模型预测未来两年广州市的U5MR。预先掌握U5MR可能的变化状况,为制定相关的干预措施与卫生政策提供决策依据[2]。

1 资料与方法

1.1 资料来源

为保证数据的真实可靠性,所有数据均从广州市卫生信息中心的卫生统计年鉴及各医疗机构上传至卫生信息中心的统计报表中获取。由于研究选用的广州市U5MR数据在2001年之前普遍缺失或者缺乏登记导致数据不可用,且2018年数据尚未公布,故选用2001年至2017年的可靠数据作为观察值。

1.2 方法

使用Excel对数据进行汇总整理,通过SPSS 19.0构建ARIMA模型,并根据得到的ARIMA模型对待研究数据进行数据处理、建模、检验以及预测分析[3]。

建立ARIMA模型的方法如图1所示:

图1 建立ARIMA模型流程图

2 结果

2.1 数据平稳化与模型定阶

将收集到的2001—2017年广州市的U5MR时间序列汇总整理,绘制原序列时序图(见图2)。得知广州市U5MR随着时间的推移,呈现明显下降趋势,由2001年的10.51‰降低至2017年的3.03‰,属于非平稳序列,需要进行差分平稳[4]。通过SPSS预测模型中的差分模型,原序列经二阶差分后序列表现为平稳(见图3)。由图3可知2阶序列在均值附近波动,表现平稳,因此可以确定差分d的阶数等于2, ARIMA模型为(p,2,q)。

图2 广州市U5MR时间序列图

图3 经过二阶差分后的广州市U5MR序列图

2.2 模型识别

使用SPSS19.0中的分析预测模型,对图3进行自相关分析,建立ACF图与PACF图,见图4、图5。由图4可知ACF在一阶以后快速回落至置信区间以内;由图5可知PACF在一阶之后在置信区间内缓慢变化,据此判断ACF一阶截尾,PACF拖尾。初步判断得到(0,2,1)、(0,2,0)、(1,2,0)、(1,2,1)四种ARIMA模型。

图4 二阶差分序列自相关图

图5 二阶差分序列偏自相关图

2.3 模型选择

对各备选ARIMA模型进行拟合效果进行评价与比较(见表1),根据比较结果得出,唯有 (1,2,0) 模型参数检验P小于0.05,且标准化BIC值与平稳R2均在可接受范围内,因此研究适用ARIMA(1,2,0)模型。

表1 各个模型拟合精度比较结果

2.4 模型残差检验

对模型进行LB-Q检验、对残差序列进行S-W检验,得到LB-Q检验的P值的最大值等于0.791,最小值等于0.227,均大于显著水平(α=0.05),说明残差之间无相关性[5]。S-W检验P=0.17,大于显著水平(α=0.1),说明残差服从正态分布[6]。因此可以得出残差是纯随机白噪声序列。说明模型已提取出原时间序列中所包含的信息,ARIMA(1,2, 0)模型对该序列拟合成功。

2.5 模型的回顾性分析及预测

在得出拟合的ARIMA模型后,根据2001年到2016年的时间序列,对拟合模型预测的2017年广州市的U5MR与实际的2017年U5MR进行比较分析,结果得出2017预测值为2.72‰。同实际值3.03‰比较,模型拟合误差在10%以内,且拟合的模型与原时间序列的走向大致相仿,原时间序列均落在拟合模型的置信区间之中,可以认为ARIMA模型(1,2,0)拟合程度较高,能够较为准确地对广州市未来的U5MR进行预测。根据拟合模型的预测结果,广州市2018年的U5MR为(2.62±1.21)‰,2019年的U5MR为(2.22±2.20)‰,2020年的U5MR在(1.77±2.64)‰之间,见图6。

图6 2001—2017广州市U5MR实际值与模型预测及其95%置信区间对比

3 讨论

从2001—2017年广州市的U5MR观察值中可以直接得出广州市的U5MR总体呈现明显下降趋势,结合国家统计局U5MR的数据(从2001年的35.9‰下降至2017年的9.1‰),广州市的下降趋势幅度(平均每年0.41‰)同比全国较低(平均每年1.675‰)。这是因为广州市的U5MR(2017年3.03‰)远低于全国平均值(2017年9.1‰)所导致,说明广州市在儿童疾病安全卫生工作方面领先于全国平均水平。

U5MR是衡量一个国家或地区的儿童健康状况、社会、经济、环境的综合卫生指标,反映了我国未成年人90%以上的死亡情况[7],因此U5MR的准确预测结果是为科学客观地对社会、经济、卫生等方面进行决策的重要依据。由于U5MR受社会、经济、文化、环境、卫生状况等多种复杂因素影响,因此使用ARIMA模型利用观察值随时间的动态变化综合替代了各方面因素的影响,对观察值构成的时间序列进行预测[8]。该模型具有准确度较高,适合各种实际环境的优点,但同时也要求数据必须是随时间有着趋势变化的序列,并要求此变化趋势在短期未来持续保持,而且需要收集至少10个以上的观察值。本次预测分析在保证数据来源真实可靠的前提下收集了广州市2001年到2017年共17年U5MR的数据样本,以提供足够的样本量,并且观察值均落在所求的拟合模型ARIMA(1,2,0)的置信区间之内,说明拟合效果比较好,该模型可以较为准确地广州市U5MR的未来变化情况进行预测。

猜你喜欢
置信区间差分残差
RLW-KdV方程的紧致有限差分格式
基于双向GRU与残差拟合的车辆跟驰建模
Maxwell分布参数的最短置信区间研究
p-范分布中参数的置信区间
数列与差分
多个偏正态总体共同位置参数的Bootstrap置信区间
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
列车定位中置信区间的确定方法
综合电离层残差和超宽巷探测和修复北斗周跳