张 丽 相晓妹 张水平△ 宋 晖 董 敏 米白冰 党少农△
【提 要】 目的 探讨ARIMA乘积季节模型、Holt-Winters季节模型、多层感知器模型在出生缺陷发生趋势预测中的可行性。方法 本文采用2009年10月至2016年9月西安市妇幼保健院出生缺陷监测及围产儿数据进行研究。选择2009年10月至2015年8月出生缺陷月发生率时间序列进行模型拟合,应用2015年9月至2016年9月出生缺陷月发生率对模型进行评价。 结果 三种模型均通过了检验。ARIMA(0,0,1)(0,1,1)12模型预测平均绝对误差和相对误差分别为11.64和0.11。Holt-Winters加法模型预测平均绝对误差和相对误差分别为14.21和0.14。Holt-Winters乘法模型预测平均绝对误差和相对误差分别为16.64和0.16。多层感知器模型预测平均绝对误差和相对误差分别为20.58和0.20,通过比较模型预测能力,最优模型为ARIMA(0,0,1)(0,1,1)12。结论 ARIMA乘积季节模型更加灵活,结果可能较优。同时,随着预测时间的延长,模型预测的准确性降低。
出生缺陷是胚胎或胎儿发育过程中结构、功能或代谢异常,是婴幼儿死亡及致残的主要原因[1]。随着儿童传染病的显著控制,出生缺陷已成为影响儿童健康的重要因素,其流行状况受到遗传、社会环境和生活方式等多种因素的影响[2],在预测中难以综合考虑。目前,疾病预测方法众多,如灰色模型、神经网络模型、时间序列模型等。其中,时间序列预测是基于对象历史数据变化规律,用该变量以往资料建立模型并外推的方法,时间是替代了各种影响因素的综合效应[3]。目前ARIMA模型主要用于传染病预测,在妇幼卫生中主要用于孕产妇及婴幼儿死亡预测[4],出生缺陷预测较少见[5],可能由于出生缺陷病因复杂等原因,模型适用性值得考虑。本研究选取ARIMA乘积季节模型、Holt-Winters季节模型和多层感知器模型,对出生缺陷发生趋势展开动态预测,探讨三种模型在出生缺陷发生趋势预测中的可行性,并比较其拟合能力。
出生缺陷及围产儿数据来源于西安市妇幼保健院,以2009年10月至2016年9月西安市所有产科医院住院分娩的孕满28周至产后7天内的围产儿(包括活产、死胎、死产、治疗性引产及7天内死亡的新生儿)为监测对象。
按《中国出生缺陷监测方案》要求,采用以医院为基础的监测方案。监测年度按“3+1” 模式(当年前3季度数据加前一年第4季度数据作为该年全年数据)进行统计,采用全国统一的《出生缺陷儿登记卡》和《围产儿数季报表》收集数据,监测缺陷类型以体表先天畸形和先天性心脏病为主,分类标准参考国际疾病分类(ICD-10)。
本研究应用ARIMA乘积季节模型、Holt-Winters季节模型和多层感知器模型对西安市出生缺陷月发生率趋势开展动态预测,探讨三种模型在出生缺陷发生趋势预测中的可行性。
(1)ARIMA乘积季节模型
ARIMA乘积季节模型,即ARIMA(p,d,q)(P,D,Q)s模型,能综合考虑季节、趋势、随机干扰等成分,各参数意义如下:非季节回归阶数p、非季节差分阶数d、非季节移动平均阶数q、季节自回归阶数P、季节差分阶数D、季节移动平均阶数Q、季节长度s[6]。建立该模型可归纳为4个步骤。①数据平稳化:对序列平稳性判断及非平稳序列平稳化。若序列不平稳,选择合适的差分提取原序列中周期性和趋势变动等信息,以此确定d和D。②模型识别:考察差分后序列的自相关和偏自相关图,确定模型阶数p和q,参数P和Q超过2阶的情况少见,可从低到高逐个尝试。季节长度s可由疾病背景分析得到。③参数估计与模型检验:采用Box-Ljung统计量检验残差是否为白噪声序列,若差异有统计学意义,则残差非白噪声序列,说明残差中还存在有用信息未被提取,需对原模型进行改进,转向步骤②,重新选择模型拟合。白噪声检验P<0.05差异有统计学意义。若两个或两个以上模型通过检验,通过BIC等拟合优度指标选择最优模型,BIC越小模型拟合程度越好。④模型评价:利用最优模型预测,并用实际数据进行验证,评价模型是否恰当。
(2)Holt-Winters季节模型
Holt-Winters季节模型是较高级的指数平滑方法,可同时修正时间序列的季节性和倾向性,并能将随机波动的影响适当过滤掉,特别适于含趋势和季节变化的时间序列。Holt-Winters季节模型在每个周期中采用一个水平分量、一个趋势分量及一个季节分量三个权重来更新分量。水平和趋势分量初始值通过对时间进行线性回归得到。季节分量初始值使用去除趋势后数据的虚拟变量回归得到。当水平分量和季节分量相乘时,为乘法模型,当二者相加时,为加法模型[7]。
(3)多层感知器人工神经网络模型
多层感知器模型(MLP)是应用最多的人工神经网络,由输入层、隐含层和输出层构成,即信号从输入层输入,经隐含层传给输出层,由输出层得到输出信号[8]。MLP最常用误差反向传播算法,其过程由信号正向传播与误差反向传播组成。正向传播时,输入样本从输入层传入,经各隐含层处理后,传向输出层。若输出层实际输出与期望输出不符,则转入误差反向传播阶段。误差反传是将输出误差以某种形式通过隐含层向输入层逐层反传,并将误差分摊给所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权重值的依据。这种信号正向传播与误差反向传播的各层权值调整过程,周而复始,对权值不断修正,使模型实际输出更接近期望输出。
(1)数据平稳化
对2009年10月至2015年8月出生缺陷发生率做时序图,呈上涨趋势,提示为非平稳序列。对原始序列进行1阶12步季节差分提取其季节和趋势影响,得到一个近似平稳的序列,基本符合ARIMA模型对平稳性的要求。对差分后序列进行ADF单根性检验,结果显示P<0.05,说明差分后为平稳时间序列。
(2)模型识别
根据差分变换次数及出生缺陷季节等因素,初步确定以12个月为周期的ARIMA(p,0,q)(P,1,Q)12模型。四个待定参数p、q和Q、P的确定,采用从低阶至高阶逐个尝试,比较模型拟合优度等参数确定。本研究在确定d=0,D=1后,测试了待定参数p、q和Q、P分别取0,1,2的所有模型,共81个。
(3)参数估计及模型诊断
在尝试的81个模型中,共39个模型通过了白噪声检验。参考模型拟合优度指标BIC等,得到最优模型为ARIMA(0,0,1)(0,1,1)12,其参数估计结果见表1。对其残差值进行验证,自相关和偏自相关系数基本在可信区间范围内(图1)。
表1 最优模型ARIMA(0,0,1)(0,1,1)12 参数估计结果
注:ACF为自相关,PACF为偏自相关
利用时间序列预测功能中的指数平滑法,以2009年10月至2015年8月出生缺陷月发生率数据为基础,分别拟合Holt-Winters季节加法和乘法模型,对两个模型残差分别作ACF和PACF图(图2),结果显示残差自相关和偏自相关系数基本在可信限内,同时Ljing-box统计量差异无统计学意义,可认为残差序列为白噪声序列,两模型成立。Holt-Winters季节加法和乘法模型R2分别为0.504和0.377。
注:ACF为自相关,PACF为偏自相关
本研究MLP参数中以双曲正切函数为连接函数,其余为默认选项,模型结构见图3。模型残差图显示残差在0两侧分布均匀,认为模型拟合成功。将构建的模型导出,运用该模型预测2015年9月至2016年9月出生缺陷发生水平。
注:隐藏层激活函数:双曲正切;输出层激活函数:恒等式
图3MLP神经网络模型结构
利用3种模型对西安市2015年9月至2016年9月出生缺陷发生率进行预测(表2)。ARIMA(0,0,1)
(0,1,1)12乘积季节模型绝对误差和相对误差范围分别是1.89~27.26和0.02~0.29,平均绝对和相对误差为11.64和0.11。Holt-Winters加法模型绝对误差和相对误差范围分别是2.02~31.30和0.02~0.35,平均绝对误差和相对误差分别为14.21和0.14。Holt-Winters乘法模型绝对误差和相对误差范围分别是4.75~32.95和0.04~0.34,平均绝对误差和相对误差分别为16.64和0.16。MLP模型绝对误差和相对误差范围分别是4.77~42.87和0.04~0.48,平均绝对误差和相对误差为分别20.58和0.20。通过比较绝对、相对误差范围,平均绝对、相对误差,最优模型为ARIMA(0,0,1)(0,1,1)12模型。该模型2015年9月至2016年2月预测的相对误差在15%内,且波动较小,提示预测相对准确;2016年3月至2016年9月预测波动较大,提示预测结果准确性相对降低。
表2 2015年9月至2016年9月西安市出生缺陷发生率预测结果(1/万)
本研究选取ARIMA模型、Holt-Winters模型及MLP模型建模,通过比较ARIMA(0,0,1)(0,1,1)12模型、Holt-Winters加法模型、Holt-Winters乘法模型和MLP模型平均相对误差,对模型预测结果进行评价,三个模型的优劣顺序是:ARIMA(0,0,1)(0,1,1)12模型> Holt-Winters加法模型> Holt-Winters乘法模型>MLP模型。
时间序列预测模型是基于对象历史数据变化规律,用变量以往统计资料建立模型并外推的预测方法,时间是替代了各种影响因素的综合效应,其中,ARIMA模型主要用于传染病预测,用于出生缺陷较少见。本研究应用西安市出生缺陷数据拟合的ARIMA模型通过了检验,说明在出生缺陷时间趋势预测中ARIMA模型值得考虑[5]。ARIMA模型预测准确性较Holt-Winters模型略高,其原因可能是ARIMA模型可调整参数,能充分提取序列长期趋势、周期性、随机波动等信息,且能判断这些因素间确切作用关系[9]。而Holt-Winters模型仅能提取序列确定性信息,对随机波动信息浪费严重[10]。在本研究中,ARIMA季节模型预测近期结果较准确,而远期预测结果准确性降低,提示随着时间推移,预测准确性降低。因此,在实际应用中,应及时掌握和更新出生缺陷发病数据库,随着数据动态变化,及时补充更新数据进行模型再次拟合,才能对出生缺陷防控提供一定指导。
相比ARIMA模型,Holt-Winters模型也有其优点。Holt-Winters模型操作较简便,重要参数经系统多次比较,自动产出最优参数,故当序列中确定性信息比较强劲时,选择Holt-Winters模型预测也会得到不错的预测结果。因出生缺陷发生率受多种因素影响,有时利用传统线性数学模型难以进行理想拟合。近年作为非线性建模方法的人工神经网络,具自组织、自学习、非线性逼近能力和容错能力强的优点,可尝试用于出生缺陷的预测[11]。本研究中MLP在近期预测误差均在15%以内,远期预测误差均大于15%,提示在出生缺陷发生的近期预测中多层感知器模型值得考虑。
出生缺陷预测以往多使用灰色模型,因其所需数据量少,不受数据分布影响,且预测精度较高。李玲等应用灰色模型预测山东省围产儿出生缺陷发生率,平均相对误差为7.2%[12]。刘晓东等应用灰色模型预测中国出生缺陷发生率平均误差率为1.8%[13]。孙金杰等应用灰色模型模拟预测某省出生缺陷发生率平均误差为6.98%[14]。当序列数据变化较急剧时,灰色模型构造的参数值可能会产生较大的滞后误差,模型偏差较大,灰色模型对出生缺陷的预测误差似有较大的地域或人群波动,可能与之有关,后续我们也将进一步评估灰色模型在西安出生缺陷预测中的应用价值。ARIMA模型预测西安市出生缺陷发生率的平均误差率为11%,较灰色模型略高,可能与本研究预测周期较长有一定关系,但在可接受范围内。WANG JF等应用支持向量机预测陕西省神经管畸形发生水平,预测对象是神经管畸形在抽样村的发生等级,训练数据集和测试数据集预测精确度分别为71.50%和68.57%[15]。另外基于危险因素,使用神经网络模型预测个体水平上出生缺陷是否发生也是值得考虑的问题[16]。
本研究从实践出发,寻找预测误差在可接受范围内且实际操作更为简便的出生缺陷预测模型,通过比较预测误差和建模过程,Holt-Winters模型及MLP模型预测误差较大,预测精度相对较低,而ARIMA模型在出生缺陷的应用中有一定的预测价值。