我国新发HIV感染者时空分布特征分析(2004—2017年)

2021-11-06 14:36曾志平左中宝王妙婵徐爱芳武静
国际流行病学传染病学杂志 2021年5期
关键词:季节性感染者季节

曾志平 左中宝 王妙婵 徐爱芳 武静

杭州市西溪医院检验科310023

截至2019年底,全球有约3 800万HIV感染者,其中2019年新发感染170万例[1]。2019年1—10月,我国共检测HIV2.3亿人次,新报告HIV感染者13.1万例,至2019年10月底,全国报告存活的HIV感染者共95.8万,是威胁我国居民健康的主要问题之一[2]。虽然国内有部分地区描述分析了当地的HIV新近感染者的时空特征[3-4],但基于国家层面仅局限于艾滋病分布时空演化及其影响因素研究[5-6]。本研究拟采用Joinpoint模型、时间序列分析以及空间分析预测HIV的时空流行特点,为HIV的防控提供科学的指导,以进一步减少HIV的产生。

资料与方法

一、资料来源

2004—2017年新发HIV感染者数据来自中国疾病预防控制中心公共卫生科学数据中心(http://www.phsciencedata.cn/Share/edtShareNew.jsp?id=39208),包括全国31个省级行政区域(不含港澳台地区);人口学相关数据来自国家统计局的中国统计年鉴(http://www.stats.gov.cn/tjsj/ndsj/)。

二、研究方法

1.Joinpoint回归

利用Joinpoint软件分析2004—2017年HIV发病趋势的持续变化。网格搜索法用于寻找显著趋势,蒙特卡洛置换检验方法模拟每个趋势的连接点。总体时间趋势采用年平均变化率(AAPC)计算。

2.时间序列估计

本研究采用季节自回归综合移动平均(SARIMA)模型对我国HIV发病流行进行预测。SARIMA模型可以写成(p,d,q)(P,D,Q)S的形式,其中p、d、q分别表示非季节性自回归阶数、非季节性差分和非季节性滑动平均阶数;P、D、Q分别表示季节性自回归阶数、季节性差分和季节性滑动平均阶数;s表示季节性周期(本研究s=12)。时间序列可以分为3个部分:季节效应、趋势曲线和不规则噪声。季节效应是指每年以相似方式重现的趋势波动,趋势曲线是时间序列的长期运动,不规则噪声指去除趋势曲线和季节效应后的剩余分量。

SARIMA模型的构建可以分为以下步骤:首先,用增广Dickey-Fuller(ADF)检验时间序列的平稳性;其次,通过自相关函数(ACF)图、偏自相关函数(PACF)图和逆自相关函数(IACF)图确定模型参数(p、d、q、P、D和Q),通过对模型参数的变换,构造了一种替代SARIMA模型;最后,利用Akaike信息准则(AIC)和Schwartz-Bayesian准则(SBC)来确定不同SARIMA模型的适合度。最优模型具有最低的AIC和SBC值,并通过Box-Ljung检验来检验最终模型的残差是否与时间无关。用平均绝对误差(MAE)和平均绝对百分比误差(MAPE)检验模型的预测有效性。本次研究使用2004—2016年的HIV发病率构建SARIMA模型,2017年的数据来验证模型的预测效果。

3.空间自相关分析

计算HIV发病率的全局Moran’sⅠ,以检测空间聚类模式。Moran’sⅠ值为-1~1,而接近1的值表示空间正相关,接近-1的值表示空间负相关,0表示随机分布。计算局部Moran指数,并进行热点分析以确定聚类的位置。利用局部Moran指数确定空间自相关,检测具有相似相邻特征和异常值的空间聚类。当发病率有类似的低值或高值时,这些区域被认为具有正自相关(低-低或高-高自相关),反之则定义为负自相关(低-高或高-低自相关)。

三、统计学分析

Joinpoint 4.7.0.0软件用来观察2004—2017年HIV发病趋势;使用SAS 9.4软件建立SARIMA模型并预测HIV发病率;使用Arcgis 10.2软件观察HIV空间分布。P<0.05认为差异有统计学意义。

结 果

一、变化趋势

从2004年1月至2017年12月,本研究共纳入HIV感染者748 019例,年平均发病数为53 430例。HIV发病率从2004年的1.02/10万上升到2017年的6.87/10万,最高发病率为2017年。Joinpoint最终选择模型为1分段点模型(P=0.87),分段点为2006年。2004—2006年,平均百分比变化率(APC)为44.99(95%CI:18.31~77.63,P<0.01);2006—2017年,APC为10.04(95%CI:9.24~10.92),HIV发病率一直呈上升趋势,见图1。2004—2017年,14年的年平均百分比变化率为14.82(95%CI:11.74~18.02)。

图1 2004—2017年中国HIV发病率的变化趋势Joinpoint回归分析

2.时间趋势及预测

在2004—2017年共14年中HIV的发生呈明显季节性,见图2,并且在12个月内季节周期保持波动。白噪声检验的结果(χ2=627.87,P<0.01)否定了白噪声的零假设。增强Dickey-Fuller(ADF)检验不显著(τ=-2.13,P>0.05,lag=1),对发病率进行一阶12期的季节性差分。季节拆分后的HIV发病率是稳定的(τ=-15.61,P<0.01,lag=1),以此构建SARIMA模型(图3)。根据PACF、ACF和IACF的图,最佳ARIMA模 型 为(0,1,1)(0,1,1)12,可 以 写 成(1-B)(1-B12)Xt=εt(1-0.704 74B)(1-0.275 82B12),该模型拥有最小的AIC(148.10)和SBC(154.03)。残差间无显著相关(lag=6,χ2=4.39,P>0.05),残差为白噪声,以此构建的SARIMA模型预测2017年的发病率,图2展示了预测和实际值的分布,平均绝对误差(MAE)和平均绝对百分比误差(MAPE)分别为0.41和0.07,预测值与2017年原始发病率数据吻合较好。剔除季节效应和不规则噪声对HIV的影响后,HIV发病曲线变得更加平滑(图2),发现2004—2017年HIV发病率呈上升趋势。

图2 2004—2017年中国HIV的实际发病率及随季节变化发病率

图3 时间序列一阶12季节拆分后的自相关图

三、空间聚类分布与地理特征

除西藏地区在2004年无HIV病例报告外,其余年份和地区在这14年中均有病例报告。发病率最低的地区为天津(2004年,0.03/10万),发病率最高的为新疆(2017年,26.81/10万)。新疆在2006年和2008—2017年的报告发病率均大于15/10万,是我国HIV报告发病率最高的地区;云南省在2006—2017年报告HIV发病率均大于15/10万;四川、贵州、重庆和北京等地在这13年内HIV的报告发病率逐年上升,而广西的HIV报告发病率在2004—2012逐年上升,在2012—2017年则是逐渐下降。

根据全局自相关分析,2004—2017年新发HIV感染者的分布具有空间相关性(表1)。Moran指数在0.14~0.36之间,2016年指数最高(Moran指数=0.36,Moran Z-评分=3.65,P<0.01)。根据局部自相关分析结果,2004—2017年共有37个高-高聚集、12个高-低聚集和4个低-高聚集,详见表2。2004年云南、广西和贵州表现为高-高聚集,2005—2012年,云南和广西表现为高-高聚集;2013—2017年,由开始的云南,广西和贵州3个地区高-高聚集到2017年的云南、广西、贵州、重庆和四川5个地区高-高聚集。除了2004年和2016年,新疆在其余年份均表现为高-低聚集;西藏在2004—2009以及2012—2015年表现为低-高聚集。HIV传播热点主要集中在我国西南地区,包括广西、云南、贵州、四川和重庆,该区域主要为高-高聚集。

表1 2004—2017年中国新发HIV感染者全局自相关分析

表2 2004—2017年中国新发HIV局部自相关分析

讨 论

我国自报道首例艾滋病例以来,HIV的时间和空间流行趋势一直在发生变化[5,7-10]。本次研究显示,2004年1月至2017年12月,我国共报告748 019例HIV感染者,年平均发病人数为53 430例,为我国的公共卫生带来了巨大的负担。了解HIV的时空流行病学模式有助于采取针对性的防控措施,进一步控制我国HIV病例数量。

本研究显示,我国2004—2017年HIV发病率的年平均百分比变化率为14.82(95%CI:11.74~18.02),从2004年的1.02/10万上升到2017年的6.87/10万,升高了5.7倍。Joinpoint模型最终选择为1分段点模型,2004—2006年,APC为44.99(95%CI:18.31~77.63);2006—2017年,APC为10.04(95%CI:9.24~10.92),2006年后HIV发病率升高速度下降可能与我国采取的一系列政策有关[11-12]。HIV发病率在2004—2017年里始终呈上升趋势,这也与之前的研究[5,9]相吻合。

时间序列分析表明,我国HIV发病率一直处于增长阶段。经过模型的建立和筛选,最终选择的SARIMA为(0,1,1)(0,1,1)12,可以写成(1-B)(1-B12)Xt=εt(1-0.704 74B)(1-0.275 82B12),预测的发病率结果与真实的结果一致性较高。剔除时间序列模型的季节效应和不规则噪声对HIV发病率的影响后,HIV发病曲线变得更加平滑,且一直处于上升趋势。此外,既往的研究[6,13]表明,艾滋病的发病率存在季节性,这也与本研究的结论一致。

本研究显示,HIV传播热点主要集中在我国西南地区,包括广西、云南、贵州、四川和重庆,该区域主要为高-高聚集,这可能与我国各地区经济、交通、医疗水平发展的不平衡[14-15]有关系,同时我国HIV的发病率呈现一个从2004年的“少数地区低发病率”到2017年的“多数地区高发病率”的特点。因此在未来的防控措施上,既要保持对新疆、云南、四川和贵州等高发病率地区的防控,还要防止疫情进一步向邻近地区扩散,做好周边地区HIV发病的防控,这些高发病率地区需要更多的政策支持和援助。值得注意的是,广西HIV报告发病率在2004—2012年逐年上升,在2012—2017年则是逐渐下降,这可能与该地区加强干预防控策略[16-17]有关。

由于本研究的数据来源于被动监测系统的报告感染,不可避免地低估了HIV病例总数,此外一些地区的诊断水平可能导致对HIV发病率的低估。在今后的研究中,有必要考虑以上因素,以提高数据分析的正确率。

利益冲突 所有作者均声明不存在利益冲突

猜你喜欢
季节性感染者季节
粕类季节性规律:豆粕篇
艾滋病感染者就医和就业歧视状况调查
季节性需求放缓 钾肥价格下行
我喜欢的季节7
季节蠕变
蔬菜价格呈季节性回落
季节的变换
远离季节性过敏
花的季节
HIV感染者48例内镜检查特征分析