基于不同参数的空间扫描统计量方法在传染病暴发探测中的效果比较*

2014-03-10 08:59李小洲王劲峰杨维中李中杰赖圣杰廖一兰
中国卫生统计 2014年2期
关键词:灵敏度传染病预警

李小洲王劲峰杨维中李中杰赖圣杰廖一兰

基于不同参数的空间扫描统计量方法在传染病暴发探测中的效果比较*

李小洲1王劲峰2△杨维中3李中杰3赖圣杰3廖一兰2

目的根据不同传染病,比较和筛选空间扫描统计量方法适宜的预警参数,从而更好地应用于传染病暴发早期探测预警。方法以2009年湖南省报告的痢疾和山东省报告的手足口病的病例与暴发事件为数据来源,以灵敏度和阳性预测率为评价指标,比较空间扫描统计量30种参数设置方案对不同传染病的预警效果。结果对于痢疾,将4天的病例数按1阶权重取和后再进行空间扫描统计量预警运算,具有最优的预警效果;对于手足口病,将当前病例数采用3天的病例数之和再进行预警运算,具有最佳的预警效果。结论采用空间扫描统计量进行传染病暴发预警时,不同传染病具有不同的最优参数,但下一步应根据传染病的不同发病水平,进一步筛选最优参数。

空间扫描统计量 传染病 早期预警

尽早发现传染病暴发,及时采取有效的控制措施,可有效降低疾病造成的发病和死亡,因此如何在早期探测发现暴发事件是公共卫生领域始终关注的一个热点问题[1]。在2003年SARS暴发后,我国建立了一套基于互联网的国家“疾病监测信息报告管理系统”,该系统使全国各级各类医疗卫生机构可通过互联网,将法定报告传染病的个案信息实时地报告至国家传染病监测数据库[2]。

传染病暴发一般表现为局部范围内的病例数异常上升,但可能发生病例聚集的地区范围无法事先作出预测。空间扫描统计量方法[3-4]是由Dr.Kulldorff提出的一种探测空间聚集性的统计方法,在传染病暴发预警方面也已经有了广泛的应用,例如美国纽约市的症状监测预警系统[5-6]。使用空间扫描方法可以探测到局部的病例聚集区域,发出预警信号,为疾控机构调查核实和防控提供帮助。

已有的研究[7-9]一般将空间扫描统计量方法直接用于各病种的探测,未能够根据不同疾病的特点,设置相应适合的预警参数。因此,本研究根据不同传染病的特点,比较和筛选空间扫描统计量方法不同的预警参数,从而更好地应用于传染病暴发早期探测预警。

数据来源与方法

1.数据来源

本研究选取2009年1月1日至12月31日,“疾病监测信息报告管理系统”中报告的湖南省痢疾和山东省手足口病病例,以及“突发公共卫生事件报告管理信息系统”报告的相应省份和病种的暴发事件作为数据源。

2.方法

(1)空间扫描统计量方法介绍

该方法主要具有三个特点[3-4]:一是考虑了在整个研究区域内,具有患病风险的人口数具有非均匀分布的特点;二是对于聚集区域的范围、位置都不需要预先判断,就可以探测出实际发生聚集的具体位置和范围;三是对于探测到的聚集性区域,可以进行统计推断,帮助用户判断这种聚集是否随机偶然出现。

空间扫描统计量方法的主要步骤如下[3-4]:

首先,列出所有可能发生病例聚集的候选聚集区域。然后,利用各个候选区域已知的病例数和具有患病风险的人口数,一般也可以用该区域的人口普查数据代替,计算出每个候选聚集区域的似然比值。计算似然比值时,需要假定,至少在某一个候选聚集区域内的患病风险值,大于该区域外的患病风险值。其中,具有最大似然比值的候选聚集区域即为最大可能性病例聚集区域。最后,通过Monte Carlo模拟方法对所探测到的最大可能性聚集区域进行统计学检验,计算P值。P值小于设定的预警阈值,即认为该区域存在病例聚集。参照国家传染病自动预警系统的运行方式[1],本研究对各县每天分别进行空间扫描,寻找和判断病例的聚集性区域(包含1个或若干个乡镇),并发出预警信号。

(2)参数设置和测试方案

我们每天都需要把空间扫描统计量方法应用于各乡镇上报的病例数据,以便及时地探测到可能的传染病暴发事件。对于每天病例数的预处理方式和预警阀值P的选择,是本方法在应用中的主要可调整参数。不同的参数设置可能会导致非常不同的预警效果。考虑到不同地区不同疾病的传播规律会有较大的区别,本研究一共设计并提出了30套参数方案。利用已经收集到的病例数据进行测试,希望从中选择出适合特定区域、特定病种的最优参数。每一套参数包括以下三种可调的参数:

(1)为计算当前病例数所取的时间范围。一共需要利用前面多少天的病例数来计算得到病例数当前值?我们设定的预警方案有四种选择,分别是当天数据、当天以及前1天、当天以及前2天、当天以及前3天。利用“疾病监测信息报告管理系统”的个案数据,可以得到每个乡镇的每日报告病例数。利用每个乡镇当天以及前面若干天的报告病例数据,经预处理之后,作为该乡镇的当前病例数,再应用到空间扫描统计量方法中进行探测预警。

(2)对病例数如何预处理。对前面多少天的病例数据进行了何种预处理以得到当前值?如果只利用当天数据,则显然不需要预处理。如果计算当前值考虑到了前面若干天的病例数据,则需要对不同的时间所得到的病例数值赋予不同的权重,然后取和得到新的当前值[10]。我们设c(i)表示某个乡镇在第i天上报的实际病例数,C(i)表示在第i天参与预警运算时的当前值。假设我们利用了当天以及前2天的病例数据,则C(i)=f(c(i-2),c(i-1),c(i)),f()表示某种预处理函数。我们设定的预警方案可以选择三种预处理函数。

其中fs()表示直接取和,f1()表示对每日病例数赋予一阶权重系数,f2()表示对每日病例数赋予二阶权重系数。

(3)预警阈值:分别设定了三种阈值,0.01、0.02、0.03。

将上面的三种参数的不同设定值进行组合,共产生30套不同的预警参数方案,如表1所示。

3.评价指标

本研究中我们对于研究区域(湖南省和山东省)内的每一个县(由若干个乡组成)、每一天分别采用以上设定的30种不同预警参数进行空间扫描。本文中利用“突发公共卫生事件报告管理信息系统”中报告的传染病暴发事件数据作为评判预警信号的参考标准。每起暴发事件信息包括每日报告病例数、报告日期和病例所在的乡镇。本研究选定暴发首次报告病例日期为暴发开始时间,末次报告病例日期为暴发结束时间,二者之间为暴发持续时间。在此期间,预警方法发出1个及以上信号且预警信号探测到的病例聚集乡镇在暴发事件当日报告病例所在乡镇范围内,即认为探测到该起暴发,该条预警信号是有效的信号。

本研究采用灵敏度、暴发探测时间和阳性预测值等指标评价不同预警参数设置的效果。灵敏度指探测到的暴发事件数占全部暴发事件数的百分比。暴发探测时间是指暴发开始至空间扫描统计量方法首次正确发出预警信号的时间间隔,采用所有暴发探测时间的中位数来评价预警的及时性[10]。阳性预测值指有效的预警信号所占预警信号总数的百分比。

本研究采用最高灵敏度、最短暴发探测时间、最高阳性预测值作为最优阈值的依次筛选依据[11],即灵敏度越高,方法探测效果越好;灵敏度相同,则暴发探测时间越短,方法探测效果越好;若灵敏度和暴发探测时间相同,则阳性预测值越高,方法探测效果越好。

4.数据处理与分析软件

采用R统计软件[12]编写空间扫描统计量算法运算程序,对数据进行处理和分析。

结 果

1.湖南省痢疾探测效果

湖南省在2009年一共报告了11352个痢疾病例,全年总的发病率为18/10万。其中的暴发事件有3起,一共由6条暴发事件记录构成,包括了56个暴发事件病例。30种预警方案的结果如表1所示。

30种预警方案在灵敏度方面都取得了比较好的结果。所有的预警方案都探测到了全部3起暴发事件。被探测到的暴发事件也全部在事件发生的第一天就被探测到了,有较好的及时性。预警信号数和预警信号阳性预测值方面有较大的差别。根据评价标准,第22套参数最优,它具有最好灵敏度值1、最短暴发探测时间1天和最高的阳性预测值0.333,而且预警信号数最少,为18条。

2.山东省手足口病探测效果

山东省在2009年一共上报了138387个手足口病例,全年总的发病率为180/10万。其中的暴发事件有108起,一共由939条暴发事件记录构成,包括了1673个暴发事件病例。30种预警方案的结果如表1所示。

30种预警方案在灵敏度和阳性预测率两方面都有着较大的差异。几套性能较优参数方案的灵敏度都大于92%,但阳性预测值均较低,预警信号数较多。根据评价标准,第21套参数最优,它具有最好灵敏度值0.944、最短的暴发探测时间2天,但阳性预测值不高,为0.053,预警信号数为8567条。

表1 30种预警方案应用于2009年湖南省痢疾病例和山东省手足口病例数据

讨 论

当将空间扫描算法应用于传染病暴发探测时,为了达到最优的预警效果,对于不同地区的不同传染病需要选择完全不同的参数方案。不同疾病在发病水平上的较大差异,可能是导致不同参数预警效果差异的原因之一。

手足口病在山东省2009年的总体发病率几乎是痢疾在湖南省2009年的总体发病率的10倍,相应的暴发事件以及暴发事件病例数,山东省也远远高于湖南省。对于总体发病率较低的湖南省,最优的预警方案是将4天的病例数按1阶权重取和得到当前值,然后再参与空间扫描运算。这样可以在一定程度上消除某一天偶然病例数上升的影响。而对于总体发病率相对较高的山东省,最优的预警方案是将3天的病例数直接取和得到当前值,然后再参与空间扫描运算。这说明,在真实的传染病暴发区域内,只采用1天的病例数尚不足以产生预警信号,只有将3天病例数取和之后再参与运算,才能够对大多数的暴发事件作出响应。另外,不同传染病本身的特点也会对参数方案的选择产生较大的影响。

本研究只是对比了不同疾病在不同地区的参数预警效果,这时两种不同疾病的各自特点会在一定程度上影响对不同参数方案的选择。下一步可以考虑同一种疾病在不同发病水平地区的参数预警效果比较,这样可以消除不同疾病间差异的影响。另外,采用“突发公共卫生事件报告管理信息系统”报告的暴发事件作为真实暴发的判断标准也存在一定的局限性,可能存在一些真实的较小暴发事件,因为某些客观原因,并没有被系统上报。这可能是导致预警阳性预测值不高的原因之一。

1.杨维中,兰亚佳,李中杰,等.国家传染病自动预警系统的设计与应用.中华流行病学杂志,2010,31(11):535-539.

2.Wang L,Wang Y,Jin S,et al.Emergence and control of infectious diseases in China.Lancet,2008,372(9649):1598-1605.

3.Kulldorff M,Nagarwalla N.Spatial disease clusters:Detection and inference.Statistics in Medicine,1995,14(8):799-810.

4.Kulldorff M.A spatial scan statistic.Communication in Statistics-Theory and Methods,1997,26(6):1481-1496.

5.Heffernan R,Mostashari F,Das D,et al.Syndrom ic surveillance in public health practice,New York City.Emerg Infect Dis,2004,10(5):858-864.

6.Kulldorff M,Heffernan R,Hartman J,et al.A space-time permutation scan statistic for the early detection of disease outbreaks.PLoSMedicine,2005,2(3):216-224.

7.徐敏,曹春香,程锦泉,等.甲流感疫情时空聚集性的GIS分析.地球信息科学学报,2010,12(5):707-712.

8.殷菲,李晓松,冯子健,等.基于网络直报系统和时空聚集性探测的传染病模拟实时监测与预警.现代预防医学,2009,36(12):2204-2207.

9.张文增,李长青,冀国强,等.空间扫描统计量在手足口病空间聚集性研究中的应用.中国卫生统计,2012,29(4):507-509.

10.Reis BY,Pagano M,Mandl KD.Using temporal context to improve biosurveillance.Proc Natl Acad Sci,2003,100(4):1961-1965.

11.赖圣杰,李中杰,金连梅,等.传染病暴发早期预警系统评价内容及其指标.中华流行病学杂志,2009,30(6):637-640.

12.R Development Core Team(2010).R:A language and environment for statistical computing.R Foundation for Statistical Computing,Vienna,Austria 2010-11-10.http://www.R-project.org

(责任编辑:丁海龙)

The Effect Com parison of Spatial Scan Statistic M ethod Based on Different Parameters in Early W arning of Infectious Disease Outbreak

Li Xiaozhou,Wang Jinfeng,Yang Weizhong,et al(School of Public Health,Wuhan University of Science and Technology(430065).Wuhan)

ObjectiveFor better application of spatial scan statistic method in early warning of infectious disease outbreak,we need to choose different parameters for spatial scan statistic method.MethodsWe took the cases and outbreaks of hand-foot-and-mouth disease(HFMD)and dysentery reported by Shandong and Hunan provinces in 2009 as data source.Taking sensitivity and positive prediction ratio as evaluation indices,we compared the performance of thirty groups of parameters on these two diseases.ResultsFor the dysentery cases in Hunan province,taking the sum of cases in four days w ith 1-rank coefficients,we could get the best performance.For the hand-foot-and-mouth disease(HFMD)cases in Shandong province,taking the sum of cases in three days directly,we could get the best performance.ConclusionWhen applying spatial scan statistic method in early warning of infectious disease outbreak,we ought to choose different parameters for different kinds of infectious disease in order to get the best results.In next steps,we out to choose the best parameters based on the different incidence rates.

Spatial scan statistic;Infectious disease;Early warning

国家科技重大专项/子课题(课题号2012ZX10004-201);卫生行业科研专项项目(课题号201202006)

1.武汉科技大学医学院公共卫生学院(430065);

2.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室

3.中国疾病预防控制中心传染病预防控制处,传染病监测预警中国疾病预防控制中心重点实验室

△通信作者:王劲峰E-mail:wangjf@lreis.ac.cn

猜你喜欢
灵敏度传染病预警
《传染病信息》简介
传染病的预防
基于机电回路相关比灵敏度的机电振荡模式抑制方法
3种传染病出没 春天要格外提防
基于灵敏度分析提升某重型牵引车车架刚度的研究
法国发布高温预警 严阵以待备战“史上最热周”
复合数控机床几何误差建模及灵敏度分析
机载预警雷达对IFF 的干扰分析
穿甲爆破弹引信对薄弱目标的灵敏度分析
日盲紫外探测技术在空间预警中的应用