北京市大兴区疾病预防控制中心(102600) 高艳青 刘海博 李冬梅 袁 明 甘亚弟 侯文俊
2008年4月,中国疾病预防控制中心开发并试运行国家传染病自动预警系统(CIDARS)。运行之初将基线数据的P50设置为所有预警病种的预警界值〔1〕,其后,将各病种的预警界值有所调整。但是,由于此预警面向全国,覆盖面过大,不能很好兼顾灵敏度、特异度,因此,有必要在区县级开展针对本地区的预警界值研究,以提高预警能力和效果。本文依据北京市大兴区猩红热的发病特点,分别对不同流行状态下该病种在本地区的预警界值进行研究。
1.资料来源 国家疾病预防控制信息系统中北京市大兴区2005~2011年猩红热发病数据,以周为单位整理数据,建立数据库。
2.流行标准取5年数据,以ˉx+2s作为流行判断标准〔2〕。2010年大兴区猩红热属于非流行年;而2011年发病数则较前5年最高发病数增加185%,属于流行年。
3.统计学分析 应用Excel 2007软件建立模型和绘制ROC曲线;应用Medcalc 12.3软件计算灵敏度、特异度、阳性预测值、约登指数。
1.建立预警模型 根据控制图预警模型原理和流行年与非流行年预警的基线数据,分别采用2005~2009年、2006~2010年期间猩红热每周及其前后2周的发病数,计算出指定的百分位数(P20、P25、P30、P35…P95、P99),建立预警模型(表1)。
表1 北京市大兴区猩红热预警模型
2.优选预警界值
(1)在非流行年状态下优选预警界值
将大兴区2005~2009年猩红热周发病数代入模型,用各候选百分位数界值对2010年(非流行年)的猩红热分周发病进行预警,同时用流行标准判断是否发出预警信号,并计算各候选预警界值的灵敏度、特异度、阳性预测值、约登指数,绘制ROC曲线(图1),比较其预警功效。
(2)在流行年状态下优选预警界值
将大兴区2006~2010年猩红热周发病数代入模型,按照上述步骤对2011年(流行年)预警界值计算、绘制ROC曲线(图2)。
综合平衡各指标后,流行年与非流行年均确定P95为大兴区猩红热的预警界值,详见表2。
表2 大兴区猩红热非流行年与流行年预警界值灵敏度(%)、特异度(%)、阳性预测值(%)、约登指数
图1 猩红热非流行年预警界值ROC曲线
图2 猩红热流行年预警界值ROC曲线
对传染病的早期预警,需要历史数据的铺垫,选择较长时间的基线数据可能会提高预警的准确性,但传染病的流行趋势变化会增加基线数据的变异,从而抵消长基线带来的好处〔2〕。北京市猩红热发病在2003年以前为长期下降趋势,但自2003年起发病呈现上升趋势且有较大幅度的波动〔3〕,并在2011年出现流行,大兴区的发病亦遵循这一规律〔4〕。若基线数据时间太长,会使预警过于敏感。因此,本研究回溯5年数据,并将预警周向前向后各偏移2周作为基线,使原来的5个数据增加为25个数据,保证建模数据充足,增加其稳定性。
本研究中,P95以下的各预警界值灵敏度都在100%,随着预警界值逐渐升高,特异度、阳性预测值和约登指数均逐渐增加。当预警界值为P95时,各指标达到最佳平衡,ROC曲线也直观显示了P95为最佳平衡点。此结果不同于孙乔等〔1〕利用移动百分位数法对全国数据确定的最优阈值P90。
除了达到指标间的平衡外,由于传染病不同病种危害程度不同,在各地的发病水平、暴发频率与规模、暴发标准的确定亦有差别,故在实际工作中,应充分考虑到疾病的特点,灵活设置阈值。相关研究表明,不同参数的调整,会直接影响到疾病异常探测算法的探测效果〔5〕,与目前应用的P80界值相比,P95界值阳性预测值提高了2% ~15%,预警信号发出条数减少,可以在保证及时预警的条件下,减少基层对假阳性预警信号响应的工作量与工作成本。将P95确定为大兴区猩红热的预警界值,在流行年与非流行年均有很高的预警功效,可应用于日常工作。
控制图法预警技术,适用于具有明显季节性疾病的预测预警〔6-7〕,且简单易行,直观,预警功效高,避免了其他预测方法需要不断调整参数的弊端〔2〕,非常适合区县级开展研究和利用。
1.孙乔,赖圣杰,李中杰,等.移动百分位数法不同阈值在传染病暴发预警中的效果比较.中华流行病学杂志,2011,32(5):450-453.
2.杨维中,邢慧娴,王汉章,等.七种传染病控制图法预警技术研究.中华流行病学杂志,2004,25(12):1039-1041.
3.沈艳辉,王全意,吴疆,等.北京市1949~2006年猩红热流行特征分析.海峡预防医学杂志,2008,14(2):30-31.
4.李冬梅,侯文平,刘海博.北京市大兴区1999年~2008年猩红热发病分析.现代预防医学,2011,38(15):2939-2941.
5.Wang X,Zeng D,Seale H,et al.Comparing early outbreak detection algorithms based on their optimized parameter values.Journal of biomedical informatics.2010,43(1):97-103.
6.张轸麒,章扬熙.流行控制图法.疾病监测,1994,9(1):17-19.
7.尹志英,方春福.传染病预警预测方法探讨.中国卫生统计,2010,27(2):218-220.