李婷 何金戈 杨长虹 李运葵 王丹霞 陈闯 吴建林
·论著·
基于空间聚集性与时空扫描的肺结核流行特征分析
李婷 何金戈 杨长虹 李运葵 王丹霞 陈闯 吴建林
目的 探讨2011—2015年四川省肺结核发病的时空分布特征。方法 基于中国疾病预防控制信息系统传染病报告信息管理系统中四川省184个县、市、区2011—2015年肺结核疫情数据和人口数据,建立地理信息数据库,导入OpenGeoda 1.2.0和SaTScan 9.4.1软件,进行全局、局部空间自相关分析和时空扫描聚类分析,确定肺结核发病时空热点区域,通过ArcGIS 10.2软件进行可视化。结果 2011—2015各年度四川省肺结核报告发病率分别为77.62/10万(63 040例)、76.45/10万(62 325例)、74.51/10万(60 781例)、68.65/10万(56 485例)和67.13/10万(54 645例),呈明显的聚集性分布,各年度全局空间自相关系数(Moran指数I值)分别为0.46、0.50、0.52、0.56和0.63,均具有统计学意义(P值均=0.001)。局部空间自相关分析结果表明,2011—2015年分别有18、15、15、15、14个地区处于“高-高”(HH)区域,连续5年处于HH区域的有8个,全部位于甘孜州。时空扫描分析表明,2011—2015年四川省肺结核疫情存在八级聚集区域,共涉及81个地区,对数似然比(log-likelihood ratio,LLR)为24.65~3012.78,P值均<0.01。其中,一级聚类区域位于2013—2014年甘孜州的16个县和阿坝州的7个县,LLR值为3012.78,RR值为3.18,P<0.01。结论 四川省肺结核疫情存在明显的时空聚集特征,在川西高原少数民族地区、凉山州彝族地区、秦巴山区尤为显著,应实施针对性强的区域结核病防治策略和政策支持。
结核,肺; 时空聚类分析; 传染病控制
目前,结核病仍是各国关注的严重公共卫生问题,是全球范围内对人类最具威胁性和挑战性的传染性疾病之一。据估算2015年全球有1040万新发结核病患者,中国有91.8万例,结核病负担仅次于印度和印度尼西亚[1]。四川省是结核病疫情最严重省份之一[2],笔者对四川省2011—2015年肺结核疫情展开分析,以县域为空间分析尺度,采用空间自相关分析及时空扫描分析,旨在发现四川省肺结核发病的空间聚集性及时空热点,为进一步探索影响发病的因素及有针对性地制定防控策略和合理配置卫生资源等提供科学的理论依据。
一、资料来源
从中国疾病预防控制信息系统传染病报告信息管理系统中获取四川省184个县、市、区(包括绵阳市科学城)2011—2015年年统计表中肺结核报告发病例数和报告发病率(包括涂阳、涂阴、菌阴、仅培阳和未痰检),按照发病日期进行统计。每年报告发病例数均为年末统一订正的数据,确保数据的准确性。数据查询日期为2016年5月25日。人口基数来源于中国疾病预防控制信息系统基本信息系统中的2011—2015年四川省常住人口数。
二、研究方法
1.构建地理信息数据库:以县、市、区为单位,建立包括地理编码、经度和纬度等信息的地理信息数据库。以数据属性表中地理编码关联肺结核疫情数据及人口数据,建立四川省肺结核发病信息的地理信息数据库。
2.空间自相关分析:空间自相关分析是以全局指数探测整个研究区域内的空间聚集模式,以局部指标评估每一空间单元与临近单元同一属性的相关程度,检验每个空间单元相对于整体其空间自相关是否足够显著,从而判断研究单元在空间“高-高”(HH)、“高-低”(HL)、“低-高”(LH)和“低-低”(LL)的分布[3]。
全局型空间自相关系数(全局Moran指数I值)反映的是空间邻接或空间邻近区域单元属性值的相似程度。全局Moran指数I值取值范围介于-1~1,I值越接近于1,表示空间单元之间关系越密切,性质越相似,整体呈现聚集性分布(高值聚集或低值聚集);I越接近于-1,表示整体呈现离散型分布,样本之间差异越大或分布越不集中;I值为0,表示整体随机性分布[4]。本研究首先采用全局空间自相关Moran指数I值来探测整个研究区域内的空间聚集模式,并进行统计学检验,检验水准为α=0.05。
局部型自相关分析用于反映一个区域与邻近区域的相关程度。Moran散点图用来研究局部的空间不稳定性。Moran散点图分4个象限,分别对应于区域单元或与其邻近单元之间4种类型的局部空间联系形式,能够进一步区分区域单元和邻近单元之间属于HH、LL、HL、LH中的具体空间联系形式,在Z检验的基础上(P≤0.05)绘制局部空间关联指标(local indication of spatial autocorrelation,LISA)积聚图[4-5]。
3.时空扫描分析:SaTScan时空扫描软件是以空间动态窗口扫描统计为基础,对每一个扫描窗口,根据实际发病数和人口数计算出理论发病数,然后利用扫描窗口内和扫描窗口外的实际发病数和理论发病数构造检验统计量对数似然比(log-likelihood ratio,LLR)来评价窗口内的发病数是否异常,并通过蒙特卡罗法模拟进行统计学检验,计算概率值。LLR值越大且差异具有统计学意义,则表示该动态窗口下所含区域为聚集区域的概率越大[6]。其中,一级空间聚集区域的LLR值最大,二级空间聚集区域较一级空间聚集区域的LLR值小,说明其成为空间聚集区域的概率较一级聚集区域低,以此类推[4]。本研究将聚类范围最大值限定为30%的总人口处于风险人群中、总研究期限的50%为时间尺度,根据资料特点(研究数据包含人口资料),选用SaTScan软件中的Possion模型进行统计分析。以肺结核报告发病数为病例数据(分子),以常住人口数为人口数据(分母),以各县、市、区质心坐标为空间分析数据进行分析。检验水准为α=0.05。
4.统计学分析:应用ArcGIS 10.2软件构建地理信息数据库并绘制年均报告发病率的空间分布;OpenGeoda 1.2.0软件定义空间权重矩阵并对各年度肺结核疫情开展空间自相关分析;SaTScan 9.4.1软件进行时空聚集性分析并在ArcGIS 10.2中完成可视化。
一、疫情概况
2011—2015年,四川省肺结核报告发病数分别为63 040、62 325、60 781、56 486和54 645例,报告发病率从77.62/10万下降至67.13/10万,见表1。肺结核年均报告发病率(5年总发病例数/总常住人口数)为72.86/10万。年均报告发病率最高的为甘孜州雅江县(901例,354.23/10万),最低的为绵阳市科学城(9例,4.26/10万),地区差异明显,川西地区报告发病率较高,川中地区较低,见图1。
表1 2011—2015年四川省肺结核报告发病率
二、空间自相关分析
1.全局空间自相关:2011—2015年四川省肺结核报告发病率分布的Moran散点图见图2~6(a),各年度Moran指数I值分别为0.46、0.50、0.52、0.56和0.63,且均具有统计学意义(P<0.05),表明各年度四川省肺结核报告发病率呈明显的聚集性分布。
2.局部空间自相关:局部空间自相关分析结果显示,2011—2015年分别有18、15、15、15、14个县(区)处于HH区域,见图2~6(b)、表2。连续5年处于HH区域的有8个,全部位于甘孜藏族自治州,分别是道孚县、甘孜县、德格县、白玉县、理塘县、石渠县、雅江县和新龙县。阿坝州的壤塘县和红原县,分别在2011—2014年,2012和2014年处于HH区域,但在2015年转变成了LH区域。凉山州木里县在2012—2015年均处于LL区域。
图1 2011—2015年四川省各地区肺结核年均报告发病率
表2 2011—2015年四川省各地区肺结核报告发病率聚集分布情况
注 各年度均未发现“高-低”区域
图a为全局空间自相关分析;图b为局部空间自相关分析,图例括号内数值为该区域内县区个数图2 2011年四川省各地区肺结核报告发病率空间自相关分析示意图
图a为全局空间自相关分析;图b为局部空间自相关分析,图例括号内数值为该区域内县区个数图3 2012年四川省各地区肺结核报告发病率空间自相关分析示意图
图a为全局空间自相关分析;图b为局部空间自相关分析,图例括号内数值为该区域内县区个数图4 2013年四川省各地区肺结核报告发病率空间自相关分析示意图
图a为全局空间自相关分析;图b为局部空间自相关分析,图例括号内数值为该区域内县区个数图5 2014年四川省各地区肺结核报告发病率空间自相关分析示意图
图a为全局空间自相关分析;图b为局部空间自相关分析,图例括号内数值为该区域内县区个数图6 2015年四川省各地区肺结核报告发病率空间自相关分析示意图
3.时空扫描分析:时空聚集性扫描分析结果显示,2011—2015年四川省肺结核疫情存在八级聚集区域,共涉及81个县、市、区。一级聚集区域(即最有可能聚集区域)位于2013—2014年的甘孜藏族自治州的石渠县、德格县、甘孜县、色达县、白玉县、炉霍县、新龙县、巴塘县、道孚县、理塘县、丹巴县、雅江县、乡城县、得荣县、康定县、稻城县等16个县和阿坝藏族羌族自治州的壤塘县、阿坝县、金川县、马尔康县、红原县、若尔盖县、小金县等7个县。二级聚集区域位于2011—2012年的凉山彝族自治州的美姑县、雷波县、越西县、昭觉县、甘洛县、喜德县和金阳县等7个县和乐山市的峨边彝族自治县和马边彝族自治县。三至八级聚集区域分别包括34、9、2、1、2、1个县、市、区,见表3(因聚类分级信息较多,表中只列出了一、二、三级聚集区域信息)、图7。
图7 2011—2015年四川省各地区肺结核报告发病率时空聚集性分析图
表3 2011—2015年四川省各地区肺结核报告发病率时空扫描分析结果
结核病是以空气传播为主要传播途径的慢性传染病,患者之间在时间、空间上具有一定的相关性,即一定的时间或空间的聚集倾向或趋势[7-8]。传统的数量统计模型不能满足传染病时空分布变化的研究,而空间统计为在分析空间关系的基础上进行数值的相关分析提供了新的思路,其核心就是认识与地理位置相关数据间的空间依赖关系[9]。肺结核作为一种传染病,与当地地理环境、经济状况、人口特征等都存在一定的关联,而这种空间相关特点成为空间统计学分析的前提[10]。对结核病在时间、空间或时空方面表现出来的聚集性进行研究,既可为疾病的病因学研究提供线索,还有助于进一步评价不同时期、不同区域结核病的防控效果,又可为制定有效的防控措施和卫生决策提供科学依据[11]。
既往研究中,赵飞等[7]通过空间扫描分析2008—2010年中国以省级为单位的结核病总登记率,发现四川省2008和2009年处于一级聚集区域,而2010年处于非聚集区域。说明四川省结核病总体负担在下降。笔者在以县域为单位的全局空间尺度的空间相关性分析结果显示,2011—2015年的四川省报告发病率呈明显的聚集性分布,提示四川省内结核病负担存在较大的不均衡性。在局部自相关分析中,空间聚集区分布是逐年减少的,分别有18、15、15、15、14个县处于HH区域(即发病率较高),周围地区发病率也高的地区,但空间位置较为恒定,主要位于川西高原的甘孜、阿坝、凉山等少数民族聚集地区,其中连续5年处于HH区域的有8个县,全部位于甘孜藏族自治州。由此,一方面提示结核病疾病负担在川西高原区域较为集中和严重,是结核病高风险传播聚集区,应采取措施加强结核病的控制工作,特别是做好肺结核的发现和治疗管理工作;另一方面,也表明在“十二五”期间,全省结核病防治工作是卓有成效的,结核病发病高值聚集区逐步减少,肺结核报告发病数量总体呈现稳步逐年下降趋势。在首先重点关注HH区域结核病防治的同时,也要重视和巩固LH和LL区域的结核病防治工作。木里县在2012—2015年均处于LH区域,提示应受到重点关注,防止向HH区域转变,同时要考虑是否存在传染病漏报。还值得注意的是,阿坝州的壤塘县和红原县,分别在2011—2014年,2012和2014年处于HH区域,但在2015年转变成了LH区域,可能与这两个县均在2014年底实施了结核病防治新型服务体系,将肺结核诊疗工作由疾控中心移交至了定点医院,移交初期肺结核患者发现和疫情报告等工作滑坡有关。另外要注意处于LL区域的成都平原地区,与川西高原地区有着密切的人员文化及经济交流,应高度防范。
通过对肺结核发病率的全局和局部空间自相关分析,基本摸清了其分布规律,但均忽略了时间在其中的作用,看不到肺结核发病随时间变化的趋势,而时空扫描统计考虑了时间维度,是单纯空间扫描统计分析的有益补充[12]。本研究时空扫描分析的结果显示,2011—2015年全省肺结核疫情存在八级聚集区域,共涉及81个县。其中一、二级聚集区均为甘孜、阿坝、凉山州的34个少数民族县,其地域辽阔、人口密度小、经济社会发展相对滞后、防治机构力量薄弱等特点,为结核病患者发现工作带来了一定的挑战。三级聚集区为2011—2012年以巴中市通江县为中心的川东北秦巴山区34个县、市、区。可能与川东北地区社会经济发展水平较低,结核病疫情本身较高,结核病防治技术力量及防治机构力量薄弱等有关[13]。结果也表明,四川省肺结核疫情呈现明显的聚集性特征,高发区域具有一定的时空稳定性。出现空间聚集现象的原因有很多,除当地的肺结核疫情、结核病防治工作水平外,还可能与当地的气候、人口学特征、地理、经济、社会文化等诸多因素相关[14-17]。这也提示今后在防控策略和技术措施上,对聚集区和非聚集区要有所区分和侧重,应该大力强化对川西高原少数民族地区、凉山州彝族地区、秦巴山区结核病防治的力度,结合高原山区的地理、人口、经济、文化等因素,科学合理配置结核病等公共卫生资源,实施针对性强的区域结核病防治策略和政策支持,确保全省的结核病防治工作的均衡发展。
在传统的流行病学“三间”分析中,地区分析无法考虑相邻地区之间传染病的相互影响及传播。利用时空扫描分析方法探索传染病聚集性,由于事先未对聚集性的大小、位置、规模作任何假定,避免了选择偏倚,可以最大限度地进行数据信息的挖掘,发现聚集性的存在[14]。目前,国内对结核病空间分布的研究多以省为空间分析尺度,空间尺度较大,不够精确;或是以乡镇为尺度对某市的疫情聚集性进行分析,区域较为局限。而本研究在相对较小尺度下(县级水平)对四川省的情况进行分析,有较高的精确性。然而本研究也有一定的局限,研究数据均来源于“大疫情”系统的报告,由于部分患者未到结防机构进行确诊,再加上各地结核病诊断和传染病报告水平参差不齐,所以本数据并不能完全代表当地的结核病自然发病水平。另外,由于未收集各地区社会经济、地理环境等信息,因此本研究只完成了肺结核病聚集性的统计学检验,未对产生聚集性的影响因素进行分析和描述,这也是今后需要进一步完善和探究的方向。
[1] World Health Organization.Global tuberculosis report 2016.Geneva:World Health Organization, 2016.
[2] 李婷,何金戈,张佩如,等.2012年四川省结核病流行病学调查结果分析. 预防医学情报杂志,2013,29(11):937-941.
[3] Tsai PJ, Lin ML, Chu CM, et al. Spatial autocorrelation analy-sis of health care hotspots in Taiwan in 2006. BMC Public Health, 2009,9:464.
[4] 赵飞,王黎霞,成诗明,等.中国2008—2010年结核病空间分布特征分析.中华流行病学杂志,2013,34(2):168-172.
[5] 岳玉娟,任东升,刘起勇. 2005—2013年中国大陆登革热疫情时空分布.疾病监测,2015,30(7):555-560.
[6] Song C, Kulldorff M. Power evaluation of disease clustering tests.Int J Health Geogr,2003,2(1):9.
[7] Nunes C.Tuberculosis incidence in Portugal: spatiotemporal clustering.Int J Health Geogr, 2007, 6:30
[8] Jia ZW, Jia XW, Liu YX, et al. Spatial analysis of tuberculosis cases in migrants and permanent residents, Beijing, 2000—2006. Emerg Infect Dis, 2008, 14(9): 1413-1419.
[9] 王永.肺结核发病的时空聚集性研究.杭州:浙江大学,2008.
[10] 唐益,龚德华,白丽琼,等. 湖南省2003—2011年活动性肺结核患者登记的空间分析.中国防痨杂志,2012,34(12):764-767.
[11] 刘云霞,李士雪,王忠东,等.基于时空重排扫描统计量的结核病聚集性研究.山东大学学报(医学版),2009,47(2):122-125.
[12] 山珂.肺结核发病空间聚集分布及影响因素研究.济南:山东大学, 2014.
[13] 李婷,张佩如,夏勇,等. 2009—2013年四川省在校学生结核病患者登记情况及特征分析.中国防痨杂志,2015,37(1):24-29.
[14] 单志力,徐刚,周祖木,等.2008—2013年温州市肺结核疫情时空流行病学分析.中国防痨杂志,2016,38(2):99-103.
[15] 孙果梅, 路丽苹, 彭文祥, 等. 2006—2009年上海市松江区结核病空间分布特征及影响因素.中华预防医学杂志,2012,46(10):903-907.
[16] Li XX, Wang LX, Zhang H, et al. Spatial variations of pulmonary tuberculosis prevalence co-impacted by socio-economic and geographic factors in People’s Republic of China, 2010. BMC Public Health, 2014, 14:257.
[17] 丛明瑶, 云妙英, 阿德娜依·阿力肯. 气候因子对肺结核发病率影响的分析. 中华疾病控制杂志, 2014, 18(11): 1051-1054.
(本文编辑:李敬文)
A clustering study on pulmonary tuberculosis based on pure spatial clustering and spatiotemporal scanning
LITing*,HEJin-ge,YANGChang-hong,LIYun-kui,WANGDan-xia,CHENChuang,WUJian-lin.
*TuberculosisPreventionandControlDepartment,SichuanCenterforDiseaseControlandPrevention,Chengdu610041,China
Correspondingauthors:HEJin-ge,Email:hejinge@163.com;YANGChang-hong,Email:changhong_yang@hotmail.com
Objective To explore the spatial and temporal distribution of pulmonary tuberculosis (PTB) in Sichuan province. Methods Geographic information data were from the incidence data of PTB and demographic data reported in the China disease prevention of infectious disease reporting information management system in 184 counties of Sichuan province from 2011 to 2015. Global indication of spatial autocorrelation (GISA), local indication of spatial autocorrelation (LISA) and spatial-temporal clustering analysis were conducted with software OpenGeoda 1.2.0 and SaTScan 9.4.1 in order to determine high risk areas of PTB, and it could be visualized by software ArcGIS 10.2. Results From 2011 to 2015, the incidence rates of PTB in Sichuan were 77.62/100 000 (63 040 cases), 76.45/100 000 (62 325 cases), 74.51/100 000 (60 781 cases), 68.65/100 000 (56 485 cases) and 67.13/100 000 (54 645 cases), respectively. There was obvious clustering for the incidence rate in each year and the global spatial autocorrelation coefficient Moran’sIwas statistically significant (from 2011 to 2015, the values were 0.46, 0.50, 0.52, 0.56 and 0.63, respectively, allP=0.001). Local autocorrelation analysis showed that there were 18, 15, 15, 15 and 14 counties in the “high-high” (HH) region from 2011 to 2015, respectively. There were 8 counties all located in Ganzi in the HH region for 5 consecutive years. Spatial temporal clustering analysis showed that there were 8 clustering districts of the epidemic of PTB in Sichuan, covering a total of 81 counties, log-likelihood ratio (LLR) values ranged from 24.65 to 3012.78, allP<0.01. The most likely clustering was in 16 counties of Ganzi and 7 counties of Aba from 2013 to 2014 (LLR=3012.78,RR=3.18,P<0.01). Conclusion Obvious spatial temporal clustering of PTB distribution was found in Sichuan, especially in ethnic minority areas in the Western Sichuan Plateau, Liangshan Yi area and Qin Ba mountain area, where TB control strategies and policy support should be targeted.
Tuberculosis, pulmonary; Space-time clustering; Communicable disease control
10.3969/j.issn.1000-6621.2016.12.007
四川省科技厅应用基础研究项目(2011JY0066)
610041 成都,四川省疾病预防控制中心结核病预防控制所(李婷、何金戈、李运葵、王丹霞、陈闯),公共卫生信息所(杨长虹),办公室(吴建林)
何金戈,Email:hejinge@163.com;杨长虹,Email:changhong_yang@163.com
2016-09-18)