基于肘聚类分析的中国疫情模式回顾性分析

2020-08-18 10:05钱碧云冯铁男
关键词:聚集区行政区患病率

李 蔷 ,孙 喆,钱碧云, ,冯铁男,

1.上海交通大学公共卫生学院,上海200025;2.上海交通大学医学院临床研究中心,上海200025;3. 上海申康医院发展中心临床研究促进与发展中心,上海200041;4. 中国核工业集团公司416 医院,成都医学院附属第二医院,成都610057

2019 年12 月,中国湖北省武汉市出现一批病因不明的肺炎患者,其临床表现与病毒性肺炎十分相似[1]。通过对疫情暴发早期肺炎患者呼吸道样本的检测,专家发现该疾病的病原体为一种新型冠状病毒[2]。该病毒可以在人与人之间传播,因此在短期内形成了大量感染者,同时武汉是我国的交通枢纽,人口流动性高,再加上疾病暴发时间正值我国春节前期,众多因素导致该病迅速蔓延[3-5]。2020年1 月30 日,世界卫生组织宣布该新型冠状病毒疫情为国际关注的突发公共卫生事件[6],并在2 月11 日将该疾病正式命名为coronavirus disease 2019(COVID-19)[7]。

为了控制疫情的传播,2020 年1 月23 日上午10 时武汉市宣布封锁其与周边城市的交通渠道[8]。此后,全国多个省(市、区)启动突发公共卫生事件一级响应,开始实施不同程度的区域封锁、停学和停工等围堵策略[9]。在研究传染病在人群之中的传播时,常采用基本传染数(R0)来评估疫情是否可得到控制;R0指在没有外力介入且所有人均没有免疫力的情况下,一个感染某种传染病的人会把疾病传染给其他多少人的平均数,其值愈大表示该传染病的控制愈难[10]。目前已有大量研究对COVID-19 疫情的发展趋势进行了研究:Zhao 等[11]通过指数增长模型估算了本次疫情R0的平均值范围为2.24 ~3.58;Zhou 等[12]利用SEIR(susceptible-exposed-infectious-recovered)模型对疫情的发展趋势进行了预测。这些研究对COVID-19 的防控提供了很好的参考依据,但未考虑不同地区的疫情特点和发展情况。本研究采用肘聚类(elbow clustering)方法对截至2 月13 日的所有中国省级行政区COVID-19 的发病数、治愈数和死亡数情况进行了分析,并描述了疫情在国内不同地区的发展模式,希冀为未来的疫情管理提供 借鉴。

1 资料与方法

1.1 数据来源

本研究利用R 语言“rvest”包(Version 0.3.5),通过网络爬虫的方法,获取了中华人民共和国国家卫生健康委员会于2020 年1 月13 日—2 月13 日公开发布的中国地区COVID-19 病例的时间序列数据(http://www.nhc.gov.cn),其中包括每日的新发病例数、治愈数和死亡数等信息。然后从中华人民共和国国家统计局(http://data.stats.gov.cn/easyquery.htm?cn=C01)、中国香港特别行政区政府统 计 处(https://www.censtatd.gov.hk/home/index_tc.jsp)、中国澳门特别行政区政府统计暨普查局(https://www.dsec.gov.mo/zh-MO/)获得中国34 个省级行政区2018 年的常住人口数据,以进行患病率的计算。

1.2 统计学方法

运用R 软件(3.6.1 版本),基于肘聚类方法对全国34个省级行政区于2020 年1 月13 日—2 月13 日的患病率进行聚类分析,将疫情相似的省级行政区进行聚合,从而发现其中规律;然后基于SEIR 模型计算不同类别聚集区的R0值,以评估各类别聚集区的疫情控制情况。用中位数与四分位数对不同类别聚集区的疫情进行描述,并采用非参数独立样本检验(Kruskal-Wallis H 检验) 进行组间差异比较,P<0.05 认为差异具有统计学意义。

2 结果

2.1 肘聚类分析结果

2020 年1 月13 日—2 月13 日,按照患病率可将中国34 个省级行政区分为4 类,从低到高依次为Ⅰ类聚集区、Ⅱ类聚集区、Ⅲ类聚集区和Ⅳ类聚集区(图1),用于聚类分析的主成分1 的累积方差贡献率为96.5%,主成分2 为3.1%,2 个成分的累积方差贡献率为99.6%,几乎能够完全覆盖原始数据的信息。各聚集区的患病率依次为0.036(0.003,0.111) / 万、0.148(0.111,0.194) / 万、0.540(0.372,0.707) /万和8.786/万。

利用Kruskal-Wallis H 检验进行各类别聚集区患病率、治愈率、病死率的分布差异比较,结果表明各类别聚集区患病率分布不全相同,差异具有统计学意义(P=0.000),治愈率和病死率的分布差异不具有统计学意义(表1)。

图1 34 个省级行政区聚类结果Fig 1 Clustering results of 34 provincial administrative regions

表1 4 类聚集区COVID-19 患病率、治愈率、病死率的比较Tab 1 Comparison of prevalence rates, cure rates and case-fatality rates in the four types of clusters

2.2 4 类聚集区的疫情变化情况

湖北的数据记录时间均早于其他3 类聚集区。截至 2 月13 日,除湖北外,其他3 类聚集区的患病率趋于平稳,治愈率呈上升趋势;湖北患病率和病死率变化曲线仍高于其他3 类聚集区,治愈率曲线低于其他3 类聚集区(图2)。由于其他地区的详细数据记录是从1 月20 日开始,而湖北是从1 月13 日开始,因此起始时间有所不同。

2.3 4 类聚集区的R0 值分析

利用已有的数据进行曲线拟合,其中拟合度最高的是Ⅳ类聚集区(湖北),其他类别聚集区的拟合度不高。从计算结果来看,湖北的R0为3.984,Ⅰ、Ⅱ、Ⅲ类聚集区的R0依次为2.764、3.056 和3.899。从曲线趋势来看,2 月13 日之后,除湖北外,其他3 类聚集区的发病数将持续走低;湖北省(Ⅳ类聚集区)的情况仍然比较严峻 (图3)。

图3 4 类聚集区R0 值分析Fig 3 Analysis of R0 values of the four types of clusters

3 讨论

本研究通过对中国COVID-19 疫情的公开数据进行分析,基于肘聚类分析法根据地区患病率,将中国34 个省级行政区进行了归类。从结果来看,作为疫情首发地的湖北省疫情严重程度远远高于其他聚集区,其他3 类聚集区中,与湖北相邻的重庆成为相对较重的省级行政区,但浙江与湖北不相邻疫情仍相对较重。从结果推断,随着我国交通运输的迅速发展,越来越多的人群会聚集到经济相对发达的地区,增加当地的人口导入,而这些地区则会成为未来疫情防疫的重点区域,需要当地政府加强相关的监测建设。而与湖北相邻的陕西、河南、安徽、江西、湖南则没有相邻的重庆严重,可能与这些地区人员流动的去向有关。河南、江西、湖南人员流动的主要去向是广东一带,而安徽人员流动的主要去向是上海等长三角地区。在本次疫情中,北京和上海的情况并不算严重,属于Ⅱ类聚集区,一方面与武汉“封城”有关[13],另一方面北京和上海经历了2003 年的严重急性呼吸道综合征(severe acute respiratory syndrome,SARS)疫情[14],对疫情的管理有一定经验。而Ⅰ类聚集区则是与武汉人口流动相对较少,或是交通、经济均相对较弱的地区。因此,除地理因素外,影响地区疫情的关联因素还包括交通便利性、经济发展水平以及人员流动去向。

从累积患病率和治愈率来看,疫情发展也将逐步由4 类聚集区变为2 类聚集区——湖北与其他地区。除湖北外,其他聚集区患病率增长均逐步趋向于0[15]。而随着对湖北医疗资源的补充,确诊病例数仍会持续上升,因此在短期内,湖北的疫情还会比较严重,这与模型的预测结果基本一致。而其他地区由于政府强力控制人员流动[16],不断降低预测模型的人员有效接触率,逐步将疫情的拐点提前,从而控制了疫情在除湖北地区外的传播。从疾病的治愈率来看,由于在疫情早期病因和治疗方法均不明确,医疗资源极其紧张,导致湖北治愈率较低;而其他地区由于相关部门反应及时,以及有湖北前期经验借鉴,治愈率提升较快,病死率较低[16]。与中国相比,欧洲的疫情在近2个月仍处于较为严重的阶段,其与欧洲各国防疫措施不够严格密切相关[17]。

中国在2003 年SARS 疫情后,已经建立了一套疫情监测系统,在本次疫情中也发挥了作用;但是在应对短时间内出现大量患者时,应建立更高效的公共资源征用与更加智能化的早期预警工具,如建立更加智能化的疾病特异性识别算法等,提升疫情的早期预警效率。

未来在疫情管理中,除了疫区的临近地区外,越来越便利的交通线将会是疫情需要重点关注的管理靶点。本次疫情中遇到的问题以及相应的疫情管控措施,均能够为中国建立更加完善的疫情预警与管理系统提供借鉴和经验。

参·考·文·献

[1] World Health Organization. Novel coronavirus (2019-nCoV) situation report-3[EB/OL]. [2020-02-11]. https://www.who.int/docs/defaultsource/coronaviruse/situation-reports/20200123-sitrep-3-2019-ncov.pdf?sfvrsn=d6d23643_8.

[2] Zhu N, Zhang DY, Wang WL, et al. A novel coronavirus from patients with pneumonia in China, 2019[J]. N Engl J Med, 2020, 382(8): 727-733.

[3] Li Q, Guan XH, Wu P, et al. Early transmission dynamics in Wuhan, China, of novel coronavirus-infected pneumonia[J]. N Engl J Med, 2020, 382(13): 1199-1207.

[4] Hui DS, I Azhar E, Madani TA, et al. The continuing 2019-nCoV epidemic threat of novel coronaviruses to global health: the latest 2019 novel coronavirus outbreak in Wuhan, China[J]. Int J Infect Dis, 2020, 91: 264-266.

[5] Castells M. Globalisation, networking, urbanisation: reflections on the spatial dynamics of the information age[J]. Urban Stud, 2010, 47(13): 2737-2745.

[6] World Health Organization. Statement on the second meeting of the International Health Regulations (2005) Emergency Committee regarding the outbreak of novel coronavirus (2019-nCoV)[EB/OL]. [2020-02-11]. https://www.who.int/news-room/detail/30-01-2020-statement-on-the-secondmeeting-of-the-international-health-regulations-(2005)-emergency-committeeregarding-the-outbreak-of-novel-coronavirus-(2019-ncov).

[7] World Health Organization. Novel coronavirus (2019-nCoV) situation report-22[EB/OL]. [2020-02-11]. https://www.who.int/docs/defaultsource/coronaviruse/situation-reports/20200211-sitrep-22-ncov.pdf?sfvrsn=fb6d49b1_2.

[8] 武汉市人民政府. 市新型冠状病毒感染的肺炎疫情防控指挥部通告(第1号)[EB/OL]. [2020-02-10]. http://www.wuhan.gov.cn/hbgovinfo/zwgk_8265/tzgg/202001/t20200123_304065.html.

[9] 中国疾病预防控制中心新型冠状病毒感染的肺炎疫情防控技术组. 新型冠状病毒感染的肺炎疫情紧急研究议程:传播和非药物缓疫策略[J]. 中华流行病学杂志, 2020, 41(2): 135-138.

[10] Dietz K. The estimation of the basic reproduction number for infectious diseases[J]. Stat Methods Med Res, 1993, 2(1): 23-41.

[11] Zhao S, Lin QY, Ran JJ, et al. Preliminary estimation of the basic reproduction number of novel coronavirus (2019-nCoV) in China, from 2019 to 2020: a datadriven analysis in the early phase of the outbreak[J]. Int J Infect Dis, 2020, 92: 214-217.

[12] Zhou T, Liu QH, Yang ZM, et al. Preliminary prediction of the basic reproduction number of the Wuhan novel coronavirus 2019-nCoV[J]. J Evid Based Med, 2020, 13(1): 3-7.

[13] Tang B, Wang X, Li Q, et al. Estimation of the transmission risk of the 2019-nCoV and its implication for public health interventions[J]. J Clin Med, 2020, 9(2): 462.

[14] 赵琦, 徐飚, 姜庆五. 成功控制SARS 的经验与教训[J]. 中国初级卫生保健, 2003, 17(9): 24-26.

[15] Tian HY, Liu YH, Li YD, et al. An investigation of transmission control measures during the first 50 days of the COVID-19 epidemic in China[J]. Science, 2020, 368(6491): 638-642.

[16] 程诚, 陈帅印, 耿娟, 等. 湖北以外省份新型冠状病毒肺炎病例谱特征和扩散强度初步分析[J]. 中华流行病学杂志, 2020, 41. DOI: 10.3760/cma.j.cn112338-20200314-00347.

[17] 刘恩赤, 刘文丹, 林鑫洪, 等. 新冠病毒欧洲蔓延趋势分析——以西班牙,意大利和英国为例[J]. 商业全球化, 2020, 8(3): 37-51.

猜你喜欢
聚集区行政区患病率
成都市科技服务业发展现状分析
2020年安图县学生龋齿患病率分析
京字头
云南省寻甸县小学生视力不良及屈光不正患病率调查
昆明市3~5岁儿童乳牙列错畸形患病率及相关因素
上榜派出所统计表
上榜派出所统计表
现代物流产业聚集区发展研究
我国高血压人群的一般规律
沈阳铁西区装备制造产业聚集实证分析