厦门大学公共卫生学院,分子疫苗学和分子诊断学国家重点实验室(361102)
杨天龙# 王 瑶# 赵泽宇 芮 佳 林胜男 祝媛钊 徐静文 刘星纯 杨 蒙 邓 彬 刘 婵 李卓阳 刘炜康 黄杰锋 罗 丽 赵本华△ 苏艳华△ 陈田木△
新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)是由新型冠状病毒(SARS-CoV-2)所引起的,对全球公共卫生具有重大影响的潜在致命性新发传染病[1]。该病的潜伏期为1~14天,通常为3~7天,甚至可以达到24天[2]。易感人群被SARS-CoV-2感染后,主要症状表现为发热,咳嗽和乏力等[3]。此外,该疾病主要通过呼吸道飞沫传播和接触传播,并且在相对密闭的环境中也可通过气溶胶传播[4]。
根据国家卫生健康委员会公布数据,截至2020年11月12日,我国现有确诊病例394例,累计报告确诊病例86307例,其中累计死亡病例4634例[5]。截至2020年11月12日,新疆(喀什地区疏附县和克州地区阿克陶县)现有确诊病例36例,无症状感染者244例[6]。当前中国大部分地区疫情已经得到较好控制,但国内新冠肺炎的流行趋势依旧严峻,局部小范围的聚集性暴发事件时有发生,在不同地区疫情发生的原因及体现的问题也不同。随着入境政策的逐渐开放,有些周围与诸多国家相接壤的地区发生新冠肺炎聚集性暴发的风险升高,如黑龙江舒兰的疫情暴发由入境病例引起,乌鲁木齐疫情是由于跨境婚礼中的大量人员聚集所引起;此外由于接触到进口冷藏生鲜及海产品在冷链运输过程中外表面附着的病毒,而引发的聚集性疫情在全国各地频发,如北京新发地市场、大连等由于物传人所导致的疫情。2020年10月~11月新疆喀什疫情也极具特殊性,新疆喀什地区地处中国西部边陲,与塔吉克斯坦、阿富汗、巴基斯坦接壤边境接壤,地广人稀,且经济及医疗卫生水平较差。同时疫情被发现时的第一例病例是在该地区“应检尽检”的筛查中发现的无症状感染者,并随着密切接触者的排查发现大量的无症状感染者。因此本研究对新疆维吾尔自治区新冠肺炎疫情的预测可以为边疆或边境地区,如西藏,新疆,云南等地疫情的防控提供新的证据和借鉴意义。当此类疫情发生时,可为当地的医疗卫生部门进行医疗资源分配以及政府部门整体防控统筹提供建议和指导。
传染病动力学模型可以用来判断新冠肺炎疫情的发展趋势,并计算其传播能力来评估疫情的防控效果。根据以往研究,我们根据吉林省、厦门市、宁波市等地区的实际发病情况,构建了符合本地传播规律的易感者-潜伏期者-确诊病例-无症状感染者-移出者(susceptible-exposed-infectious-asymptomatic-recovered,SEIAR)传播动力学模型,评估了卫生部门采取措施前后新冠肺炎在当地的传播能力,评价实际防控效果[7-9]。同时,我们在吉林省舒兰市暴发的第二波新冠肺炎疫情中评估了该次聚集性疫情的传播能力,并评价卫生部门在疫情发生后干预节点所实施的防控措施效果,预测了不同干预场景(发病至确诊时间缩短、传播能力降低、所有病例均隔离)情况下的流行情况。新疆喀什疫情特殊之处在于,2020年10月24日,在新疆维吾尔自治区喀什市疏附县出现第一例无症状感染者后,当地卫生部门立即介入,并对首例病例及其亲属的全部密切接触者进行核酸检测,因此可以认为在10月24日之后卫生部门已经有效限制了新冠肺炎在当地的传播。此时评估当前新冠肺炎的传播能力不具有实际意义。而此次疫情传染源未知,疫情涉及规模和传播时间尚不明确。研究者及卫生系统关注更多的是在当地采取防控措施之前,即未发现首例无症状感染者之前新冠肺炎在此地的传播情况,因此本文通过利用SEIAR模型,不仅计算了符合当地实际传播情况的参数,同时考虑了实际防控情况,计算10月24日前已经存在的潜伏期患者,并预测确诊病例高峰时间及病例数以及全部潜伏期感染者清零时间。
1.数据来源及变量说明
本研究收集新疆维吾尔自治区2020年10月24日至11月7日新冠肺炎病例时间分布数据,收集信息包括报告日期、病例类型(包括确诊病例、无症状感染者等)、治愈人数、无症状感染者解除医学观察人数,以及新疆维吾尔自治区喀什地区疏附县和克州阿克陶县常住人口数。以上病例数据信息来源于新疆维吾尔自治区卫生健康委员会网站,人口数据来源于《2019年新疆统计年鉴》。
2.建模方法
根据我们之前的研究[10],我们建立了SEIAR模型。由于本次疫情同时暴发大量无症状感染者和部分确诊病例,因此在本研究中假设此次疫情传播中的潜伏期患者与确诊患者、无症状感染者一样也具有传染性。
模型方程如下:
3.参数估计
根据本次疫情防控实际情况,喀什地区于10月24日发现第一例无症状感染者后立即采取封城和对密切接触者核酸检测等措施,因此新冠疫情在此地的传播得到了较好的控制。根据以上情况我们假设本次疫情仅在发现第一例无症状感染者之前传播,即在10月24日之后新冠肺炎在喀什地区不具有传播能力。因此本次疫情传播以10月24日为节点的传播能力系数分为β1和β2,β1为4.82435×10-7,β2为0。
根据以往研究[10-11],无症状感染者与确诊患者的传播能力相同,因此k设置为1。已有研究表明[7,10-11],COVID-19的潜伏期为7天,潜隐期为5天,因此ω=0.143,ω′=0.200。根据实际病例数据计算,无症状感染者占全体核酸检测阳性者的比例80.15%,P=0.802。确诊患者的病程和隐性感染者的传染期为10天[7,10-11],γ=γ′=0.100。病死率f为0。各参数的定义及来源如表1。
表1 新疆维吾尔自治区COVID-19传播动力学模型参数定义及来源
4.场景设置及模拟潜伏期患者人数
2020年10月24日新疆喀什地区出现第一例无症状感染者,由于无症状感染者随着时间进展存在不断转为确诊病例和解除医学观察的可能,因此我们选择更能体现实际发病情况的确诊病例进行模型拟合。考虑到集中核酸检测结果检出时间和上报时间的限制,在开始出现确诊病例的前几日报告的病例数的增长趋势可能存在波动,因此本研究尝试将10月27日,28日,29日分别作为报告确诊病例的起始时间,即拟合开始时间。故本研究选取现患确诊病例数据分三种情况进行SEIAR模型拟合。
根据拟合数据起点日期不同,本研究将设置以下三种场景:场景1,将10月27日设置为拟合起始日期,拟合从10月27日至11月7日之间的数据,根据实际报告数据显示,此种场景初始现患确诊病例数为22例;场景2,将10月28日设置为拟合起始日期,拟合从10月28日至11月7日之间的数据,根据实际报告数据显示,此种场景初始现患确诊病例数为45例;场景3,将10月29日设置为拟合起始日期,拟合从10月29日至11月7日之间的数据,根据实际报告数据显示,此种场景初始现患确诊病例数为45例。基于以上假设,拟合并计算三种场景起始日期对应的潜伏期患者人数,模拟预测未来新发确诊病例、新发无症状感染者人数、现有确诊病例、现有无症状感染者人数随时间变化的曲线,估计疫情高峰时间、高峰时不同病例类型的病例数和病例清零时间。
5.统计方法
模型模拟采用软件为Berkeley Madonna 8.3.18,采用四阶龙格库塔法微分方程求解,曲线拟合优度的判定指标为模型拟合数据和实际数据的最小均方根(least root mean square,LRMS)[12-13],输出的最优结果与实际数据进行决定系数检验。若决定系数≥ 0.5且P<0.05,则模型拟合效果较好,结果有统计学意义;若决定系数<0.5或P>0.05则模型拟合效果不好,结果没有统计学意义。
2020年10月24日至11月7日,新疆喀什地区共报告COVID-19病例507例,其中累计新增确诊病例78例,首例病例报告日期为10月27日,末例病例报告日期为11月5日,主要集中在10月28日之前,没有明显发病高峰;累计新增无症状感染者429例,首例病例发病日期为10月24日,末例病例发病日期为11月7日,主要集中在11月3日之前,高峰为10月25日,峰值为137例。病例时间分布详见图1。
图1 新疆喀什地区COVID-19疫情时间分布(以报告日期统计)
模型拟合数据与实际报告数据拟合效果较好,场景1,场景2和场景3的拟合曲线与实际现有确诊病例人数的拟合优度检验结果R2分别为0.706,0.246和0.515;P值分别为0.001,0.121和0.019,场景1和场景3的模型数据与实际数据差异有统计学意义,场景2模型数据与实际数据差异无统计学意义。模型与疫情实际报告数据拟合情况详见图2。
图2 新疆喀什地区COVID-19实际数据与SEIAR模型拟合效果
模型拟合结果显示(表2),根据场景1、场景2和场景3的设置,即分别从2020年10月27日、28日和29日开始拟合,则估计拟合开始时潜伏期者人数分别为751人、577人和589人。
表2 新疆维吾尔自治区喀什地区COVID-19发病趋势预测结果
模拟预测确诊病例未来趋势结果显示,按照场景1的设置,从2020年10月27日开始拟合,此种情况下新增确诊病例数于2020年10月27日达到高峰,估计到达峰值当日有确诊人数22人,疫情于2020年11月12日出现末例确诊病例,累计确诊病例可达122例(95%CI:102~146例),累计罹患率0.024%(总人口为518200人,下同);根据场景2,若从2020年10月28日开始拟合,新增确诊病例数于2020年10月28日达到高峰,估计到达峰值当日有确诊人数17人,疫情于2020年11月11日出现末例确诊病例,累计确诊病例可达144例(95%CI:93~135例),累计罹患率0.022%;根据场景3,若从2020年10月29日开始拟合,新增确诊病例数于2020年10月29日达到高峰,估计到达峰值当日有确诊人数17人,疫情于2020年11月13日出现末例确诊病例,累计确诊病例可达140例(95%CI:117~163例),累计罹患率0.027%,如图3。
图3 SEIAR模型模拟不同场景的新增确诊病例流行曲线
模拟预测未来无症状感染者发病情况显示,场景1情况下新增无症状感染者人数于2020年10月27日达到高峰,估计到达峰值当日有无症状感染者人数120人,疫情于2020年11月21日出现末例无症状感染者,累计无症状感染者855例(95%CI:798~912例),累计罹患率0.165%;场景2情况下新增无症状感染者人数于2020年10月28日达到高峰,估计到达峰值当日有无症状感染者人数92人,疫情于2020年11月20日出现末例无症状感染者,累计无症状感染者712例(95%CI:658~762例),累计罹患率0.137%;场景3情况下新增无症状感染者人数于2020年10月29日达到高峰,估计到达峰值当日有无症状感染者人数94人,疫情于2020年11月22日出现末例无症状感染者,累计无症状感染者729例(95%CI:678~783例),累计罹患率0.141%,如图4。
图4 SEIAR模型模拟不同场景的新增无症状感染者流行曲线
模型模拟现有确诊病例人数结果显示,按照场景1设置,现有确诊病例于11月2日到达高峰,高峰当日现患确诊病例数为68例,预计在12月21日现患确诊病例清零;按照场景2设置,现有确诊病例于11月2日到达高峰,高峰当日现患确诊病例数为68例,预计在12月21日现患确诊病例清零;按照场景3设置,现有确诊病例于11月3日到达高峰,高峰当日现患确诊病例数为69例,预计在12月22日现患确诊病例清零,如图5。
图5 SEIAR模型模拟不同场景的现有确诊病例数流行曲线
三种场景的现有无症状感染者人数模型拟合数据与实际疫情数据拟合较好,实际疫情的流行曲线与模型拟合的曲线基本趋于一致。场景1:现有无症状感染者于11月2日到达高峰,高峰当日现患无症状感染者人数为394例,预计在明年1月8日现有无症状感染者清零;场景2:现有无症状感染者于11月3日到达高峰,高峰当日现患无症状感染者人数为310例,预计在明年1月6日现有无症状感染者清零;场景3:现有无症状感染者于11月4日到达高峰,高峰当日现患无症状感染者人数为323例,预计在明年1月7日现有无症状感染者清零,如图6。
图6 SEIAR模型模拟不同场景的现有无症状感染者流行曲线
同时由于11月7日之后,本次聚集性疫情没有新增确诊病例和新增无症状感染者出现。因此我们选取三天后更新的现有确诊病例人数和现有无症状感染者来对模拟结果进行验证(图5、6验证区)。发现报告现有确诊病例人数与模拟结果基本一致,报告现有无症状感染者人数略低于模拟结果。
模型拟合数据与实际发病数据的拟合优度检验结果显示,场景1和场景3拟合效果较好(场景1:R2=0.706,P<0.01;场景2:R2=0.246,P>0.05;场景3:R2=0.515,P<0.01)。经实际情况验证,预测结果与疫情实际持续时间基本一致。在以往的传染病建模研究中,我们关注更多的是传染病的传播能力。但结合本研究的实际情况,由于10月24日有关卫生部门已经隔离相关密切接触者,在传染源基本得以控制的情况下再探索传播能力的价值甚微。而在本次暴发的聚集性疫情中,我们未知的是在卫生部门未介入前疫情未防控的情况下的潜伏期人数,即在传播没有被发现并控制时疫情扩散的程度,此时关注已被感染却尚未被检测出的潜伏期患者人数更有意义。根据预测结果,在疫情初始阶段存在大量潜伏期患者,因此可以假设在10月24日发现第一例无症状感染者之前就存在新冠肺炎病毒传染源的大范围暴露,即新冠病毒于一个潜伏期时间内在此地区感染了大量的易感者,根据此种情况可以计算出假设的三种拟合起始时间出现的感染者人数。
本次疫情主要暴发于喀什地区,该地区地处中国新疆维吾尔自治区西南部,是中国最西部的边陲城市,与塔吉克斯坦、阿富汗、巴基斯坦接壤。该地土地面积范围较广且人烟稀少,经济发展水平和医疗卫生水平较为落后。本次疫情中,政府和当地卫生部门的及时响应与正确的防控处理措施是得以控制本次疫情的重要原因,喀什地区疏附县在“应检尽检”人员定期检测中发现1例新冠肺炎无症状感染者,周边地区迅速开展流行病学调查及溯源工作,对全部密切接触者进行隔离和健康管理,迅速在喀什地区开展全员核酸检测,强化重点人群和重点区域管控与环境消毒消杀,迅速遏制了疫情的发展[14]。其他经济与卫生条件类似的国家和地区的疫情与此次疫情相比,防控效果并不理想。有研究表明非洲一例COVID-19患者将会传播2.37个易感者,由于其脆弱的卫生保健系统,卫生人员不足,缺乏水和用于维持卫生的消毒剂等,即使发现感染者,也无法做到短期内对全部密切接触者进行新冠病毒核酸检测和隔离,从而导致疫情加重[15]。而在欧洲等一些经济发达地区,医疗和检测水平强于发展中国家,但由于其国情限制,政府的干预和控制难以达到像本次疫情中的干预力度,也无法遏制疫情的蔓延[16]。因此本次疫情中新疆政府及卫生部门对于疫情管控的具体措施,可以为更多中国的边境地区及其他情况类似的国家,在突发新冠疫情时提供经验。
由于本次疫情在暴发初期即发现大量无症状感染者,因此极有可能是由于外环境被新冠病毒污染所导致的大范围易感人群的感染,因此本研究还可为最近国内频发的由外环境污染所致新冠疫情带来启示。随着疫情管控的逐渐放开,对外贸易政策的开放,在进口产品的运输中也可能携带新冠病毒。有研究表明新冠病毒在零下二十摄氏度的条件下可长期存活,气温的降低使新冠肺炎病毒的存活条件更加适宜[17-18]。外环境的污染和进口生鲜冷链运输过程中的污染是导致近期各地疫情暴发的主要原因,尤其是作业空间比较封闭的环境[19]。在接下来的研究中,可以通过带有外环境介质的传播动力学模型,即易感者-潜伏者-染病者-隐性感染者-移出者-介质(Susceptible-Exposed-Infectious-Asymptomatic-Recovered-Water,SEIARW)模型来预测和评估新冠疫情的发展趋势,为卫生部门提供紧急预案和防治对策[20]。
本研究的创新性在于根据新冠肺炎自然史和以往聚集性新冠肺炎疫情中传播动力学的特点构建SEIAR模型,并用新疆喀什地区的实际疫情数据来设置参数,因此该模型的设置更加符合在本次聚集性疫情的实际特征。同时,由于已知在疫情暴发初期,报告数据受核酸检测时间和上报时间滞后的限制,可能存在报告质量不稳定的情况,因此将出现确诊病例的前三天(10月27日,28日,29日)分别作为拟合起点设置了三种场景,考虑到不同拟合起点所导致预测结果的波动,三种情况所得结果可以作为疫情预测的取值范围。
本研究尚存在一定的不足,由于本文中用来拟合的数据为报告数据,较发病时间数据存在一定的时间滞后性,不能准确反映疾病的传播。因此受到数据源的限制,本文的预测结果可能会与实际发病数据存在一定的误差。但本研究的重点是在一种可以公开获得数据源的背景下,如通过查找官方网站报告数据来对疫情传播及当前扩散规模的方法学探讨,为今后有类似情况的研究提供方法学依据。
综上所述,本研究对于疫情源头未知的情况下估算出潜伏期人数的方法进行了探索,可以为卫生相关部门采取相应的应急措施和资源分配提供依据。此次疫情为聚集性传播,病例以无症状感染者为主,主要发生在作业空间比较封闭的村办企业。而密切接触者的及时隔离和核酸检测在本次疫情的控制中起了主要作用。因此核酸检测要提高质量,完善检测方案,扩大检测覆盖范围,优化检测流程和操作规范。同时要坚持人、物同防,加强工厂等闭塞且人员密集场所的外环境消毒以降低疫情传播风险。