李卓宇,夏必胜,马乐荣
(延安大学数学与计算机科学学院,陕西 延安 716000)
持续的新型冠状病毒肺炎大流行(Corona Virus Disease 2019,COVID-19,简称“新冠肺炎”)给世界经济造成了巨大的健康负担和影响。在全球范围内迅速蔓延的同时,感染患者数量惊人,死亡人数每日都在增加,并构成严重的公共卫生风险[2]。在少数国家,由于干预措施的成功实施,COVID-19疫情有所消退,对于一些人口大国的国家来说防疫工作仍然是一个巨大的挑战。但是利用合理、准确的暴发预测疫情的数学模型,可以科学预测不同地区传染病流行趋势,对于深入了解传染病的可能传播和后果以及疫情的发展阶段做出合理的评估,具有重要意义。因此,了解疫情动态,提前预测感染病例的数量或疫情高峰期,并及时实施有效的干预措施将对控制任何地区的新冠肺炎流行病作出巨大贡献。例如在此次COVID-19传染病大流行期间,随着实践检验,特定群体健康保障、旅行限制和社会疏远、密切的联系追踪等预防措施,甚至是封城封国等强制干预措施均表明可以遏制疫情的发展。这些工作可以作为今后发生类似流行病时遵循的指南。
传染病对人类社会而言是一个巨大的威胁,但可以用数学模型研究、预测传染病的传播速度等,使人类可以有效地预防和控制传染病的传播。传染病动力学则是一种定量分析方法,可以根据人群所处的地理环境、传播规律,及一些社会等因素,建立能反映出该传染病动力学特性的数学模型。并且通过对模型的稳定性和数值模拟,分析其发展过程和预测所研究传染病的人群状态变化趋势等。
目前传染病建模方法中常见的模型按照传染病类型分为 SI、SIR、SIRS、SEIR 模型等,对于目前仍在持续的COVID-19大流行疾病,在最基础的传染病模型中只有SEIR 模型考虑了潜伏者,由于COVID-19具有潜伏期并且带有传染性,本文将从经典SEIR模型和各种变体优化的SEIR模型这两个类型作详细介绍。
常见数学模型中假设一般把传染病流行范围内的人群状态分成以下4种:
1)易感人群S,(Susceptible),指未感染者,但是缺乏免疫能力,与感染者接触后容易受到感染的人群;
2)暴露人群E,(Exposed),指接触过感染者,但处于潜伏期,暂时没有传染力将疾病传播给其他人的人群。此类人群状态适用于潜伏期长的传染病;
3)感染人群I,(Infectious),指感染上传染病的人群,可以将疾病传播给易感人群S,将其变为暴露人群E或感染人群I中的一员;
4)恢复人群R,(Recovered),指因病愈具有免疫力或被隔离的人群,以及死亡。在免疫期是有限的情况下,R中的成员可以重新变为易感者。
在大流行病传播期间,许多研究人员及学者们讨论流行病学的指标有多个,其中最重要的指标是基本再生数R0。基本再生数指在没有如传染病防控政策等外力介入,以及所有人对某种传染病缺乏免疫力的情况下,一个感染者会把该疾病传染给其他多少个人的平均数。 在传染病模型中是一个极为重要的概念,它指示着大流行病是否会扩散到更多地区或者逐渐减少直至消失。因此在介绍以下4个传统传染病数学模型的同时也介绍了基本再生数的求解方法。
2.1.1 SI(Susceptible-Infectious)模型
SI模型是一个逻辑斯谛模型。SI模型中只有两类人群状态,易感人群(S)和感染人群(I)。模型假设条件为:易感者与感染者通过有效性接触就会被感染,变为感染者,在此过程中无潜伏期、无治愈情况以及无免疫力。并且在疾病传播期内,模型应用的地区总人口数(N)保持不变,N=S(t)+I(t)。因此模型建立如下微分方程
(1)
β表示传染率;t表示时间戳。由于总人口数不变,根据守恒关系可得
(2)
r表示指数增长率。根据SI模型可得出两个重要结论:①指数增长率与人口总数呈正比关系。在总人口数N越多,且属于重要交通枢纽的地区,传染率β不变时,疾病大爆发的速度会越快,此时政府需要及时实施防预措施显得极为重要,例如隔离感染者。②在感染人群(I)是总人口数(N)的一半时,感染者数量将会增加得最快,同时也是医院门诊量最大的时候,所以医疗卫生部门需要重点关注该因素。
(3)
m表示有m组不同的感染阶段,vm表示从m阶段向m+1阶段发展的平均概率(m=1,2,…m-1),dm表示感染者在第m阶段的死亡率,βm为处于第m阶段的个体的传染率系数。
由于SI模型应用范围非常局限,经过一定的时间所有人都会感染,只考虑爆发和传播过程,没有考虑治愈人数,与现实情况偏差较大。
2.1.2 SIR(Susceptible-Infectious-Recovered)模型
在SI模型的基础上,SIR模型在传染病大流行期间进一步考虑了病人的康复过程,弥补了这一缺陷。SIR模型中有三类人群状态,易感人群(S)、感染人群(I)和恢复人群(R)。模型假设条件为:感染者在康复后就获得了永久免疫,或者高致死率传染病导致有死亡病例,这两种都可归为R类人群。并且在疾病传播期内,模型应用的地区总人口数(N),N=S(t)+I(t)+R(t)=常数。模型的微分方程如下
(4)
β表示传染率;γ表示恢复率。在传染病流行期内,易感人数(S)等于考察地区的总人口数(N),随着时间t的增加,易感人群的人口数开始单调递减,而感染人数(I)会在易感人数S=γ/β时达到最高值。所以在实际传染病模拟预测应用中,可以根据SIR模型预测出感染人数的峰值点及时间,及时告知医疗卫生部门做好相应准备措施,避免峰值日期时在医院就诊造成二次爆发。
SIR模型基本再生数R0的求解,有两种方法。第一,假设对于总人口恒定的SIR模型,出生系数与自然死亡系数均为μ,恢复率为γ,传染率系数为β。可由基本再生数R0的定义导出。
(5)
第二,由初始时刻感染者的单调性可得基本再生数。
(6)
2.1.3 SIRS(Susceptible-Infectious-Recovered-Susceptible)模型
对于某些传染病来说,感染者痊愈后还是有一定概率再次被感染。此时SIR模型就不适合该传染病的模拟仿真预测,于是出现了SIRS模型。SIRS模型和SIR模型的人群状态类别相同,分为易感人群(S)、感染人群(I)和恢复人群(R)。模型假设条件为:易感者与感染者通过有效性接触就会被感染,变为感染者,无潜伏期。在被治愈为恢复者后有短暂免疫力,单位时间后再次转为易感者,可能会二次感染。并且总人数N=S(t)+I(t)+R(t)等于一个常数。模型微分方程如下
(7)
α表示痊愈者获得免疫的平均保持时间;β表示传染率;γ表示恢复率。由SIRS模型微分方程组可得知,在传染病开始流行之前S=N;在传染病流行阶段,S=γ/β(I/R=α/γ)。由此可得出两个结论:1)当某地区存在传染病传播时,疫情防控措施能够迅速实施控制疾病的传播,医疗技术的提高让恢复率γ>βN。此举措可以使传染病逐渐缓和直至消除。2)对于突然爆发的新型流行病,在疾病大流行期间,政府无法实施能够控制疫情发展的政策措施时,医院应该做到尽量减小α,提高恢复率γ,让更多人保持对该疾病的免疫力。
SIRS模型的基本再生数R0的求解方法可参考文献[2],假设α是因病死亡率;d指平均康复期。基本再生数R0则表示为
(8)
2.1.4 SEIR(Susceptible-Exposed-Infectious-Recovered)模型
对于某些具有长潜伏期的传染病来说,上述3种模型均不适用,因此出现了SEIR模型。SEIR模型中有四类人群状态,易感人群(S)、暴露人群(E)、感染人群(I)和恢复人群(R)。模型假设条件为:某种传染病具有潜伏期,与感染者接触过的易感者并不是立刻患病和出现相关临床医学反应,而是成为疾病病原体的携带者,暴露在社会群体中,难以被医护人员发现,因此将这类潜伏者归入暴露人群中(E)类中。依然存在守恒关系研究地区总人数N=S(t)+E(t)+I(t)+R(t)=常数,如有病死者,则可归为R类。此时SEIR模型的微分方程组如下
(9)
β表示传染率;γ1表示潜伏期恢复率;γ2表示感染期恢复率;r:感染者接触易感者的人数;a表示潜伏者转化为感染者的速率,估计为已知的平均潜伏期Y的倒数,即a=1/Y。与SIR模型相比,SEIR 模型考虑了与感染者接触过的人中,存在部分人员具有传染性的因素,且潜伏期使疾病的传播周期更长。通过SEIR模型微分方程组和数值模拟技术结合,可以预测疾病对易感人群人数的影响、感染人群的高峰期及趋势走向,以及影响人数R∞。
SEIR模型的基本再生数R0的求解,在给定基本初始条件下,通过Runge-Kutta法,结合最小二乘法可以拟合出参数的最优解,从而得到基本再生数R0。
目前COVID-19仍然是全球大流行传染病。全世界有很多研究机构现已研发多种新型冠状冠状病毒的疫苗。因此,需要对COVID-19大流行进行定量和定性分析,以及快速检测感染鉴定对控制COVID-19传播的作用,带有计算模拟的数学模型是帮助研究者估计疾病关键传输参数和进一步改进控制这种疾病发展的有效工具。
如SEIR模型,SEIR模型特别考虑了传染病存在潜伏期的情况,并且也是目前最具代表性的固定人群传染病动力学研究数学模型,因此该模型在新冠肺炎疫情预测中的应用最为普遍。研究关注因素和结合方法等汇总见表1。
表1 在传统SEIR模型下COVID-19的模拟预测关注因素及特点等汇总表
在全球新冠疫情使用SEIR模型模拟预测应用中,Carlos等[3]结合蒙特·卡罗方法模拟了COVID-19在中等规模社区的传播,并研究了检疫和疫苗接种等预防措施的效果。翟羿江等[4]将含有基础疾病历史的人群作为关注因素添加到经典的SEIR模型中,用数值模拟对理论结果做了有效验证。发现不考虑基础病的数学模型会低估疾病传播的基本再生数和感染人口的规模。Liu等[5]通过结合EEMD方法引入季节因素,分析了在南半球国家寒冷的季节和北半球国家暖季增加的总感染量,结果表明COVID-19的季节性在纬度较高时更为明显。在较冷的气候条件下,该疾病的传染率和死亡率均较高。以及Chris等[6]利用随机网络改变模型关键参数进行模拟研究,分析有效再生数和流行病其它指标的被影响程度。发现在感染状态下的平均时间长度和传播速度是最重要的模型参数。
也有大量学者应用SEIR模型预测中国各地区疫情的发展情况。其中Hu等[8]对该传染病的传播机制进行分析和模拟,模拟分析人口迁移变量对确诊病例数及疫情防控效果的影响。肖燕妮等[7]构建了干预措施、疫苗接种和个体行为变化的动态演化方程,计算了最优的干预强度和疫苗接种速率,发现过早解除干预措施和个体对疫情的重视程度是导致COVID-19疫情多次暴发的关键原因。Daniel等[9]引入年龄类别干预措施因素,拟合了武汉市官方死亡人数并计算死亡年龄分布,量化年龄选择性干预对武汉市死亡率的影响。结果表明年龄选择性干预策略可以使死亡人数减少> 30 %。Feng等[10]基于SEIR和AI模型模拟预测武汉和非武汉地区的COVID-19流行趋势。由于政府实施了强干预措施,研究结果发现解除封锁,中国大陆非武汉地区的疫情规模将翻倍。
其它国家COVID-19流行趋势的SEIR模型模拟预测应用研究中,Chung等[11]将社会网络连接的多样化分类模型与SEIR模型相结合,研究了新加坡人口密集社区内传染病的不同时刻和阶段采取社会隔离和封锁等控制措施的可行性和有效性。Marwan等[12]基于SEIR模型和Runge-Kutta方法,利用已有数据得到基本再生数,最后估计了15个国家的暴露率系数、感染率系数、恢复率系数和死亡率系数。Frank等[13]将非线性物理的序参量和特征值引入经典SEIR模型,发现泰国疫情暴发遵循一个适当定义的SEIR序参量。Yarsky等[14]基于遗传算法解决了参数的多变性的问题,对美国新冠病毒的传播和医院资源开放及利用的影响做了预测和分析。Noor等[15]将SEIR流行病学模型和神经网络相结合,使用250天的现有数据进行训练,对孟加拉国确诊病例的预测准确率大约在90 % ~ 99 %之间。Mauricio等[16]将蒙特·卡罗方法结合SEIR模型,在智利疫情预测中,发现预测病例上升和病例下降的高峰和开始时效果非常好。Medrek等[17]将人工智能( AI)方法结合增强的传染病动力学 SEIR模型,预测波兰、法国和西班牙的疾病流行趋势,分析检疫预防措施的有效性,以及该措施对疾病传播率和持续时间的影响。Liu等[18]应用贝叶斯模型和SEIR模型将中国和英国9个地区COVID-19传播的局部传播动态进行对比,发现英国的基本再生数( R0)相对较高。通过对时间变化的有效再生数( Rt)的估计表明,控制措施,特别是强制封锁,对降低传染率和遏制COVID-19疫情是有效的。
由于COVID-19流行病有着高传染性和无症状者隐蔽性传播,在大流行过程受到多种外界因素的影响。如地理位置,人口规模、环境气候、防预和干预措施政策的实施等因素。仅基于经典的SEIR模型预测被研究地区的疫情发展与现实疫情偏差较大,因此大量国内外学者根据被研究地区的实际疫情传播和防控流程政策,将传统SEIR模型进行改进优化,建立更加符合局部地区的疫情发展预测模型。研究关注因素和结合方法等汇总见表2。
表2 在各种变体SEIR模型下COVID-19的模拟预测关注因素及特点等汇总表
在全球新冠肺炎流行病仿真预测中,Deborah等[19]基于Z-control控制方法建立了包含过度暴露机制的SEIR模型。Tang等[20]通过建立确定性的分区SEIR模型发现对密切接触者追踪检疫隔离等干预措施能够有效地降低有效再生数和传播风险。Zhao等[21]提出SEIR / V-UA 模型研究疫情传播与信息扩散之间的相互影响。Saikat等[22]结合COVID-19的季节性传播,扩展了传统SEIR模型。Zhang等[23]考虑当地医疗卫生系统的能力和可能的干预措施因素,提出改进的SEIR模型模拟COVID-19疫情,发现需要根据各地区本身条件实施有效的应对政策才能遏制疫情的暴发。Veronika等[24]引入群体因素,建立扩展流行病学SEIR模型,分析流行病控制措施,结果表明需要结合量身定制的机制,例如保护弱势群体、追踪密切接触者和隔离方法,可以有效地预防高死亡率。
在全国新冠肺炎流行病仿真预测中,刘汉卿等[25]将小世界和无标度网络模型与改进的SEIR模型结合,进行社交行为(正常、保持距离、隔离措施)的仿真预测,验证结果表明该模型具有良好的适用性。赵鑫等[26]建立改进的传染病动力学CSEIR模型,通过仿真预测发现居家隔离、减少人群接触、患者追踪、集中收治等有关疫情防控措施对遏制疫情发展是有效的。邓春燕等[27]提出的D-SEIR模型考虑了地区之间和地区内的人口流动因素,能够准确拟合COVID-19传播过程中的易感人群和确诊人群的演化趋势。以及Pan等[28]考察气象要素(湿度、风速、紫外辐射)与COVID-19传播能力的相关性。利用混合群体SEIR模型模拟中国COVID-19在不同温度和相对湿度条件下的日病例变化,实验结果表明该3种气象因素与R0均无显著相关性。Chen等[29]通过对进口风险的控制措施(入境限制、旅行检疫、国内遏制措施)建立了参数化SEIR模型模拟了中国疫情动态不同情景下的病例输入和局部疫情。模型所模拟的病例输入数量和本地传播均符合历史流行曲线。Sun等[30]基于机器学习的参数优化下提出新的D-SEIQ模型,预测我国COVID-19疫情累计病例数,验证了该模型在模拟和预测COVID-19暴发趋势方面的有效性。
另外,在国外新冠肺炎流行病仿真预测中,Ajay等[31]基于感染脆弱性分层的影响和预防感染传播的措施,提出扩展的SEIR模型,预测美国和欧洲等国家可能的大流行动态。还有Shin等[32]根据韩国疫情对不同阶段的参数估计建立相应的SEIR ( D)隔室流行病模型,发现公共卫生当局非药物干预( NPIs)的有效性能影响感染模式。Biala等[33]提出分隔室模型( SEI A I S HRD),发现需要执行更严格的措施,如使用戴口罩、减少社交、联系人追踪,甚至更长时间的隔离,以减轻病毒的传播。Michael等[34]使用改进的SEIR传染病数学模型,研究与驾驶有关的短期旅行对病毒传播的影响程度。Li等[35]提出潜伏期的时间依赖SEVIS模型,对COVID-19大流行进行跟踪、及时监测,并对其进行精确预测。Hussam等[36]将非线性奇异分数阶和修正的SEIR模型结合,对马来西亚和巴基斯坦等不同国家的 COVID-19进行了相应的仿真预测。Marinho等[37]使用年龄结构的扩展SEIR模型和社会关系矩阵来评估印度的年龄特异性疫苗分配策略。
1)新冠肺炎疾病大流行直至目前,仍是研究者们的热点研究对象。通过整理多篇文献发现SEIR模型和多种变体的SEIR模型在疫情早期大多数研究工作是预测COVID-19大流行的暴发期及未来发展趋势,且关注或分析的因素大致相同,如强干预措施(封城、隔离、控制社会接触等)的可行性和有效性。随着接种疫苗的普及,现阶段该两类模型的关注点大多数在于疫苗接种的有效性、防预措施如检疫和不同强度下干预措施的重要性、无症状者等因素。
2)对于疫情仿真预测,该两类模型在与其它方法的多元化结合上,所涉及的共同领域有人工智能、机器学习、神经网络、统计学、数理统计等。对传染病指标分析最多的一项指标是基本再生数R0。关于参数取值大多使用数值模拟得到,或根据实际数据进行参数估计,也有使用机器学习模型的超参数优化方法。对模型预测的效果及模型实证验证或分析,通常使用统计的数据进行数值模拟来验证,同时发现模型稳定性分析、敏感性分析在此环节中较为重要。
3)无论是经典SEIR与其它方法多元化结合的模型,还是多种变体SEIR模型,预测或发现的结论,如某些关系的可能性互相影响,都需要结合现实可行性和潜在益处和弊端加以解释。
1)由于各区域病例类型不同(如重症患者、轻度患者)和强流行的持续存在,简单的传染病模型预测与现实存在偏差。使用经典SEIR模型与其它领域方法相结合较多,其对疫情预测和评估比仅使用经典SEIR模型预测更准确。该类模型的适用性范围大于多种变体的SEIR模型。
2)传统的SEIR传染病数学模型或与其它方法两者结合的模型,相比于变体动力学SEIR模型,可能会受到各种不确定性因素的影响,如参数多变性。由于控制疾病传播的生物学过程不是根据现实情况作出改进的,这可能会强烈限制其预测能力。多种变体的SEIR模型能够考虑众多因素的影响,例如地区封锁、社交隔离等,是结合实际现实情况建模,大多都能够更为准确的预测COVID-19疫情的长期趋势,以及对政策干预措施进行合理评估。总体来说传染病数学模型都能更好的有助于发现COVID-19在人群流动下的传播规律和特性,为不同城市和地区的风险预警提供决策依据。
由于世界各国疫情形势、非药物防控措施、疫情下的民众行为模式及疫苗接种等差异巨大。对我国而言,现阶段国内仍需加强防预管理措施。目前多次局部疫情暴发根本原因有2个:①入境限制,可以防止国外患者大量流入中国,对我国人民安全构成重大威胁。但是随着新冠病毒的变异,该疾病有着高传染性和隐藏性,有无症状感染者,潜伏期时间最长达到20天,所以国际机场的环境卫生和对入境外来人员应该是重点防预对象,可对入境人员再次增加隔离时间。一旦松懈势必会导致局部疫情再次暴发。②旅行检疫,由于传染病长时间的持续,人们心理对疫情防预措施或多或少产生疲惫,在节假日期间,社交行为完全不受限制,各地区之间人口流动量增加,某些地区防预管理措施不当,例如发现疑似有问题人员,没有及时隔离和限制出游,导致疫情涉及多地。
由于通过信息跟踪发现短期旅行比长期旅行能更好的解释疾病的传播,因此根据疫情反复暴发的原因,可以发现每逢处于假期时间,人口流动性较大,在节假日之后的时间段疫情就会上升,说明疾病是在假期内进行传播,在假期结束后通过检疫或发病得知感染。因此建议在时间管理和防预措施强度这两方面需要调整,可在假期内加强检疫措施和管理,限制人口流动范围。
根据国外疫情发展现状,COVID-19大流行传染病还在持续。通过梳理文献发现疫苗资源存在分配问题,这是由于疫苗获得途径和数量非常有限。因此在今后的研究工作中不仅可以对国外疫情进行预测评估,也可以从管理优化方面对有限的疫苗实行最优分配策略。
大多数研究是将新冠肺炎传染病与机器学习领域相结合,与环境领域交融尚且浅薄,但是该疾病的传播途径之一是气溶胶传播,病毒是能够附着在气溶胶颗粒上。因此生物气溶胶的浓度、分布空间范围、流动速度等因素对新冠肺炎病毒的传播率或死亡率的影响可做进一步探讨。