邹浩越,李世霖,刘韩坤
(湖南工业大学 理学院,湖南 株洲 412007)
2019年,一类意想不到的COVID-19病毒给中国乃至世界经济造成了严重损失,COVID-19病毒具有非常强的空气传染能力,其通过与人体黏膜细胞上的血管紧张素转化酶Ⅱ(angiotensin converting enzyme-Ⅱ,ACE-Ⅱ)特异性结合,从而引发呼吸系统病变[1]。新型冠状病毒肺炎的潜伏期一般为14 d左右,病毒传染能力非常强,因其传染性较强而使得防疫非常困难。但是中国政府通过宏观调控,运用政策手段限制住了病毒的传播范围,使得我国的疫情形势转好。
为了探求如何有效进行防控防疫,本文拟基于SIR/IR模型进行分析[2-3],通过Matlab对现有数据进行分析和评价,评估政府干预对公共安全的影响,为此后类似疫情的防疫和救治工作提供理论支持和实践参考。
SIR模型,是由W.O.Kermack等[4]于1927年建立的,用于研究传染病动力学传播的经典仓室模型。仓室模型的基本思想,是将自然状态下的人群分为若干仓室,再对仓室建立模型和进行分析。仓室模型中最具代表性的模型是SIR模型。
大多数感染性疾病都是免疫的——即患者治愈后,在被感染的系统中立即被移除,称为移除者。而患者在治愈后具有非常强的免疫力(默认不会再次患病),可以认为康复后的患者既非健康者也非不患病者,退出了传染病体系。
SIR模型是常见的一种描述传染病传播的数学模型,其基本假设是将人群(总人数N不变)分为以下3类[5]:
1)易感者(susceptible)。文中以S表示,指未感染,因自身免疫力低下或者缺乏免疫力,而与患病的人接触后易受感染的人。S占N的比例,即S/N以S(t)表示。
2)感染者(infectious)。文中以I表示,指已经感染上传染病的人,他们可以通过接触传染等传播方式将病毒传染给易感人群。I占N的比例,即I/N以I(t)表示。
3)移除人群(recovered)。文中以R表示,指从系统中移除的人,包括在疾病中康复或死亡的人。这些人不再参与模型的后续过程。RI(t)占N的比例,即R/N以R(t)表示。
本研究基于仓室SIR模型模拟COVID-19的传播情况。以β表示日接触率(平均每日每名感染者感染易感染者数量),用以反映疾病传播的强度;以γ表示日恢复率(平均每日移除感染体系的感染者数量),取决于系统感染发展时间的平均值。模型建立在以下假设基础之上。
1)不考虑所取得样本区域的人数总量改变,假设本区域人口总数为常数且为定值。故本模型设定研究期间湖北省的人口数总量为定值。
2)此种病必须为传染病,且假设病人一旦与易感者接触后就必然发展成为具有一定的传染力的感染者,系统初始时的样本空间人群都没有这种疾病的抗体。假设单位时间t内,一个病人能传染的易感者数目与系统环境内的易感者总数S(t)成正比,且比例系数为β。故在单位时间t内被所有病人传染的总人数为β·S(t)·I(t)[6]。
3)疾病可以被治愈或导致死亡,从而产生R(t)人群。在t时刻,单位时间内从染病者中移除的人数与病人数量成正比,比例系数为γ。故单位时间内移除者的数量为γ·I(t)。
SIR模型中3种人群之间存在如图1所示的转换关系。
图1 SIR状态迁移图Fig.1 SIR state transition diagram
为了简化,用3组人群的第一个字母S、I、R分别表示3组人群的总人数。N表示人口总数[7],系统中的3类人群可用以下形式的常微分方程组体现出数量随时间的动态发展变化规则:
由于自2020年1月23日10时起湖北省关闭了省内的大部分出城通道,因此可将此阶段的湖北省视为一个暂时封闭的整体。此外,由于湖北省的疫情数据在5月1日之后没有大的变化,因此课题组选择将1月22日—4月30日(1月22日就有检疫数据)的数据作为所要处理的数据,部分具体数据见表1,数据来源于腾讯新闻新型冠状病毒肺炎实时更新[8]。
表1 新型冠状病毒肺炎1月22日—4月30日部份疫情数据Table 1 Some COVID-19 epidemic data from January 22 to April 30
图2和图3分别为运用Matlab对表1中数据拟合湖北省境内患病累计确诊、治愈或死亡人数,以及每日新增人数的情况,起计日期为1月22日。
图2 累计确诊、治愈或死亡人数拟合曲线Fig.2 Cumulative number of diagnoses, cures and deaths
结合图3和表1中数据可以得知,在1月27日之前,每日新增确诊人数都是以十位或百位数量增加,然而自1月29日至2月18日,每日新增确诊人数的量级从百位迅速提升到了千位。其中,最为突出的是2月12日,当天新增确诊人数高达14 840,查阅央视新闻报道以及湖北省卫健委发布的公告可知,2月12日,湖北省COVID-19疫情防控局除了之前的试剂检查以外,还增加了“临床诊断”,于是出现了一轮新增病例数量的增加。自2月19日到3月10日,每日新增病例的数量从千位量级回到了百位、十位,且新增病例的数量逐步下降。从3月11日—3月17日,每日新增病例数基本稳定在个位数。3月18日—4月30日基本没有新增新型冠状病毒肺炎病例,表明疫情已经基本得到了有效控制。
图3 每日新增疫情情况拟合曲线Fig.3 Daily new epidemic tendency
在经典模型当中,利用Matlab使用线性最小二乘法对待定参数进行估计,由图2可以得出,一般情况下,正常病毒性肺炎的恢复周期为14 d左右,故将此次病毒性肺炎恢复周期估计为14 d,而由移除率的定义可以得出恢复系数γ≈1/14,通过Matlab进行拟合可得传染率β=0.291 32。同时可以采用如下公式估算出新型冠状病毒肺炎的基本传染数。
R0为基本传染数,是指在没有外力介入,所有人都没有免疫力的情况下,一个感染某种传染病的人会传染给其他多少个人的平均数[9]。通过计算得出COVID-19的初始基本传染系数为4.078 48。
基本传染数的一个重要指标是衡量疾病传染性。R0的一个重要临界点是R0=1,R0的数字越大,代表流行病越难以控制。若R0<1则传染病将会随着时间的推移而逐渐消失;若R0>1则传染病会以指数形式传播,最终演变成流行病。非典(严重性呼吸综合症,SARS-Cov)的基本传染系数约为0.8~3.0,埃博拉病毒的基本传染系数约为1.5~2.5。由此可看出新型冠状病毒的感染力较强[10]。
通过式(1)进行模型拟合,即可得出由SIR模型预测的武汉市患病人数,如图4所示,其中监测天数起计日期为1月22日。
图4 监测期内SIR模型的数值变化曲线Fig.4 SIR model numerical change curves
由图4可知,随着时间增长,易感人数比S(t)从1逐渐降低至0;感染人数比I(t)则是先增长,S达到峰值后逐步下降至0;而移除人数比R(t)是从0缓慢增长至1。但SIR模型的感染来源为感染人群(I)感染易感人群(S),而实际情况下新冠病毒的感染人群增加的主要原因为隔离人群在隔离期确诊,并且我们国家新冠防控的R0是变化的,随着时间推移逐渐缩小(防疫越来越严格),而SIR模型的R0是一个定值,因此SIR模型与实际情况间会出现一定的误差。
由于SIR模型不能很好地体现出由基本传染系数的变化而使模型对未来预测发生改变,所以课题组选择舍去易感者S(t)再进行模型拟合,即可得出IR模型,该模型的常微分方程如下:
基本传染系数R0,为每个患病人员每天会接触并感染的正常人个数,即为病毒的基本传染系数,R0可以从侧面显示防疫管控程度的好坏,即R0越大,表明隔离和管控措施越差;R0越小,则表明对疫情防控起到了出色的效果。通过R0变量能清楚地认识到疫情隔离防控的好坏对疫情未来发展趋势的影响,不同R0下IR模型拟合结果如图5所示,其中监测天数起始日期为1月22日。
由图5可以看出,随着R0数值的减少,患病人数比I(t)达到的最大值减小,当R0=2.29时患病人数比I(t)甚至不超过25%,随着疫情管控增强(R0减少),感染人群从骤增到达高点至最后减少到0所用的时间在减少,说明采取严厉的管制和防控隔离措施对控制新型冠状病毒肺炎患病人数的增加和缩短疫情结束时间有着显著的效果[11]。
图5 不同R0下湖北省患病人数比例随监测天数变化的IR曲线Fig.5 IR curves of the proportion of patients in Hubei Province with different R0 with the number of days
图6为除中国以外的部分国家感染人数变化趋势图,时间为2020年3月至12月。
图6 美国等国家的新型冠状病毒肺炎感染人数趋势图Fig.6 Trends in the number of COVID-19 in the United States and other countries
由图6可以看出,美国的新型冠状病毒肺炎变化趋势十分严峻,归其根本是因为在疫情初期没有尽可能的在政策上加强管制和防控隔离,同时民众大多不能正确地认识到疫情的严重性,将其戏称为“大号流感”,这造成了病毒在人群中大肆传播,给本国经济、群众就业造成了巨大压力。同时,中国与美国两种截然不同的疫情发展趋势,从侧面体现出在疫情初期做好隔离管控的重要性。
SIR模型是一种非常有效的传染病分析模型。为了简化传染病的传染规律,得到更为精确的解,课题组将人口结构划分为易感人群(S)、感染人群(I)和移除人群(R)3类,从而得到更适合实际情况的传染病传播规律。本文利用该模型的优势拟合新型冠状病毒肺炎疫情在湖北省的发展规律。从拟合曲线可以看出,如果不加干预,该次疫情将造成较大伤亡。而实际情况与拟合情况间较大差异的原因在于,我国政府在疫情发生后,采取了严格的疫情管控措施,致使疫情能够在短时间内得到有效控制。
虽然SIR模型能非常直观地展示传染病的过程,但是应注意到,该模型对人群的分类不够细致,未能清晰考虑出隔离这一重要因素。而实际情况下对疑似病人采取隔离措施是阻止疫情传播最有效的方法,同时模型没有引入反应机制,在对模型进行拟合的情况中,单就依据已有数据猜测未来较长一段时间的数据,必定会使得准确度下降,同时SIR模型没有考虑到移除人群再次感染的情况。此外,微分方程组求解较为困难,且模型对初值比较敏感,这对模型的稳定性有极大影响[12]。
由于模型仍然是一个粗略的模型,主要是未能考虑到COVID-19病毒存在潜伏期这种情况。一般情况下,3~7 d为COVID-19病毒的平均潜伏期,最长的甚至达到24 d。而假若忽略了潜伏期,那么会造成模型拟合与事实情况出现一定的偏差。SEIR模型则囊括了这一点,将潜伏者(exposed指有接触过感染者但未发病,可能与存在潜伏期的传染病)变量引入模型当中,此时模型的拟合将更为精确。课题组将在后续研究中使用SEIR模型进行研究,以得到更为拟合的模型。