郭志荣,张 华,姜道旭
(1.扬州职业大学数学系,江苏 扬州 225009; 2.扬州市妇幼保健院,江苏 扬州 225000)
我国通过采取积极的医疗救治与预防控制措施,使新型冠状病毒肺炎得到了极为有效的控制,社会、经济秩序得到了有序恢复,但是新冠肺炎仍在部分国家和地区蔓延。由于新冠肺炎传染性强、传播途径广并具隐蔽性,人群普遍易感,因此在复工复产复学导致流动人口激增的情况下,需要厘清传染病突发事件发生机理、传播规律,运用科学思维方式,预防和控制传染病的传播,这是全球公共卫生管理部门迫切需要解决的问题[1-3]。
数学模型是解释传染病流行的一种重要模式,通过数学建模能有效预测疫情的传播趋势,为传染病的防控决策提供科学依据。从传染病发病原因、传播途径入手,立足于寻找影响疫情传播的因素,通过建构传染病传播的预测模型,发现疫情传播规律,切断疫情传播途径。
传染病的预测模型主要经历了以下三个发展阶段:
A.疫情预测的经典模型。
传染病疫情预测的经典模型主要包括两类,一是依据偏微分方程来构建预测模型,二是依据变量在时间序列的线性变化建构预测模型。
依据偏微分方程来构建预测模型。1926年,Kermack和Mc Kendrick提出SIR仓室传播模型,建立传染病动力学的阈值理论来研究1665-1666年伦敦黑死病的传播规律,取得了重大成果[4]。2007年,Eichner等人开发Influ Sim仿真工具,模拟依据偏微分方程来构建的传染病预测模型,帮助管理部门提出疫情的最佳处置方案,成功遏制了流感的传播[6]。由于经典的微分方程预测模型需要设定感染区域的总人数固定不变,无法考虑复杂的现实因素,因此依据偏微分方程来构建的预测模型使用范围受限。
依据变量在时间序列的线性变化建构预测模型。通过分析传染病发病率的一维时间序列来对传染病进行预测,主要包括ES模型(Exponential Smoothing)、MC模型(Markov Chain)等。依据变量在时间序列的线性变化建构的预测模型是从分析变量在时间序列上的数据着手,通过参数估计、曲线拟合来描述疫情变化趋势,一旦采集的数据比较离散、不规则,此类模型就无法发挥作用了。
B.基于互联网的疫情预测模型。
人们一旦患病,经常会使用互联网检索与病症相关的资料。而互联网使用痕迹是可以追踪的,通过追踪用户在网络和社交媒体搜索的关键词频率,可估计传染病的发生率,从而建立基于互联网的疫情预测模型。百度等中国互联网公司运用此模型为疫情防控作出了重要贡献。对比疫情预测的经典模型,基于互联网的疫情预测模型特点明显,能在第一时间对传染病疫情进行预测,但因数据采集的不规范和不可控,预测是否准确还需要进一步分析。
C.基于机器学习的疫情早期预测模型。
基于机器学习的疫情早期预测模型,其目标是利用机器学习分析导致新型传染病的最突出因素,借助可视化工具来说明导致疫情的因果关系。从2000年至今,建立基于机器学习的疫情预测模型取得了重大进展,IBM公司从电子病历、传染病疫情监测和疫情传播的图像数据入手,实现了对疫情传播的预测。
综上所述,从研究内容来看,少有服务于地方突发传染病防控的操作性研究。从研究方法来看,少有将计算机软件运用于传染病疫情的实证研究。从研究视角上看,少有对疫情不同阶段管理侧重点的操作性研究,特别是缺少指导各地公共卫生管理部门在面对疫情时,应该“如何建设”“怎样建设”的操作性研究。
利用IBM开源大数据的流行病学时空建模平台(Spatio-Temporal Epidemiological Modeler,STEM),对新冠肺炎疫情的预测模型建立和最佳防控策略选择进行了深入研究,建立了动态反馈仿真模型,将其作为新冠肺炎疫情应急管理的核心依据与方法,为各地公共卫生管理部门制定预防措施提供科学参考。主要成果:基于STEM平台的新冠肺炎风险预测模型的建立,通过各地数据拟合、算法优化,扩展了模型的使用范围,提高了疫情预测的准确性。新冠肺炎疫情的非药性防控策略设计与实现,在复工复学导致外来人口激增的现实条件下,特别是无症状感染者成为流动人员的情况下,实施常规防控措施并达到理想效果难度较大。本项目借助STEM建模平台提供的防控策略选项,反复模拟演练,给出了新冠肺炎疫情防控的的最佳措施。
图1为模型作出的累计确诊病例的logistic回归图,左图为全国的,中图为江苏省的,右图为扬州市的,采用数据截止日期是2020年4月8日。从图中可以看到,全国累计确诊病例模拟峰值为78 000例左右,江苏省模拟峰值在620例左右,扬州市的模拟峰值在20例左右,与实际情况比较吻合。模型显示,我国防控措施到位,短时间内控制了疫情的传播与蔓延,达到峰值的天数中,江苏扬州区间在20~30 d,中位数是25 d;江苏省区间在25~35 d,中位数是30 d;全国区间在30~40 d,中位数是35 d。
图1 确诊病例的logistic回归图Fig.1 Logistic regression of confirmed cases
基于STEM平台的COVID-19疫情风险预测模型的研究对提高各地应对新冠肺炎疫情水平、促进疫情常态化管理、稳步推进复工复学具有良好的社会效益。通过构建一种新的传染病风险评估模型,为疫情防控提供了有价值的参考,具有重要的社会意义。