信息技术在COVID-19防控中的应用与思考

2020-04-29 10:33汤一平浙江工业大学

杭州科技 2020年1期

□ 文 /汤一平浙江工业大学

3月2日，习近平总书记在北京考察新冠肺炎防控科研攻关工作时强调，要统筹病毒溯源及其传播途径研究，利用病毒蛋白和不同受体的结合特征，评估可疑动物作为中间宿主的可能性，利用人工智能、大数据等新技术开展流行病学和溯源调查，搞清楚病源从哪里来、向哪里去，提高精准度和筛查效率。

对于传染病的防控，有三个重要的基本环节，那就是控制传染源，切断传播途径，保护易感人群。

在抗击新冠肺炎的战场上，有这样一群人。他们不是警察，干的工作却有点像破案，这就是流行病学调查员。做流行病学调查有点像警察破案，要在千头万绪中抽丝剥茧，去寻找传染源的蛛丝马迹，同时排查可能传播的范围，这需要有缜密的思维，还要有扎实的专业知识和丰富的经验。

流行病学调查速度是一个与病毒传播速度进行时间赛跑的过程，只有跑赢了才能有效阻断病毒的有效传播。信息技术是否能帮助疾控“福尔摩斯”减少工作量与工作强度，提升破案的工作效率呢？

计算机病毒与生物病毒都具有寄生性、传染性、潜伏性、破坏性，两者一个是生命形式，一个是非生命形式。

早期的生物流行病学的研究就是利用数学建模的方式来建立传染病模型，分析病毒的传播规律。上个世纪九十年代初期，J.O.Kephart和S.R.White考虑到网络病毒和生物流行病毒的相似性，利用其与生物流行病相同的建模方式来分析计算机病毒，建立类似的计算机病毒模型，为以后计算机病毒模型的研究奠定了基础。历经二十余年，网络病毒模型的研究已经日渐走向成熟，模型的研究方法也逐渐完善。迄今为止网络病毒的研究方向大致分为三类：第一类是概率方法即利用马氏链来描述病毒的状态转移过程；第二类是利用统计的知识，通过数值模拟分析病毒的传播规律；第三类是通过建立数学模型探究网络病毒的传播规律。

在计算机病毒领域中的研究成果是否也能为生物病毒防控提供一些新的手段？

信息角度防控策略的讨论

传染病的防控是有其科学规律的，要把握三大原则：隔离传染源、切断传播途径、保护易感人群。通过“早、快、严、小”来实现，采取措施早、快速采取措施、严格执行措施、把疫情控制到最小范围。

在COVID-19疫情防控中，新加坡能做到以极小的代价有效地阻止了疫情的蔓延。我国在武汉大规模扩散传播的情况下，也做到了有效地在全国范围内遏制了疫情的蔓延趋势。但是，我国也由于疫情使得全国停摆，对整个社会经济人民生活造成了重大的影响。痛定思痛，我们应该从这件事情中吸取教训。

2月17日，中国疾控系统研究人员在《中华预防医学杂志》发表《我国新型冠状病毒肺炎疫情早期围堵策略概述》，对中国的围堵策略做了阐述和评价。

该文认为，整体来看，围堵策略措施的实施降低了除武汉外中国其他地区出现社区持续传播的风险，延缓了流行高峰到来的时间，缓解了医疗资源的压力，为应对可能出现的严重流行争取了宝贵时间，但也对武汉等疫情较重地区的人民生活和社会生产造成了一定的影响，经济和社会成本巨大。

围堵策略（containment）于2005年由WHO提出，作为流感大流行防控的指导性策略。这种策略主要是在新发传染病疫情早期，在限定的地理范围内，采用医学和非医学（区域封锁、停学和停工等）干预策略和措施，以迅速阻断疫情传播。

策略的核心措施包括封锁疫区，加强病例隔离和密切接触者管理、减少人员流动（交通管控和限制出行等），增加人际距离（停止大型活动、学校延迟开学、工厂推迟复工）和促进公众个人预防等。

从图1可以看出，疫情在1月23日至2月2日达到顶峰，湖北省的积极封锁控制工作中，至少有5000万人处于“居家封锁”状态，为其他省份抵抗疫情的工作争取了宝贵的时间，并最终预防了（其他省份）成千上万病例的出现。用空间上的损失换取了宝贵的时间。

图1 WHO对湖北抗击COVID-19的以时间轴展开的归纳图

所以，有必要补充制定关于特殊情况且原因不明的风险决策机制，即在不明原因、风险尚难预估的条件下，迅速评估最坏的情况和结果，并作出有针对性的决策，例如，可以对一定的区域，立即采取封锁、隔离、排查等严厉措施。总之，宁可十防九空，也不可留下遗憾、贻误战机。即使在事后看，当初一些反应有些过激，影响面不大，但为了稳妥、安全起见，也是必要的、可以理解的。

以下是防控三大原则指导下的具体举措：

①控制传染源：

对来自疫情重点地区的人禁止出行；

及时关闭产生病毒源的场地，并对其消毒处理；

尽可能迅速全部找出密切接触者，并尽快进行检测和隔离；

对居家隔离者进行随访和追踪等多种措施。若违反隔离措施将予以处分。

②切断传播途径：

敦促公民保持冷静和警惕，提供良好的公共卫生建议，戴口罩、注意手卫生；

在官网上即时更新每个案例传播链条的详细分析，完善输入性病例监测；

鼓励所有有感冒症状的患者前去就诊；

取消部分大型聚众公众互动；③保护易感人群：减少公众活动，控制人员流动；良好的公众沟通解释和信息披露；

对患者、患者的密切接触者、疑似患者尽快诊断出来，把密切接触者都找出来，进行管理和治疗，这是防止新发病人的根本办法。

通过手机定位技术以及轨迹跟踪是可以获取病毒携带者和密切接触者的时空信息的，病毒携带者的个人及手机信息是可以通过各地疾控中心获得的，病毒携带者的行为以及所产生的病毒场是可以通过大数据等计算分析手段追溯得到的，密切接触者是可以通过用其进入病毒场的频度、时间长度和接近程度进行推理计算得到的。

现实疫情防控中，有两类密切接触者最为难防，一类是为了某些原因故意隐瞒的，另一类是就连自己也不知道是密切接触者。有两类感染者也更为难防，一种是潜伏期就具备了传染力的感染者，另一种是无症状感染者。

互联网时代我们缺的不是信息，缺的是快速、准确的从海量的信息中筛选出真实，有益部分的能力。抗疫情最需要有一个动态实时精准反映疫情的地图，及时获取病毒携带者时空分布信息并映射成相应的病毒场时空分布信息，然后精准地筛选和提取出可能被感染或者感染他人的语义场景并实时更新，让信息上报、流动、发布和采取隔离措施的速度跑赢病毒传播速度。

那么将病毒携带者与病毒场进行映射，能带来什么效果呢？

能实现对个人隐私的保护，公开的信息中不会出现感染者和密切接触者的任何个人信息，这样容易实现对已感染患病的人群、担忧被感染的人群以及大量健康的人群实施人道主义关怀，有助于提高全民对传染病的群防群控自觉性。

能精准定位防控对象、分类精准实施防控措施、体现对疫情无情对人温情、兼顾疫情防控和生活生产。

病毒场的大小以及分布范围是可以进行计算的，病毒携带者在某个相对比较密闭的空间滞留的时间越长，其产生的病毒场就越大；在某个空间内病毒携带者越多那么病毒场就越大；同样道理，易感人群滞留在病毒场时间越长、滞留的病毒场病毒密度越高，那么被感染的概率就越大；通过这种方法将病毒传播感染的问题转化成概率计算问题。

实现对事不对人，有利于避免对疾病标签下的污名化，传染病疫情对整个人类都是灾难，疫情爆发地的所有居民首先都是受害者。

在法律方面，有助于解决疫情信息发布和预警之间责任不清问题；疫情发布，是对巳经明确的疫情进行公开，需要由国务院卫生行政部门负责向社会公布传染病疫情信息；预警是对还没有发生或者可能发生的疫情进行前置式的警示，发布预警主体是县级以上地方各级人民政府。如果以病毒场的信息发布，就像一个路段或者小区发生煤气泄漏一样，早些告知居民主动避开这些区域，即能阻止病毒的蔓延，同时也能减少民众的恐慌心理。毕竟传染病与其他自然灾害有所不同，如地震预警预报是一个很大的区域，而传染病的预警可以限制在一个比较小的范围内。

从信息工作者角度来说，要解决几个核心问题：一是两步可视化方法，即对病毒携带者可视化和对其向周围散发的病毒分布可视化；二是在充分保护个人隐私的前提下对病毒携带人群的时空轨迹数据和感染发病数据的收集、清洗与加工；三是计算病毒携带者为位置中心的病毒分布密度；四是将病毒携带人群的时间、空间和病毒分布密度数据映射到时态GIS上；五是排查出所有可疑重点的传染病病毒场，并根据空间位置语义信息标识出高风险的传染病病毒场。

大数据、人工智能、云计算等技术在防控中的应用

大数据的核心意义在于对事物未来发展趋势的预测。依据大数据处理时间要求，可以将大数据处理模式分成三种：离线批处理式数据处理，查询式数据处理和实时式数据处理。而对于COVID-19这样的防控，是在与病毒的传播速度进行赛跑，就必须采用实时式数据处理方式。

大数据在公共卫生领域中的应用，更是得到了人们的关注，突出体现在以传染病监测数据为基础，利用不同数据处理技术，建立敏感特异的传染病监测预警体系。

基于网络数据的监测预警系统，具有明显的优势：

一是避开了传统监测系统的层峰式结构，具有实施快速的特点。

二是传统监测系统只能收集疾病治疗阶段的数据，而基于网络数据的监测系统可以在症状出现时起，或者疾病发生早期进行预警。

三是基于网格的监测系统，适合于大量人群的数据分析，即使在一些中低收入国家，网络使用率仅为30.7%，网络来源的数据分析依旧优于传统监测系统。

医疗大数据主要来自检验结果，影像数据，费用数据，基因数据等，数据量庞大，每天都在更新。大数据在医疗卫生领域应用广泛，包括疾病诊断，治疗效果评估，流行病预测和药物不良反应分析的医疗大数据，对传染病的监测预警，主要是通过症状监测模式来实现。症状监测是指持续、系统的收集分析临床明确诊断前与疾病爆发相关的资料，及时发现疾病在时间空间上的异常聚集，以及对疾病爆发进行早期探查，预警和快速反应的监测方法。症状监测通常不依赖于特定的疾病诊断，而是对人群中特定临床综合征进行监测。症状监测，作为传统监测的有益补充，提高了新发传染病和暴发疫情发现的敏感性，提高了疾病防控的能力和水平，但是当前的症状检测也存在着一些不足之处，比如推广成本高，信息化建设落后，病原检测滞后，数据不能共享等。

传染病暴发流行，是病原体通过传播途径，在易感人群中引发的。这种监测，对于明确疾病的传播过程，追溯传染来源等能够起到关键作用。病原监测涉及到病原体分离鉴定分子诊断，血清学监测，以及其他体内体外试验。国际上发达国家尤其重视细菌性传染病监测中的病人分析与预警工作，通过整合病原检测技术，网络实验室现场调查和数据分析，达到提前预警。

不同数据来源的传染病监测预警系统有各自的优势和不足，如何取长补短，融合不同预警系统的优点，改进监测手段，成为下一步研究的重点。具体工作主要集中在以下几个方面：

第一，在探讨新的监测手段，即将监测系统应用于新的疾病种类的同时，应注意如何将这些监测手段与现有监测系统融合。新的监测系统，不是对现有监测系统的取代，而是在现有监测系统上的延伸。

第二，网络数据的监测系统，仅仅应用在发达国家，但是随着旅游和贸易的全球化，国家与国家之间的联系愈加频繁，检测、监测和防控传染病，成为一个全球的问题，在探讨如何解决网络大数据不足支出的同时，也应着手建立基于网络数据来源的全球化监测系统。

第三，建立对监测系统的评价体系，要从逻辑学经济学流行病学的角度，去评价监测系统，以保证监测系统的使用及推广。

这次，首先由杭州推出的健康码就是运用了大数据、云计算来实现的，它在抗击COVID-19中起到了非常重要的作用。

综上所述，基于大数据的传染病监测预警工作的研究方法和理论，已经取得了长足的进步，并逐步走向成熟，尽管大数据存在一些等待解决的挑战，比如数据噪声、数据共享以及个人隐私安全等，但是我们相信，随着数据处理技术日新月异的发展以及国家层面大数据相关政策的落实，大数据必将带来巨大变革，也必将在传染病监测预警领域发挥至关重要的作用。

传染病网络直报系统

多位医学专家回顾此次疫情暴发早期的工作得失，不约而同地提到2003年SARS疫情以后，中央和地方花费巨资建立的“传染病网络直报系统”并未充分发挥作用。那么它为什么没能充分发挥作用呢？

传染病网络直报系统的信息报告反馈流程如图2所示。建设该系统的目的是在医院接诊传染病病人或疑似传染病病人后，能快速上报、审核，卫生部门与疾控系统也能快速分析、研判疫情。按照设计规划，这套庞大的信息系统是一个理论上横向覆盖全国，纵向贯穿“到乡镇卫生院的电脑里都可以看到这个网络系统”。

从流程框图来看，这个网络系统属于一般的信息系统，估计没有运用大数据和人工智能等技术。

图2 传染病网络直报系统的信息报告反馈流程图

复旦大学附属华山医院感染科主任张文宏教授说：“中国疾控直报系统并不是花架子，这个系统对于已知的病原体（如MERS，2009大流行株H1N1流感病毒）或者传播不快、有限传人的病原体（如H7N9禽流感），比世界上大多数国家都厉害。”

但这个系统的一个问题是“经受不起大量垃圾信息的摧毁”。

以信息专业的语言来说就是涉及到模式识别和知识发现的问题。

通过申报系统上报上来的是数据，这些数据本身可能会杂乱，如果不经过梳理、清洗和加工，对用户来说不能够称为信息，可能成为所谓的“垃圾信息”。目前申报系统对上报的数据处理能力比较弱。

因此，笔者认为，应对直报系统进行升级改造，比如引入钟南山团队的人工智能预测模型，在方案设计时引入数据科学家和人工智能团队成员；加强直报系统升级，使信息更为通畅、处理更为智能、反馈更为及时、使用更为便捷、权利和责任更为清晰。

信息技术在疫情防控中的思考

COVID-19爆发后，笔者团队做了以下三个方面的研究工作：基于时空轨迹数据的流行传染病病毒场可视化处理方法、基于流行传染病病毒场追溯传染源的方法和基于流行传染病病毒场的防控方法，并完成了总体设计工作。

基于时空轨迹数据的流行传染病病毒场可视化处理方法

为了克服已有的传染病防控方法对已经患病或者疑似患病者识别排查难、对个人隐私保护缺失、对付病毒的隐匿性手段欠缺、难以计算与病毒携带者相遇后被感染的概率、对疫情的精准施策和精准防控缺少有力的技术支撑等不足，设计目标是提供一种通过病毒携带人群的时空轨迹数据和感染发病数据加工成病毒携带者为位置中心的病毒分布密度图，并加入空间位置语义信息映射到时态GIS上，将流行传染病病毒场可视化处理的方法。

通过构建一个基于时态GIS的流行传染病病毒场云平台，面对全国各地每天产生的海量疫情数据的加工处理，采用云计算的方式来实现；各地基层疾病防控中心工作人员通过基于时态GIS的流行传染病病毒场云平台输入病毒携带者感染发病数据；然后通过病毒携带人群的时空轨迹数据和感染发病数据的收集、清洗与加工单元，病毒携带者位置语义信息获取单元，病毒携带者为位置中心的病毒分布密度计算单元，病毒携带人群的时间、空间和病毒分布密度数据映射单元进行云计算，最后自动生成基于时态GIS的可视化的流行传染病病毒场。

基于流行传染病病毒场追溯传染源的方法

为了克服已有的传染病防控方法对追溯病毒源和查清感染途径耗费大量人力、用时长、结果不准确、调查时间长、需要耗费传染学病专家很多精力与时间、静态的调查结果难以从时间和空间维度、从全局和局部、动态地追溯感染途径等不足，设计目的是提供一种通过病毒携带人群的时空轨迹数据和感染发病数据加工成病毒携带者为位置中心的病毒分布密度图，然后基于时态GIS的病毒分布密度图追溯病毒携带者在何时何地被病毒感染的，最后得到所有被感染的病毒携带者与产生该病毒场的病毒携带者传染传播链的方法。

基于流行传染病病毒场的防控方法

为了克服已有的传染病防控方法防控对象不清晰、防控方法一刀切、人文关怀欠缺、耗费人力物力财力大、难以平衡疫情防控和生活生产等不足，设计目标是能提供一种精准定位防控对象、分类精准实施防控措施、体现对疫情无情对人温情、兼顾疫情防控和生活生产的疫情防控方法。■