Haddon 模型视角下大数据和人工智能在COVID-19 疫情防控中的应用分析

2023-10-23 11:20高景宏王言研蒋帅付航段彦然王素凡王成增
中国全科医学 2024年1期
关键词:人工智能机器人防控

高景宏,王言研,蒋帅,付航,段彦然,王素凡,王成增*

1.450000 河南省郑州市,郑州大学第一附属医院 河南省医院管理研究院

2.450000 河南省郑州市,河南中医药大学第五临床医学院(郑州人民医院)产科

世界卫生组织(WHO)报告,截至2022-12-11,全球已有超过6.45 亿和660 万的新型冠状病毒感染(COVID-19)确诊病例与死亡病例[1]。鉴于COVID-19的人群健康危害,有必要在COVID-19 流行的每个阶段采取预防和控制措施,以有效遏制COVID-19 的肆虐。值此背景下,大数据和人工智能技术在COVID-19 疫情防控中得到广泛探索与应用[2-3]。但是,目前鲜有研究对大数据和人工智能在疫情各阶段的应用情况进行综合探讨,不利于其在健康医疗领域的深入发展和突发疫情时的全面防控。因此,本研究拟在总结COVID-19 疫情防控面临的主要问题基础上,首先对大数据和人工智能的优势及其在COVID-19 疫情防控中的常用技术进行概述,并基于Haddon 模型视角,深入分析大数据和人工智能在COVID-19 疫情发生前、发生中和发生后3 个阶段的应用。本研究对进一步明确大数据和人工智能在新发疫情发生、发展过程中的应用与未来趋势,提升COVID-19 疫情防控效率和质量有效应对复发或新发传染病具有重要意义。

1 信息检索策略

使用电子数据库PubMed、中国知网(CNKI)和万方数据知识服务平台对2019-01-01—2023-05-01 发表的中、英文论文进行文献检索。检索主题词或关键词包括:(1)“新冠”或“COVID-19”;(2)“大数据”或“big data”;(3)“人工智能”或“artificial intelligence”;(4)“预防”或“prevention”;(5)“控制”或“control”;(6)“应用”或“application”。根据不同文献数据库的具体要求,检索词组合方式主要有(1)+(2)(1)+(3)(1)+(4)+(5) 或(1)+(2)+(3)+(6)等。另外,本研究还检索了WHO专题报告、卫生健康委员会网站、政府报告、企业产品技术宣传、学术会议报告等。纳入标准:(1)涉及大数据或人工智能技术;(2)目标疾病是COVID-19;(3)包含COVID-19 的预防或控制;(4)是具体技术的疫情防控应用。排除标准:(1)涉及技术不属于大数据或人工智能范畴;(2)面向的是COVID-19 以外的其他传染病;(3)属于技术理论或其实现过程。基于最终纳入的文献资料,进行相关证据或信息的归纳总结。

2 COVID-19 疫情防控面临的问题

在COVID-19 疫情防控过程中,存在诸多问题与挑战。首先,疫情防控涉及监测、预警、响应、任务派发、执行等多个环节,传统的单纯依靠人工值守和操作各个关口,负荷大且效率低,难以满足疫情防控争分夺秒的时效性需求。其次,疫情防控产生的海量多模态数据,使现有技术在信息读取和融合处理方面的承载能力捉襟见肘。再者,在流调、消杀、科普宣传等疫情防控场景中,传统的人工方式,一方面增加工作量影响工作效率,另一方面还易增加健康人群、医护人员的暴露风险与交叉感染风险,不利于疫情防控。另外,疫情防控产生了大量健康医疗数据,其中蕴含的信息与价值,传统的统计分析方法很难予以挖掘利用。最后,疫情防控涉及大量隐私敏感信息,分布于各个层级的疫情防控活动中,现有信息安全技术已无法为其提供足够的保障。

3 大数据和人工智能技术的优势

鉴于疫情防控面临的诸多问题,大数据和人工智能技术因其以下几个方面的优势而得到广泛应用。第一,减少人工负担,提高工作效率。通过在疫情防控的必要环节研发和配置智能机器人部分替代人工,提高疫情防控业务指令的流转与运行效率。第二,高效的海量信息读取、存储和处理能力。通过大数据和人工智能技术,可提高多模态疫情数据的录入、识别与分析,提升数据处理与辅助决策的效率[3-4]。第三,替代人工完成诸多疫情防控任务。例如,通过研发和部署智能机器人,代替人工进行流调、消杀、配送任务,避免重点人群暴露传染源或交叉感染[5]。第四,深度挖掘和利用海量疫情数据,辅助疫情防控决策。通过对海量疫情数据进行深入挖掘,大数据和人工智能技术能更充分地利用疫情数据助力COVID-19 疫情防控[6-7]。最后,可靠的数据安全和隐私保护。大数据和人工智能在疫情防控中的应用均以确保数据安全为前提,有专门的技术手段防止信息泄露。

4 疫情防控常用的大数据和人工智能技术

目前,在COVID-19 疫情防控中常用到的大数据和人工智能技术包括机器学习、流程机器人、人工智能光学字符识别技术(OCR)、自然语言处理、智能语音机器人、智能交互、机器视觉、知识图谱和隐私计算等(表1)。

表1 用于COVID-19 疫情防控的大数据和人工智能技术Table 1 Big data and artificial intelligence technologies for the prevention and control of COVID-19

4.1 机器学习技术

机器学习是关于数据学习的多领域交叉学科,其使计算机能够从现有的复杂数据和统计信息中学习规律,通过模拟或实现人类的学习行为,获取新的知识或技能,从而预测未来的行为结果或趋势,并通过重新组织和划分已有的知识结构来提高学习效率,不断优化自身算法和性能。在疫情防控中,机器学习通过分析多模态疫情大数据,可早期监测和预警疫情发展态势,及时保护易感人群,从而提高疫情数据的利用效率和疫情防控质量。伊朗的一项研究采用多种机器学习算法对1 500 例COVID-19 患者的健康医疗数据进行挖掘分析,结果显示随机森林算法具有更好的预测性能,其准确度、灵敏度和特异度分别达到95.03%、90.70%和95.10%,对辅助识别患者死亡风险、提前采取适当干预措施具有重要意义[8]。

4.2 流程机器人

流程机器人是以软件机器人和人工智能为基础的业务过程自动化技术,目标是使某些符合适用性要求的、基于桌面的业务或工作流程实现自动化、智能化。这些业务通常数量多、需要重复操作,且可以通过严格的规则和结果予以定义。通过在疫情发生前监测预警、疫情发生中防控救治和疫情发生后复工、复产等必要环节研发和设置流程机器人,可实现疫情防控任务在不同机构、不同执行人员间的高效流转,减少人工值守和操作环节,实现疫情防控全链条的自动化、智能化运转,保证防控任务决策、分派和执行的时效性。中国的一项研究显示,COVID-19 疫情期间,通过将机器人过程自动化技术应用于学校财务系统,其成本仅为全职员工薪酬的三分之一,而7×24 h 全天候工作模式可完成2~5 名全职员工的工作量,在解决财务运维问题的同时,也减少了COVID-19 的暴露与传播[9]。

4.3 人工智能OCR

OCR 是从图像、视频中读取信息并将其转换成可编辑、可搜索的数字格式。基于硬件和软件的结合,OCR使用硬件设备对文档进行扫描,检测暗、亮的模式确定目标形状,然后用字符识别软件将形状翻译成计算机代码进行加工处理。虽然OCR 实现了数据的自动化读取,但是在识别的正确率、速度和易用性等方面尚显不足。将OCR 与人工智能相结合,可提高OCR 的识别效率与准确率,从而实现海量数据的智能读取。例如,有研究采用OCR 技术与正则表达式,进行健康码、行程码、核酸结果截图的机器自动审核,结合智慧工地中配备的一体化人脸闸机,实现了建筑工地在疫情防控期间人员进场管理的自动化、无人化和智能化[10]。

4.4 自然语言处理

自然语言处理是利用人类自然语言与计算机进行有效交互通讯的技术。基于大数据、机器学习和语音识别等技术,自然语言处理可实现深度问答、机器翻译、人机对话等,进而服务于各类实际业务。在疫情防控中,自然语言处理可以使计算机读取并理解人类语言,然后结合语音识别技术,实现疫情防控工作中自然语言交流的电子化、自动化、智能化,从而提高交互效率,降低人工负荷,并通过分析COVID-19 相关舆情态势,及时调整、完善疫情防控政策。美国的一项研究通过采用自然语言处理技术分析接受COVID-19 评估或治疗的患者数据,结果显示自然语言处理应用程序的评估准确度达到比较理想的效果(召回率85.8%、准确率81.5%),成功实现了疫情期间数据驱动的预测分析和患者建议[11]。

4.5 人机交互智能语音系统

人机交互智能语音系统亦称为智能语音机器人,其通过自然语言处理和语音识别技术,对用户的咨询内容和对系统问题的回答进行分析,然后根据用户提供的信息,动态地给出针对性的解答,实现交互式、智能化人机问答场景应用。人机交互智能语音系统已在COVID-19 疫情防控中得到广泛应用,例如有研究基于自然语言处理技术研发了人机交互智能语音系统,然后在电话流调、患者初筛与导诊、智能问答咨询热线、智能语音播报和科普宣传等场景,实现部分替代人工,提供7×24 h 不间断疫情防控服务[5,12]。

4.6 机器视觉

机器视觉是通过机器对视频、图像中的信息特征进行识别、抽取、理解的技术,涉及计算机软硬件、图像处理、自然语言处理、光学成像、传感器等。机器视觉可代替人眼来完成测量、识别和判断等任务,提高业务的灵活性和自动化程度。在疫情防控中,存在海量的视频图像资料,传统的人工查验已难以胜任。通过机器视觉技术,自动识别疫情相关视频图像数据,结合必要的人工核验,在行程码验证、人群流调筛查、人员活动轨迹分析、人脸识别、医疗影像辅助诊断等应用场景,可有效提升信息抽取、数据解析和辅助决策的效率[2,6,13]。例如,LI 等[14]提出一种计算机辅助诊断模型可通过机器视觉技术根据胸部X 线检查识别COVID-19,在两个公共COVID-19 影像数据库进行应用,准确率分别达到了0.996 6 和0.990 1,可为放射科医生提供可靠的参考依据。

4.7 知识图谱和图计算

知识图谱是通过将图形学、信息学、应用数学、可视化技术与计量学引文分析方法结合,以图谱的形式可视化展示目标的核心知识结构、关系网络。图计算是将数据按照图的方式建模,以获得扁平化视角下难以得到的结果。针对海量数据,知识图谱和图计算通过改变现有信息存储和管理模式,以图的建模方式形象地揭示各种复杂关系,可提升复杂场景的信息查询与分析效率。例如,针对多源异构疫情数据进行知识学习和结构性分析,通过建立大规模知识图谱的实体和关联,可揭示疫情传播三要素之间的各种复杂关系,溯源传播链,预测未来发展趋势,模拟“决策-成效”仿真模型,进而集成多维度信息辅助疫情防控决策[15-16]。

4.8 其他

疫情防控中常用到的大数据和人工智能技术还包括智能交互和隐私计算。智能交互主要是在多场景应用的前端设备,包括智能消杀机器人、采样机器人、流调机器人以及自助核验通道等,能在涉疫场所针对传染源、传播途径、易感人群实施无接触、24 h 待命的预防与控制措施。隐私计算是在确保数据责任主体不泄露原始数据的前提下,对数据进行处理分析的一系列技术,使数据在流转与利用过程中“可用不可见”。疫情防控涉及大量健康医疗敏感信息,隐私计算可实现多模态疫情数据的跨机构、跨地域安全融合和隐私保护,从而促进疫情大数据的深度挖掘和辅助防控决策。

5 大数据和人工智能技术在COVID-19 疫情各阶段的应用

大数据和人工智能技术的使用贯穿COVID-19 疫情发生与流行的各个阶段。与其他公共卫生事件相比,COVID-19 具有传播速度快、感染人数多、涉及部门广、数据信息大、响应时间紧等特点,这对大数据和人工智能在其中的应用提出了新的要求与挑战,包括但不限于:需要处理海量多模态数据,不同疫情发展阶段适用不同的方法技术,无接触信息采集、分析、决策和行动尤为必要,对时间和空间信息更为重视等[17-19]。在伤害流行病学中,根据伤害发生的阶段,HADDON 提出按伤害发生前、发生中和发生后3 个阶段针对伤害发生的3个条件(致病因子、宿主和环境)进行预防,成为伤害预防和控制的经典模型[20]。参照Haddon 伤害预防模型,本研究将COVID-19 疫情流行划分为疫情发生前、发生中和发生后3 个阶段,然后对各阶段疫情防控中大数据和人工智能的应用场景(图1),以及针对传染源、传播途径和易感人群三要素的大数据和人工智能相关预防与控制措施(表2)进行探讨。

图1 大数据和人工智能全流程参与COVID-19 疫情防控的场景图Figure 1 Scenario diagram of big data and artificial intelligence participating in the whole process of COVID-19 prevention and control

表2 Haddon 模型视角下大数据和人工智能在COVID-19 疫情中的应用Table 2 The application of big data and artificial intelligence in COVID-19 epidemic from the perspective of Haddon model

5.1 疫情发生前

在COVID-19 疫情发生之前,针对传染源,通过采用机器学习算法分析挖掘公众的互联网检索与寻医问诊记录数据,实现COVID-19 的早期发现与预警;而通过研发和设置人机交互智能语音系统,能实现COVID-19患者的早期筛查与导诊[5,21]。针对传播途径,通过研发和部署智能消杀机器人,实现潜在传播媒介、场所的无接触常规消杀,然后利用智能机器人进行无接触的常规环境采样与检测,以及时发现和阻断传播途径[22-23]。针对易感人群,通过智能语音机器人进行COVID-19 疫情相关的常规科普宣传与教育,增加公众疫情防控知识、技能与意识;并通过人机交互智能语音系统,实现疫情相关信息的咨询与心理疏导,以缓解公众对疫情的紧张、恐慌情绪[5,12]。另外,通过智能语音、机器视觉、人工智能OCR、智能机器人等技术,在疫情发生前的病毒抗原与核酸检测、电子健康码及通行凭证、目标人群筛查等场景,实现常规业务的自动化快速操作和智能审批,确保疫情防控措施制定、下发、分配和执行的效率,减少人力与时间方面的成本(图1)[2,22-24]。

5.2 疫情发生中

在COVID-19 疫情发生过程中,针对传染源:一是采用人工智能OCR 技术对通信行程、健康状态、核酸检测等海量疫情数据进行快速检测和读取,实现万条疫情信息的秒级录入与核验,为辅助疫情防控决策(如人员排查处置、封控区管控区划定等)提供及时的信息支撑,有效缩短疫情处置与响应时间[19,25];二是通过自然语言处理技术对流调通话、客服热线咨询、智能机器人问答等疫情相关自然语言数据进行提取和分析,梳理公众时空信息、关注焦点和诉求领域,实现对舆情态势的整体监控和高危人群的初步筛查[5,11];三是基于多模态大数据挖掘,精准追溯传染源,快速厘清疫情传播脉络并采取针对措施;四是利用智能机器人进行查房、问诊、送药、送餐等服务,避免健康人群接触传染源。针对传播途径,首先基于知识图谱和图计算进行场景分析,快速评判区域和场所的疫情风险等级并采取相应防控对策;接着采用智能机器人对潜在传播途径进行无接触按需消杀;在此期间,通过智能机器人进行无接触的物资配送。针对易感人群,通过计算机视觉技术辅助人工核验病毒抗原与核酸检测、健康码与通行凭证、密接与活动轨迹等信息,并结合人工智能语音识别技术流调和排查目标人群[22,26]。另外,通过计算机视觉和大数据技术,可协助医生进行快速、精准的患者肺部 CT诊断,减轻医护人员工作负荷的同时早期干预和救治COVID-19 患者[2,6]。

5.3 疫情发生后

在COVID-19 疫情发生后,针对传染源采用智能机器人进行无接触的终末消毒与采样检测,确保传染源已完全康复。针对传播途径,亦通过智能机器人进行无接触的常规环境消杀,有效阻断潜在传播链条。针对易感人群:一是通过自然语言处理技术分析海量疫情数据,实现对舆情态势的整体监测,并研发智能语音咨询机器人,面向公众提供创伤后应激反应综合征相关的心理疏导与咨询服务,促进疫情后公众和社会的快速复苏(图1)。二是基于知识图谱的场景分析,辅助疫情防控措施的完善。三是采用机器学习和自然语言处理技术,对疫情后多模态健康医疗数据进行分析,辅助优化既行疫情防控措施,夯实疫情防控职能机构的技能与资源储备,搭建“平疫转换、平急结合”智能化疫情防控任务管理平台、卫生医疗资源调度平台和具有弹性的供应链,提升未来新发、复发传染病疫情防控的能力、效率与质量[2,22,26]。

6 未来趋势

目前,虽然大数据和人工智能已在COVID-19 疫情发生与流行的各个阶段得到广泛应用,但是依然面临一定挑战。首先,实现跨省份、跨应用场景疫情信息的交互共享和互联互认。疫情防控涉及的很多信息,比如核酸检测、疫苗接种、行程码、健康码、乘车码等,在不同省份、不同应用场景之间存在系统平台接口标准不同、数据传输协议各异、信息内容不一致、承载信息不互认等问题。这势必影响大数据和人工智能读取和处理疫情信息的能力,进而影响跨区域疫情防控的效率与效果。其次,充分挖掘和整合疫情防控数据的价值。精准高效的疫情防控离不开多维度疫情信息的全方位支撑,但是疫情防控数据面临来源不明、维度单一、完整性欠缺、准确性不足、时效性不够等问题,导致疫情防控相关海量数据所蕴含的价值尚未被合法、安全、充分地挖掘利用。未来需要通过现代信息技术和人工智能算法,对疫情防控数据进行多维整合与深入分析,以充分释放其蕴含的巨大价值,更好地辅助疫情防控决策。

另外,夯实多模态疫情防控数据的安全与隐私保护。疫情防控数据涉及公众诸多敏感信息,而数据的整合利用过程中导致不同数据间的关联更加紧密和清晰,从而增加敏感信息泄露的风险[27]。未来需要基于区块链、边缘云和隐私计算等技术,进一步规范数据的采集、传输、整合与分析等程序,明确疫情数据的使用条件、适用范围和安全责任主体[19,22]。最后,打造一体化大数据和人工智能疫情防控软硬件体系。疫情防控过程中,大数据和人工智能技术的应用零星化严重,散布于疫情防控的各个环节,各类技术和应用之间在接口标准、通信协议、对接机制和结果互参等方面,均存在不同程度的“烟囱”现象,亟需打造一体化大数据和人工智能疫情防控软硬件体系,以通畅和高效运转疫情防控的各个环节,进一步缩短疫情防控的响应时间,提高疫情防控效率[22,28-29]。

7 结语

大数据和人工智能技术在COVID-19 疫情防控中发挥了积极作用,有效提高疫情防控信息的处理和分析速度,辅助疫情防控决策,减少人工和时间成本。本研究从COVID-19 疫情防控面临的问题出发,在介绍大数据和人工智能优势的基础上,对疫情防控过程中常用的大数据和人工智能技术及其实际应用案例进行了概述,并创新性地基于Haddon 模型视角,从疫情发生前、发生中和发生后3 个阶段,针对传染源、传播途径和易感人群3 个要素,对大数据和人工智能在其中的应用进行了分析。研究结果对明确大数据和人工智能在疫情各流行阶段的积极作用及发展应用方向,提升COVID-19 疫情的防控效率和质量,有效应对未来新发、复发传染病疫情等具有重要意义。

作者贡献:高景宏、王成增进行文章的构思与设计、研究的实施与可行性分析,并撰写论文,负责论文修订、文章的质量控制及审校,对文章整体负责、监督管理;王言研、蒋帅、付航负责原始资料整理、背景资料信息梳理;段彦然、王素凡负责大数据处理技术相关资料的检索与信息整理。

本文无利益冲突。

猜你喜欢
人工智能机器人防控
配合防控 人人有责
猪常见腹泻病症状及防控
守牢防控一线 静待春暖花开
夏季羊中暑的防控
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!
机器人来帮你
认识机器人