何权瀛
在COVID-19疫情暴发之前,有关人工智能(AI)在肺炎诊断和评估治疗中的研究较少,且多数基于胸部X线检查,自从COVID-19疫情暴发以来,基于胸部CT检查的AI技术发展迅速,展示了其在肺炎诊断方面的良好应用前景。近年来,随着计算机和互联网技术的进步,硬件、数据库及算力水平大幅提升,以机器学习(ML)和深度学习(DL)为代表的AI技术相继出现并不断发展。现阶段计算机视觉、语音识别、自然语言识别、决策规划和大数据分析等众多AI技术方向已经取得了重大突破,并逐步应用到医学领域中,为传统医学带来改革,在抗击COVID-19疫情中,AI技术在诊断和治疗中发挥了重要作用,特别是在疫情分析、预测及疾病诊断、评估和治疗中。
对疫情的有效分析、经验总结和临床转化应用是控制COVID-19疫情传播的重要手段,随着COVID-19疫情局势的不断扩展,大量疫情相关患者的临床数据库也呈现在公共卫生平台上,需要通过AI技术进行总结、分析。
1.COVID-19疫情分析:传染源、传播途径、易感人群是传染病流行的3个必要因素,因此,在疫情暴发初期,Alimadadi等[1]的研究所便针对上述3个因素构建了开源、自动更新数据库,并基于ML分析2019-nCOV感染患者的临床特点及疫情流行病模型,通过AI技术分析结果实现对易感人群的有效识别,研究结果实现了疫情抗击中对易感人群的良好保护。Subudhi等[2]建立的ML算法模型将COVID-19确诊患者的电子病历整体导入,经过数轮临床数据分析和模型训练,证实该模型能够准确预测病毒感染的高风险群体,为政府公共卫生部门的系统决策提供了有效参考。还有研究通过AI技术对46例COVID-19患者进行血清蛋白组学和代谢组学分析,最终计算出COVID-19患者血清中出现了巨噬细胞失调、血小板脱颗粒、补体系统抑制和代谢抑制等多项蛋白分子水平变化,这一结果可应用于筛选血液中潜在的生物学标记物,为临床表现阴性的患者提供快速诊断及病情程度预测[3]。
2.COVID-19疫情预测:AI技术也广泛应用于对COVID-19的传播预测,为政府公共卫生部门早期决策预防和响应疫情暴发事件提供积极参考。在疫情暴发早期,临床数据量尚不充足,Buscema等[4]率先提出了一种新型拓扑加权算法(TWC),该算法能够在缺乏足够临床数据和疫情暴发信息中实现深度挖掘、分析,随后以热图的模式来预测、呈现未来一段时间COVID-19的可能扩散模式。Santosh等[5]采用主动学习、跨群体训练测试方法构建了ML算法模型,基于对COVID-19多模态数据库的学习及对全球范围内疫情分布情况、跨群体模式的归纳总结,该模型最终实现了COVID-19疫情模式的准确识别,并对全球范围内疫情暴发趋势进行理论预测。我国作为全球疫情暴发初期的暴风眼地区,也有类似AI技术预测疫情传播的相关研究。如有研究基于ML算法对国内34个省份的疫情局势分析和数字化轨迹进行追踪,最终从理论上实现了对国内疫情扩散趋势的实时预测,且该模型预测结果的发布时间达到领先现实情况2天的水平,为政府公共卫生部门预警部署、早期决策提供参考,也为我国COVID-19的防控工作提供有力帮助[6-7]。同样,还有研究通过AI技术对COVID-19密切接触者的活动进行追踪,并对各种流行参数限定下的疫情暴发规模和峰值成功作出预测,该研究结果还证实了政府公共卫生部门前期决策的正确性和有效性,若无此类精准决策方案,国内疫情规模可能扩大3倍以上[8-9]。此外,还有大量研究都是通过AI技术实现了COVID-19的精准预测,这种AI预测可指导当地政府公共卫生部门进行早期决策,相关部门可参考模型预测结果,结合当地疫情特点最大限度地提升防控效率,为疫情防控工作提供科学保障[10-12]。
在COVID-19大暴发时期,发热门诊患者激增、病情严重、影像学读片需求大的情况下,影像科的医疗资源显得相对不足,同时很多COVID-19患者表现并不典型,在这种条件下不仅快速应急诊断难以实现,工作负荷过重也极易导致人工疲劳和临床漏诊、误诊,使原本艰难的诊断工作更加困难。
AI技术再次发挥其智能化、自动化、便捷化特点,通过构建算法模型对确诊患者的影像学数据库进行深度学习后,实现了对新疑似患者的智能诊断,大大降低了影像科医师的工作压力,同时减少了疲劳性漏诊、误诊可能,提高了COVID-19的诊断效率和精准性。
2018年Kermany等[13]在视网膜光学相干断层扫描(OCT)图像训练出来的诊断眼部疾病的AI系统基础上,采用超过5 000张胸部X线图像加上“迁移学习”,构建出能诊断肺炎的AI系统。该系统在检测肺炎时能够达到92.8%的准确度、93.2%的敏感度和90.1%的特异度。此外,AI系统还可很好地区分细菌及病毒性肺炎,准确度达90.7%。Zhang等[14]基于超过50万张临床影像学图像开发了一款COVID-19 AI辅助诊断系统。通过测试,该系统的准确度可达90%左右。Wang等[15]提出了一种通过CT扫描对COVID-19进行诊断和预后分析的AI系统,在训练集中该系统表现出良好的诊断性能[受试者工作特征曲线下面积(AUC)=0.90],并在两个外部验证集中得到了证实(AUC分别为0.87和0.88)。可见在大量临床影像数据的支持下,AI系统能够准确地检测出COVID-19患者,这不仅有助于快速诊治,还能协助训练住院医师,提高诊断水平。Bai等[16]构建了DL模型对2020年2月1日~3月3日多家联合医院所确诊的2 447例COVID-19患者的CT数据进行学习,经过训练后其成功推出了COVID-19的AI评估及诊断系统,之后应用该系统来诊断2 120例新疑似患者、722例新确诊患者以测试模型的检测能力与病变区域识别水平,结果表明,该算法模型对于COVID-19患者诊断的敏感度为92%、特异度为85%,与影像科高年资医师小组的评判水平相比,该系统的诊断时间平均缩短16分钟,实现了快速诊断,加快了COVID-19患者的临床诊断流程。此外,Mertz[17]开发的Thoracic VCAR(新型AI系统)能够在对肺部病变区域进行客观定量分析的基础上,实现对不同的病变类型进行分类、整合并生成诊断报告;通过对肺部组织受累情况的定量检测,该软件能够准确计算出肺部受累组织的体积及不同组分之间的比例,为临床诊断工作提供可靠参考。通过回顾性分析COVID-19患者的临床资料和影像学特征,AI技术对重症型、危重症型患者的诊断准确度高达91.2%,很大程度上加强了临床诊断工作开展[18]。这样基于AI技术的新型诊断方法可对COVID-19患者进行影像学量化、分析、解释,改良了传统诊断模式,极大提高了临床诊断的效率和准确度,为COVID-19的抗击提供有力辅助。
当患者确诊为COVID-19并被隔离后,及时开展院内病情评估、重病风险预测是合理分配医疗资源、保证患者有效治疗的关键,而AI技术同样实现了对患者病情的评估及风险预测。基于患者入院时的血氧饱和度及动脉氧分压等参数分析,Zhu等[19]建立的ML算法模型对6 995例新感染COVID-19患者的预后进行推测,并将其预后转归分类为“需要机械通气”、“多器官功能衰竭”、“ICU重症监护”、“死亡”4个等级,该模型整体敏感度为88.0%、特异度为92.7%、准确度为92.0%,证实AI技术在COVID-19患者风险评估、预后预测和临床管理中的良好效果。McRae等[20]也开展了国际多中心研究,通过对752例COVID-19确诊患者的临床检查结果、影像学特征、预后转归等数据进行开发,并验证了新型AI技术在风险评估、预测方面对患者病情进行量化以区分重症型和危重症型患者及辅助临床早期分诊、决策的效力。Xue等[21]建立的人工神经网络(ANN)模型通过学习确诊患者的数据库特征(如人口统计学特征、共病特点、吸烟习惯等)实现了对患者住院期间死亡的个体化风险预测,为临床医师提供早期预警。此外,Russo等[22]通过AI技术分析COVID-19患者的D-二聚体、血氧指数、中性粒细胞/淋巴细胞百分比、C反应蛋白、乳酸脱氢酶等指标变化情况,结果表明该AI技术在病情评估、死亡预测方面的效果优于临床常用的评分量表。同样还有类似研究通过AI技术分析患者N末端脑钠肽前体、肌红蛋白多肽、降钙素原、肌酸激酶同工酶和肌钙蛋白I等数据后建立“实时临床护理决策支持系统”,该系统能够指导临床医师、护士优先处理高风险或不良预后的患者,合理分配医疗资源,有力加强了COVID-19患者的临床管理[23]。可见AI技术在COVID-19患者诊断、评估方面的应用可以帮助临床医师根据患者病情轻重合理化安排医疗资源,为患者的生命健康提供保障。
在诊断效能方面,几乎所有的AI模型都能快速将COVID-19从普通病毒性肺炎、社区获得性肺炎、肺部其他病变或正常肺部CT表现中识别出来,但不同研究的入组参数不同,诊断效能差异较大。如基于521例COVID-19和665例非COVID-19患者数据建立的AI模型,识别COVID-19的准确度,敏感度、特异度均超过95%[16];一项基于79例COVID-19和180例普通病毒性肺炎患者AI模型的准确度、敏感度、特异度分别为89.5%、88.0%、87.0%[24]。尽管不同AI模型诊断效能存在差异,但均有助于提高放射科医师诊断的准确度。此外,Mortani Barbosa等[25]发现深度学习模型识别COVID-19的AUC、敏感度、特异度均高于影像特征模型;另一项研究的结果类似,两个模型在验证集的AUC分别为0.98和0.91,敏感度为91.8%和80.0%,特异度为93.4%和87.2%;在外部验证集的AUC则为0.84和0.86,敏感度为75.7%和76.5%,特异度为76.8%和80.9%[26]。AI辅助诊断软件测定的定量指标(全肺感染体积、磨玻璃密度体积和实性密度体积)与肺炎临床分型具有较好的相关性;动态测量CT肺炎病灶体积比有助于评价疾病的严重程度和预判疾病的发展趋势,病灶体积快速增长的患者更易转变为重症型或危重症型。综合CT图像和临床数据的AI技术可成功预测患者进展至重症的时间,识别出高风险患者,为临床及早干预提供依据,对降低重症型及危重症型患者病死率有重要意义。
面对COVID-19全球大暴发,特效药物研发是所有临床医师和制药行业的共同目标。然而,由于药品或疫苗的研发需要经过体外实验、动物实验、人体试验等漫长流程,从实验到临床应用通常需要长达数年时间,耗时长、风险高、价格贵,同时成功率不足3%[27]。因此,在疫情暴发的紧急情况下,新冠特效药物研发的问题极为迫切。AI技术同样弥补了传统药物、疫苗研发中存在的不足,可通过建立智能模型分析病毒结构、检测潜在靶标,促进临床新型医药研发[28]。有研究通过使用DL算法对2003年暴发的严重急性呼吸系统综合征(SARS)病毒遗传学数据库进行分析后发现,2019-nCOV和SARS病毒间存在多重相似性,通过对比学习SARS病毒数据库,最终该算法实现对2019-nCOV潜在有效药物的药理结构预测[29]。Abdulla等[30]的研究则通过基于ML算法的Vaxign疫苗反向研发系统对2019-nCOV的蛋白序列进行分析预测病毒潜在免疫靶点,结果表明含有结构蛋白和非结构蛋白的“Sp/Nsp即鸡尾酒疫苗”能够有效诱导免疫应答,促进了新冠疫苗的研发进展。为了实现新冠疫苗针对病毒不同变异种提供交叉保护,Mohanty等[31]利用ML算法分析了来自不同国家的多种2019-nCOV序列,最终确定了保守基因,并建立起多肽数据库,为新冠疫苗的研发提出了新方法。除了不断寻找COVID-19特效药物,还有研究提出可通过AI技术智能筛选病毒靶点、优化疫苗组合方案,以增强临床疗效,基于此理论,美国国家过敏与传染病研究所和Moderna生物公司共同开发了mRNA-1273新冠疫苗,目前己获得美国食品药品监督管理局(FDA)批准[32]。此外,在COVID-19的临床治疗中,联合用药时药物间的协同作用远超过各成分效果的简单叠加,如何选择最优药物配比又成为难题,IDentifAI系统则有效解决了此问题,该系统可通过AI技术识别、检测出有效药物,同时快速生成不同药物之间的最优比例和剂量,制定最优药物组合方案[33]。在COVID-19的治疗中,除不断研制新药、新疫苗外,“老药再利用”也是一个办法。“老药再利用”的目标是研究安全性己确认的药物是否对COVID-19具有潜在疗效,若挖掘出潜在疗效,该药物便无需经过传统药物研发步骤即可直接进入临床预试验和正式试验,大大降低了研发风险和成本。而AI技术智能识别、筛查的功能,进一步缩短了“老药再利用”药物筛查周期、流程,让“老药再利用”成为COVID-19流行期间治疗患者的重要方案,并在短期内成为弥补新药、新疫苗研发困难的替代手段[34]。如Molavi等[35]的研究通过AI技术识别出治疗类风湿关节炎的药物巴瑞替尼(Baricitinib)对COVID-19有潜在疗效,部分确诊患者使用巴瑞替尼进行治疗后病情有所好转,这项突破性成果发表在2020年《柳叶刀》杂志上,说明将AI技术应用在“老药再利用”上切实可行。随后,通过AI技术自动化、便捷化、智能化的筛选和预测优势,又有近80种现有药物被确认对COVID-19具有潜在疗效,尤其是博赛泼维、氯喹、高尖杉酯碱、地洛酮和盐霉素等,提示这种通过AI技术实现老药快速筛选的模式对COVID-19的治疗具有深远意义。
此外,在COVID-19中医治疗研究中,基于AI技术的网络药理学也实现了对现有中药的药效分析,筛选出具有潜在功能的中药成分,为COVID-19的中医治疗提供了科学依据[36-37]。还有研究通过数据挖掘、分子嵌合、网络药理学等AI技术构建了传统中药的药物筛选系统,通过挖掘潜在作用机制、虚拟筛选药物有效化合物成分后确定出甘草、黄芩、大黄、柴胡等中药对COVID-19具有潜在药效[38];且还有学者尝试通过网络药理学和分子嵌合等技术挖掘我国著名COVID-19特效药“清肺排毒汤”治疗COVID-19的潜在作用靶点,该研究指出清肺排毒汤的方剂成分能够对2019-nCOV的多条信号通路及多个免疫靶点发挥作用,进一步肯定了清肺排毒汤的功效[39]。
COVID-19疫情暴发以来,影像AI辅助肺炎诊断迅速成为研究热点,但随着疫情防控常态化的开展,2019-nCOV感染的早期检出率极大提高,影像AI应用的热度逐渐消退。然而,无论是在COVID-19疫情流行之前、流行期间,还是在后疫情时代,肺炎的病原体鉴别、精准治疗都是临床面临的巨大挑战。如何在已有研究基础上总结经验,推进影像AI辅助肺炎诊断的未来发展,更好地服务于临床都值得重视。
1.重视高质量数据集的构建:AI模型要具有强大的诊断效力,必须建立在高质量数据集的基础上。收集大规模的临床样本,充分考虑临床样本的多元化,除肺炎样本外,还应纳入肺结核、肺肿瘤患者及正常人群等各种非肺炎样本。由于目前临床数据共享不足,不同来源的数据异质性较大(如CT参数不一致),获取高质量数据难度较大,建议国家各级政府层面加强不同医疗中心大数据平台的搭建,实现医疗图像资源共享,为研究提供更优质的数据集。
2.重视肺炎影像数据标注的标准化:数据预标注是构建AI模型的重要环节。理论上,需对肺炎病灶边缘进行精确勾画,并避开血管等非病灶区域,但肺炎病灶多呈片状形,其边界往往模糊不清,人工分割标注不仅费时费力,且具有主观性,可重复性较差,这将影响后续的定量分析、严重程度评级,最终削弱AI模型的稳定性。因此,有必要优化标注系统、提高手工标注效率,并对数据标注规则、标注流程设计、标注人员管理、过程质控等方面建立严格的标准规范。
3.重视AI技术的创新、算法的优化及AI模型的验证:AI效能的提升离不开技术的创新及算法的优化。目前机器自主学习能力仍相对有限,同时也面临诸如泛化能力、速度、可理解性及数据利用能力等技术性难关均有待更大的突破。AI模型的建立及优化是一个模拟临床诊断过程,由于肺炎的影像表现复杂多变,“同病异影”和“异病同影”的现象较为普遍,除分析图像特征外,还应考虑患者特殊的流行病学史和环境暴露史、潜在的免疫缺陷类型及临床表现进展的速度和方式等,并结合实验室检查、微生物培养等检查资料。此外,AI模型的准确度和泛化性必须进行严格的内部验证和外部验证。
4.重视AI在其他类型肺炎中的研究:目前影像AI在肺炎诊断方面的研究大多聚焦于COVID-19,忽视了其他同样值得关注的病原体肺炎,如肺真菌病。随着自身免疫性疾病、恶性肿瘤、器官移植等患者数量的增多,抗生素、糖皮质激素、免疫抑制剂、化疗等药物的广泛使用,肺真菌病发病率呈现逐年增高趋势,但其早期诊断较为棘手。为改善预后临床上存在过度诊断及经验性抗真菌治疗的不良倾向,可能会造成宝贵的医疗资源浪费、真菌耐药及器官损害等。尽管部分关于COVID-19的研究包含了真菌性肺炎的数据,但样本量均较小。真正以影像AI辅助肺真菌病诊断为主题的文献数量有限,而临床危害性更大的侵袭性肺曲霉病则未见报道。此外,细菌性肺炎和非典型肺炎仍是临床常见的肺炎,但目前尚未见有影像AI用于鉴别如葡萄球菌性肺炎、链球菌性肺炎、肺炎支原体肺炎、军团菌肺炎等各类肺炎的报道,其中多重耐药菌是影响细菌性肺炎治疗效果的重要问题,值得进一步探索。
从长远观点来看,AI与呼吸影像的深度融合有助于优化当前医疗实践模式,促进区域医学影像诊断同质化,实现多点智能实时远程诊断及提高呼吸科医疗水平。未来肺炎的影像学有赖于呼吸科医生、放射科医生、算法工程师等多方合作,在借鉴已有研究或其他学科先进经验基础上,充分融合大样本、高质量CT图像及其他临床资料,不断优化算法模型,并期待在鉴别各种病原体肺炎、准确评估肺炎的严重程度及预后、判读混合感染等方面为临床决策提供更多参考。