王拥军,李子孝,丁玲玲
卒中已经成为全球导致死亡的第二大原因,每年新发患者高达1370万[1]。中国是全球卒中负担最重的国家之一,现有卒中患者1494万人,每年新发病例330万人[2]。在我国医院收治的神经系统疾病患者中,卒中患者占比高达66.5%[3]。卒中诊治的医疗服务负担重,需求量大,卒中专业医师短缺[4]。我国遵循指南的卒中急性期和二级预防治疗取得一定程度改善,但是包括溶栓和心房颤动抗凝在内的治疗措施执行率仍仅为18.3%和21.0%[5]。传统的基于临床路径等的医疗质量改进工具可改进卒中医疗质量和改善患者预后[6],但对临床医师专业知识和技能的更新要求较高。在临床研究方面,包括临床电子病历、检验信息、影像特征、蛋白组学和基因组学等多维度卒中研究队列形成海量数据,对传统的统计分析带来巨大的挑战[7-9]。同时卒中新的治疗技术,如血管内治疗技术,对患者结局有显著的时间依赖性,患者越早获得干预,预后越好[10-11]。如何快速评估潜在适宜干预的患者对临床决策和患者结局有着重要影响。
人工智能(artificial intelligence,AI)作为计算机科学的一个分支,包括研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术和应用系统。1956年,在美国汉诺斯小镇召开的达特茅斯(Dartmouth)会议中首次提出了人工智能,开启了人工智能元年。近年来随着深度学习、卷积神经网络、自然语言处理等人工智能算法的不断成熟和应用,基于临床大数据的人工智能诊疗决策技术研究和应用日趋成熟。人工智能在急性神经功能障碍患者头颅CT诊断[12-13]、颅脑损伤急性期意识障碍患者的脑电监测[14]等神经系统疾病诊断和评估方面取得了显著进步。在卒中领域,人工智能已逐渐应用于影像评估、临床辅助决策和预后预测等多个方面。
1.1 快速、高效的医学影像分析 医学影像作为人工智能在医学领域应用的最早和最重要领域之一,因其快速、高效、重复性高、可定量、低成本等优势,在医学研究和临床实践中得到广泛应用。神经影像是卒中诊断及治疗决策的重要依据。目前在卒中领域,美国食品药品监督管理局批准的人工智能软件均为基于医疗影像研发的辅助诊断工具。依据头颅CT影像特征对卒中的早期分诊和诊断至关重要。在Titano等[12]的研究中,对于急性神经功能障碍患者,通过机器学习算法判读颅脑CT影像仅需1.2 s,比放射科医生快约150倍。快速识别颅内大血管闭塞对急性缺血性卒中患者血管内治疗的决策至关重要。基于人工智能算法开发的Viz.ai's Contact、Brainomix和RAPID软件是目前主要应用于检测急性缺血性卒中患者大血管闭塞的影像辅助诊断工具,通过自动化算法实现快速检测、诊断,提高放射科医生对神经影像解释的速度和准确性,帮助医生快速识别需要血管再通治疗的患者[15]。随着经过专业医师标注的医学影像大数据的积累,通过人工智能技术分析神经影像不仅可以缓解医生的工作压力,而且有助于对医学影像信息进一步深入挖掘,从而发现新的影像组学特征,探索病因、发病机制,推荐诊疗方案和预测患者预后。
1.2 基于循证的临床决策支持系统 如何架起指南推荐和临床实践的桥梁,使卒中患者能获得基于循证证据的治疗方案,对于改善卒中医疗质量和患者结局至关重要。临床决策支持系统(clinical decision support system,CDSS)可以利用计算机技术及时、高效地实现人类专家智能和循证知识的模拟和延伸。随着深度学习、自然语言处理等人工智能技术的发展,出现了IBM Watson等新一代基于人工智能的CDSS[16]。将人工智能技术和CDSS相结合(AI+CDSS)可能成为未来解决医疗资源短缺以及改善医疗质量、促进医疗服务优质化和同质化的有效模式。CDSS结合到电子病历系统等信息系统,自动发出警示是能够实现有效临床干预的重要途径,也是医院信息化建设的重要发展方向[17]。目前在脑血管病领域,CDSS的研发主要集中在卒中诊断[18]、抗栓治疗[19]、心房颤动抗凝治疗[20]等方面。BioMindTM“天泽”脑血管病诊疗辅助决策系统是第一个专门针对卒中研发的包括诊断、治疗及风险预测等卒中院内综合干预措施的CDSS,有待通过临床研究验证其有效性。CDSS的推广应用对于解决基层医院卒中疾病负担、提升基层医务人员诊疗能力等方面可以发挥巨大的推进作用。
1.3 探索卒中的风险及预后预测模型 目前已有研究通过人工智能算法来预测卒中风险。对于心房颤动患者,通过卷积神经网络分析心电监测预测卒中风险的ROC曲线下面积(area under the curve,AUC)为0.7,优于传统的CHA2DS2-VASc评分(AUC为0.5)[21]。通过人工智能技术分析颈部血管超声,评估脂质核心、纤维帽和钙化组织等应用于卒中风险的评估也可获得良好的效果[22]。在预后预测方面,深度神经网络模型预测急性缺血性卒中患者3个月mRS评分的AUC显著高于传统洛桑急性卒中登记分析(acute stroke registry and analysis of Lausanne,ASTRAL)评分(0.888 vs 0.839,P<0.001)[23]。目前用于卒中风险及预后预测的人工智能算法开发尚处于探索阶段。未来集成电子病历数据、影像组学、蛋白组学及基因组学等多组学数据建立人工智能预测模型具有巨大的临床应用前景,有望能够为患者带来良好的获益。
2.1 优质临床数据是开发人工智能工具的重要基础 在卒中领域,人工智能应用工具的开发依赖于优质、标准化的临床数据。但是,目前多中心,经专家标注过的,针对不同卒中亚型和发病时期,覆盖临床、影像、血液、基因以及患者结局等多维度信息的高质量数据集非常匮乏。在训练人工智能算法时需要综合考虑数据异质性等问题。与人工智能在其他病种的影像研究中遇到的问题一样,在卒中领域人工智能算法的性能受到各种因素的影响,如影像成像设备、制造商、采集参数、运动伪影等。并且临床实践产生的数据存在大量非结构化的数据,利用较为困难,比如记录医疗过程的电子病历,文本的挖掘依赖自然语言处理(natural language processing,NLP)技术[24]。此外,数据的共享和利用少,数据的共享隐私、安全、所有权和使用权界定等均是制约获得优质临床数据的重要因素。通过优化、整合卒中临床、生物样本和影像等公共数据资源可以为建立卒中人工智能大数据平台奠定良好的数据基础。
2.2 金标准是影响人工智能算法性能的关键在医疗人工智能算法开发过程中需要明确定义训练集和测试集,金标准数据集的选择对人工智能算法的性能至关重要。如果开发数据集是基于未经验证的报告,则会造成“废进废出”(garbage in,garbage out)。金标准的制定通常需要大规模、高质量的专家级别的人工标注。人工智能标注工具的开发可以部分缓解所需耗费的人力及时间。无监督学习则可以通过分析大量未标记的数据以识别数据中的隐藏模式或结构,这大大增加了可分析的数据量,如医院电子病历系统数据等,但可能会降低数据的质量和可解释性。半监督学习可以同时使用标注数据及未标注的数据,从而尽量减少人力投入,并提高准确性。
2.3 提升人工智能算法的可解释性 目前的人工智能算法尚未为广泛应用于临床实践做好准备,除了评估人工智能算法的临床适用性之外,各种机器学习模型的“黑箱(black box)”是一个重要的限制因素。应用于临床的人工智能算法需要具备“可解释性”,说明算法是如何得出结果的,反映每一个特征对模型的影响力,提升结果的可信度[25]。探究深度学习的可解释性,打开“黑箱”是研究工作者一直致力解决的问题。SHAP(SHapley Additive exPlanation)可以对每个预测样本产生一个预测值(SHAP值),反映特定特征对模型决策的贡献程度[25]。类激活映射(class activation map,CAM),也称为注意力图(attention map),具有可视化和定位能力,可以在任何给定的图像上对预测依据进行可视化处理,突出显示具有区分性的部分,从而提供可解释性[26]。
2.4 人工智能工具的临床价值验证 基于人工智能算法开发的工具、产品对改善卒中医疗服务质量和患者结局的临床价值,需要严谨和科学的临床研究来评价。比如评估缺血性卒中急性期缺血半暗带的RAPID软件,通过国际上数项大型缺血性卒中急性期再灌注治疗临床研究的验证,为拓宽再灌注治疗时间窗和改善患者结局提供了强有力的证据,使得RAPID软件在临床实践的应用得到了国际上广泛认可[11]。
尽管人工智能在卒中诊疗的研究和临床应用,尤其在影像分析、诊疗决策和预后预测等方面曙光初现,但是在优质和金标准的卒中临床数据集、结果的可解释性和临床价值验证方面,仍存在重大挑战,任重道远。人工智能在卒中领域的转化应用研究,需要以临床需求为目标导向;制定规范的研发及评价策略;建立标准化的临床研究数据、产品研发和评价医院网络;利用深度学习等人工智能技术开发新的卒中诊疗辅助决策工具及风险预测工具;通过严谨的临床研究评价验证其有效性,以实现人工智能产品在临床实践中的有效落地(图1)。
图1 人工智能在卒中的转化应用策略