林 振,秦宇辰,秦婴逸,李冬冬,吴 骋,贺 佳
(海军军医大学卫生勤务学系军队卫生统计学教研室,上海 200433)
脑卒中,又称为中风、脑血管意外,是由脑血管阻塞或破裂而导致脑组织损伤的一类疾病,包括缺血性脑卒中(约占70%)和出血性脑卒中(约占30%)[1]。脑卒中为世界人口仅次于缺血性心脏病的第二大死因,而在我国已经成为头号死因[2]。在过去的10 a,随着医疗技术水平的不断发展,脑卒中的预后有所改善,但是其患病率和发病率仍持续上升[1]。进入21世纪以来,生物医学数据的爆炸式增长以及高性能计算机的出现给研究者提供了发现新的疾病相关影响因素的可能性,有利于提高护理质量、改善医疗决策。深度学习是机器学习领域的一个分支[3],该领域见证了计算机在理解和分析数据如图像[4-5]、语言[6]和语音[7]等方面的惊人进步。与普通的机器学习相比,深度学习是一种表示学习形式,在这种学习中,计算机接收原始数据,然后开发出多层神经网络,这些神经网络层通常按顺序排列,由大量原始的、非线性的算法组成,从原始数据输入开始,每一层的表示被输入到下一层,并转换为更抽象的表示[3];数据流经系统的各层时会不断地转换,直到得到最后的结果。通过这种学习方式,可以得到高度复杂的函数。常见的深度学习包括卷积神经网络(convolutional neural network,CNN)、循环神经网络(recurrent neural network,RNN)及生成对抗网络(generative adversarial networks,GAN)等,其中CNN广泛应用于脑卒中的诊疗[8],如图1所示。CNN包括卷积层、汇聚层、Dropout层以及输出层。其中,卷积层能够学习数据特征;汇聚层通过聚集相似或冗余的特征减少特征数量;Dropout层有选择地关闭感知器,以避免过度依赖网络的单个组件;输出层将学习到的特征整理成一个分数或分类,例如基于给定的影像图片分辨其是否有缺血的迹象。这些算法在图像分类任务中取得了巨大的成功,且其准确率已经与专业人员读片的准确率不相上下[9-11]。
图1 卷积神经网络[8]
随着各类医疗设备和医疗信息系统的日益普及,医学领域已积累了海量的医学数据,这些数据可以有效地用于深度学习[12]。随着新型诊断和预后工具的发展,脑卒中诊疗研究领域也开始受到深度学习的影响。鉴于脑卒中的临床诊断往往依赖于细微的症状和具有颗粒状、高维信号的复杂成像模式,深度学习在这些方面具有天然的优势。本文对深度学习在脑卒中医学影像分析、医疗文本分析、结构化数据分析等方面的应用展开综述,并对其目前所面临的挑战进行分析,以进一步促进深度学习在医疗保健领域的应用。
脑卒中作为一种急性神经系统疾病,及时明确诊断和治疗十分关键,而CT和MRI起着至关重要的作用。计算机视觉是深度学习获得巨大成功的领域之一,应用深度学习可以实现对图像进行目标检测与分割以及预测等功能。在图像分析领域,CNN相较于其他算法优势显著,绝大多数与影像相关的深度学习研究采用基于CNN的神经网络框架,因此本章节主要针对CNN相关的研究进行探讨。
快速诊断脑卒中是改善患者预后的关键,目前一些基于深度学习的平台已经被应用于自动诊断脑卒中领域。这些平台主要用于区分缺血脑组织和非缺血脑组织,如基于CT血管造影来检测是否存在大动脉闭塞,基于CT灌注区分正常脑组织、缺血脑组织和梗死脑组织。Stib等[13]采用基于CNN的DenseNet-121架构来自动诊断基于CT血管造影的大血管闭塞模型,经过训练后AUC达到89%,敏感度达到100%,特异度达到77%。Sheth等[14]采用CNN在CT血管造影上诊断大血管闭塞和梗死体积,用于检测大血管闭塞的AUC达到88%,而用于检测梗死体积的AUC达到90%。Azwani等[15]则采用VGG-16、GoogleNet及ResNet-50架构对正常和异常脑CT图像进行分类,结果表明ResNet-50在区分是否梗死方面的准确性最高。此外,Shinohara等[16]应用CNN从CT图像中识别大脑的动脉高密度征,准确率达到86.5%。上述的应用均达到了较高的准确率,虽然这些应用不能完全替代医生对于脑卒中的诊断,但是作为一项辅助诊断技术,可以为医生在诊断脑卒中时提供一定参考。
在脑卒中的治疗中,区分正常和病变脑组织至关重要。脑卒中损伤的定位和体积量化可以为脑卒中的康复治疗提供重要信息,特别是指导血管内治疗,这往往受到随机试验数据和医生个人经验的综合影响。利用影像学指标来确认脑卒中患者是否应该进行溶栓治疗或血管内机械取栓,已开始成为标准的指导原则之一。临床医生急需先进的数据分析技术来识别缺血核心和可挽救的缺血半暗带,并以可重复和准确的方式预测预后结局,而基于深度学习的图像分割在这方面具有巨大的潜力。
Maier等[17]评估了9种不同的分类方法,包括传统的机器学习方法和CNN,结果表明CNN优于传统的机器学习方法。目前,CNN模型是最常用的分割模型,而Dice相似系数是比较不同分割模型性能最常用的指标[18]。运用Dice相似系数比较2个样本之间的相似性(如比较计算机和人类对病变进行分割的相似程度),系数越接近1,代表计算机分割得越好。Chen等[19]早在2017年使用CNN模型在741例患者的弥散加权成像(diffusion weighted imaging,DWI)序列图像中进行急性脑卒中分割,Dice相似系数平均达到0.67。而Zhang等[20]则利用3D-CNN模型在DWI图像中进行自动分割,Dice相似系数达到0.79。目前,大多数CNN模型的Dice相似系数为0.6~0.8。
随着深度学习的发展,模型不仅仅局限于传统的CNN。Wang等[21]利用CT灌注成像,提出一个基于灌注参数映射合成伪DWI的新框架,该框架利用3个CNN进行端到端的训练,通过获得更好的图像质量提高DWI图像的合成质量和分割精度。而Tomita等[22]则开发出一个基于深度残差神经网络的框架,从脑卒中患者的T1加权MRI图像中实现了对不可逆损伤脑组织病变体积分割,在评价识别病变准确性的指标如Dice相似系数、平均表面距离、Hausdorff距离等方面均取得了较好的成绩,证明了该方法对病变体积分割的有效性。此外,Lucas等[23]引入临床专家知识,在结合卷积自编码器构建多尺度CNN的基础上,对患者的组织病变概率进行预测,得到的Dice相似系数为0.46。
鉴于脑卒中的高致残率,预测预后及不良事件并及时做出适当的治疗决定,对于降低发病率和死亡率、提高患者生活质量至关重要,而深度学习在预测最终脑组织结局、脑卒中并发症和功能结果等方面具有一定优势。目前几种不同的深度学习模型已被广泛应用于脑卒中患者的预后预测。Tang等[24]认为将临床和影像学相结合的信息作为定量的生物标志物,利用深度学习预测短期和长期脑卒中预后具有一定的前景。例如,Chauhan等[25]基于CNN框架,在最初诊断时使用3D MRI作为输入来评估语言缺陷的严重程度,并将CNN模型与传统的机器学习算法进行比较,发现CNN模型与主成分分析相结合时表现更出色。与此类似,Bacchi等[26]将3D CNN和人工神经网络相结合以预测临床结果,并将其与其他方法进行比较,研究结果表明,将3D CNN和人工神经网络相结合,即包含了影像和临床信息的模型效果最好。而Hilbert等[27]仅仅利用CT血管造影图像,构建基于残差神经网络与自动编码器相结合的模型,以此预测血管内治疗的再灌注结局和功能,也取得了较好的效果。
在深度学习和预训练模型的帮助下,自然语言处理(natural language processing,NLP)技术也得到了迅速发展。NLP作为一种新兴的人工智能技术,主要研究利用计算机来处理、理解和运用人类语言的各种理论和方法。所谓的自然语言,即与计算机等编程语言相区别,主要是指日常生活中所用的书面语言和口头语言。预训练模型的出现显著提升了NLP技术的性能。预训练模型是迁移学习的一种应用,通过在超大型数据集进行训练(如维基百科、百度百科),学习单词的语义和句法意义,将相关模型参数保存后作为字向量。现阶段的预训练模型分为基于词嵌入的预训练模型和基于语言模型的预训练模型,基于词嵌入的预训练模型其向量是固定的[28],而基于语言模型的预训练模型可以对下游任务的文本的向量表示进行微调[29-30],克服了一词多义的问题。对于训练数据量较小的模型,预训练模型给下游的神经网络提供了更佳的初始状态,使训练的准确率得到提升。
由于很多重要的临床信息都被记录在非结构化的医疗文本中,医生花费了大量的时间来记录,如现病史、体格检查、病程记录、影像学报告等,据专家估计这部分信息占总量的80%以上[31],NLP技术在包含了大量信息的医疗文本分析中逐渐得到应用。Garg等[32]在电子健康档案上使用深度学习算法,通过分析病历及影像学报告,根据急性卒中治疗低分子肝素试验分类系统实现了在入院时确定脑卒中的分类亚型。而Ong等[33]利用RNN开发了一个较为全面的NLP框架,用来分类脑卒中患者的影像学报告文本,并能够识别脑卒中的亚型、位置等相关特征信息。Fu等[34]则采用CNN从影像学报告文本中发现无症状性脑梗死,准确率达到了99.4%,证明了NLP技术的可行性。此外,Heo等[35]使用脑部MRI的影像学报告文本,利用深度学习预测了急性缺血性脑卒中患者的不良预后,算法包括CNN、RNN、多层感知机等,结果表明深度学习要优于其他机器学习算法的性能,而在较差预后的预测中,CNN要优于RNN。
结构化数据一般存在于类似电子医疗索赔数据库这种大型数据库中,由于其收集过程的大规模性、纵向性以及收录的患者健康信息的多样性而成为一个有价值的数据源,而这种数据往往比影像学数据更容易收集,因此,将深度学习应用于结构化数据有较好的前景。Hung等[36]选择了一个约80万患者的基于人群的电子医疗索赔数据库,利用深度学习来预测患者是否在5 a内发生脑卒中。结果表明,基于深度学习的模型与其他机器学习模型的预测精度相当,而深度学习使用的患者数据量更少,获得了最优结果。而Cheon等[37]则利用韩国公立医院2013—2016年的调查数据,采用深度学习预测了脑卒中的发生及患者脑卒中后的死亡,AUC能达到0.8以上。
尽管深度学习在生物医学领域取得了巨大的进步,但在获得广泛应用之前,仍面临一些重大挑战。
脑卒中相关的数据分散存储在各家医院中,然而电子医疗记录高度异构,通常由临床文字记录和各种数字代码组成。临床文字记录往往由不统一的用词和缩略语组成,经常因专业不同而不同,且包含冗余信息,并受到隐私限制,使得这些数据不太容易获取。此外,考虑到患者的表现和疾病过程的复杂性,训练脑卒中相关模型所需的可靠的真实标签非常昂贵,往往需要多个领域的专家共同努力。标注数据的缺乏仍然是深度学习在医学领域应用发展的重要瓶颈。
目前,基于深度学习的脑卒中病变分割或梗死体积量化的研究使用了不同的评价指标,其中一部分使用了基于分割的统计度量,如Dice相似系数,而另外一部分则使用了损伤体积相关度量,但损伤体积相关度量仅描述体积的大小,因此可能夸大病变结果。病变分割及梗死体积测量的准确性对脑卒中患者的预后至关重要,因此相关部门有必要制定统一的评价指标来检验各种深度学习模型。
现有的与脑卒中相关的深度学习研究大多数均在探索新模型、新方法,而不是调查和验证当前已有的方法,往往缺乏外部验证,且训练数据集的来源可能并不具有代表性,如样本仅仅来自于同一家医院,或者样本量仅仅几十例,因此这些模型、方法应用在临床实践中的适用性还应通过大型多中心随机对照临床试验进一步验证。此外,基于深度学习的研究更多的是用来诊断脑卒中,而用于评估脑卒中预后的研究较少。因此,未来的研究可以进一步利用深度学习模型的优势来开发评估脑卒中预后相关的模型,这将有助于医生评估治疗方式的效果。
深度学习具有映射复杂的非线性函数的能力,使其难以被解释,这在脑卒中诊疗中是需要医师着重考虑的问题。由于临床决策支持系统旨在增强医疗保健专业人员的决策能力,可解释性对于说服医疗保健专业人员相信算法提出的建议并采用至关重要。因此,解决可解释性方面的问题才能进一步促进深度学习在脑卒中诊疗等医疗保健领域的使用。
深度学习给医学实践带来了革命性的影响,随着其算法的不断创新,在未来类似于GAN、迁移学习等新技术将进一步促进其在脑卒中领域的发展。深度学习在脑卒中诊疗领域的贡献尤为突出,其在成像中的应用有可能发现肉眼几乎看不到的脑损伤,可提高临床医生的决策能力,减少治疗延误,并预测患者的预后。如何将深度学习整合到日常临床实践中是其面临的紧迫问题,在未来还需要更多标准化的数据集和更广泛的深度学习研究来建立和验证其在脑卒中诊疗领域中的实际应用效果。