高天欣,褚天琪,张栩阳,梅玉倩,陈端端
(北京理工大学生命学院, 北京 100081)
心脑血管疾病具有高患病率、高致残率和高死亡率的特点,在我国现约有2.9 亿患者,且高居因病死亡原因之首,已成为影响我国居民健康、阻碍社会经济发展的重大公共卫生问题和社会问题[1-3]。近年,机器学习(ML)在医学界受到较大的关注,如疾病诊断、药物发现、流行病预测等。随着计算机科学和医学影像学的飞速发展,ML在医学图像分析领域,尤其在影像的自动化精确诊断和信息的进一步挖掘,如病灶识别[4]等具有革命性意义。ML作为人工智能(artificial intelligence, AI)的重要子集,通过数据驱动的训练,使得算法模型在不同领域完成相关的判别和预测任务,从算法类型上,可分为有监督学习、无监督学习以及强化学习三类[5]。临床上,数字减影血管造影(digital subtraction angiography, DSA)、核磁共振成像(magnetic resonance image, MRI)、计算机断层扫描(CT)、正电子发射断层扫描(positron emission tomography, PET)、超声成像等医学影像技术在心脑血管疾病诊断和治疗中发挥着不可或缺的作用,已广泛用于诊疗过程。如何充分利用ML的方法分析、处理规模庞大的医学图像数据,进一步挖掘医学信息,为临床的诊疗以及评估提供更加科学的方法和依据,是前沿医学影像分析发展的关键[6]。以下简要概述几种常用医学图像的特点。
计算机断层扫描(CT)是根据人体不同组织对X射线的吸收率不同,计算机根据探测器接收到的X射线信号重建人体断面3D图像,可以准确探查不同组织间密度的微小差别,且由于CT扫描时间短,可有效避免器官运动产生的伪影,提供清晰的人体骨性组织解剖结构和病灶影像,但不能提供清晰的软组织和病灶影像[6]。
CT血管造影(CT angiography,CTA)是经静脉注射含碘造影剂后行螺旋CT扫描,三维重建时去掉皮肤、肌肉、骨骼等不需要显示的结构,只显示血管和内脏结构,不仅能提供血管腔的情况,还可提供血管壁的改变及相邻血管与组织结构的情况。CTA图像清晰,在介入治疗中发挥着重要作用。随着介入放射学的发展,目前已经广泛应用于临床,如冠状动脉CTA(coronary CTA, CCTA)、脑血管CTA、颈动脉CTA等。
磁共振成像(MRI)的模态比较多,对于人体没有损害,且可以显示高精度的软组织器官,不同模态的影像数据训练的模型是不能交叉应用的。其中,磁共振血管成像(MR angiography, MRA)是一种无创、不需对比造影剂的血管成像方法,对血流的流动十分敏感,具有很高的瞬时清晰度。MRA可以有效的区分正常及异常血管结构,并判断血管中是否存在血栓、出血、狭窄并确定其准确部位。飞行时间法(time of flight, TOF)是临床上应用最广泛的MRA方法,以血流或流入血管造影为基础,利用较短的回声时间和流量补偿,使流动的血液比静止的组织更加明亮,但在血流缓慢和血管细长的情况下,不可避免地会由于噪声、低对比度等而降低成像质量[7]。MRA主要用于脑部血管、颈部血管、下肢血管等的检查。
数字减影血管造影(DSA)是将造影前后的图像相减而获得的数字化图像。该技术可以从X射线图像中去除覆盖在上面的骨骼和软组织阴影,故可以高对比度显示血管。因为可以实时显示,有利于介入性处理,因此,DSA是血管疾病诊断与介入治疗手术导航的重要依据,但其空间分辨率不高,细小血管显示不清晰。
通过对扫描人体的超声束的反射信号的接收、处理,获得的体内器官的图像为超声图像。利用多普勒效应,超声可以探查心脏活动以及血流状态。超声设备不像CT或MRI那样昂贵,且可获得器官的任意断面图像,观察运动器官的活动情况,具有成像快、无损伤的优点。不足之处在于图像的对比分辨力和空间分辨力相比CT和MRI较低,另外,气体对超声影响很大,检查结果容易受到患者肠气干扰等多方面因素影响。
分类是将样本归类为先验已知类别的过程,其中以二分类最为常见。在图像分类中,将一个或者多个图像作为输入,而输出结果为一个诊断变量[8]。在医学影像中,通常表现为将一组图像分成不同的临床相关类别、不同疾病类型,或者确定一幅图像描述的疾病是良性,还是恶性[9]。
图像分类是机器学习在心脑血管医学图像分析领域最早做出巨大贡献的任务类型之一[8]。 其中ROC曲线下的面积(area under roc curve, AUC)可以作为评价二分类模型性能的一个指标,即曲线下方所围成的面积越接近1,模型具有的性能越好。
阻塞性冠状动脉疾病是最常见的心血管疾病之一[10],是由动脉粥样硬化斑块在冠状动脉壁上积聚导致的冠状动脉狭窄。在阻塞性冠状动脉疾病患者中,需要确定冠脉狭窄的功能以指导治疗,多通过有创冠状动脉造影(invasive coronary angiography, ICA)测得的血流储备分数(fractional flow reserve, FFR)来确定。然而只有发生功能性显著狭窄,即显著限制血流的狭窄才需要进行有创冠状动脉造影。目前一些学者在这方面应用AI进行了研究[11-14],Zreik 等[15]提出了一种无创检测分类方法,用以区分患者是否有必要进行ICA。通过对冠状动脉CT造影(CCTA)进行深度无监督分析,使用支持向量机(support vector machine, SVM)对提前转化成编码的动脉进行分类。其AUC在患者层面达到0.87±0.02,有助于显著减少不必要的有创ICA检测的数量。然而有时二分类不能满足临床的需求,Zreik 等[16]对于冠状动脉狭窄中不同类型的斑块以及狭窄程度进行了多任务分类。分类的输入是通过卷积神经网络(convolutional neural network, CNN)提取特征后,再经由循环神经网络处理后得到的序列。斑块类型的分类准确率为0.77,狭窄程度分类的准确率为0.80。结果表明,冠状动脉斑块和狭窄的自动检测和分类是可行的,可以将患者自动分为无冠状动脉斑块和需要进一步的心血管检查的冠状动脉斑块狭窄的患者。
烟雾病是一种累及颈内动脉及其近端分支的颅内动脉狭窄闭塞性疾病。目前确定烟雾病病情严重程度的标准是用导管血管造影术对主要颅内血管进行狭窄分级。然而,该方法存在围手术期风险,并使患者暴露在电离辐射下,因此不适合用于长期监测[17]。Waddle[18]等分析了非动脉粥样硬化颅内血管狭窄和烟雾病患者的fMRI影像和人口统计学变量,应用SVM对大脑半球区域是否发生新梗死进行分类,ROC曲线下面积为0.94,特异度为0.85,敏感度为1.0。该研究结果强调了血流动力学成像和机器学习在识别脑血管损伤方面的相关性。
此外,迁移学习也经常会应用到图像分类任务中[19],通过使用预先训练的网络(通常是使用自然图像),用于深度网络训练的大数据集的需求。目前CNN、SVM等机器学习算法在心脑血管医学影像分析领域已经显示出令人满意的分类结果,甚至可以超过人工在某些任务中的准确性。
图像检测可以分为对于感兴趣区域的定位和对于目标病变的检测。对于目标对象在时间或者空间上的定位,已经成为血管影像分割任务和临床治疗计划制定的重要预处理步骤[8]。
腹主动脉瘤(abdominal aortic aneurysm, AAA)是指主动脉局部扩张,超过其正常直径50%以上的血管病变[20]。近几年,主动脉瘤的治疗已经从开放手术转向一种微创的替代方案[21],称为血管内动脉瘤修复术(endovascular aneurysm repair, EVAR),但其术后的随访对于评估患者的病情进展和发现并发症至关重要。Karen等[22]提出一种新的基于CNN的自动检测目标血栓区域的方法,并用于后续的血栓分割。由于血栓的大小、形状和方位各不相同,检测起来十分困难,通过使用DetecNet检测网络学习更复杂的表示和数据驱动的模型优化,从而在CTA中提取目标感兴趣的区域,此DCNN模型的目标是检测CTA体积中的每个2D切片中血栓是否存在并确定其边界,然后生成适合分割的连续3D感兴趣区域。该方法在血栓检测上取得的优异性能,将为接下来的分割任务减少所需存储量和计算时间。
对于目标病变的检测,Wang等[4]通过机器学习(DCNN)对乳腺动脉钙化的定量检测分析,来帮助识别和评估女性患冠心病风险的大小。另外,对于冠状动脉功能性狭窄程度的检测,仅从CCTA影像学的角度预测中、重度狭窄的病变时,功能上表现不佳,因此需要FFR的进一步评测[23]。在检测病变特异性缺血方面,使用有创冠状动脉造影(ICA)对所使用的计算流体动力学模型从CCTA中推导出的无创血流储备分数(CT-FFR)进行了验证[24-25]。近年来,基于机器学习方法开发了一种评估冠状动脉狭窄的功能严重性程度的算法(CT-FFR)[26-28]。Tesche等[29]对该算法的诊断性能做了进一步评估,探索了冠状动脉钙化评分对该算法的影响。研究表明该算法与临床工作流程的整合,可能会减少下游测试的需要,并更好地为治疗决策提供信息。
分割是心脑血管领域图像分析中的一个热点问题,对于术前诊疗规划以及临床效果的评估都至关重要[30-31]。与自然图像的人工标注类似,传统基于人工的血管分割与重建的时间成本非常高,另一方面血管结构的标注依赖于专家医生的经验,不同专家的针对同一案例的标注结果也往往存在经验化的差异[32]。在心脑血管领域,图像分割可以分为血管结构的分割和病变的分割,需要全局和局部上、下文来执行准确的分割,针对不同的医学成像技术特性(如分辨率、噪声、血管对比度),选择合适的分割算法,分割任务通常被定义为识别组成感兴趣区域的轮廓或者内部的一组体素[8]。
对于无症状的颈动脉狭窄患者,斑块的形态学评估可以辅助判断斑块破裂的风险和卒中的发生,超声成像为此提供了一种安全和非侵入性的手段,而颈动脉中膜-外膜边界和管腔-内膜边界的分割是这一过程中必不可少的一部分。Azzopardi等[33]在颈动脉的超声影像上,使用结合几何约束的CNN模型分割颈动脉图像中的中层外膜边界和管腔内膜边界,融合幅度和相位数据作为输入数据的双峰源,并设计了一种新的几何约束目标函数用于深度模型的训练,该模型在中层外膜边界和管腔内膜边界的Dice系数达到0.962和0.925。
中风主要由脑动脉瘤、动静脉畸形等严重的脑血管疾病引起,而准确的脑血管分割是实现脑血管结构可视化、血管诊断和计算机辅助治疗的关键步骤。Zhang 等[34]基于颅内飞行时间法(TOF-MRA)影像,构造并训练了一种基于扩张卷积的深度网络。结合模型驱动和数据驱动的方法提出了一种新的脑血管自动分割策略,平均Dice系数可达0.932。与其他方法相比,该模型对脑血管结构的分割具有更好的完整性和敏感度,尤其是对细小血管也有良好的分割效果。而Zhang 等[35]提出了一种基于U-Net的深度学习方法,在DSA图像上也实现了脑血管的自动分割,准确度达到0.978,平均Dice系数为0.8268。
机器学习中模型以及算法的训练需要基于准确标注的大量的训练数据,以充分学习模型参数,同时防止出现过拟合。增加可用训练数据量的一种常用技术是数据增强,即将预定变换(如平移、旋转等)应用于已有的训练数据。而数据增强的另一种方式是合成全新的数据,即图像的生成。其中生成对抗网络(generative adversarial network, GAN)是图像生成中最常使用的网络模型,由生成器和鉴别器两部分网络组成,其中生成器生成新的血管几何形状,而鉴别器则将生成的血管与真实血管进行区分,采用“零和博弈”的思想,优化生成器和鉴别器两个网络的参数。
分析冠状动脉CT血管造影以检测动脉粥样硬化斑块或狭窄,对冠心病的诊断和预后具有临床价值[36]。因此,对CCTA的定量分析一直是医学图像分析领域的研究热点。2018年Yi等[37]训练了一个生成对抗网络用于机器合成冠状动脉血管。通过将真实的和合成的血管的几何形状参数化为基于血管中心线的1D信号,生成器合成具有特定特征的血管。与以往基于模型的血管合成方法不同,该生成方法能够用数据驱动的方法合成逼真的血管模型。该模型可有效地捕获训练集中存在的数据,并生成与在训练期间看到的样本不同的新样本。而从三维结构转为医学影像也在Hamarneh等[38]使用关于组织密度的假设,将合成的血管几何形状转换成相应的CT图像的工作上有所突破,生成的数据对验证图像分析技术是十分有意义的。
不同成像技术各有优势,所含有的信息也不尽相同,在训练网络模型或者优化计算机辅助诊断时提供了不同的信息,而获得相同患者的不同成像数据经常不易实现。因此,机器学习还可应用于医学影像模态的转换。磁共振成像(MRI)与计算机断层扫描(CT)在图像的生成中是两种常用的医学影像,2019年Rubin等[39]设计了一种条件生成对抗网络(conditional GAN, CGAN),基于CT灌注影像重建出了MRI影像,并将生成的MRI影像作为额外的信道输入到分割网络中,提高了对于病变的分割效果。同年,Wang[40]等实现了从MRI图像中生成CT图像,研究了脑立体放射性治疗中的剂量计算,并在生成CT与原始CT之间的轴向剂量平面上,采用3%/3 mm标准进行伽玛分析,进一步评价生成CT的剂量准确性。研究结果显示通过率为97.5%~100%。在图像的生成中,GAN发挥了不可或缺的作用,将生成模型和判别模型一起对抗训练,生成模型产生一张图片去欺骗判别模型,再由判别模型去判断这张图片的真假,两个模型在训练过程中的能力越来越强,最终达到稳态。
机器学习现已被应用于心脑血管领域的多种医学影像分析任务中,均取得了突破性的进展,可在血管类疾病的临床诊疗过程中起到巨大的辅助作用。传统的机制驱动方法高度依赖于复杂和繁复的模型参数,而数据驱动的出现,让我们对学习模型的优化有了新的表达方式,但两种驱动方式有各自的优势,未来将两者结合可能对于模型的优化有更好的方法和表达;而多模态医学影像的配准与融合在机器学习中的进一步应用,可以实现对感兴趣区域的信息的补充,或将提高机器学习的效率以及优化学习的效果;在将来机器学习也许可以利用无监督学习来减少对数据标注的依赖,而强化学习的应用或可以实现机器不依赖人的指导创造出更优的医学诊断与治疗方案的目标。
随着机器学习和医学影像学技术的发展,机器学习的应用将减轻医生的工作量,同时为患者提供更加准确的诊断和治疗的规划,从而在减轻患者痛苦方面取得更大的进步;因为其在某些方面已经可以代替或者超越专家的诊断,故也会减轻医生工作压力,节约临床诊断的宝贵时间;另外,形态学分析从二维向三维的转变,有助于在一些疾病上建立标准化的测量体系。