赵福锴,李剑明
天津医科大学心血管病临床学院 泰达国际心血管病医院核医学科,天津 300457;*通信作者 李剑明 ichlijm@163.com
核心脏病学中最常采用SPECT和PET心肌灌注显像(myocardial perfusion imaging,MPI)诊断和评估冠状动脉疾病(coronary artery disease,CAD),一份完整的MPI检查包括丰富的影像学信息和临床变量,对可疑或确诊冠心病患者的预后评估具有重要价值[1]。然而,处理和整合分析这些大量且多样的信息对技术操作者和报告医师充满挑战。近年来人工智能(artificial intelligence,AI)在医学成像方面的应用迅速发展,主要包括基于特征分析的机器学习(machine learning,ML)和基于图像的深度学习(deep learning,DL)技术,前者使用预先定义的特征建立数学模型从而完成预测,后者则从成像数据中自动提取特征并进行预测。AI不仅能辅助处理复杂而大量的数据,而且能直接准确地从图像中提取信息并进行整合分析,消除了人的主观性,在优化图像质量的同时,能得出重复性好、可靠且可解释的结论。目前国际上利用AI在MPI多个方面进行初步研究,预计这些基于AI的新方法能很快进入临床实践,并在核心脏病学中发挥重要作用。为此,本文对AI在MPI的采集过程、衰减校正、图像后处理、诊断报告和患者预后评估方面的最新研究进展进行综述。
1.1 利用AI减少图像采集时间 目前的MPI采集过程要求患者在机器上相对较长时间保持静止,减少采集时间能带来更少的不必要运动及更好的患者舒适度,对不能久卧患者更友好。Shiri等[2]使用DL中的卷积神经网络减少每个投影的采集时间或减少角度投影的数量采集的图像质量。与作为参考的全时间/角度采集图像相比,预测的全时间/角度图像具有可靠的一致性。除上述方案外,Hu等[3]探索通过减少MPI成像步骤,减少受检者的辐射暴露和额外费用,仅负荷显像可大幅降低辐射量并缩短检查时间;该研究使用ML生成的评分预测来自多中心数据库的20 414例患者发生主要心血管不良事件(major adverse cardiovascular event,MACE)的概率,实现自动判断是否取消静息扫描。在静息扫描取消率相同时,3种ML方法选择的仅负荷试验患者发生MACE的风险低于临床视觉分析选择方法。与Hu等[3]使用是否发生MACE作为取消扫描的指标相比,Eisenberg等[4]采用是否发生高危或阻塞性冠心病作为预测指标,该研究中ML评分阈值为0.29时,检测阻塞性冠心病的敏感度为95%,检测高危冠心病的敏感度优于采用总灌注缺损或专家读片方法(96%比90%比89%;P<0.01)。基于ML的评分系统的高灵敏度为诊断医师提供了一种新方法,在保证SPECT MPI预后价值的前提下,自动取消静息扫描,从而减少患者所受辐射剂量、额外费用和缩短扫描时间,并减轻临床医师的负担。
1.2 利用AI弥补低剂量信息及降低高噪声 在成像过程中减少用药剂量能降低患者所受辐射剂量,如何准确、高效地处理低剂量采集所带来的图像噪声是首要问题。Ramon等[5]使用卷积神经网络的DL算法抑制采用连续低剂量SPECT MPI时升高的图像噪声,从而在降低剂量的同时完成对灌注缺陷的检测;该研究结果表明,DL算法降噪处理在1/2注射剂量条件下可获得与全剂量传统滤波反投影和有序子集最大期望重建类似的诊断效果。Aghakhan Olia等[6]采用DL中的对抗生成网络取得更好的结果:该研究采用的DL算法在1/2和1/4注射剂量下图像的临床接受率与1/8剂量下(11%)相比,达到100%和80%。Liu等[7]采用DL中噪声对噪声的训练方法及耦合的U型网络抑制噪声,该方法不需要原始图像与噪声图像集的训练,仅使用不同噪声下的图像集即可进行图像降噪,该研究采取的DL算法较传统的后滤波可产生更好的噪声抑制。此外,使用最佳设置时在灌注缺损检测方面优于传统的三维高斯滤波器、三维非局部均值滤波器及卷积自编码降噪网络。Yu等[8]使用DL中的卷积神经网络基于低剂量图像预测正常剂量图像,并将图像去噪的性能与保真度指标以及心脏缺陷检测能力进行比较,结果发现该去噪方法降低图像噪声的同时降低了缺陷对比度,从而降低了缺陷检测的性能。上述研究均基于SPECT,在PET方面也有类似的研究。Wang等[9]采用融合人工神经网络改善PET MPI图像质量,该方案改善了灌注缺损中噪声与偏差及对比度的权衡,提高了对跨壁及非跨壁放射性缺损的检测能力。
使用CT扫描图像进行衰减校正可以提高SPECT的精度,且能进行半定量分析[10]。但目前医疗机构使用的大多为未配备CT的SPECT设备,单独进行CT扫描一方面增加了患者的辐射剂量,另一方面异机CT采集可能存在一定的配准误差、运动或重建伪影等,使衰减校正图像质量不佳。基于此,有研究将衰减校正与DL结合,其中又分为基于DL的间接衰减校正和直接衰减校正。间接衰减校正从发射图像中预测生成CT衰减图,再使用CT衰减图进行衰减校正;而直接衰减校正从没有CT衰减图的非衰减校正图像中直接预测生成衰减校正图像。
在SPECT MPI方面,Shi等[11]使用DL中的条件对抗生成网络模型从受检者的SPECT发射数据间接进行衰减校正,在该DL模型中,输入端同时接受SPECT图像和散射数据,输出端生成CT衰减图进一步用于生成DL预测衰减校正图像;该研究中预测衰减校正图像和真实衰减校正图像之间的归一化标准误为(0.26±0.15)%;同时证明在仅有发射数据而无散射数据时,该DL模型较普通模型产生CT衰减图仍是可行的。Prieto等[12]采用的基于U型网络的DL算法间接生成CT衰减图的归一化标准误达到(0.23±0.13)%。与Shi等[11]使用间接衰减校正方法和传统SPECT数据不同,Yang等[13]使用基于U型网络的DL算法对来自碲锌镉(cadmium-zinc-telluride,CZT)SPECT心脏专用机的患者数据进行处理,直接从非衰减校正图像生成预测衰减校正图像。与非衰减校正图像相比,该算法预测的衰减校正图像能带来更小的节段误差。此外,Shanbhag等[14]采用条件对抗生成网络直接生成预测衰减图像,在阻塞性冠心病中诊断总灌注缺损的效能与CT衰减校正图像相似[曲线下面积(AUC)0.79比0.81,P=0.196]。此外,Shanbhag等[14]还使用单中心的数据训练DL模型并在来自两个不同中心的数据上进行外部测试,结果显示使用该模型诊断梗阻性CAD的准确度高于使用非衰减校正图像(AUC 0.79比0.70,P<0.001)。Chen等[15]在此基础上采用2种DL方法比较直接和间接衰减校正方法在心脏专用SPECT和通用SPECT上的性能,结果显示无论是在心脏专用还是通用SPECT,间接衰减校正方法较直接衰减校正方法在图像体素、靶心图分段和缺损范围方面均具有更稳定、优越的性能。尽管直接方法存在对真正的缺陷进行过度修正、易对缺陷大小估计不足等问题,但受限于心脏专用机有限的采集视野,仍需进一步完善对直接衰减校正方法的研究。Hagio等[16]使用DL方法在11 000人以上数据中进行直接衰减校正生成预测衰减校正图像,与非衰减校正图像相比,预测图像的总灌注缺损诊断性能有所改善(AUC 0.827比0.780,P=0.012),且预测图像与CT衰减校正图像的AUC无显著差异。Wang等[17]的PET MPI研究表明,结合多尺度可变形结构及卷积神经网络的U型网络算法较单纯U型网络算法在直接衰减校正方法的性能更好。
目前该方向研究普遍存在一些局限性:首先,大多数研究采用小样本量进行DL训练,容易出现过拟合,在多样化的人群中可能表现不佳;其次,研究数据均来自单一机构、单一设备、单类显像剂,且在数据预处理过程中易受操作者主观因素干扰,结果缺乏泛化性。但这些研究均验证了采用DL算法生成衰减校正图像的可行性。
MPI诊断CAD和左心室功能评估,需要准确的图像处理与分割,而目前的方法需要大量人工调整,既烦琐又主观,AI方法的引入可以在提高这些过程精度的同时实现自动化。
3.1 对靶心图量化描述 目前MPI预测CAD的表现不佳,通常需诊断医师结合相关临床信息做出判断,使结果具有一定主观性。靶心图为强度值直接排列在极坐标网格中的图像,与人工神经网络相比,图像卷积神经网络不需要重新采样即能直接分析靶心图信息。靶心图描述又分为直接和间接两种方法,直接方法使用原始靶心图进行量化和降采样作为输入,间接方法通过图像衍生的定量指标进行计算机辅助诊断。
Spier等[18]使用图像卷积神经网络的DL算法实现不依赖正常数据库即可对从MPI获得的靶心图进行CAD自动检测、分类和定位病变节段,在CAD分类方面,该方法在静息/负荷试验与读片专家的一致性达89.3%和91.2%。Apostolopoulos等[19]采用DL中的视觉几何群网络算法开展类似的研究,该方法与核医学专家进行的半定量靶心图的准确度分别为74.53%和75.00%;而未保留学习权重的2种DL方法的准确度仅为43.05%和54.6%。Papandrianos等[20]在使用视觉几何群网络算法进行迁移学习的基础上评估DL参数对卷积神经网络性能的影响,在该模型的最佳参数组合下,2种DL算法的专家一致性均达到96%;参数中的卷积层、密集层和像素大小等最佳组合能提高至少7%的分类精度,表明一个良好的模型需要进行大量的参数验证以实现最优效果。上述研究未考虑年龄、性别和易感因素等临床数据,缺乏常规正常数据库作为对照、仅由核医学专家标注的数据对模型进行评估、由单一设备获取的图像和数据集过小等。在完善上述问题后,一个完整的系统将有机会部署到临床工作中。
3.2 对左心室准确分割 Wang等[21]使用多分类DL算法进行左心室分割,并测量门控MPI成像中的左心室容积及射血分数,该研究采用的分割方法与人工分割结果的相关系数高且左心室容积的平均相对误差小[0.910±0.061和(1.09±3.66)%]。目前临床采用的方法易高估小心脏容积和低估大心脏容积,而在Wang等[21]所用方法中,容积误差和左心室容积大小的线性相关系数为0.222(P=0.238),表明该方法不受左心室容积大小影响。Josselyn等[22]采用U型网络及视觉几何群网络对18F-PET/CT图像进行左心室分割并识别摄取模式,结果表明在每种摄取模式下DL算法与专家在左心室分割上具有良好的重叠,在体积测量上具有很好的相关性(R2=0.35,β=0.71)。Ko等[23]采用DL方法在自动分割心肌的同时,不需要靶心图即可预测阻塞性CAD,该方法基于患者水平和基于血管水平分析,预测阻塞性CAD的AUC均显著高于采用总灌注缺损的方法(患者水平:0.844比0.759,P<0.01;血管水平:0.803比0.722,P<0.01)。手动进行左心室分割是一项冗长、复杂的操作,并且依赖操作者的经验,采用DL方法分割的精度与人工相当,能够提高效率及可重复性。
4.1 提高诊断准确度 左束支传导阻滞易导致MPI假阳性,从而导致诊断准确度降低。Abdi等[24]使用转移学习的DL方法探索其识别左束支传导阻滞假性缺损的能力,DL方法在2次验证中的准确度均达到类似核医学专家水平。单纯负荷实验具有降低辐射剂量、缩短扫描时间及减少花费等优点,但医师的准确诊断受到多方面影响,因此提高负荷实验MPI诊断准确度极为重要。Liu等[25]采用DL自动诊断接受仅负荷实验和负荷/静息实验的37 243例患者的SPECT MPI中的心肌灌注异常,结果表明该DL算法优于传统定量法,并且在有利于传统定量法的同一特异度(77.7%)时,该算法的敏感度仍高于前者。与传统定量法相比,DL算法不需要依赖正常数据库即可对MPI进行分析诊断。在使用更多附带患者侵入性冠状动脉造影结果的MPI诊断进行DL训练后,该方法的诊断准确度可能进一步提高。
4.2 自动识别异常 Kaplan Berkaya等[26]通过对比不同DL算法的分类模型与核医学专家的经验分类模型,探索DL辅助分类模型帮助临床诊断CAD的可行性,结果显示,基于视觉几何群网络的DL分类模型与基于经验的模型的最大准确度、敏感度和特异度接近;与其他研究相比,该研究利用经过预训练的DL模型进行转移学习,结合带有深/浅特征的ML分类器,在无大量数据集训练的情况下也能达到与核医学专家相似的诊断性能。Apostolopoulos等[27]使用DL与ML结合的混合多输入方法自动识别异常的MPI,在准确度与特异度方面与核医学专家相似,但敏感度较后者弱。Apostolopoulos等[28]后续采用结合了特征融合和注意力机制的DL网络,提高了算法的定位能力和诊断性能,与核医学专家(准确度为0.784 0)相比具有良好的诊断性能(准确度为0.788 8)。Miller等[29]对DL方法能否改善医师对MPI图像的解释进行评估,该DL算法的诊断准确度较不使用DL的医师和总灌注缺损方法均有较好的AUC(0.793比0.747比0.718,P<0.01)。Otaki等[30]尝试让DL方法预测阻塞性CAD更通用、具有可解释性,结果表明DL算法无论是在单个患者水平还是单只血管水平的表现均优于总灌注缺损方法和医师诊断。Ko等[21]的研究结果与Otaki等[27]相似,并表明给模型添加定量图像对预测准确度无改善。Teuho等[31]使用卷积神经网络对15O-H2O PET MPI进行缺血/非缺血识别。除敏感度DL较临床诊断低(65%比75%)外,AUC、准确度、特异度及精确度均与核医学专家相似。随着可解释的DL诊断CAD的准确度不断提高,接近甚至超过标准定量分析和临床视觉分析,其整合到标准的临床软件中后将能够辅助快速、准确地诊断CAD。
Megna等[32]比较不同的ML方法在PET MPI中评估疑似CAD患者的价值,该ML方法在训练/测试中敏感度与特异度的AUC非常宽泛(61%~95%),并且在验证阶段对疑似CAD患者缺血反应的预测价值较有限。与此类似,Wang等[33]使用不同指标和ML方法评估PET心肌灌注和代谢联合成像对疑似CAD的诊断价值。ML最优模型的AUC、准确度、敏感度和特异度均较半定量模型有优势。此外,由于乳房衰减影响MPI的诊断准确度[34],ML也用于比较传统SPECT与CZT-SPECT识别女性患者低中度CAD的能力[35],结果表明对于疑似CAD的女性患者CZT-SPECT的诊断准确度更高,并能更好地区分伪影和真实的灌注缺陷。Cantoni等[36]使用ML比较传统SPECT与CZT-SPECT对CAD的诊断准确度,结果表明CZT-SPECT的临床一致性与敏感度均高于前者。Miller等[37]研究表明使用ML方法预测MPI异常灌注较常规方法更优(AUC 0.829,95%CI0.822~0.836),准确识别高/低危患者可以指导医师开展不同的临床决策,如早期血管重建或取消静息扫描等。然而,掌握核心脏病学的诊断是一个学习积累的过程,初学者成长为经验丰富的心脏影像诊断专家需要大量时间与精力。Zhang等[38]使用ML技术开发了一种使用不同轴位MPI图像区分CAD缺血情况的方法,该方法的诊断准确度优于不同经验级别的医师(初学者、无经验者及经验丰富的专家)。Chiba等[39]探索ML中的人工神经网络能否帮助初学者在MPI诊断上取得与专家读片者类似的结果。在设定的简化5节段心肌模型下,该ML算法帮助初学者解释不明显灌注组和不明显缺血组的MPI与专家的结果类似。
4.3 提供智能报告 Garcia等[40]采用非参数方法将17个心室节段的灌注、缺血等信息进行归一化评分,通过贝叶斯推理引擎输入开发的AI报告系统,最终自动填充字段生成结构化的报告。结果显示在高特异度水平下,该系统与核医学专家对CAD和心肌缺血的报告无差异。Zheng等[41]开发了一种自然语言处理算法提取MPI报告,结果显示该算法识别心肌缺血患者的敏感度、特异度、阳性预测值及阴性预测值均较高。传统的MPI报告不同机构/医师间的解释不同,基于AI的算法可以高准确地提取MPI中的信息,并生成一致性较高的可解释报告,大幅减轻人工书写及审核所需要的资源。
Arvidsson等[42]使用DL直接从MPI中预测冠状动脉造影定量值。与视觉评估相比,卷积神经网络算法在预测狭窄程度≥50%时的准确度在单支血管和3支血管的平均结果均无显著差异,但在单个患者水平视觉评估的表现更好。该方法有望减少非必要的侵入性冠状动脉造影手术。Juarez-Orozco等[43]的研究证明DL能直接定量评估PET MPI靶心图,从而提高对发生MACE患者的识别。Singh等[44]使用DL评分模型对患者发生全因死亡和心肌梗死的准确度优于传统总灌注缺损评分方法,并且能将MPI图像与潜在的冠状动脉解剖结构相关联,更准确地对MPI图像做出解释。以上模型的建立均需要大量多样数据类型,但在临床实践中,可能会存在一些缺失值。因此,Rios等[45]使用ML评估7种不同的缺失值处理方法对预测特定患者MACE风险的影响,结果表明缺失值会降低ML对MACE预测的准确度,通过删除有缺失值的变量并重新训练ML模型能改善预测水平。Hu等[46]开展的一项多中心研究表明ML对MPI后患者早期血管重建的预测优于总灌注缺损方法或核心脏病学专家。Cantoni等[47]通过ML方法证明传统SPECT与CZT-SPECT的负荷MPI预后价值相当,但CZT-SPECT仍有较高的准确度和召回率,而且辐射剂量较低、伪影较少、成像时间较短。Singh等[48]采用DL算法基于PET MPI和靶心图数据预测全因死亡率,发现这种方法预测全因死亡率的AUC优于逻辑回归、心肌血流储备量和心肌缺血程度等传统预测指标。Dekker等[49]采用DL对747例行82Rb PET/CT MPI的疑似CAD患者进行自动冠状动脉钙化评分,并分析与MACE的关系,结果显示无论患者是否存在缺血,冠状动脉钙化评分均与可疑CAD患者的MACE相关,该方法可以可靠地获取非心电门控的MPI冠状动脉钙化评分。Morf等[50]采用基于DL的评分工具能全自动、轻松地提供不同采集方式中的冠状动脉钙化评分,但通常低估了非门控采集的钙化评分。Miller等[51]采用的DL方法可以从用于衰减校正的CT图像中自动检测和量化冠状动脉钙化,该模型展现出良好的专家一致性(线性加权κ值为0.80),并且可以在数秒内自动完成量化,而专家量化需要至少2.5 min。该方向的研究均显示DL算法可以改善疑似CAD患者的心血管风险分层,在风险预测方面具有极大潜力。
AI技术的快速发展使其能应用于核心脏病学的多个方面,尤其在MPI方面的研究与应用较为广泛,涉及成像到诊断过程的各个关键环节。成像过程中使用AI能够减少采集时间,同时能够维持或提高图像质量、不依赖CT图像进行衰减校正,在图像后处理环节对靶心图量化分析和进行左心室自动分割,最终提高左心室分割和报告的自动化诊断及准确度,还能更准确地评估CAD及预测MACE。基于AI的DL和ML可以充分提取整合图像或临床特征,对在患者中实现个体化应用做出较大贡献。尽管基于这些算法的训练需要强大的硬件和较长的计算时间,但最终的模型可以很容易地应用于标准的成像工作站,并且在数秒内完成。因此,随着核心脏病学的不断发展,AI的加入将不断提高以MPI为代表的核心脏病学从采集、成像、后处理、诊断和预后评估各个环节的智能化水平。