沈文茜 杜国庆
(哈尔滨医科大学附属第二医院超声医学科,黑龙江 哈尔滨 150086)
由于超声心动图是唯一允许对心脏实时和动态观察,即刻检测出心脏各种异常的成像方式,所以在心血管疾病的诊断和治疗中起着至关重要的作用[1]。心脏结构和功能的准确定量评估是临床诊断和制定合理治疗方案的基础,但基于主观评价的二维超声心动图的定量和诊断容易出错,主要问题是操作者的手法以及对超声心动图的解读,操作者之间存在相当大的差异,尤其对于质量较差的图像[2]。尽管人工智能20世纪50年代就已出现,但直到最近,人们才对人工智能在医学成像中的应用产生浓厚的兴趣和研究,机器学习(machine learning,ML)是人工智能的一个子领域,ML模型可通过对海量超声心动图图像的回顾来“学习”图像中不同的特征代表什么,然后来识别新的图像,量化感兴趣区域或识别特定疾病模式等[3]。在ML模型的辅助诊断下,可减少操作者之间和操作者内部的差异,从而提高诊断的准确性,并提供额外的人眼无法察觉的信息[4]。因此,ML模型有望成为快速和准确地评估心血管结构和功能的工具。现对ML在超声心动图中的应用进展做一综述。
ML是一门以数学和计算机科学为基础的广泛学科,它可通过复杂的计算和统计算法“教会”计算机快速、准确和高效地分析大量数据,这些算法从现有的数据集中推断关系,并了解其中哪些关系具有最高的预测能力。利用这些知识ML模型就能对新的数据进行预测。ML可分为监督学习、非监督学习、半监督学习、增强学习及深度学习[5]。(1)监督学习:在监督学习中,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,在建立预测模型时,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断地调整预测模型,直到模型的预测结果达到一个预期的准确率。分类和回归是监督学习的两种类型。(2)非监督学习:在非监督学习中,数据并不被特别标识,学习模型试图找出输入数据之间的相似性,并根据这些相似性对数据进行分类,也被称为密度估计。非监督学习包含有聚类。(3)半监督学习:半监督学习介于非监督学习(未标记数据)和监督学习(标记数据)之间。在此学习方式下,输入数据部分被标识,部分未被标识,这种学习模型可用来进行预测,但模型首先需学习数据的内在结构以便合理地组织数据来进行预测。(4)强化学习:在这种学习模式中,当答案错误时,算法会被告知,但不会告知如何纠正它,它必须探索和测试各种可能性,直到找到正确的答案。强化学习不同于监督学习,因为它不提供精确的输入和输出集,也不提供精确的次优操作。(5)深度学习:深度学习是一种人工神经网络,能使用卷积神经网络等技术处理更大和更复杂的数据集。深度学习可以是有监督、无监督或半监督[6]。
虽然ML模型具有快速地分析大量数据的潜力,但它们本身需大量数据来确保它们得到充分的训练。在医疗领域,需付出巨大的努力以确保数据的充足、质量以及准确性,然后才能用来训练模型。此外,更重要的是要确保这些用于模型训练的数据集能代表总体,因为抽样偏差和数据的缺失会对模型的预测能力产生负面影响[7]。目前ML已被应用到医学成像领域的各种技术中,例如CT冠状动脉造影中的钙化评分[8]、辅助放射科医生对乳腺病变的检测[9]以及皮肤病学中的皮肤癌分类[10]。
指南建议超声心动图通过对心脏腔室和瓣膜的定量测量来指导临床决策[11],然而,定量分析操作复杂,有时还需大量的时间来进行手动描记,在繁忙的临床环境中这是不可能实现的[12]。所以视觉定性评估仍在临床实践中占主要地位,这就需操作者具备大量的图像采集和超声心动图解读经验,而低年资超声专业医师往往不具备这样的能力。在急诊科,超声检查变得越来越普遍,而对于未经正式训练的内科医生,操作规范和图像解读都非常难[13]。应用ML来完成对量化的需求,为临床医生提供快速的全自动测量,可提高诊断的准确性[14]。
随着三维超声心动图等多维成像方法的出现,超声心动图中获得的数据量逐渐增加[15],获得的大部分数据未得到充分利用。ML技术就具有同时从超声心动图中提取多个数据集的潜力,通过ML模型这些数据集可以高效和自动化的方式进行解读[6]。此外,ML模型能将现有的电子健康记录中的临床数据与超声心动图数据联系起来,为临床医生提供更多的信息,以便更好地服务于患者[16]。
虽然ML在超声心动图中的应用还处于相对早期的阶段,但已应用在超声心动图的很多方面,包括图像识别、心功能的自动量化、瓣膜疾病的自动评估以及鉴别超声征象相似的疾病。
超声心动图实现全自动心功能评估的最重要步骤之一就是图像识别,标准图像的自动分类是预处理阶段的关键,也为后续全自动分析提供基础。基于时空特征提取的多节段分类算法和监督学习法,实现了自动识别并分类超声心动图中的心尖两腔心、心尖四腔心和胸骨旁长轴切面,正确率分别为97%、91%和97%,平均识别率为95%[17]。研究表明深度卷积神经网络模型对超声心动图心尖四腔心切面进行自动质量评估,通过图像是否清晰显示四个腔室,专家人为地将图像质量定义为0~5分(0分:仅显示明显的主动脉瓣和/或仅显示房间隔或室间隔;1分:显示一个或两个腔室的边界;2分:显示三个腔室的边界;3分:显示三腔或四腔的边界,但不够清晰,无法量化所有腔;4分:清晰地显示三腔或四腔的边界,可用于量化分析;5分:清晰地显示四个腔室的边界,所有心腔均可量化)。最终训练模型与专家评分的平均绝对误差为0.71±0.58,并且可推广到超声心动图其他标准切面[18]。另有研究表明:由卷积神经网络组成的深度学习模型能自动地检测和识别15个标准视图(左室长轴切面、右室流出道切面、大动脉短轴切面、二尖瓣口短轴切面、心尖四腔心切面、心尖五腔心切面、心尖两腔心切面、心尖三腔心切面、剑突下四腔心切面、下腔静脉长轴切面、剑突下腹主动脉切面、胸骨上窝主动脉弓长轴切面、脉冲波多普勒、连续波多普勒和M型超声心动图)的特定特征,而不用考虑图像分辨率,其准确率为97.8%[19]。图1是一个卷积神经网络模型用于超声心动图图像分类的例子。
定量评估左心室的大小和功能是目前超声心动图最主要的目的之一。在传统ML和深度学习之前,形变模型在边缘检测、分割、形状表征和运动跟踪方面显示出巨大潜力[20]。研究证明:ML模型可实现测量自动化,增加测量重复性,在专家和初学者之间搭建桥梁,提高检查效率和简化工作流程。自动测量心功能是最早实现的应用技术之一,可明显减少操作者的主观性,增加测量重复性[21]。随着技术的进步,基于ML图像分析的新型全自动软件实现了快速和可重复地测量左心室容积、射血分数以及双平面纵向应变[22]。在三维超声心动图方面,ML模型可自动测量左心房和左心室体积以及射血分数,自动化测量结果不仅可与人工测量相比拟,还与心脏磁共振具有良好的一致性[15,23-25]。最新研究表明:ML模型可准确地测量三维超声心动图中右心室容积和射血分数,重复性较好,如32%的患者实现准确的全自动化分析仅需(15±1) s,且重复性为100%;而其余68%患者还需在自动分析后手动进行调整,平均时间为(114 ± 71) s[26]。
图1 卷积神经网络模型示意图
超声心动图是评价瓣膜反流的最常用影像方法。最新指南建议使用半定量和定量超声心动图技术来评估瓣膜反流的严重程度[27],后者临床多采用反流紧缩口宽度及近端等速表面积法(proximal isovelocity surface area,PISA)。基于二维超声心动图的PISA和半球对称性几何假设的内在局限性,三维超声心动图的PISA技术已被证明与心脏磁共振有更好的相关性[28]。de Agustín等[29]研究中使用自动化软件对三维超声心动图中二尖瓣PISA进行自动量化。Choi等[30]采用三维全容积彩色多普勒超声心动图对主动脉瓣反流容积进行定量分析,结果与心脏磁共振具有很好的正相关,比二维超声心动图PISA更能准确地反映主动脉瓣反流的严重程度。此外,经食管三维超声心动图二尖瓣自动评估软件实现了比人工判读更可靠和一致的二尖瓣环大小及其形态的定量评估[31]。
不同的病理状态可有相似的超声心动图表现,如果操作者缺乏临床经验将很难进行鉴别诊断。如运动员常出现左心室肥大,但这种超声征象也会在肥厚型心肌病中出现[32]。一项研究开发了一种集成模型,包括支持向量机、随机森林和人工神经网络,可精确地区分这两种情况,该模型可自动地区别运动员生理性左心室肥大和肥厚型心肌病,校正年龄后,灵敏度为96%[33]。此外,缩窄性心包炎(constrictive pericarditis,CP)与限制型心肌病(restrictive cardiomyopathy,RCM)患者的血流动力学特征相似,使得区分这两种疾病比较困难。由于CP和RCM的治疗方案和临床结果存在显著差异,区别二者就具有至关重要的意义。超声心动图是诊断CP和RCM的首选影像学方法,一项研究证明ML模型具有准确地区分CP和RCM的患者群体中相似征象的能力,利用多种超声心动图特征,ML分类算法能准确地区分二者,准确率为90%[34]。
虽然超声心动图是诊断心血管疾病常用且较易操作的成像方式,但在很大程度上依赖于操作者的经验。ML已被证明可提高超声心动图的优势:不仅使解读过程重复性更好,准确性更高,并且可大大缩短分析时间。尽管有人担心,将ML模型整合到医疗环境中可能会取代临床医生,但它更有可能成为临床医生(尤其是经验较少的医生)的辅助工具,使他们能更准确和更快速地进行分析和诊断。虽然ML的使用近几年来有了很大的进步,但仍处于起步阶段,还需进一步的研究来完善。