王丽珊,张瑞明
潍坊医学院附属益都中心医院放射科,山东 潍坊 262500
影像组学通过提取定量特征,将图像转换为可开采数据,然后对这些数据进行分析,以支持临床决策[1],自2012年兴起以来[2-4],它在临床肿瘤诊断及预后方面显现出了巨大优势[2,4-8]。影像组学在非肿瘤学方面也有研究进展,在神经系统方面,主要有影像组学自动化工具箱脑体积精确测量,注意缺陷多动障碍儿童的MR影像组学图像特点及精神分裂症患者影像组学方法诊断的准确性。在心血管系统方面,有影像组学鉴别肥厚性心肌病和高血压性心脏病,急性冠脉综合征和粥样斑块影像组学特点。在消化系统,基于超声和磁共振的肝硬化影像组学精确诊断研究也是热点。如同在肿瘤系统精确诊疗和临床决策上取得了显著成果一样,在非肿瘤及功能性疾病的精确诊断方面崭露头角并提出相关进一步研究方向。本文通过文献复习,根据所研究病变所属系统分类综述如下。
有研究使用3个广泛使用的自动化工具箱[9]:SPM(www.fil.ion.ucl.ac.uk/spm/),FreeSurfer(surfer.nmr.mgh.harvard.edu)和 FSL(https://fsl.fmrib.ox.ac.uk/fsl)对38例患者研究质量的薄层脑MR图像和常规的临床MR图像进行脑容量估计。分别对脑总体积(TBV)、灰质体积(GMV)和白质体积(WMV)进行了估计。利用类内相关系数(ICCs)对每种方法的薄截面和厚截面体积进行了比较。SPM表现出良好的ICCs(TBV、GMV、WMV的ICCs分别为0.97、0.85、0.83)。在TBV、GMV和WMV中,FSL的ICCs分别为0.69、0.51和0.60,但低于SPM。Free Surfer仅对TBV表现出良好的ICC(0.63)。在此之前,有研究对来自相同患者的不同切片厚度(1~6 mm)的MR图像使用FSL,发现TBV的FSL估计值不随切片厚度的变化而变化[10-11]。有学者研究了图像切片稀疏采样的效果[12],结果表明,在25个切片中采样密度为1的情况下,可以可靠地估算出颅内总容量。有研究利用薄片图像比较了SPM version 5、FSL和FreeSurfer在计算GMV、WMV和TBV方面的性能,发现SPM version 5和FSL的体积精度优于FreeSurfer[13]。Malone等[14]研究表明,SPM version 12在计算颅内总容量方面优于FreeSurfer。
一项前瞻性研究分析了患有注意缺陷多动障碍(ADHD)儿童的MR图像[15]。研究对83名ADHD儿童和87名健康对照儿童的T1加权容积和扩散张量图像进行了影像组学分析。表明大脑形态的改变可以区ADHD患者和对照组,以及最常见的ADHD亚型。ADHD患儿与对照组在脑总容量及灰白质体积上无明显差异。用分类器对ADHD患者与对照组患者进行分类的平均准确率为73.7%。左颞叶、双侧楔叶及左侧中央沟周围皮质形态的改变,对群体辨别有重要作用。使用分类器区分ADHD-I和ADHD-C的平均分类准确率为80.1%,在模型构建过程中,所有相关特征的选择过程识别出左颞叶皮质形状的改变,双侧楔叶及左侧中央沟周围区域对ADHD患者与对照组的区分有显著贡献,而涉及默认模式网络和岛叶皮质的特征对ADHD亚型的区分有显著贡献。有研究认为随着年龄的增长,儿童的大脑会沿着既定的发展轨迹发生显著变化[16]。有文献研究的儿童年龄为7~14岁,检测到大脑特征的改变是由于正常发育而不是ADHD,并认为将上述研究的方法论框架应用于年龄范围较窄的多动症参与者,将发育轨迹效应与疾病效应分离开来,将是有趣而重要的[15]。
有研究应用功能连接特征进行数据集内训练诊断精神分裂症患者的准确性为87.09%,在独立的重复数据集中进行验证(准确性82.61%)[17]。数据间集验证通过功能连接特征进一步确认了疾病定义(训练集准确性83.15%,验证集准确性80.07%),展示了精神分裂症患者皮层和边缘系统区域之间的连接以及皮层和皮层下区域之间的连接。边缘系统检测到额下回三角部分、杏仁核和补充运动区、海马和颞上回的异常连接。除此之外,包括丘脑、尾状核、壳核、苍白球和伏隔核在内的所有皮质下区域都显示出异常的连接模式。
肥厚性心肌病和高血压性心脏病的鉴别是一个挑战,因为对这两种心肌病患者的处理及其结果是不同的。有研究对232名(高血压性心脏病53例,肥厚性心肌病108例)受试者进行了多切片T1 mapping的影像组学纹理分析[18-19],应用4组纹理描述符捕获空间相关和独立的像素统计信息,依次选择6个具有高血压性心脏病和肥厚性心肌病最佳区分能力的纹理特征,并使用支持向量机分类器对其进行测试。每个疾病组均按4:1随机分组,在验证数据集中分析了模式的可重复性。6个纹理特征在高血压性心脏病和肥厚性心肌病之间具有最佳的鉴别能力。与T1区分这两种病理实体的准确率为64%相比,T1 mapping影像组学纹理分析的总体准确率为86.2%,内部验证准确性为80.0%。
易引起急性冠状动脉综合征的进展性动脉粥样硬化斑块的特征是大量富含脂质的坏死核、炎症细胞数量增加和纤维帽薄[20]。这些动脉粥样硬化病变被认为是易损斑块,有很高的破裂和动脉粥样硬化血栓驱动急性冠状动脉综合征的可能性。目前临床应用最广泛的评估冠状动脉斑块的非侵入性成像方式是冠状动脉计算机断层血管成像(CCTA)。冠状动脉计算机断层血管摄影可以检测到正性重构、低衰减斑块和斑点状钙化,这些是已知的急性冠状动脉综合征的前兆。这些动脉粥样硬化斑块特征也与心肌缺血有关,预示着更恶性、快速进展的冠状动脉疾病。目前还没有单一的检测方法能够以一种经济有效且对患者友好的方式捕捉所有已知的易损性先兆。
有研究使用影像组学技术对具有napkin-ring征的冠状动脉斑块进行了识别[21],该研究比较了30例有napkin-ring征斑块的患者与30例没有napkin-ring征斑块的患者,这些斑块具有相似程度的钙化、腔阻塞、定位和获取参数。所有斑块均采用商用软件(QAngio CT)手工分割,计算8种常规斑块定量指标(病变长度、面积狭窄、平均斑块负荷、病变体积、重塑指数、平均斑块衰减、最小和最大斑块衰减)。使用作者开发的影像组学图像分析软件包对分割斑块进行分析,以量化4440个影像组学参数。采用接收机曲线分析和5次交叉验证比较了影像组学参数与常规参数对具有餐巾环征斑块的识别性能。结果发现,一些影像组学特征对(包括3个参数-短期和长期的低灰度强调和高衰减体素与总表面的表面比值-突出了napkin-ring信号斑块的低衰减和异质形态)高危斑块的鉴别能力明显高于病变体积和其他常规定量参数。
另一项前瞻性研究对25例疑似冠心病患者的44个冠状动脉斑块进行了分析[22]。所有患者均在90 d内接受CCTA、18F-NaF PET、IVUS和OCT检查。在所有试验中,均建立了斑块易损性的常规标记物的存在和程度,并与CCTA中至少存在两种斑块易损性的常规特征相关联。随后,研究人员评估了影像组学特征与斑块易损性标志物之间的相关性。总共计算了935个影像组学特征,并研究了这些特征相对于传统特征的增量值。本研究的主要发现是影像组学标记显著提高了CCTA对易损斑块特征的诊断准确性。影像组学参数“高衰减体素表面”的准确性获得了最高的增益,该参数在接收算子曲线下的面积为0.87,用于识别18F-NaF PET阳性病灶,而传统高风险斑块特征的识别面积为0.65。其他学者认为该研究在处理少量的患者时,一个挑战是避免大量的影像组学参数与少量传统的易损斑块参数之间的虚假关联。为了解决这个问题,使用大量重复的分层交叉验证来获得诊断性能的可靠估计是一种公认的方法,可以在真实世界中获得诊断准确性的普遍性;研究的另一个限制是需要在影像组学分析之前手工分割斑块,这可以通过应用深度学习技术来克服[20];另外,作者只考虑了有餐巾环征的斑块,而没有考虑其他不利斑块特征(低衰减、正重构)[23]。
乙型肝炎病毒(HBV)感染在中国是一个严重的问题,据报道世界上超过1/3的HBV感染者(约9300万)居住在中国[24]。肝纤维化是慢性乙型肝炎的一种进行性疾病,准确评估肝纤维化对慢性乙型肝炎患者的预后、监测和管理至关重要。肝活检被认为是肝纤维化分期的参考标准。然而,它是侵入性的,受样本误差、观察者之间的变异性和各种潜在并发症的限制。生物标志物如APRI和FIB-4也被用来评估肝纤维化,但它们的诊断性能在HBV感染患者中仍然存在争议。近年来,基于无创超声成像技术的肝脏硬度测量因其在肝纤维化评估中的有效性和可行性而受到许多指南的大力推荐。几项研究表明,二维实时剪切波弹性成像(2DSWE)在评估肝纤维化方面的诊断性能可与瞬时弹性成像或剪切波弹性成像测量值相比,甚至更好。尽管有这些优点,2D-SWE的肝脏硬度测量仍然受到很多因素的影响。定义肝脏硬度测量的最佳感兴趣区域、区分可靠和不可靠的测量以及控制整体图像质量的重要标准在指导方针中仍然是模糊的。相比之下,一种名为影像组学的新兴技术可以从医学图像中自动量化大量图像特征(称为影像组学表型),这有可能揭示肉眼无法识别的疾病特征。
一项前瞻多中心研究假设发现,一种独特的影像组学技术可能能够使用更多来自2D-SWE图像的有价值的信息,而不是仅仅依赖2D-SWE值,从而可能提供更好的肝纤维化分期准确性[24]。该研究从中国12家医院招募了398名患者,最终选取1990幅2D-SWE图像,试图探讨一种名为卷积神经网络的深度学习方法在HBV感染多中心患者的2D-SWE图像中对纤维化分期的诊断性能。本研究以肝脏活检获得的组织学为参考,并使用2D-SWE和生物标志物与这种新的定量诊断策略,即弹性成像的深度学习影像组学(DLRE)进行比较。采用ROC曲线下面积(AUC)估计正确预测肝纤维化分期的概率。在评估肝硬化(F4)和晚期纤维化(F3)方面,DLRE与2D-SWE和生物标志物相比有显著改善。在训练队列中,DLRE的AUC分别为1.00和0.99;在验证队列中,DLRE的AUC分别为0.97和0.98,说明DLRE与参考标准肝活检具有相似的诊断效果。2D-SWE的诊断准确率第2,训练队列的AUCs分别为0.87和0.81,验证队列的AUC分别为0.86和0.85;生物标志物的AUC在分层和队列中均≤0.75。为了研究不同ALT、BMI和炎症水平是否影响2D-SWE和DLRE的表现,对亚组进行分层分析。结果表明,肝硬化(F4)炎症等级对2D-SWE的性能影响显著,而对DLRE的影响不显著。另外,研究发现DLRE高度依赖于数据量。如果每个患者获得更多的2D-SWE图像来训练DLRE模型,那么无论是在训练还是验证队列中,它都显示出在评估所有纤维化阶段时诊断准确性的系统性提高;与DLRE不同的是,2D-SWE并没有随着数据量的增加而表现出显著的差异。最后,DLRE在多中心研究中表现出了显著的鲁棒性。采用随机选择的3家医院组合建立训练队列,使用DLRE对训练和验证队列进行肝纤维化分级,未发现有显著差异,诊断准确率与DLRE的总体诊断准确率相符。
有研究选取接受过钆酸增强MRI检查的436例肝纤维化患者,按照3:1的比例随机分为训练队列(n=329)和测试队列(n=107)[25],在训练队列中,建立了一个模型来计算影像组学组学纤维化指数(RFI),采用logistic回归和弹性网络正则化来区分F3-F4期和F0-F2期。通过ROC分析,确定诊断临床显著纤维化(F2-F4期)、晚期纤维化(F3-F4期)和肝硬化(F4期)的最佳RFI截止时间。在测试队列中,应用Obuchowski指数与归一化肝增强、APRI、FIB-4指数进行比较。研究表明,MRI增强肝胆期图像的影像组学分析可以准确地分期肝纤维化。使用训练队列数据创建的RFI模型使验证队列中的肝纤维化分期成为可能,曲线下面积为0.89~0.91,准确率为80%~81%。与假设一致,RFI结合了来自多个图像特征的信息,使得肝纤维化的分期(Obuchowski index,0.86)比归一化肝增强(Obuchowski index,0.77)更准确,且优于血清学指标(Obuchowski index,0.60~0.62)。
在过去的10年里,计算能力的进步为医学成像提供了一种新的视角。高功率计算的可用性使得自动分析更详细的层析图像和快速提取可转换为数字的量化亚视觉特征成为可能。对这些图像进行分割后,测量其选择性特征。对于每张图像,通常会测量和评估数百种不同的特征。根据所捕获的图像属性类型,定量特征大致可分为4类:强度、结构、纹理/梯度和小波,这个过程通常被称为影像组学[19]。多中心前瞻性研究及深度学习方法是研究的亮点及优势所在[24]。研究的主要局限性是受限于人群规模[9,20,24];患者人群分布不平衡;图像是从不同的成像仪上获取的,具有不同的采集平面和采集序列[9];单一制造商成像仪上进行的,这可能限制了推广研究结果的能力[25];回顾性研究可能引入了选择偏差。深度学习方法尚处于发展阶段[24],未来的研究需要让更多的、更大范围的患者参与进来,从而更好地训练深度学习模型;而更大的多中心、多供应商、多领域研究可能提供更好的结果概括性,包括外部验证背景下的整体稳定性验证[18]。