欧静 陈天武* 唐隼 唐孟婕
食管癌是全球常见的恶性肿瘤之一,其发病率占全球恶性肿瘤第8位[1]。临床上早期食管癌可采用根治性手术切除,但由于不完善的筛查机制以及缺乏早期诊断的敏感指标,大多数食管癌病人就诊时已处于中晚期,错过了手术治疗最佳时期,对于这类病人,多采用根治性手术辅以放化疗的综合治疗方案[2-3]。因此,在病人治疗前进行准确分期、治疗后及时进行疗效评估,对于调整和制定个体化治疗方案非常重要。但由于病人个体的基因、细胞、生理微环境、生活习惯和生存大环境等诸多因素的影响,使得肿瘤存在异质性[4-6]。传统的成像方法如胃肠道钡餐造影、CT、MRI和正电子发射体层成像(PET)/CT已被应用于诊断和评估食管癌的分期和放化疗反应等,但这些成像方法主要描述食管癌的形态变化和肿瘤大小等,而对于寻找肿瘤的内涵特征,还需医学影像特征量化分析。基于这一理论,影像组学应运而生,它从CT、PET、MRI等医学影像中高通量地提取并分析大量高级定量的影像特征来量化肿瘤等重大疾病[7-8]。本文主要就影像组学在食管癌方面的研究进展予以综述。
荷兰研究者Lambin等[9]首次假设性提出肿瘤内微环境的改变可能会在宏观影像上得到体现,首次提出了影像组学的概念。Kumar等[7]将影像组学的概念进一步扩展,定义为 “高通量地从CT、MRI和PET中提取并分析大量高级的定量影像学特征”。影像组学实际上是一种多种影像互相结合、多种学科交叉的技术,主要包括影像的获取及重建、影像分割及兴趣区(ROI)勾画、特征的提取和量化、特征的选择、分析建模等5个步骤。第1步,获得高质量、标准化的影像(MRI、CT和PET等),用于疾病的诊断和评估。采集影像时应尽量选用同一台或同种扫描设备以及选择合理的层厚、像素大小和管电压等参数[10]。第2步,手动或自动分割与重建图像,目前常用的分割方法有图形切割法、活动轮廓法、区域生长法和水平集法等,通过以上方法勾画出肿瘤实质区域[11]。第3步,特征提取和量化,是从ROI中提取高维特征数据,包括形态特征、语义特征、纹理特征(一阶、二阶、高阶特征和基于模型和基于变换的纹理)[12]。第4步,特征的选择,根据特征的可重复性、与其他特征的相关性,以及与分期、预后、基因表达的关系等对其进行筛选。最后,将筛选出的影像组学特征纳入合适的预测模型中。
提取高维特征数据用于定量分析ROI的过程是影像组学的核心步骤。其中,形态特征包括肿瘤的三维大小及形状,同时也包括硬度和偏心率[13]。语义特征常用于描述ROI,主要包括位置、尺寸、血管分布、毛刺及坏死等,但上述2种特征并不涉及肿瘤的异质性。纹理特征则是指从图像中导出,用各种数学方法提供图像的不同灰度的相对位置信息,从而量化肿瘤的异质性[14]。其中基于统计方法的纹理分析已应用于食管癌:一阶特征,如灰度直方图,它与ROI中的灰度级频率分布有关,依赖于单个体素值,包括能量、平均绝对偏差、熵、偏度、锐利度、均值、最大值、中值、最小值、一致性、标准差、范围、均方根方差等。二阶特征,如灰度共生矩阵(greylevel co-occurren cematrices,GLCM)、灰度游程步长矩阵(grey-level run length matrices,GLRLM)。GLCM描述的是体素间的两两排列,包括熵、同质性、能源/角二阶矩、相关度和不同度。GLRLM描述的是具有相同强度的体素排列,包括长游程强调、短游程强调、游程长度非均匀性、灰度非均匀性[15]。高阶特征,如灰度区域大小矩阵 (gray-level size zone matix,GLSZM)、邻域灰度差值矩阵 (neighborhood graytone difference matrix,NGTDM)。GLSZM 描述同质性区域的特征。NGTDM描述单个体素与相邻体素之间的差异性。
3.1 临床分期 食管癌根治术主要适用于早期病人,而中晚期病人多采用根治性手术辅以放化疗为主要的治疗方案[16]。因此,治疗前准确分期对于选择合适的治疗方案至关重要,近年一些研究表明,影像组学有助于提高食管癌分期的准确性。Wu等[17]从154例病人的CT影像中提取了10个特征进行分析,结果显示,GLCM、GLRLM、GLSZM、NGTDM 等特征可以区分早期(Ⅰ~Ⅱ)和进展期(Ⅲ~Ⅳ)食管癌,其训练组受试者操作特征(ROC)曲线下面积(AUC)分别为0.795和0.694,验证组为0.762和0.624。Ganeshan等[18]对CT的影像组学特征进行研究,发现CT均匀性参数和熵值在Ⅰ~Ⅱ期和Ⅲ~Ⅳ期食管肿瘤中有显著差异。Dong等[19]提取40例食管鳞癌的18F-FDG PET影像组学特征进行研究,发现能量、熵、标准摄取值(standard uptake value,SUV)与肿瘤分期(T、N分期)有显著相关性,即与熵呈正相关,与能量呈负相关,与SUVmax呈正相关。Liu等[20]从73例食管癌病人提取出CT影像组学特征,结果显示,峰态在T分期T1-2与T3-4间差异有统计学意义;偏态和峰态可作为N分期的预测因子;熵有助于预测T、N分期,其AUC分别为0.37和0.851。Qu等[21]从MR影像T2快速自旋回波(TSE)刀锋(BLADE)序列和对比增强Star容积内插屏气检查 (volumetric interpolated body examination,VIBE)序列中共提取9个影像特征,并运用logistic回归模型进行分析,结果显示,T2-TSE BLADE序列中的长度、球状性、GLCM、灰度游程步长(grey-level run length,GLRL),Star VIBE序列中的GLRL等特征在有无淋巴结转移之间有显著性差异,其ROC的AUC分别为0.821(95%CI:0.704 2~0.937 6)和 0.762(95%CI:0.712 7~0.812),该模型可以很好地区分肿瘤有无淋巴结转移。Shen等[22]提取197例食管癌的CT影像特征,其研究结果与Qu等[21]结果类似,GLCM、GLRL等特征可以预测食管癌淋巴结转移情况。Ma等[23]纳入36例同时接受18F-FDG和18F-FLT PET治疗的食管癌病人,比较2种分期方式的2种强度、2种几何形态和5种纹理特征的表现,结果发现18F-FDG PET特征与病理分期的相关性较18F-FLT PET特征更为密切,并且SUVmax、肿瘤长度和偏心相比研究的纹理特征(如熵、相关性、对比度)对分期更重要。
3.2 放化疗疗效评估 经过有效的放化疗等综合治疗手段,肿瘤细胞可发生凋亡、破裂、溶解,细胞外间隙增宽,从而使肿瘤细胞的内部特征发生改变,肿瘤内部纹理特征对疗效评估及预后判断具有重要临床意义。Tixier等[24]将纹理分析应用于食管癌的疗效评估研究,从41例食管癌病人的PET影像中提取出GLCM、GLSZM、熵、长游程矩阵等特征进行分析,结果显示,这些特征能够预测食管癌的放化疗效果(无反应型、部分反应型、完全反应型),其敏感度为76%~92%,高于SUV的预测效果。Beukinga等[25]从97例食管癌病人的18F-FDG PET/CT影像中提取出GLRL等特征进行分析,其结果与Tixier等[24]的研究结果相似,均证明纹理分析有助于对放化疗疗效的评估。Paul等[26]从65例食管癌病人的肿瘤实质提取特征,结果发现所选取的特征可以区分食管癌放化疗的疗效,其AUC为0.823。随着影像组学的发展,越来越多的研究者发现不仅PET/CT影像纹理特征有助于食管癌放化疗疗效的评估,MR影像的纹理分析结果对其也有价值。Hou等[27]从68例食管鳞癌病人中的MR T2WI序列中提取了138个影像组学特征,在完全缓解与病变稳定之间、部分缓解与病变稳定之间、有反应病变与无反应病变之间,可分别通过26、17和33个特征进行区分。利用基于神经网络和支持向量机预测模型,通过精准频率反转恢复T2WI序列提取的特征,对食管癌前述治疗反应的预测具有较高的准确性,并且优于T2WI序列提取的特征(支持向量机AUC:0.929和 0.893;神经网络 AUC:0.883和 0.861)。 基于治疗后18F-FDG PET扫描,有研究者在3项不同的研究[28-30]中预测20例相同的食管癌病人对放化疗(chemoradiation therapy,CRT)的病理反应,通过提取CRT前3~5周及CRT后4~6周这两个时间点肿瘤的强度特征、纹理特征和几何特性,研究发现在治疗中出现特征的变化比预处理或后处理等单独评估更有预测能力;基线偏态、ΔSUVmean后处理惯性(对比)、相关性等重要预测因子在预测病理反应的单因素分析中AUC为0.76~0.85[28]。在第2项研究中,Tan等[29]研究了cross-bin直方图距离特征(同时捕获18F-FDG摄取分布和纵向信息),结果预测精度略高于纹理特征。这一发现需要验证,因为到目前为止尚无其他研究报道食管癌成像中的cross-bin直方图距离特征。第3项研究[30]构建了多变量支持向量机和logistic回归模型,包括33个18F-FDG PET图像特征和16个临床参数。支持向量机模型实现精度高于logistic回归模型,特别是在模型结合很多变量(最大AUC 1.00和0.90)时更加明显,但重要的是要承认模型过度拟合可能已经发生在小样本和大量的预测因子建模中,导致过于乐观的结果。随着影像组学的不断发展和数据分析模式的不断完善,影像组学作为当前医学影像特征量化分析的主流工具之一,在食管癌放化疗疗效评估方面的应用前景将更加广阔。
3.3 预后分析 Ganeshan等[18]纳入了21例食管癌病人,并使用6个平滑量表对肿瘤熵和均匀性进行了研究。分析表明,基于CT的粗均匀性特征对总体生存率具有较好的预测能力。Larue等[31]通过对239例食管癌病人治疗前的CT影像进行分析,最终提取了40个组学特征和6个临床特征,运用随机森林模型对放化疗后的食管癌病人进行3年总体生存率预测,结果显示,其训练组的AUC为0.69(95%CI:0.61~0.77),验证组的 AUC 为 0.61(95%CI:0.47~0.75)。Yip等[32-33]分别分析了36例及31例食管癌病人接受放化疗前后的增强CT影像,研究发现治疗后的 CT影像的纹理特征熵中位数<7.356、熵粗糙度<7.116、均匀性中位数>0.007和偏度特征偏态<0.39提示病人预后较好,生存期延长。Hatt等[34]评估了代谢活性肿瘤体积、熵、差异性、高强度大面积强调和区域百分比对总体生存预测的价值。虽然代谢活性肿瘤体积和异质性(伴随肿瘤分期)是非小细胞肺癌的独立预后因素,这些参数在食管癌中的互补价值较小,但这是由于总体体积较小所致。局部差异性参数对食管癌病人总体生存率的预测作用更大。
4.1 影像的获取及影像的标准化 影像组学是高通量地提取影像中的信息,不仅需要庞大的数据量,而且影像质量也需要有非常严格的要求。CT、MRI以及PET/CT是目前肿瘤常规诊断及复查手段,数据量庞大,但由于不同的扫描设备和/或不同医疗机构中使用具体成像技术的不同,并且即使在同一机构的同一台设备中,对比剂剂量、扫描层厚、脉冲序列、成像深度和增益等成像参数不同,影像质量也会有很大差别,缺乏统一的标准。并且由于CT影像采集的金属伪影、影像重建算法[35]及MR影像采集的算法、参数的鲁棒性等[36]以及PET图像的SUV的离散程序、光滑与量化[37]等均对影像质量有影响,因此获取相同的大影像数据库非常困难。
4.2 特征的分割及稳定性问题 由于肿瘤的ROI被用于影像组学特征的计算,因此肿瘤分割是首先要解决的问题。目前的分割方法有手动分割、计算机半自动分割和计算机全自动分割。由于食管壁在CT影像中对比度很低,这3种方法所勾画出的ROI差别较大,从而降低了特征的稳定性。同时,近年也有文献[38]报道,运用完全自动化食管分割与层次深入学习的方法,利用全卷积网络,可有效地结合本地和全局信息来提高定位精度。有望在食管癌图像分割问题上提出较好的解决方案。
影像组学的核心是提取辨识度高、独立性强、可重复的特征来建立诊断模型,常用特征包括大小、形态、边界、直方图、纹理、小波变换、分形维数等。由于医学影像设备缺乏统一的影像获取标准,影像质量参差不齐,则基于影像提取的特征稳定性也较差,因此如何寻找辨识度高、独立性强、可重复的特征则具有很大的困难。
4.3 特征选择与建立模型 为提高特征的预测能力,关键是选择合适的特征和建模方法。影像组学的预测准确率主要受特征个数、特征选择方法以及模型的影响[39-40]。影像组学根据不同的目标问题可以采用不同的模型,在食管癌影像组学研究中,人工神经网络、支持向量机[27-30]以及logistic回归模型[21]均显示出较高的预测性能和稳定性。但研究者根据不同的目标问题选择合适的模型仍然具有一定的难度。
影像组学在食管癌中的应用包括分期、治疗反应和预后分析,与传统影像形态学的改变相比,应用影像组学特征不仅能提高诊断准确率,还能提供传统影像特征无法提供的信息,因此影像组学的发展对食管癌的评估具有广阔的应用前景。近年有文献[41]报道了深度学习技术在多种癌症等领域的最新研究进展,体现了深度学习的发展。随着影像数据的进一步积累与标准化,以及影像专业、计算机专业以及机器学习方法的联合发展,将会为食管癌的精准分期、治疗反应和预后评估开拓新的研究方向。