韩文静 胡贵祥 胡玲静
影像组学这一概念由荷兰研究者Lambin 等[1]在2012 年首次提出,是通过提取医学影像特征和分析量化肿瘤的异质性来辅助临床决策, 不仅可提高肿瘤诊断准确性还可预测肿瘤治疗反应, 已广泛应用于脑胶质瘤以及肺部、 乳腺和肾脏等多种肿瘤的研究[2-3]。 脑胶质瘤是一种常见的原发性颅内肿瘤,起源于神经胶质细胞, 占中枢神经系统肿瘤的40%~50%[4]。 目 前 常 应 用MRI、 正 电 子 发 射 体 层 成 像(PET) 和CT 等影像方法区别脑胶质瘤与正常脑组织, 但基于人类视觉的医学影像分析仅能分辨肿瘤的形态和灰度信息。 近年来发展的基于不同成像的影像组学可以描述生理学、 病理学及基因变化等与脑胶质瘤影像异质性相关的深层信息, 对胶质瘤的诊断和预测有很好的辅助作用。 本文就影像组学的流程、 基于不同成像的影像组学处理方法及在脑胶质瘤中的应用予以综述。
对于MRI、PET 和CT 等不同的成像方法,影像组学的分析流程相同,一般包括以下5 个部分[5-6]:①图像获取,由于影像数据的获取与设备厂商、设备参数和病人体位等相关,这些会直接影响研究结果,因此需要对获得的原始图像进行预处理,实施配准、归一化等操作。 ②图像兴趣区(region of image,ROI)分割,可以将肿瘤区域从正常组织中精确分割出来。在影像组学研究中,ROI 多数由有经验的放射肿瘤学家手动勾画, 也可以采用自动或半自动的分割算法来分割肿瘤,如区域生长法、蛇形算法、基于深度学习的分割算法等。 ③特征提取, 是影像组学流程中的核心步骤。 影像组学特征一般包括一阶特征、形态特征、 纹理特征和小波特征等。 一阶特征也称为直方图特征,从图像的灰度直方图中提取,可以获得如偏度、峰度、熵、能量、均值和方差等一些常见的统计量。 一阶特征只能用来描述ROI 的灰度值分布,不能显示相邻体素之间的空间关系、交互性和相关性。 形态特征可以用来定量描述ROI 的几何特性,如肿瘤的表面积、体积、表面积和体积比、球形度、紧凑性和三维直径等,这些特征可以描述肿瘤三维的大小和形态信息。 纹理特征反映图像体素灰度之间的空间排列关系,可以从MRI、PET 和CT 等的原始图像或变换后的图像 (如进行拉普拉斯、小波、Gabor 变换等)上获得。 常用的纹理特征提取方法包括:灰度共生矩阵(gray level co-occurrence matrix,GLCM), 反映在给定的方向和距离上体素值出现的概率;灰度游程矩阵(gray level run length matrix,GLRLM), 描述相同灰度级的体素在指定方向上连续出现的长度; 灰度区域大小矩阵 (gray level size zone matrix,GLSZM),量化图像中连续体素值的区域;灰度相关矩阵(gray level dependence matrix,GLDM), 基于体素值测量相邻体素之间的差异;相邻灰度差分矩阵 (neighbouring gray tone difference matrix,NGTDM), 量化体素灰度值与特定距离内邻域的平均灰度值之间的差异。 ④特征选择, 即选择与任务相关的特征子集以简化模型、缩短训练时间,并通过减少过度拟合来增强模型的泛化性, 常用的特征选择方法有最小绝对收敛和选择算子(least absolute shrinkage and selection operator,LASSO)、最小冗余最大相关、Fisher 分数和Relief-F 算法等。⑤模型建立和分析, 用于分类任务常用的机器学习算法包括神经网络、支持向量机(support vector machine,SVM)、随机森林和广义线性模型等,Cox 比例风险回归模型可用于肿瘤的预后分析。 建立模型时应将临床记录数据、 治疗期间获得的数据或遗传学数据等作为特征纳入模型。影像组学分析流程如图1 所示。
影像组学的特征提取基于原始图像的灰度值计算各种特征, 通常需要假设多个图像中的灰度值具有相同的意义, 不同病人的图像灰度值意义相同。不同成像方法的原理不同, 为了保证影像组学特征的稳定性和可比性, 各类型的图像在预处理时稍有不同。CT 影像中体素的强度即灰度值代表相应组织的密度,不同影像中的灰度值具有可比性。PET 影像中的灰度值对应组织对示踪剂的摄取情况, 标准摄取值(standardized uptake value,SUV)是PET 常用的半定量指标,为病灶的放射性浓度(kBq/mL)与注射剂量(MBq)/体质量(kg)的比值,相同示踪剂的SUV值一般可以不再进行归一化, 不同影像间一般也具有可比性。因此,用影像组学方法分析CT 和PET 影像时不用对数据进行预处理。 MRI 影像中的灰度值对应人体组织的弛豫时间(T1、T2)或质子密度弛豫时间的长短,是多种组织特征参数的可变函数,如果直接提取特征,不能保证特征的稳定性和可比性,因而处理MRI 影像时需要对其灰度值进行归一化,将其取值映射至指定的范围, 然后再计算特征。 但也有例外,如表观扩散系数(ADC)图是扩散加权成像(DWI)的定量参数图,单独对这些图像进行分析时也可不进行归一化操作。 另外,基于PET 影像的影像组学分析除了提取常用的4 类影像组学特征外,一些研究者[7-8]将异质性参数也纳入研究,包括最大标准摄取值(SUVmax)、平均标准摄取值(SUVmean)、标准摄取值峰值 (SUVpeak)、 肿瘤/背景比 (tumor-tobackground ratio,TBR)、代谢肿瘤体积(metabolic tumor volume,MTV) 和病变总糖酵解量 (total lesion glycolysis,TLG)等。
图1 影像组学分析流程图
通过影像组学方法从医学影像中提取特征并进行建模分析后,可以对脑胶质瘤进行分级和鉴别,并能预测其基因表达及病人生存期和治疗反应等。
3.1 胶质瘤的分级 世界卫生组织按照胶质瘤的恶性程度将其分为Ⅰ~Ⅳ级,级别越高其恶性程度越高,其中Ⅰ、Ⅱ级为低级别胶质瘤(low-grade glioma,LGG),Ⅲ、Ⅳ级为高级别胶质瘤(high-grade glioma,HGG)[9]。 不同级别胶质瘤的治疗方案不同,因此术前分级有重要的临床意义。 通过影像组学特征可以获取医学图像的定量信息来表征肿瘤的异质性,有助于胶质瘤的分级。 Pyka 等[10]研究了PET 纹理特征对Ⅲ级和Ⅳ级胶质瘤分级的效能,从113 例经病理证实的高级别胶质瘤病人的PET 影像中提取异质性特征(TBR、MTV 等)和基于NGTDM 的纹理特征,结果显示纹理特征结合MTV 能够对85%的肿瘤准确分级,受试者操作特征曲线下面积(AUC)为0.83。胶质母细胞瘤(glioblastoma,GBM)是恶性程度最高的Ⅳ级胶质瘤,Hsieh 等[11]将34 例GBM 和73 例LGG 病人的MRI 局部纹理特征转换为局部二值模式特征, 建立logistic 回归分类器对肿瘤进行分级,结果显示模型的准确度高达93%,高于基于传统纹理特征预测模型的准确度(84%)。 DWI 能够有效反映水分子扩散受限的特征, 可以表征胶质瘤生理和分子特性。梅等[12]从66 例胶质瘤病人的全肿瘤ADC图中各提取107 个纹理特征, 特征降维后使用logistic 回归分析模型预测HGG 的独立危险因素,结果显示与胶质瘤分级最相关的特征是区域熵(区域熵基于GLSZM 得到, 度量肿瘤的大小和灰度级分布的不确定性,值越高表示肿瘤的纹理差异越大,即异质性越高), 结合年龄和区域熵诊断HGG 的AUC 为0.844,敏感度为75.6%,特异度为88.0%。
3.2 胶质瘤的鉴别 HGG、原发性淋巴瘤及转移瘤是颅内较常见的恶性肿瘤,其发病机制、恶性程度和治疗方案不尽相同, 影像组学特征可以区分不同类型的脑部肿瘤[13]。 Qian 等[14]基于影像组学使用12 种特征选择、7 种机器学习方法鉴别GBM 和单发脑转移瘤,每例样本各提取了1 303 个影像组学特征,结果显示LASSO 结合SVM 分类器的AUC(0.9)最高,优于具有5 年和10 年工作经验的神经放射学专业医生的诊断结果。 尹等[15]探讨了采用影像组学方法鉴别HGG 和单发脑转移瘤的可行性,从43 例单发脑转移瘤和43 例HGG 病人的236 幅MRI 影像中各提取629 个影像组学特征, 使用Relief-F 算法筛选41 个特征构建高斯核SVM 诊断模型, 结果发现训练集中诊断模型的准确度、 敏感度和特异度分别为84.5%、84.9%和84.0%。 不同于常规影像组学研究方法,Chen 等[16]在区分原发性中枢神经系统淋巴瘤和GBM 的研究中采取一种尺度不变特征转换的方法提取影像组学特征,模型在训练集(验证集)上得到的分类结果分别为AUC 0.991(0.982)、准确度95.3%(90.6%)、 敏 感 度85.0%(80.0%)、 特 异 度100%(95.5%)。
3.3 预测基因表达 影像组学假设微观基因、蛋白质和分子的改变可以在宏观影像特征上有所表达。有研究[17]确定了胶质瘤的定量影像特征与基因表达图谱及其分子亚型之间的关系。 p53 是一种肿瘤抑制基因,其突变状态是胶质瘤的关键生物标志物。Li 等[18]从272 例LGG 病人的术前MRI 中各提取了481 个定量影像组学特征, 结合每例病人p53 的变异状态, 利用LASSO 算法筛选出15 个特征并建立SVM 分类器预测LGG p53 变异状态,模型中训练集的AUC 为0.896,测试集为0.763,结果表明MRI 的影像组学特征可以预测LGG p53 突变状态。 异柠檬酸脱氢酶(isocitrate dehydrogenase,IDH)基因突变对评估脑胶质瘤病人预后具有重要意义。 Lohmann等[19]对84 例未经手术治疗的脑胶质瘤病人影像中提取了肿瘤区域传统的PET 参数 (TBR 平均值、TBR 最大值、到达峰值时间等)和纹理特征,以神经病理学结果来评价诊断准确性,结果TBR 平均值和纹理特征结合建立的模型预测IDH 基因型的准确度为93%, 表明传统PET 特征与纹理特征结合可为无创性预测IDH 基因型提供重要诊断信息。Arita等[20]的研究从129 例Ⅱ/Ⅲ级胶质瘤病人的169 个MRI 数据集中提取了109 个影像组学特征和肿瘤位置信息, 应用LASSO 回归算法, 建立了预测IDH1/2 突变体、 伴有TERT 启动子突变的IDH1/2突变体和IDH 野生型3 种分子亚型的判别模型,结果显示,结合病变的位置信息,基于影像组学模型预测IDH 突变的准确度为85%~87%。
3.4 预测生存期和治疗反应 预测肿瘤病人的总生存期(overall survival,OS)可为制定治疗计划提供重要信息。Kickingereder 等[21]基于MRI 从119 例GBM病人的多区域肿瘤ROI 中提取了12 190 个影像组学特征,通过监督主成分(supervised principal component,SPC) 分析方法筛选出11 个最主要的特征,再使用Cox 比例风险模型预测病人的OS 和无进展生存期(progression free survival,PFS),结果显示SPC分析模型比现有的临床和放射学风险模型有更好的效果,模型将病人分为高风险组和低风险组,在训练集中PFS 的风险比(hazard ratio,HR)为2.43,OS 的HR 为4.33,验证集中PFS 的HR 为2.28,OS 的HR为3.45。 Lao 等[22]在预测GBM 病人的OS 研究中除了提取传统的影像组学特征外, 通过迁移学习从预训练的卷积神经网络中提取了98 304 个深度学习相关特征,特征选择后使用LASSO Cox 回归模型进行预测GBM 病人的OS, 在训练集中OS 的HR 为5.042,验证集中OS 的HR 为5.128,结果表明深度学习结合影像组学特征可以获得更高的性能。Kickingereder 等[23]对172 例复发性GBM 病人于贝伐珠单抗治疗前提取了4 842 个MRI 影像组学特征,使用SPC 分析方法选择特征,通过PFS 和OS 生成治疗结果分层预测模型,SPC 预测变量将训练集中的病人分层为PFS(HR=1.60)和OS(HR=2.14)的低或高风险组, 并在验证集中对病人进行了成功验证,PFS 和OS 的HR 分别为1.85 和2.60。 表明影像组学可以预测复发性GBM 病人的药物治疗效果。
3.5 其他 Liu 等[24]提出基于影像组学模型预测LGG相关性癫, 从286 例LGG 病人的MRI 中提取了肿瘤的位置特征和影像组学特征, 并分析了2 种特征之间的相互作用, 通过弹性网络方法对特征进行筛选后使用多变量logistic 回归分析建立预测模型,在区分是否发生癫的任务中, 训练集和验证集AUC 分别为0.88 和0.82,结果表明影像组学分析可以更精确和个性化地预测LGG 相关性癫。 Li 等[25]基于影像组学方法研究年龄相关的GBM, 从MRI影像中提取的影像组学特征在不同年龄组间有统计学差异, 结果表明不同年龄组的GBM 具有不同的病理、蛋白质或基因起源。
由于脑胶质瘤的类型、位置、大小、形状和异质性具有可变性和复杂性,对其分级和诊断一直是研究的重点和难点。 影像组学方法可以通过提取肿瘤直方图特征、 形态特征和表征肿瘤异质性的纹理特征等无创性地对脑胶质瘤进行分级与鉴别, 并能够预测基因表达及肿瘤的预后和治疗反应。 相信随着图像采集技术的进步以及人工智能技术在医学成像方面的广泛应用,影像组学将会有更广阔的发展前景。