磁共振影像组学预测脑胶质瘤MGMT启动子甲基化状态的研究进展

2024-01-21 17:55:21李鼎王效春

磁共振成像 2023年12期

李鼎，王效春

作者单位：1.山西医科大学医学影像学院，太原 030001；2.山西医科大学第一医院影像科，太原 030001

0 前言

脑胶质瘤是最常见的原发恶性中枢神经系统（central nervous system, CNS）肿瘤，约占CNS 原发恶性肿瘤的75%[1]。尽管手术、放疗和化疗等医疗方案不断进步，但是脑胶质瘤患者的预后仍然较差[2]。替莫唑胺（temozolomide, TMZ）是胶质瘤标准治疗方案的一部分，其治疗敏感性很大程度上与O6-甲基鸟嘌呤-DNA 甲基转移酶（O6-methylguanine-DNA methyltransferase, MGMT）甲基化状态有关[3-4]。MGMT是修复DNA的酶，当MGMT启动子甲基化时，其DNA修复活性被抑制，从而使肿瘤细胞对TMZ的细胞毒性作用更加敏感[5]。因此，MGMT 成为脑胶质瘤重要的强预后和预测分子标志物之一[6]，除此之外，MGMT启动子甲基化状态与胶质瘤假性进展（pseudoprogression,PSP）之间的相关性也被多项研究报道[7-8]，MGMT 启动子甲基化的脑胶质瘤患者可能更易发生PSP。由此可见，确定MGMT 启动子甲基化状态对于胶质瘤患者的诊疗及预后都有着重要的临床价值。

目前，确定MGMT 启动子甲基化状态的主要方式仍是手术取样并进行焦磷酸测序[9]，但其耗时长，会受到肿瘤异质性的限制，并且在活检时可能损害神经功能。而影像组学是在近些年被广泛研究的一种非侵入性的影像方法，包括图像处理、图像分割、特征提取、模型建立及验证，通过高通量的特征提取，将医学图像转化为可挖掘的高维数据[10]，这也在一定程度上克服了肿瘤异质性的影响。基于一系列MRI序列的影像组学在预测脑胶质瘤MGMT启动子甲基化状态中极具潜力，MRI 影像组学以及深度学习（deep learning, DL）的研究方法得到了大量研究的尝试，本文将从MRI 影像组学和基于DL 的MRI 影像组学研究现状展开综述，旨在为后续的相关研究拓展思路。

1 MRI 影像组学预测脑胶质瘤MGMT 启动子甲基化状态的研究现状

1.1 常规MRI序列研究现状

1.1.1 对比增强T1WI 是影像组学预测MGMT 启动子甲基化的强预测序列

对于CNS 而言，最常用的成像方式是MRI。常规MRI（conventional MRI, cMRI）序列的特征可以反映脑胶质瘤MGMT 启动子甲基化状态[11]，各种机器学习（machine learning, ML）分类器也被广泛应用于脑胶质瘤MGMT 启动子甲基化状态的预测研究中[12-14]。如XI 等[15]纳入98 例已知MGMT 启动子甲基化状态的胶质母细胞瘤（glioblastoma, GBM）患者，手动分割T1WI、T2WI、对比增强T1WI（contrast enhanced T1-weighted, CE-T1WI）序列的整个肿瘤部分，高通量提取、量化并使用最小绝对收缩和选择算法（least absolute shrinkage and selection operator, LASSO）正则化最终保留了36 个特征同时输入支持向量机（support vector machine, SVM）分类器。研究发现SVM通过单一MRI序列及组合序列模型均可区分MGMT启动子甲基化状态，但各单一MRI序列相比，CE-T1WI明显具有更高的准确度（82.01%）、敏感度（84.27%）和特异度（79.19%），仅次于三者的组合模型。由此可见CE-T1WI可能是一种强预测序列，其特征可能是影像组学预测MGMT启动子甲基化的重要特征。HUANG 等[16]也进一步证实了CE-T1WI 特征的重要性，该研究分别提取了T1WI、CE-T1WI、T2WI 及T2- 液体衰减反转恢复（T2-fluid attenuated inversion recovery, T2-FLAIR）成像序列中的前五个最强大的纹理特征，并将其线性组合成影像组学评分（Radscore），然后使用多因素逻辑回归分析建立基于每个Radscore 的组合模型，其中CE-T1WI 被加权并且贡献最大。另外，沙永建等[17]引入CE-T1WI和T2-FLAIR 构建影像组学模型预测较低级别胶质瘤（lower-grade gliomas, LGGs）异柠檬酸脱氢酶突变（isocitrate dehydrogenase mutation, IDHmut）合并MGMT 启动子甲基化（O6-methylguanine-DNA methyltransferase promoter methylation, MGMTmet），经过单因素分析发现T2-FLAIR并没有特征被保留下来，而CE-T1WI 却保留了21 个特征。最终通过多因素逻辑回归建立的影像组学模型在训练集和测试集的曲线下面积（area under the curve, AUC）分别为0.842和0.935。

上述研究表明，cMRI 序列影像组学模型可以较好反映脑胶质瘤MGMT 启动子甲基化状态，而无论是单序列模型还是多序列联合模型，CE-T1WI 都有着更高的预测价值，并且表现出了更大的预测潜力，在未来的相关研究中值得获得更多的关注。

1.1.2 cMRI 影像组学联合临床因素或有助于提高MGMT甲基化的预测效能

之前的多项研究[16,18-19]已经表明加入临床特征（如年龄等）不会提高模型的预测效能，反而会增加模型的复杂性。然而，ZHANG 等[20]的研究却发现了年龄及胶质瘤分级的重要性。由于IDHmut也是胶质瘤的重要预后分子标记物之一[21-23]，所以ZHANG 等[20]不再仅仅局限于胶质瘤MGMT 启动子甲基化状态的预测，而是基于机器学习方法预测MGMTmet 与IDHmut共现的状态。该研究发现MGMTmet 与IDHmut 共现组和其他状态组别在年龄及胶质瘤分级方面有着显著的差异。一项近期的研究[24]同样构建MRI 影像组学模型去预测MGMTmet 与IDHmut 共现状态，并得到了相同的结论。这项研究构建了影像组学模型、临床模型及影像组学-临床联合模型，发现联合模型表现最佳，纳入临床因素（年龄、肿瘤分级）在一定程度上改善了模型的预测效能，AUC 从单纯影像组学模型的0.866 增加到了联合模型的0.930。由此可见，临床特征的作用或许不再是增加模型复杂性这样的副作用，将其与cMRI 影像组学联合或许有助于提高MGMT启动子甲基化的预测效能。但需要注意的是，IDHmut与年龄相关，很少出现于65岁以上的患者，而且在2～3 级的胶质瘤中更常见[25-27]。所以上述研究中的年龄及分级等临床因素可能会受到IDHmut的影响，其对于脑胶质瘤MGMT 启动子甲基化状态的影响可能还需要进一步研究的证实。

1.2 功能MRI序列研究现状

1.2.1 扩散加权成像及表观扩散系数

扩散MRI序列可以提供细胞外空间弯曲度、组织细胞结构和细胞膜完整性的信息[28],并且与多种基因的状态密切相关[29-31]。WEI 等[32]在CE-T1WI 和T2-FLAIR的基础上进一步纳入了功能MRI（functional MRI,fMRI）序列图像中的表观扩散系数（apparent diffusion coefficient, ADC）图，基于肿瘤区及瘤周水肿区提取特征并建立影像组学特征模型。遗憾的是，取自ADC 图的特征未能较好区分MGMT 启动子甲基化状态，最终由CE-T1WI 和T2-FLAIR 特征建立融合模型并取得最佳AUC 值（0.902），该研究将水肿程度和ADC值融合到影像组学特征模型中，发现预测效能下降。但是之后KIHIRA等[33]发现，在CE-T1WI和T2-FLAIR 中添加扩散数据如ADC 和扩散加权成像（diffusion weighted imaging, DWI）可以显著提高IDH1、MGMT等的预测效能，其中MGMT预测效能的增量值最高，在加入扩散MRI 特征后，联合模型的预测效能显著提高，最终AUC 为0.79。由此可见，DWI 与ADC图的影像组学特征或许可以在一定程度上提高胶质瘤MGMT 启动子甲基化的预测效能。HE 等[34]也证明了加入扩散序列特征的多序列融合模型的AUC显著高于各单序列模型。陈思璇等[35]基于T1WI、T2WI、CE-T1WI及ADC 图构建的逻辑回归模型也取得了较好的预测效能，其AUC 值和准确度分别达到了0.90 和91%。因此，DWI 及ADC 图在反映MGMT 启动子甲基化状态方面有着不可忽视的作用。

1.2.2 扩散张量成像及扩散峰度成像

扩散张量成像（diffusion tensor imaging,DTI）可以通过脑内水分子在各个方向的扩散信号来反映脑组织的微观结构信息，从而对脑白质纤维束进行无创分析[36]。扩散峰度成像（diffusion kurtosis imaging, DKI）作为一种非高斯扩散成像技术，可以用来探测非高斯扩散特性组织的复杂成分和微观结构[37-38]。TAN 等[39]探索了这两项fMRI 技术对脑胶质瘤MGMT 启动子甲基化状态的预测效能，从平均峰度（mean kurtosis, MK）和平均扩散系数（mean diffusivity, MD）参数图中分别提取了整个肿瘤的364 个影像组学特征，然后选择最有意义的影像组学特征并通过逻辑回归建立影像组学模型，其AUC值为0.835（95%CI：0.686～0.951）。DTI及DKI可以提供常规序列无法提示的重要信息，使用其进行脑胶质瘤MGMT 启动子甲基化状态的预测具有很大的潜力。不过到目前为止，相关的研究还较少，未来需要更多的研究进一步探索，从而避免该结果的偶然性与片面性。

1.2.3 灌注加权成像

灌注加权成像（perfusion-weighted imaging,PWI）可以评估肿瘤内的血管增生情况，对于判断肿瘤的恶性程度以及病理分级有着一定的价值[40-41]。已经有研究[42]通过动态磁敏感对比（dynamic susceptibility contrast, DSC）增强成像的影像组学预测GBM 中MGMT 启动子甲基化状态。该研究回顾性分析了59例GBM患者的DSC-MRI图像，从相对脑血容量（relative cerebral blood volume, rCBV）和相对脑血流量（relative cerebral blood flow,rCBF）图中共获得92 个定量图像特征（image features, IFs）。研究者将GBM 中MGMT 启动子甲基化状态分成三组：未甲基化（unmethylated, UM）、中间甲基化（intermediate-methylated, IM）、甲基化（methylated, M）[43]，并用Mann-WhitneyU检验评估患者组之间IFs差异是否存在统计学差异，其中有显著差异的IFs 被称为相关IFs（relevant IFs,rIFs）。在UM-M、IM-M 和（UM+IM）-M 组中发现了14 个rIFs，所以该研究将患者进一步分为（UM+IM）组和M组，建立了机器学习模型，并得到了75%的敏感度和85%的特异度，AUC 值为0.84。有趣的是，在14 个rIFs 中，有10 个来自rCBV 图，相比rCBF 图，rCBV 图似乎在MGMT 启动子甲基化状态确定方面提供了更多可能性。所以PWI 对于预测脑胶质瘤MGMT 启动子甲基化状态有着一定的价值。

由此可见，fMRI 序列在脑胶质瘤MGMT 启动子甲基化状态的预测方面有着不可忽视的潜力，其与cMRI 序列的融合或许可以起到信息互补的作用，从而进一步提高预测效能。但是到目前为止，相关影像组学的研究还比较少，未来的研究空间还很大。

2 基于DL 的MRI 影像组学预测MGMT 启动子甲基化状态的研究现状

DL 作为一项重要的新兴技术，已经在许多不同的领域崭露头角。对于脑胶质瘤MGMT启动子甲基化的预测，深度神经网络也表现出了较高的准确性，而且在一定程度上减少了人工干预的影响。

2.1 单一MRI序列DL的研究现状

DL 网络构架结合单一MRI 序列可以预测脑胶质瘤MGMT 启动子甲基化状态。KORFIATIS 等[44]基于T2WI 比较了三种深度残差学习网络（residual deep neural network, ResNet）模型，无须进行独特的肿瘤分割步骤即可评估它们预测MGMT甲基化状态的能力。研究表明ResNet50（50 层）体系结构优于其他模型（ResNet18、ResNet34），并在155 例GBM 患者的预测中达到了94.90%的准确度。这一结果说明ResNet的精度可能随着层数的增加而增加。但层数超过50层会增加计算难度和过拟合，也因此ResNet50被研究人员视为最流行、稳定且适应良好的DL体系构架之一[45-46]。同样仅基于T2WI，YOGANANDA 等[47]的研究队列包括247 例高、低级别胶质瘤患者，该研究开发了仅基于T2WI 的网络（MGMT-net），该网络能够单独从T2WI确定脑胶质瘤MGMT启动子甲基化状态，准确度、敏感度和特异度分别为94.7%、96.3%和91.6%，其性能优于先前报道的算法[44,48]。可见DL 结合单一MRI序列确实可以区分胶质瘤MGMT 启动子甲基化的状态。还有研究比较了CE-T1WI 模型与T2-FLAIR 模型在DL 中的表现，如CHEN 等[49]提出了一种基于MRI 的DL 管道，以端到端方式进行胶质瘤自动分割和MGMT启动子甲基化分类，并发现T2-FLAIR 训练的模型在胶质瘤分割和MGMT启动子甲基化状态预测中取得了最佳的效果，准确度达到了0.827。以上研究均将DL与MRI序列结合在了一起，并且证实了其在预测脑胶质瘤MGMT启动子甲基化状态中的作用。但这些研究仅仅局限于单一序列，未能探索多序列联合应用在肿瘤分割和分类中的价值。

污泥热解反应特征参数见表2，不同升温速率下的 DTG、TG曲线具有较好的一致性。在较低的升温速率下，由于升高到相同温度所需的时间长，污泥在第二反应阶段的失重率相对较高升温速率下的失重率变大。由图1可见，不同升温速率下的TG曲线相交于334 ℃～361 ℃，而且在高温区域，较低升温速率下的污泥失重率小于较高升温速率下的污泥失重率。这可能是由于低升温速率下的污泥热解时间延长，导致缩聚等二次反应加强，挥发分析出量减少[5]。随着温度的升高，二次反应减弱，污泥的失重率又略有增大。但在热解反应终温阶段，不同升温速率过程下的总失重率基本接近。

2.2 多MRI序列DL的研究现状

相比单一MRI序列，多序列联合预测或许能够提供更加全面的信息。CHEN 等[50]提取了T1WI、T2WI、ADC 图和CE-T1WI 4 个序列的影像组学特征，并联合输入ResNet，研究发现基于肿瘤核心区的ADC 与CE-T1WI 联合模型表现最好，准确度（91%）和AUC（0.90）均为该研究所有模型中最高。与之前的DL研究方法不同，该研究将提取的特征作为DL 网络的输入项，而且该研究不再仅仅使用单一的MRI 序列，而是纳入了多个序列，进一步探索并证实了多序列间的联合预测价值。除此之外，还有研究[48]也证实了多MRI 序列DL 模型对于预测脑胶质瘤MGMT 启动子甲基化状态的能力。如CHANG 等[48]结合T1WI、T2WI 及T2-FLAIR 序列，使用DL 网络模型的预测准确度达到了83%。由此可见，多MRI 序列DL 模型可以更好地预测脑胶质瘤MGMT启动子甲基化状态。

总之，基于DL 的MRI 影像组学对于脑胶质瘤MGMT 启动子甲基化状态的预测具有很大的潜力，而多序列联合可能会进一步提高其预测效能。

3 MRI影像组学联合DL预测MGMT启动子甲基化状态的研究现状

利用MRI 影像组学联合DL 网络构架来预测脑胶质瘤MGMT 启动子甲基化也得到了很多尝试[50-52]。CALABRESE 等[51]评估了一种人工智能架构，该架构将MRI 影像组学和卷积神经网络（convolutional neural network, CNN）图像特征结合到一个单一模型中，用于预测GBM 的MGMT 启动子甲基化状态。研究结果表明，结合影像组学和CNN特征可能有助于提高GBM 基因生物标志物预测的准确性。SAXENA 等[52]研究了各种ML 和DL 的方法，如SVM、随机森林（random forest, RF）及ResNet 等，最后分析了一种融合深度学习框架。该框架结合了DL框架和ML框架的特点，优于单独的ML框架15%，优于单独DL框架7%。ZHONG 等[46]比较了ResNet50 和卷积3D（convolutional 3D, C3D）两种DL的性能，发现后者具有更高的准确度（91.11%），并基于后者、MRI 影像组学特征及语义特征建立多模态模型。值得注意的是，该研究发现语义特征的加入可以为MGMT 启动子甲基化模型带来8%～10%的增益。上述研究均表明，DL 网络构架与MRI 影像组学的结合会提高脑胶质瘤MGMT 启动子甲基化状态的预测效能。

综上所述，MRI 影像组学与DL 联合或许可以使二者优势互补，从而使模型获得更高的预测效能，这一点需要未来更多的研究进一步证实。

4 局限性与前景展望

对于脑胶质瘤MGMT 启动子甲基化状态的预测，MRI 影像组学已经表现出了较好的预测效能，但仍然存在着一些局限性。大多数研究均表明，将一些临床因素（年龄、胶质瘤分级等）纳入预测模型并不会提高脑胶质瘤MGMT 启动子甲基化状态的预测效能，反而会增加其复杂性，这一点还需要后续更多研究并纳入更多临床因素进一步证实；大多数研究都存在样本量过小、缺乏独立验证队列等局限性，这可能会降低研究结果的准确度；基于DL 的MRI 影像组学可以在一定程度上排除人工勾画感兴趣区的主观性差异，但是到目前为止，DL 的研究主要基于cMRI 序列。fMRI序列在脑胶质瘤MGMT启动子甲基化状态的预测方面有着不可忽视的潜力，所以将其纳入研究并联合cMRI序列或将成为未来研究趋势。

5 小结

作者利益冲突声明：全体作者均声明无利益冲突。

作者贡献声明：王效春设计本综述的方案，并对稿件重要的智力内容进行了修改，获得了国家自然科学基金项目的资助；李鼎起草和撰写稿件，获取、分析并解释本综述的参考文献；全体作者都同意最后的修改稿发表，都同意对本研究的所有方面负责，确保本综述的准确性和诚信。