赵慧敏,张辉
作者单位:1.山西医科大学医学影像学院,太原030001;2.山西医科大学第一医院影像科,太原030001
高级别脑胶质瘤(high-grade glioma,HGGs)约占脑胶质瘤的3/4,生存期短且易复发,根据《中国中枢神经系统胶质瘤诊断和治疗指南》编写组在中华医学杂志2016年96卷7期发表的2015年的中国中枢神经系统胶质瘤诊断与治疗指南,成人HGGs的1年和5年生存率分别约30%和13%,总体预后较差。最大范围的手术安全切除辅以同步放化疗为其标准治疗方案,替莫唑胺(temozolomide,TMZ)的低毒性使其成为临床上化疗的一线药物。有研究表明,同样使用TMZ的HGGs患者,O6-甲基鸟嘌呤甲基转移酶(O6-methylguanine-DNA methyltransferase,MGMT)启动子甲基化患者的生存期明显延长[1],因此临床中MGMT启动子甲基化状态已成为判断HGGs 患者疗效的重要参考指标[2-3]。目前确定MGMT 启动子甲基化状态的金标准是基因检测,需通过手术切除或活检来获得组织,创伤较大且费用昂贵。相比之下,影像学检查具有一定优势,但脑胶质瘤的高度异质性使常规的影像学评估面临巨大挑战,而人工智能则为脑胶质瘤的精准预测及个性化治疗提供了全新途径,其中机器学习技术已成为人工智能的核心部分,Jian 等[4]在对系统文献的回顾中发现机器学习预测胶质瘤MGMT 启动子甲基化时,训练数据集的合并敏感度为81%,特异度为80%,显示出良好的结果,而优化的机器模型可以成为一种无创、客观的工具来为临床决策提供重要的分子信息。
MGMT 是一种不可逆的DNA 甲基转移酶,可迅速逆转化疗药物引起的鸟嘌呤O6位的烷基化损伤将核苷酸恢复到其天然形式,而不会导致任何DNA 链断裂,因此会导致耐药性的产生。MGMT启动子甲基化则会导致MGMT转录的沉默,从而提高化疗敏感性,延长患者生存期。但MGMT 启动子甲基化患者对放化疗的高敏感性又会加重放化疗介导的放射性损伤,因此在治疗结束后3~6 个月左右,联合TMZ 同步治疗的患者中MGMT 启动子甲基化患者发生假性进展的概率高于未甲基化者[5],影像上与复发均表现为异常强化,准确鉴别两者对下一步的治疗决策至关重要。此外MGMT 高水平表达是脑胶质瘤室旁复发的重要预测因子[6]。另外,据报道MGMT 启动子甲基化状态与HGGs 生长速率降低显著相关[7],这可能与其介导的脑胶质瘤微环境中的免疫反应相关。因此,术前预测MGMT 启动子甲基化状态对于HGGs 的预后及指导其个体化治疗具有很大价值。
智能影像是指基于人工智能技术的神经元数学模型,通过挖掘海量多模态医学影像数据特征,学习和模拟影像医生的诊断思路,进行特征挖掘、重新组合以及综合判断的复杂过程[8]。
影像组学是指高通量地提取大量影像特征数据,采用自动或半自动算法将所提取数据转化为高维度可发掘的空间特征数据,并进而深层次分析和解读这些数据[9]。突破了临床上主观判读图像的局限性,可以更好地表征疾病特征[10],为胶质瘤分子分型的预测提供了新思路。
2.1.1 基于磁共振成像的影像组学
影像学检查,尤其是磁共振成像(magnetic resonance imaging,MRI)检查,既可多方位成像,又具有较高的软组织分辨力,是诊断脑肿瘤的可靠手段。Xi 等[11]发现在单一常规序列模型中,基于增强T1 加权成像(contrast enhanced T1 weighted imaging,Ce-T1WI)使用支持向量机(support vector machine,SVM)分类器在预测胶质母细胞瘤(glioblastomas,GBMs)的MGMT启动子甲基化状态时性能最好,敏感度、特异度、曲 线 下 面 积(area under the curve,AUC)分 别 为84.27%、79.19%、0.883,并且纹理特征可能是最重要的。而Huang等[12]基于T2 加权成像(T2-weighted imaging,T2WI)通过逻辑回归(logistic regression,LR)放射学模型在预测胶质瘤MGMT 启动子甲基化状态方面的表现优于基于其他序列的模型,基于Ce-T1WI的放射学模型则在预测肿瘤等级和胶质瘤异柠檬酸脱氢酶1 (isocitrate dehydrogenase,IDH1)状态方面表现更好。这些不同的结果可能部分归因于不同的队列和不同的处理方法。功能成像则能提供肿瘤的扩散、代谢及灌注特征,一些学者对术前表观弥散系数(apparent diffusion coefficient,ADC)直方图分析对胶质瘤MGMT启动子甲基化状态的预测价值进行了研究,但结果相互矛盾[13-14],Zhang 等[15]发现基于血管外细胞外容积分数(Ve)和容积转运参数(Ktrans)的直方图参数可用于评估MGMT启动子甲基化状态,其中中位Ktrans值和第90百分位的Ve值是分析MGMT 启动子甲基化的重要生物标志物,Ve值预测性能相对较好,敏感度、特异度、AUC 分别为84.2%、75.0%、0.829。而Crisi 等[16]发现采用朴素贝叶斯、决策树和多层感知器机器学习方法基于动态磁敏感增强(dynamic susceptibility contrast,DSC)成像建立的模型可用来预测MGMT 启动子甲基化状态,敏感度、特异度、AUC 分别为75%、85%、0.84,但是结果可能高度依赖于MGMT 甲基化截止值30%。另外Jiang 等[17]发现在分析MGMT 启动子甲基化GBMs 的(amide proton transfer,APT) 直方图参数时,平均APT 值显示出最高的诊断准确度为83.3%。基于功能成像的影像组学预测性能并没有显著优于常规成像模型,这可能是由于功能成像较低的空间分辨率。由此可见单个图像特征容易忽略肿瘤的其他组织特征,另外成像序列及分类算法的不同均会导致研究结果的差异。
不同序列的图像往往反应了肿瘤内不同的组织特征,与单变量预测相比,融合多种序列的影像特征可以提高预测性能[18-19],目前也在不少学者的研究中得到了证实。Xi 等[11]的研究中使用SVM预测MGMT启动子甲基化状态的最佳分类系统来源于36 个T1WI、T2WI 和Ce-T1WI 图像特征的组合,准确度为86.59%。Huang 等[20]对T1WI、T2WI、T2-FLAIR 及Ce-T1WI 的组合模型进行纹理分析预测GBMs 数据集MGMT 启动子甲基化的敏感度为90.5%,特异度为72.7%。两位学者组合模型的预测性能均高于其中任何单一序列的影像组学特征。但是Korfiatis 等[21]发现使用SVM 和随机森林(random forest,RF)分类器预测GBMs MGMT 启动子甲基化时,T1WI 结合T2WI 的图像特征性能比基于单一T2WI特征差,T1WI和T2WI图像特征的结合似乎降低了监督分类方案的性能,尤其是对于RF 模型。同样地,Wei等[22]发现基于T2-FLAIR和Ce-T1WI序列中提取的影像特征使用LR 模型预测MGMT 启动子甲基化的性能比ADC序列表现更好,但是将水肿程度和ADC 值添加入其中会导致预测性能的轻微降低,这表明在放射组学特征中加入临床和放射学因素会增加复杂性,但不会增加预测准确性,并且ADC图的低图像分辨率影响了影像组学特征的稳定性和鲁棒性。因此,关于多参数放射组学模型预测MGMT 启动子甲基化状态的最佳联合方案有待深入研究。
2.1.2 基于正电子发射断层摄影术的影像组学
正电子发射断层摄影术(positron emission tomography,PET)是一种高灵敏度的分子成像技术,可以反映肿瘤细胞中普遍存在的肿瘤代谢改变。Kong等[23]发现使用LR模型从原发性弥漫性胶质瘤患者的18氟脱氧葡萄糖-正电子发射计算机断层扫描(18fluorodeoxyglucose positron emission computed tomography,18F-FDG-PET)提取的放射组学特征可以用来预测脑胶质瘤MGMT启动子甲基化状态,在训练集和验证集中的准确度分别为91.3%、77.8%。与MRI及18F-FDG-PET相比,18氟-多巴正电子发射断层扫描(18-labeled L-dihydroxyphenylalanine positron emission tomography,18F-DOPA-PET)显示出高肿瘤背景信号和高胶质瘤检测敏感度,Qian等[24]发现利用RF模型提取HGGs 的18F-DOPA-PET 图像的放射组学特征可以用于预测MGMT 启动子甲基化状态,训练集和验证集准确度均为80%。但前者的特征提取是以T2-FLAIR 及Ce-T1WI 为参考,而后者是提取肿瘤异常摄取区的特征。Yu等[25]的研究则利用了PET/MRI 融合技术,表明11C-蛋氨酸-正电子发射断层显像(11C-methionine-positron emission computed tomography,11C-MET PET)与MRI 融合技术的直方图特征,如偏度和峰度,可用于区分MGMT 启动子甲基化组和非甲基化,但该研究没有进行受试者工作特征曲线分析来衡量疗效或评估患者的生存率,因此,PET/MRI融合技术的价值有待进一步验证。
深度学习是通过组合低层特征形成更加抽象的高层类别或特征,进而从大量的输入数据中学习有效特征,并把这些特征用于分类、回归和信息检索的一种技术。在其完成模型训练后,可以实现影像全自动分析,避免了手工勾画特征的烦琐及观察者之间的分歧。
目前,深度学习已经在胶质瘤领域开启了广泛的研究,其中卷积神经网络(convolutional neural networks,CNN)是典型的深度学习人工神经网络。Chen等[26]使用Ce-T1WI 及T2-FLAIR 图像训练的浅层CNN 预测GBMs MGMT 启动子甲基化的准确度分别为80.4%和82.7%,T2-FLAIR 图像似乎对肿瘤MGMT 启动子甲基化状态的预测性能更好。这可能是由于MGMT启动子甲基化的GBMs更容易发生坏死,而T2-FLAIR序列对坏死更敏感[27]。在Chang 等[28]的研究中,使用基于T1WI、T2WI、FLAIR 的二维CNN 预测256 例脑胶质瘤MGMT 启动子甲基化状态时具有83%的准确度。而Yogananda 等[29]基于T2WI 的3D U-Net 神经网络预测MGMT 启动子甲基化的准确度达到了94.73%。这可能是由于该研究三维网络架构中的密集连接更易于训练,并且可以减少过度拟合。此外,经典的CNN 体系结构随着网络的加深可以一定程度提升模型的性能,但过程较复杂且卷积层的不断增加会导致反向传播梯度消失和过度拟合,而深度残差网络(residual networks,ResNet)结构则支持数百层的训练网络。Korfiatis 等[30]发现基于GBMs 患者T1WI、T2WI图像的ResNet结构能够高精度预测MGMT启动子甲基化状态,其中性能最好的是ResNet50,准确度为94.90%,ResNet的更深层次的体系结构似乎可以产生更好的结果。总之,选择合适的网络深度对于深度学习模型的性能至关重要,且深度学习需要较大的数据样本,模型的性能可能会随训练数据的增多有所提高。
基于深度学习的影像组学(deep learning-based radiomics,DLR)是一种结合影像组学与深度学习的更先进的混合模型。在DLR中,高通量的图像特征直接从深度神经网络中提取,不涉及额外的特征提取操作,避免了因特征计算在放射组学分析中引入的额外误差,保证了图像特征的准确性和有效性[31]。
目前DLR模型已成功应用于脑肿瘤的基因型预测、分级及预后[32]等,Zhu 等[33]利用一种基于常规MRI 数据的性能良好的DLR模型无创预测脑膜瘤分级,AUC达0.811。Li等[34]的研究证实对于相同的低级别胶质瘤数据集,DLR 预测IDH1 时的AUC(92%)明显优于正常放射组学方法的AUC (86%)。Zhang 等[35]整合了一种全自动化、基于深度学习的胶质瘤分割方法预测IDH突变和MGMT 启动子甲基化共发生,Ce-T1WI 图像特征的性能最好,特异度为94%,准确度为89.4%,且此方法在临床环境中更具实用性。由此可见,DLR可能是从医学图像中提取深层信息的一种强有力的方法,目前尚无关于利用DLR 模型预测MGMT启动子甲基化状态的相关报道。
人工智能已广泛应用于医学影像领域,为影像科医生提供了重要信息,降低漏诊概率的同时也提高了阅片效率。其中影像组学为肿瘤的影像学特征和MGMT启动子甲基化状态建立了进一步的联系,但其特征提取依赖手工勾画且成像序列及分析方法缺乏标准化。相比影像组学,深度学习能够大幅度提高分类或预测模型的准确性,但其发展受到数据集规模的限制,而DLR则充分利用了影像组学及深度学习的优势,但这些影像研究来自多中心,且计算及分析缺乏统一标准。相信未来智能影像将克服现有不足,更好地实现脑肿瘤的精准诊疗。
作者利益冲突声明:全部作者均声明无利益冲突。