裘可凡 孟钰婷 徐姣娜 牛国忠*
作者单位: 310053 浙江中医药大学第四临床医学院(裘可凡 孟钰婷)
310006 杭州市第一人民医院城北院区(徐姣娜)
310006 杭州市第一人民医院(牛国忠)
脑肿瘤的发病率和病死率较高,2016 年在全球影响了33万人[1]。脑胶质瘤是常见的脑肿瘤,因形状的多样性和高度的异质性以及预后较差,其诊断分级、基因突变水平及预后评估至关重要。磁共振(magnetic resonance imaging,MRI)是一种多模态成像技术,广泛应用于胶质瘤术前诊断及术后评估。近年来,随着科技进步,数字化医疗日渐发展,在大数据领域,人工智能凭借其高效的数据分析及信息提取能力,成为较多学科的研究热点,尤其是医学影像方面。深度学习(deep learning,DL)作为其新兴分支,如何高效应用于脑胶质瘤的临床诊断是当前的研究热点。
计算机问世于1940 年,经典算法作为机器的主要功能,包括决策树、普素贝叶斯分类算法、随机森林等,广泛应用于生产生活的各个领域,给人类的生活带来较大便利。然而,当人们想用此解决更高层次的问题时,经典算法不可避免的存在多种弊端。人工智能被称作是人类历史上的第四次工业革命[1],其核心是机器学习。DL 作为机器学习的新兴分支,是最先进的技术,其采用多层人工神经网络(artificial neural network,ANN)模拟人脑[2],与传统技术相比,DL 在较多领域都被证明具有更高的准确性,包括自然语言处理、计算机视觉和语音识别方面。其使用具有多层抽象的学习方法来处理输入数据,而不需要手动勾画图像,自动识别高维数据中的复杂结构,从而实现人工无法完成的目标。其整个过程旨在从原始数据中检测和提取高级特征。卷积神经网络(CNN)是目前最常用的DL 方法,主要应用于成像分析,在各个行业做出了突出贡献,并被广泛应用于其他学科,特别是对于医疗临床实际问题的解决[3-5]。如发现胸片中的结核病[6-7]、皮肤的恶性黑色素瘤[8]和罹患乳腺癌后组织切片上探及到的淋巴转移等[9]。
在WHO 中枢神经系统肿瘤分类中,针对肿瘤分级及基因分型越来越细[10]。大多数胶质瘤患者的治疗依赖于手术切除,而手术范围、切除后能否放化疗、治疗预后都与胶质瘤的性质有关。穿刺活检是获取其病理及分级的金标准,但术前需耗费大量的时间。因此,胶质瘤患者术前的MRI 影像在诊断分级中扮演重要角色。基于常见序列的DL 在胶质瘤的诊断分级、分割、预后等方面取得令人鼓舞的成果[11]。
2.1 肿瘤分割 分割是在影像图像中分隔肿瘤区与正常灰质白质等区域,目的是使图像更加清晰化、直观化。RIBALTA等[12]充分利用CNN,通过输入T2 Flair 图像以获取肿瘤分级。该模型可应用于数据不平衡及存在异构的数据集,为其提供可控的训练时间,并实时推断。LUO 等[13]提出一种基于密集孔洞的3DU-Net 神经胶质瘤分割模型(DDNet),采用分类损失和交叉熵损失作为多重损失函数,改善分割中的类别不平衡问题,该模型的准确性在BraTS2018 数据集上得到验证。但其获取的分割图像较模糊,精度有待提高。Mixup 技术可用于数据增强,目前在急性淋巴细胞白血病多个疾病中得到应用,但对于大样本数据库的作用有限,DVORNIK 等[14]应用PytorchDL 框架研发一个新模型—TensorMixup。该模型具有混合效率,分割精度更高,并可得到多样化的数据。其使用张量混合图像信息及混合图像的ROI,完整肿瘤、肿瘤核心在研究中的Dice 系数值依次可达91.32%与85.67%。为进一步验证此模型性能,研究者将其与TumorMixup 及CutMix 进行对比[15],结果显示TensorMixup 在上述区域的分割精度更高。KIKINIS 等[16]采用基于DL 的单次扫描检测(SSD)来分割转移的脑肿瘤。也有研究开发了DeepsegDL 模型[17],通过Flair图像进行自动分割。上述模型均在一定程度上解决了分类不平衡的问题,但其都需对图像进行预处理,而FRANCISCO等[18]等研发了一种多路径CNN 全自动脑胶质瘤模型,该模型通过输入T1WI 图像,沿着不同处理路径在三个空间同时进行处理,在增加数据集的同时防止过拟合,其Dice 指数为0.828。同时,该模型还可用于脑膜瘤和垂体瘤的分类分割。
2.2 肿瘤分级 目前脑胶质瘤最常用的是WHO 分级,按恶性程度从低到高分为I~IV 级。在临床治疗中,医务人员针对所采集到的病理信息进行分级,从而制定个性化手术方案,因此术前分级显得尤为重要。TIAN 等[19]采集术前T1WI、T2WI、DWI 序列,利用最优特征建立支持向量机(SVM)分类器,在低级别胶质瘤和高级别胶质瘤的区分上,其准确性为96.8%,在两种高级别胶质瘤的区分上,其准确性为98.1%。GUTTA等[20]基于CNN 网络,采用Grad-CAM 可视化算法对237 例胶质瘤患者进行600 次扫描,分级准确率为87%,但此样本均来自一个中心,是否可将其应用于多中心环境有待进一步考量。ZHUGE 等[21]应用3D CNN 网络在数据集进行5 次交叉验证,准确率为97.1%,相较传统卷积神经网络技术,3D CNN 网络具有更高的效率和准确度。MZOUGHI 等[22]采用T1 Gado 序列以区分肿瘤分级,获得96.49%的总体准确性,证实充分的数据增强可致分类的准确。DL 作为一种非侵入性胶质瘤分级的技术,在无需手术活检的情况下为治疗方案的选择提供指示信息,在临床得到广泛应用。
2.3 肿瘤分子水平 2021 年WHO 中枢神经系统肿瘤分类中强调了分子指标的重要性,应用相关分子病理指标判断肿瘤的相关生物学行为,对肿瘤进行诊断、鉴别诊断、预后生存分析,从而为临床决策提供依据[23]。
随着分子生物学的发展,越来越多的基因被证实与疾病相关,靶向药物、免疫疗法等保守治疗成为延长胶质瘤患者生存期的新方向。异柠檬酸脱氢酶(isocitrate dehydrogenase,IDH)参与三羧酸循环,广泛存在于真核生物多个细胞器,相关研究证实,IDH 突变的患者生存期较长,是进行临床分层的重要指标[24]。LIANG 等[25]提出了一种多模态3D Dense Net(M3D-DenseNet)模型,其准确率为84.6%。GE 等[26]利用基于DL 的半监督学习框架进行预测,取得较好的性能。CHOI 等[27]收集来自不同医院的1,166 例胶质瘤患者术前图像,基于T1、T2、flair 图像,开发了一种非侵入性模型,其AUROC 曲线下面积为0.86~0.96。该模型同时纳入肿瘤信号强度、大小形状、患者年龄等多个指标,无需任何依赖于操作员的过程。CALABRESE 等[28]提取基于DL 的肿瘤分割的放射组学特征来预测IDH 状态,该模型的敏感性为0.93,特异性为0.88。IDH 具有多个亚型,包括IDH 野生型和突变型。NALAWADE 等[29]提出一种仅输入T2WI 图像进行无创预测IDH 状态的自动管道,该图像具有最小的预处理,在预测无肿瘤、IDH 突变和IDH 野生型时,每个轴向切片的平均分类准确率达90.5%。其在分层随机化期间确保了受试者分离,最大程度的避免数据泄漏。目前预测IDH 突变的技术较为成熟,在临床得到较多应用。
IDH 突变常伴随着O6-甲基鸟嘌呤甲基转移酶(MGMT)启动子甲基化。MGMT 是一种与胶质瘤对卡莫司汀、替莫唑胺等药物的敏感性及耐药性有关的DNA 修复酶。相较其余患者,MGMT 甲基化患者通常生存期较长[30]。LEVNER 等[31]应用L1 正则化神经网络,对T1WI、T2WI、FLAIR 进行分析,使用基于S 变换的空间频率纹理分析提取特征,此模型在59例患者中取得87.7%的准确率。但其需要输入的图像较多,不可避免的存在图像无法处理等问题,因此YOGANANDA 等[32]开发了一种模型,仅使用T2图像,采取基于DL 的三维密集UNet 对247 例受试者的磁共振信息进行三重交叉验证,其敏感性和特异性分别为96.31%和91.66%。此模型仅使用T2WI,消除了图像采集伪影的潜在缺点,减少时间及成本,具有重要的里程碑意义。KORFIATIS 等[33]应用残余深度神经网络(ResNet)进行验证,发现ResNet 50 的准确度为80.72%,是目前性能最佳的模型。
1 号和19 号染色体缺失是胶质瘤,尤其是少突胶质细胞瘤的重要分子标志,1p/19q 共缺失的患者对烷化剂联合化疗治疗敏感。CHANG 等[34]使用2D CNN 模型,采取5 倍交叉验证方法,对256 个MRI 图像信息进行预测,其准确率为92%。此外,相关文献表明,1p/19q 缺失的肿瘤更可能在额叶皮质中发现[35]。这进一步证明DL 可以自动提取特征,而无需人为干预。
除上述常见的分子标记物以外,EGFR、TERT 基因启动子突变、Ki-67、BARF 基因、TP53 基因等[30]均被证实与胶质瘤诊断及预后有关。关于上述基因的相关临床预测较少,在未来有待进一步研究。
2.4 肿瘤预后 HAN 等[36]开发并验证一种结合放射组学特征的Elastic Net CoxDL 模型,通过T1WI 以预测胶质瘤患者长期生存的可能性,其log-rank 检验P=0.014。TANG 等[37]采用多任务卷积神经网络,从术前多模态磁共振成像中导出肿瘤基因型相关特征,而不需肿瘤分割,并将其用于总生存时间预测。与其他模型不同的是,其将特征学习与分类回归相结合,相关系数为0.4695,实现目前最高的生存预测精度。在胶质瘤的治疗过程中,通常包含着真性进展及假性进展。GAO 等[38]建立了ERN-Net 模型以鉴别肿瘤复发和假性进展,其敏感度为0.947,特异度为0.817。在2018 年BraTS 比赛中,FENG 等[39]基于3D U-Net DL 网络,开发的线性模型可预测低级别胶质瘤患者的预后,取得了冠军,为后续研究奠定了基础。NIE 等[40]提出两阶段学习方法,第一阶段提取T1WI、DTI、rs-fMRI 深层特征,并进行训练,第二阶段将肿瘤相关特征(肿瘤大小、组织学类型等)输入SVM 中,最终生成生存时间的长短。该多通道的DL 生存预测框架模型的准确率为90.66%,优于其余方法。LEE 等[41]采用全MRI 图像进行预测,证实多参数序列数据的CNN-LSTM 模型性能优于单个序列,其准确度为0.62~0.75。但上述研究均为回顾性研究,除相关显性特征外,患者的心理、术后恢复状况等因素均会影响预后,因此在未来,应前瞻性纳入相关患者,进一步实现个体化精准医疗。
DL 算法是多层算法,需要大量的处理能力,并且有数百万个参数。在现有的临床报道中,大多为小样本单中心的研究,其模型缺乏普遍实用性,此外,在有限的数据集进行运算训练时,有较大概率发生过拟合。当使用少量数据获得高准确度时,这个问题令人担忧。因此,在未来,需要收集大量数据,建立大样本多中心的数据库,以供学者们进行进一步研究,改善现有不足,建造更具有普适性的模型。DL 的技术亟待进一步深化。在传统的机器学习中,对图像特征选择和提取的预处理过程常需要专家干预,DL 直接从输入数据中挖取特征,具有非常大的灵活性和不确定性,这些不确定性和复杂性常使高精度的过程变得不透明,也使纠正给定数据集所产生的偏差变得更加困难。加之DL 有多个隐藏层,在实际应用中,很难解释其提取哪些单独的特征。此外,神经网络被批评为生成不可解释的特征向量的“黑匣子”,这限制了对图像分类潜在机制的深入了解。尽管DL 在肿瘤的分割、分级诊断、分子基因分型、预后预测等方面各有建树,但目前尚缺乏将其整合在一起的模型。开发一个将诊断、分型及预后于一体的模型,能减少临床医师及放射科医师诊断所需时间。近年来,除了上述常规序列外,还有扩散峰度成像(diffusion kurtosis imaging,DKI)、磁共振谱(MRS)等多个新兴的序列,为解决临床问题提供了新思路,未来有望将其与DL 相结合,成为下一个新的研究热点。