深度学习在脑胶质瘤中的应用及展望

2023-12-01 23:48裘可凡孟钰婷徐姣娜牛国忠

浙江临床医学 2023年9期

裘可凡孟钰婷徐姣娜牛国忠*

作者单位： 310053 浙江中医药大学第四临床医学院（裘可凡孟钰婷）

310006 杭州市第一人民医院城北院区（徐姣娜）

310006 杭州市第一人民医院（牛国忠）

脑肿瘤的发病率和病死率较高，2016 年在全球影响了33万人［1］。脑胶质瘤是常见的脑肿瘤，因形状的多样性和高度的异质性以及预后较差，其诊断分级、基因突变水平及预后评估至关重要。磁共振（magnetic resonance imaging，MRI）是一种多模态成像技术，广泛应用于胶质瘤术前诊断及术后评估。近年来，随着科技进步，数字化医疗日渐发展，在大数据领域，人工智能凭借其高效的数据分析及信息提取能力，成为较多学科的研究热点，尤其是医学影像方面。深度学习（deep learning，DL）作为其新兴分支，如何高效应用于脑胶质瘤的临床诊断是当前的研究热点。

1 DL的基本概念

计算机问世于1940 年，经典算法作为机器的主要功能，包括决策树、普素贝叶斯分类算法、随机森林等，广泛应用于生产生活的各个领域，给人类的生活带来较大便利。然而，当人们想用此解决更高层次的问题时，经典算法不可避免的存在多种弊端。人工智能被称作是人类历史上的第四次工业革命［1］，其核心是机器学习。DL 作为机器学习的新兴分支，是最先进的技术，其采用多层人工神经网络（artificial neural network，ANN）模拟人脑［2］，与传统技术相比，DL 在较多领域都被证明具有更高的准确性，包括自然语言处理、计算机视觉和语音识别方面。其使用具有多层抽象的学习方法来处理输入数据，而不需要手动勾画图像，自动识别高维数据中的复杂结构，从而实现人工无法完成的目标。其整个过程旨在从原始数据中检测和提取高级特征。卷积神经网络（CNN）是目前最常用的DL 方法，主要应用于成像分析，在各个行业做出了突出贡献，并被广泛应用于其他学科，特别是对于医疗临床实际问题的解决［3-5］。如发现胸片中的结核病［6-7］、皮肤的恶性黑色素瘤［8］和罹患乳腺癌后组织切片上探及到的淋巴转移等［9］。

2 DL在脑胶质瘤中的应用

在WHO 中枢神经系统肿瘤分类中，针对肿瘤分级及基因分型越来越细［10］。大多数胶质瘤患者的治疗依赖于手术切除，而手术范围、切除后能否放化疗、治疗预后都与胶质瘤的性质有关。穿刺活检是获取其病理及分级的金标准，但术前需耗费大量的时间。因此，胶质瘤患者术前的MRI 影像在诊断分级中扮演重要角色。基于常见序列的DL 在胶质瘤的诊断分级、分割、预后等方面取得令人鼓舞的成果［11］。

2.1 肿瘤分割分割是在影像图像中分隔肿瘤区与正常灰质白质等区域，目的是使图像更加清晰化、直观化。RIBALTA等［12］充分利用CNN，通过输入T2 Flair 图像以获取肿瘤分级。该模型可应用于数据不平衡及存在异构的数据集，为其提供可控的训练时间，并实时推断。LUO 等［13］提出一种基于密集孔洞的3DU-Net 神经胶质瘤分割模型（DDNet），采用分类损失和交叉熵损失作为多重损失函数，改善分割中的类别不平衡问题，该模型的准确性在BraTS2018 数据集上得到验证。但其获取的分割图像较模糊，精度有待提高。Mixup 技术可用于数据增强，目前在急性淋巴细胞白血病多个疾病中得到应用，但对于大样本数据库的作用有限，DVORNIK 等［14］应用PytorchDL 框架研发一个新模型—TensorMixup。该模型具有混合效率，分割精度更高，并可得到多样化的数据。其使用张量混合图像信息及混合图像的ROI，完整肿瘤、肿瘤核心在研究中的Dice 系数值依次可达91.32%与85.67%。为进一步验证此模型性能，研究者将其与TumorMixup 及CutMix 进行对比［15］，结果显示TensorMixup 在上述区域的分割精度更高。KIKINIS 等［16］采用基于DL 的单次扫描检测（SSD）来分割转移的脑肿瘤。也有研究开发了DeepsegDL 模型［17］，通过Flair图像进行自动分割。上述模型均在一定程度上解决了分类不平衡的问题，但其都需对图像进行预处理，而FRANCISCO等［18］等研发了一种多路径CNN 全自动脑胶质瘤模型，该模型通过输入T1WI 图像，沿着不同处理路径在三个空间同时进行处理，在增加数据集的同时防止过拟合，其Dice 指数为0.828。同时，该模型还可用于脑膜瘤和垂体瘤的分类分割。

2.2 肿瘤分级目前脑胶质瘤最常用的是WHO 分级，按恶性程度从低到高分为I～IV 级。在临床治疗中，医务人员针对所采集到的病理信息进行分级，从而制定个性化手术方案，因此术前分级显得尤为重要。TIAN 等［19］采集术前T1WI、T2WI、DWI 序列，利用最优特征建立支持向量机（SVM）分类器，在低级别胶质瘤和高级别胶质瘤的区分上，其准确性为96.8%，在两种高级别胶质瘤的区分上，其准确性为98.1%。GUTTA等［20］基于CNN 网络，采用Grad-CAM 可视化算法对237 例胶质瘤患者进行600 次扫描，分级准确率为87%，但此样本均来自一个中心，是否可将其应用于多中心环境有待进一步考量。ZHUGE 等［21］应用3D CNN 网络在数据集进行5 次交叉验证，准确率为97.1%，相较传统卷积神经网络技术，3D CNN 网络具有更高的效率和准确度。MZOUGHI 等［22］采用T1 Gado 序列以区分肿瘤分级，获得96.49%的总体准确性，证实充分的数据增强可致分类的准确。DL 作为一种非侵入性胶质瘤分级的技术，在无需手术活检的情况下为治疗方案的选择提供指示信息，在临床得到广泛应用。

2.3 肿瘤分子水平 2021 年WHO 中枢神经系统肿瘤分类中强调了分子指标的重要性，应用相关分子病理指标判断肿瘤的相关生物学行为，对肿瘤进行诊断、鉴别诊断、预后生存分析，从而为临床决策提供依据［23］。

随着分子生物学的发展，越来越多的基因被证实与疾病相关，靶向药物、免疫疗法等保守治疗成为延长胶质瘤患者生存期的新方向。异柠檬酸脱氢酶（isocitrate dehydrogenase，IDH）参与三羧酸循环，广泛存在于真核生物多个细胞器，相关研究证实，IDH 突变的患者生存期较长，是进行临床分层的重要指标［24］。LIANG 等［25］提出了一种多模态3D Dense Net（M3D-DenseNet）模型，其准确率为84.6%。GE 等［26］利用基于DL 的半监督学习框架进行预测，取得较好的性能。CHOI 等［27］收集来自不同医院的1,166 例胶质瘤患者术前图像，基于T1、T2、flair 图像，开发了一种非侵入性模型，其AUROC 曲线下面积为0.86～0.96。该模型同时纳入肿瘤信号强度、大小形状、患者年龄等多个指标，无需任何依赖于操作员的过程。CALABRESE 等［28］提取基于DL 的肿瘤分割的放射组学特征来预测IDH 状态，该模型的敏感性为0.93，特异性为0.88。IDH 具有多个亚型，包括IDH 野生型和突变型。NALAWADE 等［29］提出一种仅输入T2WI 图像进行无创预测IDH 状态的自动管道，该图像具有最小的预处理，在预测无肿瘤、IDH 突变和IDH 野生型时，每个轴向切片的平均分类准确率达90.5%。其在分层随机化期间确保了受试者分离，最大程度的避免数据泄漏。目前预测IDH 突变的技术较为成熟，在临床得到较多应用。

IDH 突变常伴随着O6-甲基鸟嘌呤甲基转移酶（MGMT）启动子甲基化。MGMT 是一种与胶质瘤对卡莫司汀、替莫唑胺等药物的敏感性及耐药性有关的DNA 修复酶。相较其余患者，MGMT 甲基化患者通常生存期较长［30］。LEVNER 等［31］应用L1 正则化神经网络，对T1WI、T2WI、FLAIR 进行分析，使用基于S 变换的空间频率纹理分析提取特征，此模型在59例患者中取得87.7%的准确率。但其需要输入的图像较多，不可避免的存在图像无法处理等问题，因此YOGANANDA 等［32］开发了一种模型，仅使用T2图像，采取基于DL 的三维密集UNet 对247 例受试者的磁共振信息进行三重交叉验证，其敏感性和特异性分别为96.31%和91.66%。此模型仅使用T2WI，消除了图像采集伪影的潜在缺点，减少时间及成本，具有重要的里程碑意义。KORFIATIS 等［33］应用残余深度神经网络（ResNet）进行验证，发现ResNet 50 的准确度为80.72%，是目前性能最佳的模型。

1 号和19 号染色体缺失是胶质瘤，尤其是少突胶质细胞瘤的重要分子标志，1p/19q 共缺失的患者对烷化剂联合化疗治疗敏感。CHANG 等［34］使用2D CNN 模型，采取5 倍交叉验证方法，对256 个MRI 图像信息进行预测，其准确率为92%。此外，相关文献表明，1p/19q 缺失的肿瘤更可能在额叶皮质中发现［35］。这进一步证明DL 可以自动提取特征，而无需人为干预。

除上述常见的分子标记物以外，EGFR、TERT 基因启动子突变、Ki-67、BARF 基因、TP53 基因等［30］均被证实与胶质瘤诊断及预后有关。关于上述基因的相关临床预测较少，在未来有待进一步研究。

2.4 肿瘤预后 HAN 等［36］开发并验证一种结合放射组学特征的Elastic Net CoxDL 模型，通过T1WI 以预测胶质瘤患者长期生存的可能性，其log-rank 检验P=0.014。TANG 等［37］采用多任务卷积神经网络，从术前多模态磁共振成像中导出肿瘤基因型相关特征，而不需肿瘤分割，并将其用于总生存时间预测。与其他模型不同的是，其将特征学习与分类回归相结合，相关系数为0.4695，实现目前最高的生存预测精度。在胶质瘤的治疗过程中，通常包含着真性进展及假性进展。GAO 等［38］建立了ERN-Net 模型以鉴别肿瘤复发和假性进展，其敏感度为0.947，特异度为0.817。在2018 年BraTS 比赛中，FENG 等［39］基于3D U-Net DL 网络，开发的线性模型可预测低级别胶质瘤患者的预后，取得了冠军，为后续研究奠定了基础。NIE 等［40］提出两阶段学习方法，第一阶段提取T1WI、DTI、rs-fMRI 深层特征，并进行训练，第二阶段将肿瘤相关特征（肿瘤大小、组织学类型等）输入SVM 中，最终生成生存时间的长短。该多通道的DL 生存预测框架模型的准确率为90.66%，优于其余方法。LEE 等［41］采用全MRI 图像进行预测，证实多参数序列数据的CNN-LSTM 模型性能优于单个序列，其准确度为0.62～0.75。但上述研究均为回顾性研究，除相关显性特征外，患者的心理、术后恢复状况等因素均会影响预后，因此在未来，应前瞻性纳入相关患者，进一步实现个体化精准医疗。

3 小结与展望

DL 算法是多层算法，需要大量的处理能力，并且有数百万个参数。在现有的临床报道中，大多为小样本单中心的研究，其模型缺乏普遍实用性，此外，在有限的数据集进行运算训练时，有较大概率发生过拟合。当使用少量数据获得高准确度时，这个问题令人担忧。因此，在未来，需要收集大量数据，建立大样本多中心的数据库，以供学者们进行进一步研究，改善现有不足，建造更具有普适性的模型。DL 的技术亟待进一步深化。在传统的机器学习中，对图像特征选择和提取的预处理过程常需要专家干预，DL 直接从输入数据中挖取特征，具有非常大的灵活性和不确定性，这些不确定性和复杂性常使高精度的过程变得不透明，也使纠正给定数据集所产生的偏差变得更加困难。加之DL 有多个隐藏层，在实际应用中，很难解释其提取哪些单独的特征。此外，神经网络被批评为生成不可解释的特征向量的“黑匣子”，这限制了对图像分类潜在机制的深入了解。尽管DL 在肿瘤的分割、分级诊断、分子基因分型、预后预测等方面各有建树，但目前尚缺乏将其整合在一起的模型。开发一个将诊断、分型及预后于一体的模型，能减少临床医师及放射科医师诊断所需时间。近年来，除了上述常规序列外，还有扩散峰度成像（diffusion kurtosis imaging，DKI）、磁共振谱（MRS）等多个新兴的序列，为解决临床问题提供了新思路，未来有望将其与DL 相结合，成为下一个新的研究热点。