王树杰 杨 明 朱美娇
儿童神经系统肿瘤的发病率仅次于淋巴造血系统肿瘤,为第二好发肿瘤,居儿童实体肿瘤的首位[1]。肿瘤的定性和分级影响着对临床治疗方式的选择及预后的判断,故术前如何最大程度地获取精准的肿瘤影像学信息,从而更好地进行肿瘤的定性及生物特性评估,有着极其重要的意义。而磁共振成像(magnetic resonance imaging,MRI)因其软组织分辨力高、无射线损伤,已经成为儿童脑肿瘤的临床常规检查方法。另一方面,随着传统医疗模式向精准医学模式的转变,可从标准医学影像中高通量提取和挖掘图像定量特征用于临床决策支持系统的影像组学(radiomics)应运而生,并发挥着越来越重要的作用。为此,本文拟对MRI数据来源的儿童脑肿瘤的影像组学方法的应用及研究进展作一综述,以期为儿童脑肿瘤的分类、预测及临床决策提供参考。
组学这个词最早起源于分子生物学,用于描述生物分子的细节特征,其特点是从一个单一对象或样本生成复杂的高维数据。而影像组学的概念是由荷兰学者Lambin等[2]于2012年提出,它指的是提取定量的影像学特征进行分析,从中找到疾病的影像学标志物,并与基因分型、预后、治疗效果等临床信息相关联,通过构建数学模型,最终实现对相关临床信息的诊断、评估与预测[3],现已发展成为一个特色鲜明的医工交叉研究领域。由于影像组学方法相较于有创活检能更深入、全面、动态、无创地反映肿瘤的整体信息,已被广泛应用于癌症的早期诊断、预测和治疗之中,是当今国内外影像医学及其相关专业的研究热点[4-6]。
影像组学研究的方法框架主要分为图像采集和重组、图像分割、特征提取和筛选、数据库建立及分析建模等4个部分[7]。①图像采集和重组。首先需要对数据采集的标准进行统一,尽量保持扫描参数、重组数据的一致性,这样才能满足统一数据标准的要求。②图像分割。即对感兴趣区域,如肿瘤、正常组织或其他解剖结构的提取。图像分割的结果受到主观因素的影响,最优方法是尽可能地降低主观因素,并且提供精确的可再生边界图像。③特征提取和筛选。主要是选择对于正常和异常影像图像特征的描述中的有用信息,包括图像的强度、形状和纹理特征等。强度特征描述的是包含感兴趣容积(volume of interest,VOI)的体素灰度值的直方图,且基于该直方图特征,还可以进一步计算一些常用的统计量,如均值、最大值、最小值、偏度、峰度等;形状特征描述的是感兴趣区的尺寸和三维形状;纹理特征通常是使用一阶(单体素)、二阶(双体素)和高阶(更多体素)统计方法来进行数学提取,通过图像强度离散化方法来定性或定量描述。④数据库建立及分析建模。包括存储数据、建立完整的工作系统、分析整合临床数据、使用相应软件进行统计学分析并获得具有最佳诊断效能的特征组合。
目前,影像组学在脑肿瘤中的应用主要见于成人,在成人脑肿瘤的诊断、分型及预后方面显示出了巨大的潜力。
当前研究主要集中在胶质瘤[8-10],取得了令人瞩目的成果。研究的方向也在不断深入,除了常规的肿瘤定性诊断[11],研究者们还研究了脑肿瘤的分级。例如,Cho等[12]等分析了210例高级别和75例低级别脑胶质瘤,勾画了多个MRI序列的感兴趣区,提取了468个特征参数,使用了logistic回归、支持向量分类器、随机森林等3种分类器,并分别用受试者操作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)大小来评估其分类性能,平均AUC达0.94。
与此同时,还有科研人员利用影像组学技术针对胶质瘤的不同亚型进行了研究[13]。除了常规序列,也有越来越多的功能序列出现在影像组学研究中,使影像组学在成人脑肿瘤中的应用得到更深入探索[14-15]。
随着基因靶向治疗的进展,影像组学领域的研究者也进行了其与基因相关性方面的探索。Zinn等[16]利用影像组学技术首次实现了对胶质母细胞瘤的多基因预测,利用半自动勾画软件,发现T2/FLAIR序列更容易检测到癌细胞的迁移和入侵,并且与骨膜蛋白基因POSTN和miR-219的表达关系密切。
此外,利用影像组学方法对脑胶质瘤患者预后、生存率等进行的评估也被证明是可行的[17-19]。而其他类别脑肿瘤,如脑转移瘤虽是颅内肿瘤中最常见的类型,但在影像组学与基因相关性方面的研究相对较少[20-21]。
影像组学在儿童脑肿瘤中的应用较成人少见,且样本量较小,多见于颅后窝脑肿瘤的研究,其中,脑肿瘤的分类研究报道较多。Bull等[22]用logistic方法回顾性分析了54例罹患6种类型儿童脑肿瘤患儿的术前MRI资料,仅根据表观弥散系数(apparent diffusion coeffecient,ADC)直方图的第75百分位数即可将80%的幕下室管膜瘤(ependymoma)、94%的髓母细胞瘤(medulloblastoma)和100%的星形细胞瘤(pilocytic astrocytomas)区分开来,并且发现用峰值与偏度值可以将非典型性畸胎样/横纹肌样瘤与原始神经外胚层脑肿瘤完全鉴别。同时,国内学者回顾性分析了288例较大样本的儿童颅后窝脑肿瘤分类比较,发现基于常规MRI的机器学习方法与人工专家定性结果相比,对儿童颅后窝肿瘤的分类准确度较高[23]。
为深度挖掘不同脑肿瘤的差异性,专家们开始将多模态影像纳入研究,Orphanidou-Vlachou等[24]学者用Mazda软件对40例儿童颅后窝常见的3种脑肿瘤的主要成分进行特征提取,并分别采用概率神经网络(probabilistic neural network,PNN)、线性判别分析(linear discriminant analysis,LDA)这2种分类器,根据T1WI和T2WI序列的特征参数对样本进行分类,发现LDA分类器分类准确度要优于PNN分类器,且单一序列特征参数的鉴别诊断效能竟高于2个序列的联合。由此可见,不同的样本、不同的序列所获得的不同的特征,其在定性价值方面的作用是不同的。Rodriguez Gutierrez等[25]计算了17例髓母细胞瘤、16例星形细胞瘤、7例幕下室管膜瘤的增强T1WI、T2WI序列和ADC等3个序列下的肿瘤形态学及纹理特征参数,并将获得的优势特征进行组合判断,发现使用ADC直方图中第25、第75百分位数及偏度组合的支持向量机(support vector machine,SVM)分类器鉴别儿童颅后窝常见的3种脑肿瘤的正确率最高,达91.4%。其中,由于髓母细胞瘤和室管膜瘤影像学表现具有相似性,故而成为鉴别诊断的关键点,国内有学者[26]专门针对这两类脑肿瘤进行了影像组学分析,以多变量logistic回归作为特征选择方法,发现用随机森林分类器建立的模型性能最好,AUC为0.91。近年来,随着多模态影像信息的纳入及算法的改良,对同一类型但不同级别脑肿瘤、不同病理和不同基因分型脑肿瘤的区分能力进一步提升,这其中,对髓母细胞瘤的研究最多见。髓母细胞瘤是最常见的小儿恶性脑肿瘤,约占中枢神经系统恶性肿瘤的15%~20%,其 中40%位 于 颅 后 窝[27]。2014年,Rodriguez Gutierrez等[25]意外地发现ADC纹理参数(灰度共生矩阵方法计算得到的均值与方差组合)而不是ADC直方图参数可以鉴别经典型与非经典型髓母细胞瘤,其正确率达到89%,但是由于样本量的限制(仅17例),对其他病理分型未能作进一步的区分。
随后,影像组学衍生出了影像基因组学(radiogenomics)[28]等 诸 多 新 概 念。2018年,Dasgupta等[29]从髓母细胞瘤的分子分型角度入手,回顾性分析了目前最大样本量的111例髓母细胞瘤患者的MRI序列的19个特征,其中,76例患者作为训练集,35例作为验证集。结果显示,用logistic回归分析可以正确诊断95%的SHH型和78%的Group 4型髓母细胞瘤,分类最优的SHH型训练集和验证集AUC分别为0.939和0.991;相比之下,对Group 3和WNT的鉴别效果相对较弱。紧接着在2019年,有专家使用常规T1WI、T2WI序列进行儿童髓母细胞瘤的分子分型研究,并使用多中心数据交叉验证,也同样发现WNT组需要更多的训练样本才能产生稳定的预测结果[30]。由于儿童脑肿瘤样本量偏少,使用单个儿童医疗中心的病例进行机器学习以及深度学习存在一定的困难,所以多中心开展影像组学研究很有必要性,如2018年Fetit等[31]开展的多中心研究探讨了纹理特征在儿童脑肿瘤中的应用,发现尽管不同医院的MRI图像在纹理信息上存在差异性,但当使用其他医院的数据进行测试时,仍可以成功对其中某一家医院的脑肿瘤类型进行分类,且提高了模型的准确度,这对于影像组学可以进一步应用于临床来说是一个重要发现。
影像组学在评估儿童脑肿瘤生存率方面的应用研究也有少量报道。Poussaint等[32]分析了140例确诊的脑桥胶质瘤患儿放疗前后的头颅MRI,第一次发现ADC直方图与此类患儿生存率有相关性,同时发现了FLAIR序列、ADC序列直方图参数与无进展生存期(progression-free survival,PFS)、总体生存期之间的关系。类似地,Zukotynski等[33]采集了33例儿童弥漫性脑桥胶质瘤的18F标记脱氧葡萄糖(fluorine-18 fluorodeoxyglucose,18F-FDG)正电子发射体层成像(positron emission tomography,PET)及MRI影像数据,并收集了患儿PFS及其他临床资料,发现PET与ADC直方图参数(偏度、峰值)呈负相关,负相关程度越大即代表PFS越短。同时,国内也有部分文献报道用MRI影像中T2WI直方图评估髓母细胞瘤复发风险[34],以上均说明基于MRI的影像组学可通过融合影像、基因和病理特征建立识别标签,揭示影像特征与儿童脑肿瘤复发风险及生存率评估之间的关系,在未来具有很大的发展潜力。
综上所述,儿童脑肿瘤的影像组学研究已经开展,但是与成人脑肿瘤的研究相比,还存在一些不足。①儿童脑肿瘤的影像组学研究多数集中于T1WI、T2WI、FLAIR及ADC等常规序列,而成人脑肿瘤已经开始纳入功能MRI影像数据,如局部脑血容量(regional cerebral blood volume,rCBV)、脑灌注图像、BOLD及波谱序列等[35-37]。②目前发表的文献显示入组儿童脑肿瘤研究的样本量相对较小,缺乏不同研究中心之间的验证,且影像组学的可重复性较弱,操作过程中会存在人为因素导致的误差[18]。③儿童是一个特殊的群体,配合度差,采集高质量的影像数据难度较成人大,这给影像组学的进一步开展带来了困难。④儿童处于一个生长发育的动态过程中,几天至十几岁人群的生长发育情况差异性很大,且受患儿家庭情况等因素影响较大,如何合理地控制研究中的变量因素,也是我们在纵向追踪儿童脑肿瘤患儿中需要关注的问题。
总之,有关儿童影像组学的研究尚处于初级阶段,基于MRI的儿童脑肿瘤的影像组学研究从图像采集、影像分割、特征提取与量化和分析乃至模型建立等方面仍有许多问题亟待解决,而多学科合作是促进影像组学蓬勃发展的基石。面对当前儿童脑肿瘤影像组学的研究现状,还需要广大关注儿科学发展的医务工作者进行更大样本、更多中心的研究,使之在儿童脑肿瘤的分类、预测及临床决策中发挥更多的指导作用。