廖天双,陈东,李操,何如,刘思耘,陈光祥
脑膜瘤起源于蛛网膜粒帽细胞,是最常见的颅内脑外肿瘤。在成年人中约占中枢神经系统肿瘤的30%,而在儿童和青少年中则很少见(0.4%~4.6%)[1]。根据2016年WHO中枢神经系统肿瘤分类,将脑膜瘤分为Ⅰ-Ⅲ级,以反映其组织学特征以及复发率和临床预后情况[2]。脑膜瘤的病理级别越高,越容易复发,不同级别脑膜瘤的治疗方式也存在差异。
MRI是术前诊断脑膜瘤的重要手段,对脑膜瘤病理分级的判断有一定价值,但当脑膜瘤缺乏典型影像特征时,对其病理分级的预测非常困难。影像组学利用自动化高通量的特征提取算法,可从影像图中获取肉眼无法辨别的肿瘤内部特征,量化评估肿瘤整体的异质性,能更全面地反映肿瘤的病理特征。本研究旨在探讨基于多序列MRI的影像组学模型预测脑膜瘤病理分级的价值。
搜集2015年1月-2019年9月在西南医科大学附属医院行头颅MRI检查并符合本研究要求的215例脑膜瘤患者的临床和影像资料。其中,低级别(Ⅰ级)脑膜瘤174例,高级别(Ⅱ级34例+Ⅲ级7例)脑膜瘤41例。按照7∶3的比例,采用随机分层抽样方法将215例患者分为训练组(149例)和验证组(66例)。
纳入标准:病理证实为脑膜瘤且有脑膜瘤病理分级结果;在同一磁共振机上行T2WI、DWI和对比增强T1WI扫描;MRI图像质量好,无伪影干扰;所有序列的图像在患者接受手术治疗前10天内采集。
使用Philips 1.5T磁共振机和标准头部正交线圈。所有患者术前行T2WI、DWI和对比增强T1WI检查。扫描序列和参数如下。①横轴面SE T1WI:TR 490~1000 ms,TE 13~20 ms,层厚5.0 mm,层间距1.0 mm,视野240 mm×240 mm,矩阵256×256;②横轴面TSE T2WI:TR 3000~4400 ms,TE 80~110 ms,层厚5.0 mm,层间距1.0 mm,视野240 mm×240 mm,矩阵256×256;③横轴面SE-EPI DWI:TR 2300~2900 ms,TE 74~87 ms,b=0、1000 s/mm2,层厚5.0 mm,层间距1.0 mm,视野240 mm×240 mm,矩阵128×128;④对比增强T1WI:对比剂使用Gd-DTPA,经肘静脉注射,剂量0.1 mmol/kg, 注射流率1.0 mL/s,其它扫描参数同T1WI。
从PACS系统中导出所有患者的图像并以DICOM格式导入ITP-SNAP软件。分别在T2WI、DWI和对比增强T1WI图像上逐层手动勾画肿瘤的边界,提取出整个肿瘤的体积作为感兴趣区。在勾画的过程中,沿肿瘤边缘内侧1~2 mm处划线,尽可能包括肿瘤内的所有成份,包括囊变、出血等,注意避开病灶周围的水肿区及血管,如肿瘤境界不清晰,则参考其它能清晰显示肿瘤边界的序列进行勾画(图1)。采用AK软件V3.1.0.R提取病灶的六大类共396个影像组学特征,包括直方图(histogram)、形态学(form factor)、纹理(texture)、灰度共生矩阵(gray level co-occur-rence matrix,GLCM)特征、Haralick、灰度游程矩阵(gray run length matrix,GLRLM)及灰度区域大小矩阵(gray-level size zone matrix,GLSZM)特征。
图1 肿瘤三维ROI提取过程示意图。
训练组数据用于影像组学特征的选择及模型的建立,验证组数据用于评估模型的预测效能。在特征选择前,首先采用中位数填补缺失数据,并对特征数据进行标准化。然后使用Spearman相关分析,计算影像组学特征间的相关系数r,设置阈值为0.9,去除|r|>0.9的高相关特征。最后采用多元logistic回归算法对特征进行降维并构建影像组学标签。最后再采用logistic回归分析对前述步骤获得的3个单独序列的影像组学标签进行综合分析,构建综合3个序列的多序列影像组学标签。
采用受试者操作特征(ROC)曲线来评价影像组学模型的预测性能,计算曲线下面积(area under the curve,AUC)及相应的诊断符合率、敏感度及特异度。
使用SPSS 25.0软件进行统计学分析。对两组间患者性别的比较采用χ2检验;对患者的年龄进行正态性和方差齐性检验后,采用独立样本t检验进行组间比较。使用R软件进行Spearman相关分析和多因素logistic回归分析,对AK软件提取的各个序列的特征参数分别进行降维,获得鉴别诊断效能最佳的特征参数,然后进行多因素logistic回归分析,建立预测模型,最后通过R软件绘制其ROC曲线。所有统计学结果以P<0.05为差异具有统计学意义。
本研究中,低级别脑膜瘤组共174例,男45例、女129例,平均年龄(54.0±10.2)岁;高级别组共41例,男14例、女27例,平均年龄(55.3±14.0)岁。两组之间年龄和性别构成的差异均无统计学意义(t=-0.529,P=0.559;χ2=1.144,P=0.285)。
训练组和验证组中脑膜瘤病理分级情况见表1。
表1 训练组和验证组病例数分布
分别基于T2WI、DWI和对比增强T1WI单序列图像上提取的影像组学特征建立的3个脑膜瘤病理分级预测模型中,基于对比增强T1WI的影像组学模型的诊断效能最高。基于3个序列构建的联合模型,其诊断效能较基于增强T1WI的预测模型略有提高,详见表2、图2。
图2 各预测模型的 ROC 曲线。a)为各预测模型在训练组的ROC曲线;b)为各预测模型在验证组的ROC曲线。黑线为基于3个序列联合影像组学模型的ROC曲线;蓝线为基于增强T1WI的影像组学模型的ROC曲线;黄线为基于T2WI影像组学模型的ROC曲线;绿线代表基于DWI影像组学模型的ROC曲线。
表2 基于单序列及联合预测模型的诊断效能
脑膜瘤是常见的颅内间叶组织起源肿瘤,通过影像学方法评估脑膜瘤病理级别对临床决策有着积极的意义。目前,CT和MRI是脑膜瘤诊断和监测最常用的影像诊断方法,但高、低级别脑膜瘤有时会表现出相似的影像学特征,常导致常规MRI不能准确判断脑膜瘤的高、低级别。影像组学利用自动化高通量的特征提取算法,可客观量化评估肿瘤整体异质性,近年来引起了广泛关注。因此本研究采用基于多序列MR图像的影像组学模型预测脑膜瘤的病理级别。
近年来,有国内外学者尝试通过提取MR图像上脑膜瘤的纹理特征,用影像组学方法来量化医学图像上潜在的信息,从而鉴别脑膜瘤高低级别。在虞芯仪等[3]的研究中,基于常规MRI图像进行纹理分析,结果显示T2WI、FLAIR和ADC图像上提取的标准差、ADC和FLAIR图像上的偏度、对比增强T1WI、T2WI、FLAIR和ADC图像上的熵,在高低级别脑膜瘤组间的差异具有统计学意义(P<0.05),而且联合4个序列的熵值对预测脑膜瘤分级的效能最佳,AUC可达0.799。类似地,张媛等[4]对多参数MR图像进行纹理分析,结果显示ADC图像上的偏度值、T2WI和ADC图像上的熵值对脑膜瘤病理分级有较强的预测能力,而且三者联合时的AUC值可高达0.84 。国外学者Park等[5]通过分析基于增强T1WI的影像组学特征,发现脑膜瘤级别不同,其影像组学特征值不同,高级别脑膜瘤有较高的熵、相异度和粗糙度,而游程长度均匀性较低。类似地,Laukamp等[6]分析了多个序列MR图像上脑膜瘤的影像组学特征,发现FLAIR图像上病灶的形态学特征中的圆度、FLAIR和增强T1WI图像上灰度集簇阴影、DWI和ADC图像上的灰度不均匀性、FLAIR和增强T1WI图像上的灰度能量,这4个影像组学特征预测脑膜瘤病理级别的诊断效能最高,这些特征的联合诊断模型区分Ⅰ级与Ⅱ级脑膜瘤的AUC可高达0.91。由此可见,影像组学特征可用于预测脑膜瘤的病理分级,且影像组学特征联合模型预测效能更佳。需要指出的是,上述这些学者的研究结果均显示出基于MR各序列的影像组学模型及多参数联合模型对脑膜瘤病理分级具有一定的预测价值,但这些研究中均未设立验证组对模型的诊断效能进行验证,也缺少对模型的客观评价。
本研究基于多序列MR图像建立的脑膜瘤病理分级预测模型在训练组和验证组均表现良好。由于各序列图像上所提取的影像组学特征有一定差异,建立的预测模型的诊断效能也不同。在本研究中的单序列模型中,基于增强T1WI建立的影像组学预测模型的预测性能最高,其在训练组的AUC值为0.942,明显高于基于T2WI及DWI 预测模型的AUC值(分别为0.746和0.714);而基于增强T1WI的影像组学预测模型在验证组中的AUC值也明显高于T2WI和DWI(分别为0.913、0.714、0.705)。本研究结果与既往的研究结果基本一致[7]。基于DWI的影像组学模型的符合率相对较差,这可能与DWI序列的失真效应有关,因脑膜瘤多位于大脑凸面和颅底,邻近骨质和鼻窦造成的异质磁场可能导致DWI图像上局部结构变形,从而影响对肿瘤的显示和识别。
本研究结果显示,对于预测脑膜瘤的病理级别,基于多序列MRI的联合模型在训练组及验证组中的AUC值分别为0.950和0.923,AUC值高于基于单序列的预测模型,此结果与既往的研究结果相似[8]。这可能是因为与单序列模型相比,多序列MRI联合模型是由来自三个序列的数据所构建,包含的信息更多,能更充分、准确地反映肿瘤内部的特征。但在本研究中,基于多序列MRI联合预测模型的预测性能较基于增强T1WI的影像组学模型差别不大,可能是由于在三个序列图像上所选择的影像组学特征中,T1WI增强图像上保留的特征占了绝大部分,对模型预测性能起主要作用。在Hamerla等[9]利用影像组学预测脑膜瘤病理级别的研究中,尝试了随机森林(random forest,RF)、极端梯度增强(extreme gradient boosting,XGBoost)、支持向量机(support vector machine,SVM)和多层感知器(multilayer perceptron,MLP)四种分类器,并对所构建的不同分类器进行比较,构建出预测效能最佳的多参数MRI影像组学模型,其AUC高达0.97 ,高于笔者研究中的多参数MRI联合模型,这可能与该研究组合了更多MR序列的影像组学特征以及分类器选择不同有关。Yan等[10]基于增强T1WI提取了形态学特征和纹理特征参数,并分别基于形态学特征、纹理特征、形态学特征联合纹理特征,并分别采用逻辑回归(logistic regression,LR)、朴素贝叶斯(naive Bayes,NB)和SVM方法来构建脑膜瘤分级预测模型,并对这3个模型的预测效能进行比较,发现形态学特征联合纹理特征的SVM分类器具有最佳的预测性能。这项研究为以后分类模型的选择提供了依据。郑茜等[11]比较了常规影像特征模型与影像组学特征模型对脑膜瘤病理分级的预测性能,也证实了影像组学分析在脑膜瘤病理分级中具有较高的应用价值。
本研究存在一定的局限性:第一,由于高级别脑膜瘤的发病率相对较低,因此脑膜瘤分级中的数据不均衡,高级别脑膜瘤的病例数较少;第二,本研究中采用手动方法来分割肿瘤,虽然手动分割可能比自动方法更准确,但由于部分病灶边界判定困难,分割不准确的问题仍然不能完全避免;第三,本研究仅使用逻辑回归分类算法建立影像组学预测模型,并没有尝试构建其它常用的分类模型,如支持向量机、随机森林和卷积神经网络等。但是,本研究的目的在于验证影像组学模型可以用于准确鉴别脑膜瘤的病理级别,以及如何选择合适的MRI序列来建立影像组学模型使得预测性能更佳,而不是为了比较各种分类算法的优劣。
综上所述,基于多参数MRI数据的影像组学模型可用于术前预测脑膜瘤的病理级别,为临床制订个性化的治疗策略提供客观依据。