朱雪超,何玉麟,邬莺莺,黎斌,万天意,唐辛,余秋月
作者单位:南昌大学第一附属医院放射科,南昌 330006
胶质瘤是大脑神经系统最常见的神经上皮肿瘤,其中以胶质母细胞瘤(glioblastoma,GBM)WHOⅣ级恶性程度最高[1]。在众多已报道的生物标志物中,组织学分级和Ki-67增殖指数是两个重要的生物学行为标志物。Ki-67核抗原与细胞增殖密切相关,它存在于细胞周期的所有活跃期(细胞周期的Gap1期、合成期和Gap2期)和有丝分裂,但在静止(Gap0)细胞中不存在[2]。Ki-67增殖指数由Ki-67免疫组织化学(immunohistochemistry,IHC)测定,与胶质瘤的组织学恶性程度密切相关[3],分化差的肿瘤其Ki-67表达水平也相应较高。临床上,Ki-67增殖指数对肿瘤的诊断、治疗及预后具有指导作用[4]。因此,高精度地术前预测肿瘤Ki-67表达水平有利于准确评估肿瘤生物学行为,为胶质瘤患者的精确治疗提供帮助[5]。影像组学是指从医学图像中提取和分析大量的人眼无法识别的定量成像特征,既往的研究证明了定量成像特征与医学结果之间的预测或预后关系[6-7]。目前通过影像组学模型术前预测胶质母细胞瘤Ki-67表达水平的研究较少,因此本研究拟通过T2WI建立预测胶质母细胞瘤Ki-67表达水平的影像组学模型。
本回顾性研究经南昌大学第一附属医院伦理委员会批准,免除受试者知情同意。收集我院2016年1月至2020年7月确诊为胶质母细胞瘤的患者。纳入标准:(1)经手术病理证实的GBM;(2)术前均在我院行常规MRI检查,其中包括轴位T2WI;(3)术后病理学检查包括Ki-67增殖指数;(4)磁共振图像无明显干扰分析的伪影;(5)患者术前无放化疗史。
最终纳入GBM患者96例,参考Beesley等[8]的研究将Ki-67表达水平根据阳性率分为4级:0~4%为0级,5%~24%为1级,25%~49%为2级,50%以上为3级。本研究根据Ki-67表达水平分为低表达组(0~2级,Ki-67表达水平<50)和高表达组(3级,Ki-67表达水平≥50),其中低表达组中0~4% 0例;5%~24% 25例;25%~49% 32例,具体分组见表1。
表1 患者临床信息
所有患者轴位T2WI均在我院采集,具体设备及参数:德国Siemens Avanto 1.5 T磁共振扫描仪,扫描参数:TR 4200 ms,TE 109 ms,层厚5 mm,层间距1.5 mm,矩阵384×241,FOV 23 cm×23 cm;德国Siemens Trio Tim 3.0 T磁共振扫描仪,扫描参数:TR 4000 ms,TE 113 ms,层厚5 mm,层间距1.5 mm,矩阵256×256,FOV 22 cm×22 cm;德国Siemens Skyra(DE)3.0 T磁共振扫描仪,扫描参数:TR 4000 ms,TE 120 ms,层厚5 mm,层间距1.5 mm,矩阵384×384,FOV 24 cm×24 cm;美国GE Optima MR360 1.5 T磁共振扫描仪,扫描参数:TR 3800 ms,TE 100 ms,层厚5 mm,层间距1.5 mm,矩阵256×256,FOV 24 cm×24 cm。
1.3.1 图像分割和特征提取
本研究选取T2WI轴位图像进行感兴趣区(region of interest,ROI)勾画,由1名经验丰富的放射科医生使用开源的ITK-SNAP 3.8.0 (www.itksnap.org)软件对图像进行处理,在每个层面沿病灶边缘人工勾画二维ROI,得到感兴趣体积(volume of interest,VOI)(图1),另一名高年资影像医师检查勾画结果,遇到意见不一致的情况需经二者协商,直到他们就每个轴向T2WI上瘤体区域达成一致,最后将得到的VOI图像以nii.gz格式保存,以进行后续处理。
图1 ITK-SNAP软件对瘤体进行图像分割图2 63个特征的最小绝对收缩与选择算子系数曲线,在最佳lambda时选定的7个系数不为0的特征图3 基于T2WI筛选出的不同特征及其权重 图4 基于T2WI的三种机器学习模型ROC曲线
在提取特征前,对所有图像进行预处理,预处理包括图像归一化、重采样和偏置场校正:灰度归一化使所有MRI图像像素的灰度值分布在0~255,避免因图像对比度不足或像素亮度分布不平衡而对后续图像处理的影响,将不同的扫描设备和参数造成的差异最小化,此外将所有患者的MRI图像重新采样为1 mm×1 mm×1 mm的均匀体素大小,以进行后续图像处理;由于扫描仪本身以及扫描过程中的偏差等因素可导致MRI上的亮度存在差异,因此通过偏置场校正尽量减少由于不同扫描机器磁场的变化导致的强度不均匀性。
影像组学特征的提取通过Python的pyradiomics模块实现,提取出的特征包括形态学特征、纹理参数和小波变换特征,纹理参数包括:一阶特征、灰度共生矩阵参数、灰度游程长度矩阵参数、灰度尺寸区域矩阵、灰度依赖性矩阵参数。共计提取出806个影像组学参数,包括4个特征组:14个形态学特征、18个一阶特征、70个高阶特征和704个小波特征,小波变换特征为原始图像进行8个方向的小波变换后(在三个维度中的每一个中应用高通或低通滤波器的所有可能组合),对除形态学特征以外(形态特征只能在原始图像提取)的特征重新提取,对肿瘤进行多维全面的量化,重新提取的特征参数与原始图像提取的特征类别相同。
特征定义和计算算法可在PyRadiomics官网中找到(https://pyradiomics.readthedocs.io/en/latest/features.html)。
1.3.2 影像组学特征的筛选
所有数据按照70%∶30%的比例分为训练组和测试组,训练组用来进行特征筛选和建立影像组学模型,测试组的数据用来对建立的模型进行验证。
特征筛选过程:将获得自T2WI的所有影像组学特征导入Python 3.8软件中,首先对数据组进行标记,Ki-67低表达组标记为“0”,高表达组标记为“1”,并对数据集中所有的特征变量进行标准化处理,然后通过t检验剔除两组参数间差异无统计学意义的参数,最后通过最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)进行进一步的筛选。
1.3.3 影像组学模型训练及验证
影像组学模型的建立通过Python(3.8.0)和机器学习库scikit-learn(23.0)实现,通过特征筛选后训练组的数据分别对随机森林(random forest,RF)、Logistic回归和支持向量机(support vector machine,SVM)三种常用的机器学习算法进行训练并建立相应的影像组学模型,测试组的数据用于对训练好的模型进行验证,最后的结果以准确度、敏感度、特异度、AUC表示。
1.3.4 统计学方法
临床资料的统计学分析采用SPSS 24.0软件,计量资料以(±s)表示,通过Kolmogorov-Smirnov test检验数据是否符合正态分布,组间比较采用t检验或Mann-Whitney检验,分类资料采用χ2检验。在所有统计结果中,以P<0.05为差异有统计学意义。
ROC曲线分析评估影像组学模型的诊断效能,以准确度、敏感度、特异度和AUC值表示。0.5≤AUC值<0.7时模型诊断价值较低,0.7≤AUC值<0.9时模型诊断价值中等,AUC值≥0.9时模型诊断价值较高。
Ki-67低表达组和高表达组的年龄、性别差异均无统计学意义。
通过t检验共筛选出63个特征,进一步通过LASSO回归筛选出7个特征(图2),经过特征筛选后得到的7个特征包括一阶特征2个,灰度共生矩阵(gray-level co-occurrence matrix,GLCM)特征1个,灰度相关矩阵(gray level dependence matrix,GLDM)特征3个,灰度区域大小矩阵(gray-level size zone matrix,GLSZM)特征1个,具体特征名、特征权重见图3。wavelet-LHL_firstorder_InterquartileRange代表原始图像经过小波变换提取的一阶特征中的InterquartileRange特征。
三种影像组学模型的准确度、敏感度、特异度与AUC,具体数值见表2,绘制的ROC曲线见图4。
表2 机器学习ROC分析结果Tab.2 ROC analysis of machine learning methods
Ki-67是一种细胞增殖的生物标志物,在中枢神经系统肿瘤的常规分级和预后分析中应用广泛[9],随着胶质瘤分级的增高,Ki-67表达水平也明显升高[10],多项研究证实,不同Ki-67增殖指数表达水平的肿瘤在细胞增殖、细胞分化、亚克隆区组成等方面存在显著差异[11-13],这些差异隐含在医学图像中人眼无法识别的图像纹理特征(如像素值、灰度和复杂性等)中。
自2012年影像组学的概念提出以来,高通量纹理分析作为一种新技术被应用到肿瘤诊断的研究中,既往的研究显示了影像组学在预测不同类型肿瘤Ki-67表达水平的良好应用前景,Liang等[14]分别通过T2WI和增强扫描图像建立预测乳腺癌Ki-67表达水平的影像组学模型,结果T2WI影像组学模型对Ki-67表达水平显示出良好的识别力,AUC为0.74;Gu等[15]通过CT图像建立了6种影像组学模型对非小细胞肺癌Ki-67表达水平进行预测,其中RF模型效能最高,AUC为0.78;Wu等[16]研究了CT图像影像组学特征评估肝细胞癌Ki-67表达水平的能力,AUC为0.78~0.84。
本研究基于T2WI建立了三种影像组学模型对胶质母细胞瘤Ki-67表达水平进行预测,最后结果显示RF模型的诊断能力最好,准确度、敏感度和AUC均最高,但整体诊断效能仍属于中等;Logistic回归模型的诊断效能在三种模型中最低,SVM模型的诊断效能介于RF和Logistic回归之间;在本研究建立的不同类型的机器学习分类器中,不同的分类器表现出不同的预测性能,AUC在0.63~0.72之间,说明分类器模型类型的选择对结果有影响。其中,RF分类器在准确度、特异度和AUC方面优于其他类型的分类器。从方法论的角度看,RF是一组决策树,决策树的机制可以利用不同的特征进行补偿,多个弱树分类器可以组合成强分类器。因此,一组决策树即使基于弱特征集也能产生很好的分类结果[15]。其他的一些研究[15,17-18]也表明,RF模型的性能优于其他分类器,这与我们的结果是一致的。Logistic回归是机器学习中常用的经典分类方法之一,主要用于解决分类问题,结果容易受数据质量的影响[19],在本项研究中,诊断效能不及另外两种模型,但其结果的可解释性较好,因此也有一定的临床应用价值。SVM是一种强大和有效的机器学习分类器,主要应用于神经成像和分子生物学领域,在小样本情况的机器学习问题中应用较广泛,在刘哲等[19]鉴别胶质瘤和脑转移瘤的研究中,SVM模型的效果优于Logistic回归和朴素贝叶斯,但Ma等[20]在乳腺癌预测Ki-67表达水平的研究中,朴素贝叶斯模型优于SVM模型,这可能与不同肿瘤的生物学行为及数据的选取有关。
3.3.1 无创性手段避免了临床活检
Ki-67表达水平对肿瘤的诊断、治疗及预后具有重要指导作用,目前Ki-67指标的获取依赖组织病理活检,反复活检不仅有创而且容易产生抽样误差,通过组学模型预测Ki-67表达水平弥补了传统病理活检有创性、存在抽样误差和临床难以获得满意数据等局限性,同时可以作为肿瘤的长期随访手段为肿瘤的诊治提供指导,虽然本研究中基于T2WI建立的影像组学模型的诊断效能中等,但提示了该方法的可行性,同时本研究也显示了通过不同的机器学习模型构建的影像组学模型诊断效能的差异,之后通过其他机器学习方法,如神经网络等深度学习方法结合大样本有可能得到更加有价值的结果,为无创性评估胶质母细胞瘤患者Ki-67表达水平提供一种稳定、可行的方法。
3.3.2 符合临床实际需求
(1)本研究选择了T2WI进行特征提取,T2WI作为常规MRI扫描序列广泛应用中枢神经系统肿瘤的诊断中,避免了部分肾功能不全和过敏体质患者使用增强扫描的限制,同时也方便部分缺少功能MRI扫描序列的医疗机构的应用。(2)T2WI对肿瘤内部的坏死、囊变等更为敏感,有研究显示T2WI可在一定程度上反映肿瘤的恶性程度,Schieda等[21]发现T2WI信号增强提示前列腺癌级别较高,此外,Jha等[22]的一项研究发现T2WI上信号强度的增强与肝细胞癌生长的增加有关,这可能预示着更具侵袭性的肿瘤生物学行为。(3)实际工作中,患者的检查图像大多由不同机器采集,因此本研究收集了不同扫描机器的MR图像,通过偏置场校正、重采样等预处理,提高了结果的泛化性。
除回顾性研究的局限性以外,还有以下几点不足:(1)目前多中心合作的验证发展尚不完善,因此本研究缺少多中心对照试验。(2)未对ROI的勾画进行一致性检验,但勾画结果由另一名高年资医生进行了复核。(3)本次研究仅包含胶质母细胞瘤,未对其他病理类型的胶质瘤进行研究。未来研究方向:探究对不同级别的胶质瘤Ki-67表达水平预测的可行性,以及对其他生物标志物的预测;此外,增加样本量和外部验证以提高结果的可信度也是未来研究的方向。
综上所述,本次研究中虽然基于T2WI的影像组学模型对Ki-67表达水平预测效率中等,但与其他常规或功能性MRI序列相结合,可能会为评估肿瘤的增殖行为提供有价值的帮助。
作者利益冲突声明:全体作者均声明无利益冲突。