徐玉芸 石林 刘一骏 陈方宏
胶质母细胞瘤(glioblastoma,GBM)是成人中最常见、最致命的原发性恶性脑肿瘤[1]。尽管进行了最大程度的手术切除及术后放化疗,GBM患者预后仍然很差,中位总生存期(overall survival,OS)仅为10~14个月[2]。不同GBM患者的生存期和化疗反应差异较大,可能与GBM的异质性相关[3]。虽然异柠檬酸脱氢酶突变等基因型对患者预后的评估有重要价值,但需要在手术后才能获得,且时间周期较长。穿刺活检可以明确肿瘤病理,但只能提供肿瘤活检部位的有限信息,而不能反映整个肿瘤的特征,特别是肿瘤内部的异质特征[4]。颅脑MRI可以全面无创地评估肿瘤的异质性,对患者预后的判断和个性化治疗具有重要临床意义[5-6]。肿瘤异质性虽然发生在分子水平上,但可以通过影像组学方法从宏观的医学图像上反映肿瘤的异质性。影像组学技术已经被越来越多地用于无创提取和分析肉眼无法识别的深层定量特征[7],如灰度强度分布、像素空间位置关系、纹理异质性等,能够更好地描述肿瘤内部特征,并且可与临床数据联合建立疾病预测模型[8],在乳腺癌、肺癌、大肠癌等肿瘤研究中得到广泛应用[9-11]。然而影像组学并不能够反映肿瘤感兴趣区(region of interest,ROI)外的特征,可与肿瘤传统影像视觉特征很好地互补。因此,本研究拟探讨影像组学特征与传统视觉特征及临床因素结合的机器学习模型在GBM患者的生存预测及风险分层中的作用,现报道如下。
1.1 对象 所有临床及颅脑MRI数据从公共数据集BRATS2018数据库(http://braintumorsegmentation.org)下载。回顾性分析数据库163例GBM患者的术前常规颅脑 MRI影像及临床资料,年龄 18~86(60.33±12.08)岁。根据临床常用的风险分层[12],将所有患者分为长生存期(≥12个月)和短生存期(<12个月)两组,其中长生存期组81例,短生存期组82例。纳入标准:(1)所有患者均经手术后病理学确诊为GBM;(2)有完整的T1加权成像(T1-weighted imaging,T1WI)、T2加权成像(T2-weighted imaging,T2WI)、液体衰减反转恢复序列(fluid attenuated inversion recovery,FLAIR)和增强 T1加权成像(contrast-enhanced T1WI,T1CE)。排除标准:序列不全,图像质量不足或有伪影。纳入患者按入组时间分为训练组114例,测试组49例。所有数据来自19个不同中心,颅脑MRI检查采用不同的MRI供应商及机型,使用不同的检查参数,均包括T1WI、T2WI、FLAIR和T1CE序列。本研究经浙江省人民医院医学伦理委员会审查通过(审批文号:202101291222000596351)。
1.2 方法
1.2.1 影像视觉特征的评估 所有患者术前MRI图像导入开源软件ITK-SNAP上进行阅片分析。按照GBM常规MRI伦勃朗视觉感受图像特征(visually accessible rembrandt images,VASARI)进行视觉评估[13],内容包括:部位、左右侧、强化程度、囊变、多发、强化边界、非强化边界、出血、软脑膜、室管膜、皮层、深部白质、中线、卫星灶。影像视觉评估由两位神经影像医生采用双盲法,即不了解患者的临床和相关信息评估记录,意见分歧通过协商讨论解决。
1.2.2 图像特征的提取 所有患者颅脑MRI图像均经过BRATS18平台预处理,包括标准化处理,并配准到相同的解剖模板,内插到相同的分辨率(1 mm×1 mm×1 mm),并剥离颅骨[14-15]。所有的 T1WI、T2WI、FLAIR 序列图像均与T1CE的序列配准。GBM ROI由神经影像专业医生采用GK软件(GE公司)自动分割为3个子区域,并利用ITK-SNAP对分割结果进行修正,包括:(1)水肿 ROI,(2)增强 ROI,(3)坏死-非增强 ROI,其中(2)、(3)组合成核心肿瘤 ROI(4),(1)、(2)、(3)组合成整个肿瘤ROI(5)。将每个病例的4个颅脑MRI扫描序列及5个ROI图像导入AK软件(GE公司)进行处理,包括以下步骤:减少图像中的噪声;进行磁场迁移校正以减少外部干扰因素;进行直方图映射和强度标准化,将所有图像的灰度值限制为0~255。影像组学特征提取包括直方图特征、形态学特征、灰度共生矩阵特征和游程矩阵特征,见图1。
图1 影像组学建模流程图
1.2.3 影像组学标签建立 由于样本量有限而大量特征可能会阻碍模型的预测能力[16],因此笔者对所有提取的影像特征进行降维处理,以得到最佳特征。首先对所提取影像特征进行单因素方差分析,找出有统计学差异的特征,并对所选特征使用最大相关最小冗余(maximum relevance minimum redundancy,mRMR)算法降维,mRMR算法旨在选择与实际生存期具有最大相关性的要素;然后使用梯度提升决策树(gradient boosting decision tree,GBDT)算法对筛选出的特征进一步降维得到最优特征集;最后使用逻辑斯回归构建影像组学标签模型并计算影像组学标签分数。使用ROC曲线评估影像组学标签模型在训练组和测试组中的诊断效能。
1.2.4 列线图的构建和评估 应用多因素逻辑斯回归分析在训练组中筛选出的独立预测因子并建立预测模型及列线图。列线图效能的验证包括校正性能、诊断准确性和净效益,分别采用校正曲线、ROC曲线和决策曲线分析法(decision curve analysis,DCA)进行评估。根据列线图计算研究队列中每例患者生存状态预测值,并依据约登指数分为高危者和低危者,通过分析不同风险者实际生存状态个数差异评估其临床效果,同时使用DCA评估训练集和验证集中列线图的净效益。
1.3 统计学处理 采用SPSS 17.0和R软件(版本3.0.1),gbm、mRMRe软件包分别用于GBDT、mRMR分析,使用rms软件包进行列线图构建和校准曲线验证。符合正态分布的计量资料以表示,组间比较采用两独立样本t检验;不符合正态分布的计量资料以M(P25,P75)表示,组间比较采用Mann-Whitney U检验。计数资料以频数表示,组间比较采用χ2检验。P<0.05为差异有统计学意义。
2.1 训练组和测试组患者临床和影像特征比较 见表1。
由表1可见,训练组和测试组患者的临床和影像特征指标差异均无统计学意义(均P>0.05)。
表1 训练组和测试组患者临床和影像特征比较[例(%)]
2.2 训练组不同生存期患者临床特征比较 见表2。
由表2可见,训练组中短生存期和长生存期患者视觉特征(室管膜、灰质受累、深部白质受累、跨越中线、有卫星灶)、年龄、生存期、标签分数差异均有统计学意义(均 P<0.05)。
表2 训练组不同生存期患者临床和影像特征比较[例(%)]
2.3 影像组学标签的预测评分在训练组和测试组中的诊断准确性 本研究对每单个ROI提取了396个特征,因此从每例患者的4个MRI序列中3个子区域、1个核心肿瘤区域、1个肿瘤区域共提取7 920个特征。通过单因素方差分析共保留3 967个有统计学差异的特征,采用mRMR降低特征集的冗余度选择最优子集,使用GBDT算法对最优子集进一步降维得到26个最佳特征。基于逻辑斯回归构建的影像组学标签模型计算的生存期预测评分在训练组和测试组中差异有统计学意义,两组患者的预测效果较好,AUC分别为 0.874和0.779,特异度分别为0.803和0.810,灵敏度分别为0.736和 0.607,见图 2。
图2 训练组和测试组影像组学标签预测评分诊断效能的ROC曲线(a:训练组;b:测试组)
2.4 影像组学列线图对GBM患者生存期的预测
2.4.1 GBM患者生存期预测的单因素和多因素分析结果 见表3。
表3 GBM患者生存期预测的单因素和多因素分析结果
由表3可见,年龄、影像组学标签分数、深部白质受累是评估患者生存期的独立预测因子(均P>0.05),对3个独立预测因子采用多元逻辑斯回归建立预测模型,根据预测模型制作相应的列线图,见图3。
图3 胶质母细胞瘤(GBM)患者生存期预测的影像组学列线图(在列线图中,根据组标签分数的值绘制一条垂直线,确定相应的点值,深部白质受累和年龄的分数用同样方法得到相应点值,总分为上述3点之和,最后根据总点值画一条垂直线评估预后)
2.4.2 预测模型的建立和验证及其对应列线图的生成 列线图、联合影像(由影像组学标签及深部白质联合模型)、影像组学标签、深部白质受累和年龄在所有患者中的 AUC 分别为 0.941、0.908、0.873、0.663 和 0.655,见图4。训练组和测试组中联合模型的校准曲线见图5。联合模型预测生存期在训练组和测试组中的准确度分别为0.848和0.800,特异度分别为0.881和0.810,灵敏度分别为0.811和0.607。根据训练组构建的列线图选取的最佳诊断截断值0.753,将训练组患者分为高危39例和低危75例,高危患者中的短生存期患者比例92.3%(36/39),明显高于低危患者中的短生存期患者比例 22.7%(17/75)(P<0.01)。在训练集和测试集中DCA曲线均表现出良好的净效益,见图6。
图4 胶质母细胞瘤(GBM)患者分别应用列线图、联合影像、影像组学标签、深部白质受累和年龄预测长短生存期的ROC曲线
图5 列线图的校准曲线(a:训练组;b:测试组;虚线表示理想列线图所在的参考线,实线表示列线图的实际预测性能)
图6 列线图在训练组和测试组患者中的决策曲线(a:训练组;b:测试组;决策曲线表示不同风险阈值下的净获益;采用列线图预测生存期风险的方法优于将所有患者都看作是长生存期或短生存期)
OS预测在制定个性化治疗方案和改善生活质量方面非常重要。本研究基于影像组学特征、影像视觉特征联合临床因素构建了联合预测模型,并绘制列线图。结果表明,联合预测模型具有最高的性能。另外,影像组学特征具有很好的预测价值,在联合影像视觉特征后可以明显提高预测能力,表明两者具有互补性。
前期的一些GBM研究显示了影像组学对于原发及继发GBM患者预后的潜力。Kickingereder等[17]通过对MRI数据(脑灌注、弥散加权成像)的主成分分析,显示出11个放射学特征有很好的生存预测性能。而Lee等[18]则从动态磁敏感对比增强MRI数据中提取了与OS相关的纹理特征和动力学特征密切相关。另一项研究通过对增强后的图像和FLAIR图像LASSO降维后获得的8个影像学特征建立COX模型,明显提高了生存预测的准确性,并且超出了通过分子参数和临床评估的准确性[19]。还有研究显示,经过贝伐单抗治疗后复发的GBM患者,术前与术后MRI图像提取的10个特征也与预后明显相关[20]。在Lee等[21]的另一项研究中强化灶纹理特征与总体生存率相关。这些研究表明影像组学在预测预后上有重要的临床价值。另外为了进一步探讨影像组学联合传统影像视觉特征在GBM患者预后中的预测价值,在之前研究的基础上,笔者对ROI进行组合以提取更多的纹理值,并建立列线图,希望能给临床医生预测GBM患者预后和个性化治疗带来的更多的价值。
本研究显示深部白质受累为患者OS的独立预测因子,这与之前的研究结论一致[22],影像学上伴有深部脑白质束和室管膜侵犯的患者,与无此特征的患者相比,总生存率显著降低(8.7个月比18.6个月),推测线粒体功能障碍可能与深部白质受累表达相关。同样,年龄是GBM患者预后不良的预测指标,与其他GBM研究一致[23]。
近年来,列线图在肿瘤研究中得到广泛应用[24-25],并且一部分研究中的列线图联合了影像组学特征用于肿瘤患者生存期的预后分析[26-27],这些研究显示联合影像组学特征与临床预测指标的列线图可以显著提高患者OS预测能力。前期研究表明,与临床因素相比,影像组学联合临床因素的列线图能更好地预测OS[28-29],提示联合模型进一步改进了预测效能,能够更好地将患者进行生存风险分层,从而制定相应的治疗方案。最近的一项研究显示,融入了IDH1突变和视觉影像特征变量的融合列线图,效能显著优于仅有原始临床因素的列线图[30]。考虑到影像组学特征是基于ROI提取的,而不能反映ROI外的因素,如软脑膜、室管膜及深部脑白质的侵犯以及位置信息等,因此本研究进一步增加了传统视觉特征,结果表明影像组学联合临床因素以及影像学视觉特征的预测模型效能最佳,能更好地对GBM患者进行生存风险分层,并且校准和决策曲线显示出列线图良好的的临床实用性。
本研究优势在于基于多中心多模态颅脑MRI成像影像组学特征建立了综合模型,明显提高了GBM的预后准确度。但本研究还有一定的局限性,首先,本研究为回顾性研究,研究人群包括了具有不同临床特征和扫描参数的患者,存在数据不一致的问题,但是图像都经过归一化处理,减少了数据的不一致性;其次,数据的不一致也可以提高模型的泛化性;本研究队列缺少患者肿瘤的基因和放化疗信息,因此对于患者的预后预测尚不够准确,将在未来的GBM研究中纳入肿瘤基因型和进一步的治疗信息,以便为临床医师提供更精准的预测模型;最后,本研究未进行外部数据的验证,这将在后续的前瞻性研究中纳入本研究中心GBM患者作为外部验证数据。
总之,影像组学标签分数、深部白质受累和年龄是GBM患者的独立预测因子,基于3者的联合模型而绘制的列线图可用于预测患者OS,从而对GBM患者进行生存风险分层,更好地为患者制定个性化治疗方案。