刘旭 冯卫华 王涛 高远翔 李志明
(青岛大学附属医院放射科,山东 青岛 266003)
直肠癌是消化系统中常见的恶性肿瘤,患者发病率和死亡率一直处于较高的水平[1-2]。染色体不稳定性和微卫星不稳定性(MSI)是直肠癌发生的两种途径[3]。MSI不仅与患者的预后密切相关,还可以用于评价患者的治疗反应。MEROK等[4]的研究表明,与微卫星稳定性(MSS)的患者相比,伴有MSI的Ⅱ期结直肠癌患者的预后相对较好。但是伴有MSI的Ⅱ期直肠癌患者对5-氟尿嘧啶容易产生耐药性,从而对基于5-氟尿嘧啶化疗的收益不显著[5]。美国国家综合癌症网络、欧洲医学肿瘤学协会和日本结直肠癌协会指南都建议对新诊断的直肠癌患者进行微卫星状态的检测[6-8]。基于数据集的影像组学特征能够客观和全面地反映肿瘤的异质性,可为临床决策提供数据支持。目前已有研究表明,基于影像组学构建的预测模型可用于评估直肠癌的淋巴结转移、周围神经浸润、肺转移及肝转移情况[9-12]。本研究拟建立基于MRI影像组学特征的联合模型,并验证其预测直肠癌MSI的价值。
收集2016年3月—2021年3月青岛大学附属医院术前行直肠MR检查且术后经病理检查证实的121例直肠癌患者的临床资料和影像学数据。患者纳入标准:①术前未接受过放化疗者;②术前行直肠MR常规扫描,MR检查和手术时间间隔不超过1周者;③术后病理有MSI或MSS明确诊断者;④临床资料完整者。排除标准:①MR图像病灶显示不清晰者;②图像质量差,有明显运动伪影者。根据术后病理学结果将所有患者分为MSI组(54例)和MSS组(67例),另外再将所有患者按照7∶3比例随机分为训练组(85例)与验证组(36例)。
收集所有121例患者MR检查的轴位T1WI、T2WI、DWI图像,导入3D Slicer(Version:4.11,http://www.slicer.org/)软件中,对每个序列的肿瘤区域进行逐层手动勾画,生成三维感兴趣区(ROI)。为确保各个序列勾画的病灶范围一致,轴位T1WI、T2WI的勾画均需参照轴位DWI图像的高信号病灶区;勾画时要避开肿瘤坏死区域;勾画工作由2位具有5年以上腹部影像诊断经验的医师独立完成,第一位医师对每例患者行2次ROI勾画,第1次与第2次间隔时间大于7 d,第二位医师对每例患者行1次ROI勾画。通过3D slicer软件对2位医师勾画的ROI提取影像组学特征,对第一位医师的两次提取结果进行组内差异性检验,第一位医师第1次提取结果与第二位医师提取的结果进行组间差异性检验,剔除一致性系数P<0.75的特征。使用独立样本t检验(正态变量)或曼惠-U检验(非正态变量)对特征进行单因素筛选,剔除P>0.05的特征。最后,采取最小绝对收缩和选择算子算法对剩余的特征进行降维,剔除系数项为0的特征。
对患者的临床因素分别进行单因素、多因素Logistic回归分析,将两种分析均呈显著性的因素作为临床独立危险因素,构建临床模型。将筛选出的影像组学特征通过线性公式计算其影像组学分数,利用影像组学分数构建影像组学模型。另外将筛选出的临床独立危险因素以及影像组学分数采用Logistic回归分析构建联合模型。采取受试者工作特征(ROC)曲线下面积(AUC)评估临床模型、影像组学模型和联合模型的预测效能,并计算相应的准确性、灵敏度以及特异度。使用Delong检验比较3种模型的预测效能是否具有统计学差异。通过决策曲线评估3种模型的临床应用价值。最后分别对训练组以及验证组的联合模型绘制校正曲线并且进行Hosmer-Lemeshow检验。
采用SPSS 22.0统计软件及R软件(https://www.Rproject.org, v.3.5.1)对数据进行统计分析。连续变量以M(P25,P75)表示,采用Wilcoxon检验进行组间比较。分类变量以例(χ/%)表示,采用χ2检验或Fishers确切概率法进行组间比较。以P<0.05为差异有统计学意义。
两组患者血液中血小板计数和高密度脂蛋白水平比较差异具有显著意义(Z=6.273、6.913,P<0.05);两组患者其他指标比较差异均无显著意义(P>0.05)。见表1。
表1 MSI组与MSS组患者的临床资料比较
单因素Logistic回归分析显示,两组患者血液中血小板和高密度脂蛋白与直肠癌的MSI有关(P<0.05)。见表2。多因素Logistic回归分析结果示,血液中高水平血小板和低水平的高密度脂蛋白是直肠癌MSI临床危险因素(P<0.05)。结果详见表3。
表2 影响直肠癌患者MSI临床单因素Logistic回归分析
表3 影响直肠癌患者MSI临床多因素Logistic回归分析
从每例患者的MR图像中共筛选出8个影像组学特征,其中3个来自于轴位T1WI,3个来自于轴位T2WI,2个来自于轴位DWI,经过线性公式计算出每例患者的影像组学分数。
影像组学分数=0.409×T2_wavelet.LLL_firstorder_Minimum-0.307×T1_original_glcm_Imc1-0.122×DWI_wavelet.LLH_glszm_LowGrayLevelZoneEmphasis-0.078×DWI_original_glcm_InverseVariance-0.035×T1_wavelet.LLH_glrlm_LongRunLowGrayLevelEmphasis+0.202×T2_wavelet.LLH_glcm_MCC+0.278×T2_wavelet.LHH_glszm_GrayLevelNonUniformityNo-rmalized+0.325×T1_original_firstorder_Minimum
将单因素、多因素Logistic回归分析获得的临床危险因素(血小板和高密度脂蛋白)用于构建临床模型。利用每例患者的影像组学分数构建影像组学模型。采用联合临床危险因素和影像组学分数构建联合模型。
在训练组当中,得到联合模型的AUC为0.966(95%CI=0.932~0.991),准确性为0.906,灵敏度为1.000,特异度为0.830;影像组学模型的AUC为
0.915(95%CI=0.843~0.966),准确性为0.871,灵敏度为0.842,特异度为0.894;临床模型的AUC为0.784(95%CI=0.682~0.885),准确性为0.753,灵敏度为0.842,特异度为0.681(图1A)。Delong检验显示,联合模型、影像组学模型的预测效能与临床模型的预测效能差异具有显著性(Z=3.773、2.017,P<0.05),联合模型与影像组学模型的预测效能比较差异无显著性(P>0.05)。
在验证组当中,得到联合模型的AUC为0.931(95%CI=0.841~0.994),准确性为0.750,灵敏度为0.938,特异度为0.600;影像组学模型的AUC为0.872(95%CI=0.759~0.968),准确性为0.806,灵敏度为0.812,特异度为0.800;临床模型的AUC为0.725(95%CI=0.536~0.880),准确性为0.694,灵敏度为0.750,特异度为0.650(图1B)。Delong检验显示联合模型、影像组学模型的预测效能与临床模型的预测效能之间存在统计学差异(Z=2.395、1.980,P<0.05),联合模型与影像组学模型的预测效能之间差异不显著(P>0.05)。
通过决策曲线对3种模型预测直肠癌MSI的临床应用价值进行验证,结果表明在较大范围的阈概率下,联合模型预测直肠癌MSI的净收益为最大。联合模型的校正曲线如图2所示。图中45°灰线代表理想线,虚线代表联合模型的预测性能,虚线与理想线的拟合越接近,预测精度越高。训练组和验证组的联合模型校正曲线比较,显示出了较好的一致性。Hosmer-Lemeshow检验结果显示训练组和验证组的联合模型比较,差异无统计学意义(P>0.05),表明拟合度较好。
A:训练组,B:验证组;其中红线为临床模型,蓝线为影像组学模型,黄线为联合模型
A:训练组联合模型的校准曲线,B:验证组联合模型的校准曲线
目前,直肠癌微卫星状态的确定主要依赖于免疫组织化学染色和PCR检测法,但前者假阳性率较高,PCR检测法虽然是目前的金标准,但因为检测价格昂贵和耗时较长,限制了其临床应用。此外,通过结肠镜活检获取组织标本的方式也会对患者造成一定的伤害。因此,临床上迫切需要一种能够在术前无创预测直肠癌微卫星状态的方法。
本研究中MSI组血液中的血小板高于MSS组。而相关研究表明血小板不仅与凝血止血有关,还与肿瘤的生长、转移以及免疫逃避密切相关[13]。推测原因为直肠癌MSI中的肿瘤细胞能刺激血液中血小板的产生,并将其召集到肿瘤的微环境中,起到帮助肿瘤细胞逃脱免疫监视的作用。此外,本研究MSI组与MSS组血液中的高密度脂蛋白水平比较差异具有显著性。但目前为止关于微卫星状态与高密度脂蛋白的关系尚无明确的研究结果,推测其可能与肠道脂肪类物质代谢存在一定关联,有待进一步研究证实。而血液中的血小板与高密度脂蛋白作为本研究单因素、多因素Logistic回归分析筛选出的临床危险因素,与既往研究结果一致[14]。
由于错配修复蛋白基因缺失,相比较于直肠癌MSS,直肠癌MSI中的肿瘤细胞的分化程度更差,坏死组织更多且呈黏液性,肿瘤内部及周围有更多的淋巴细胞聚集,微血管密度更高,并且直肠癌的MSI呈局限性或膨胀性的生长方式[15-17]。而直肠癌MSI和MSS在细胞学水平的差异导致了MR图像灰度分布不同,从而导致MR图像一阶、二阶以及高阶特征的差异。因此,本研究通过LASSO降维剔除了相关性不密切的影像组学特征,最终筛选出8个影像组学特征,而这些特征就极大可能是直肠癌MSI和MSS之间的肿瘤细胞异质性的一种反应,这也提示了本研究筛选的影像组学特征对于直肠癌MSI可能具有重要的预测价值。
本研究通过临床因素构建的临床模型在训练组中的AUC为0.784,而影像组学模型中的AUC为0.915。相比于临床模型,影像组学模型展现了更好的预测性能,这提示了在预测直肠癌MSI方面,基于影像组学分数构建的影像组学模型发挥着重要的作用。虽然本研究中影像组学模型与联合模型的预测效能差异不显著,但是决策曲线结果却显示了联合模型的净收益最高,表明联合模型能为临床提供更全面的预测信息,其拥有重要的临床应用价值。
既往已有多项影像组学研究对于MSI进行了预测。LI等[18]通过18F-FDG PET/CT影像组学预测结直肠癌的微卫星状态,筛选出了2个影像组学特征构建预测模型,模型的AUC达到了0.828,达到了良好的预测效果。WU等[19]回顾性分析了102例结直肠癌患者的碘基物质分解图像,结果表明基于DECT的影像组学分析在预测结直肠癌MSI方面具有巨大的潜力。FAN等[20]回顾性分析了119例Ⅱ期结直肠癌患者的门静脉期CT图像,结果显示结合了临床因素和影像组学特征的模型的预测性能显著优于临床模型。以上研究证实了影像组学研究在预测MSI方面的重要价值。本研究回顾性分析了121例直肠癌患者的资料,构建的联合模型在训练组中AUC为0.966,验证组中AUC为0.931。联合模型在预测直肠癌MSI上取得了较好的预测效能,其优点在于,本研究采用的MR具有较高的软组织分辨率,MR图像的信号强度和定量参数能较好地反应肿瘤的异质性;并且本研究采用了病灶区ROI的三维勾画,相比于大多数研究采用的二维勾画,能更全面地纳入肿瘤生物学信息。
本研究也存在一些局限性。①直肠癌MSI的样本量较少;②本研究为单中心的回顾分析,需要通过前瞻性、多中心的研究来进一步验证结果的可靠性;③本研究只纳入直肠MR平扫图像,后续应该补充直肠MR增强图像,以进行更为综合的影像组学分析。
综上所述,基于多参数MRI影像组学特征和临床因素构建的联合预测模型,在术前可以有效地预测直肠癌MSI,能够为直肠癌患者的预后评估和选择合适的治疗方案提供帮助。