陈 虎,陈 帅,王雅静,崔金娈,陈井亚
南京中医药大学附属医院/江苏省中医院放射科,江苏 南京210029
子宫内膜癌(endometrial cancer,EC)是最常见的妇科肿瘤之一,近年来其发病率不断上升[1]。根据组织学及分子生物学特征,EC 分为Ⅰ、Ⅱ2 种亚型[2]。Ⅰ型是雌激素依赖型EC,与子宫内膜增生有关,预后相对良好;Ⅱ型是雌激素非依赖型EC,包括若干高级别和侵袭性组织学亚型,与子宫内膜萎缩有关,远处转移的发生率较高,预后较Ⅰ型差[3]。不同类型EC 的手术方式及术后辅助治疗存在显著差异[4]。因此,术前准确鉴别对治疗方案的选择至关重要。目前临床常规采用术前刮宫术获取EC 的病理,但其为有创操作,且所取组织具有局限性[5]。因此,临床迫切需要可术前无创鉴别EC 分型的方法。
影像组学可定量提取影像学特征来分析肿瘤的异质性,帮助肿瘤的诊断、疗效预测和预后评估[6-7],对预测EC 深部肌层浸润、淋巴结良恶性及风险分级有很好的前景。此外,机器学习算法可提高模型预测的准确性和可靠性。本研究基于多序列MRI 中提取的影像组学参数,应用多种机器学习方法构建模型,选择最佳模型在术前无创鉴别Ⅰ、Ⅱ型EC。
回顾性分析南京中医药大学附属医院2016 年9 月至2020 年12 月经组织病理学证实为EC 的473 例患者。纳入标准:①组织病理学确诊EC;②术前2 周内行MRI 平扫及动态对比增强MRI(DCE-MRI);③无其他肿瘤病史。排除标准:①术前新辅助化疗;②临床、影像学或免疫组化资料不完整;③MRI 图像质量差;④病灶实性成分最大径<1 cm;⑤MRI 检查前已行病理活检;⑥伴其他子宫内膜疾病。最终纳入403 例,其中Ⅰ型316 例,Ⅱ型87 例;按7∶3 随机分为训练集282 例和验证集121 例。本研究经医院伦理委员会批准。
使用Siemens Magnetom Aera 1.5 T MRI 扫描仪行术前检查,扫描范围覆盖整个骨盆区域。成像序列与参数:轴位T1WI,TR/TE 160 ms/10 ms,层厚5 mm,层距1 mm;轴位T2WI,TR/TE 1 800 ms/80 ms,层厚5 mm,层距1 mm;矢状位脂肪抑制T2WI,TR/TE 260.0 ms/4.6 ms,层厚5 mm,层距1 mm;矢状位DWI,TR/TE 6 900 ms/80 ms,层厚5 mm,层距1 mm,b 值为50、800 s/mm2。进行自动后处理生成ADC 图。DCE-MRI 经静脉注射Gd-DTPA,剂量0.1 mmol/kg 体质量,在矢状位行动脉早期(DCE1,15 s)、动脉后期(DCE2,30 s)、实质期(DCE3,60 s)和延迟期(DCE4,90 s)扫描。
所有图像均以DICOM 格式存储,用于影像组学分析。由2 位分别具有8、15 年诊断经验的放射科医师,在不知临床和病理结果的情况下,使用ITK-SNAP 软件(版本3.2.0,http://www.itksnap.org),在选定的不同序列图像上沿肿瘤边缘逐层勾勒每个肿瘤的ROI(图1)。分割结果的可重复性采用组间和组内相关系数(intraclass correlation efficient,ICC)评估。1 位放射科医师在3 个月后再次随机选择30 例MRI 图像进行ROI 分割,ICC>0.75 为一致性良好。
图1 病灶ROI 示意图
使用AK 软件(版本3.0.0,GE 医疗)进行特征提取。从ADC 和DCE4 序列提取720 个影像组学参数,包括9 个形态因子特征、10 个Haralic 参数、11 个灰度尺寸zoon 矩阵参数、42 个直方图参数、288 个灰度共生矩阵参数和360 个游程矩阵参数。对提取的参数值进行归一化并缩小至0~1 范围。采用Mann-Whitney U 检验或t 检验筛选Ⅰ型与Ⅱ型EC 差异有统计学意义的影像组学参数。使用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归模型选择具有非零系数的最显著参数。
选择6 种机器学习算法对降维后筛选出的参数构建影像组学模型,包括逻辑回归、随机森林、自举聚合、支持向量机、人工神经网络和朴素贝叶斯。基于6 种机器学习算法共获取6 个诊断模型。通过AUC、敏感度和特异度评估这6 个模型的诊断效能。
采用SPSS 21.0 软件、R 软件(版本3.7.0,http://www.r-project.org/)和MedCale 软件(版本19.6.3)进行统计分析。连续变量以表示,采用t 检验进行组间比较;分类变量以例(%)表示,组间比较采用χ2检验或Fisher 精确检验。对各模型分别绘制ROC 曲线。以P<0.05 为差异有统计学意义。
表1 2 组一般资料比较
2 组年龄比较,差异有统计学意义(P<0.05);2 组绝经状态和临床症状比较,差异均无统计学意义(均P>0.05)。
对影像组学特征的提取,观察者间和观察者内一致性良好(ICC=0.832,0.854)。经LASSO 回归分析最终选择12 个具有非零系数的影像组学特征(图2),将其分别放入6 种机器学习算法中,以构建影像组学模型。6 个模型中应用朴素贝叶斯构建的影像组学模型在训练集和验证集中均表现良好,AUC 分别为0.927和0.869,优于其他影像组学模型,敏感度分别为0.869、0.615,特异度分别为0.802、0.926(图3,表2)。影像组学评分(ADC&DCE4)=-1.022 040 822+0.035 940 94×HaralickCorrelation_angle135_offset4+0.039 382 13×Correlation_angle0_offset7+0.041 948 74×ClusterShade_angle135_offset7+0.050 466 82×histogramEnergy+0.054 897 2×ClusterShade_AllDirection_offset 7+0.071 339 94×ClusterShade_angle90_offset7+0.139 468 61×Quantile0.975+0.099 719 17×Percentile90+0.163 562 68×ClusterShade_angle0_offset7+0.21334371×ClusterShade_angle0_offset4+0.260 443 51×Variance+0.306 101 14×ClusterShade_angle90_offset4。
表2 6 种影像组学模型的验证集预测结果
图2 筛选后的影像组学参数 图3 各影像组学模型的ROC 曲线
Ⅰ、Ⅱ型EC 的病理特征存在明显差异,其中Ⅰ型在临床中常见,占70%~80%,多呈中高分化,预后良好,5 年生存率在80%以上,Ⅰ型EC 与过高的雌激素刺激相关,肿瘤高表达雌激素受体。Ⅱ型EC为非雌激素依赖型,仅占20%~30%,却导致>50%的EC 相关死亡结局;病理类型主要包括G3 期宫内膜样癌、浆液性癌、透明细胞癌、癌肉瘤及神经内分泌癌等[8];其分化程度差,即使早期病灶较小,也极易发生肌层浸润及淋巴脉管侵犯;术后复发率高,预后差,5 年生存率<50%[9]。因此,为提高EC 患者的术后生存率及生存质量,临床需明确EC 的分型,并进一步制订个性化治疗方案。国际指南推荐的EC 患者的手术方式主要是全子宫及双侧附件切除术+腹膜后淋巴结清扫,主要是行根治性手术包括全子宫及双侧附件切除术、盆腔和腹主动脉旁淋巴结清扫、大网膜切除术、广泛腹膜活检或切除,以及腹腔冲洗液细胞检查[4]。而术前对EC 无创分型,可早期评估其恶性程度,并提示临床采用不同的手术方案,对患者的预后具有较高的临床价值。常规影像学检查仅能对肿瘤进行初步定性诊断及鉴别诊断,不能判断疾病的分型及分级等微观病理特征,因此,临床需能够反映肿瘤微观层面的新型技术来提高对疾病的术前诊断效能。
影像组学是近几年发展起来的新型技术,可通过不同的计算机算法来挖掘图像内的微观特征[10-11]。影像组学具有反映癌症表型和通过充分提取肿瘤内信息指导个体化治疗的巨大潜力,可提高常规成像分析的诊断精度[12-13]。本研究应用6 种机器学习算法分别构建影像组学模型,比较不同方法对Ⅰ、Ⅱ型EC 的鉴别诊断价值。结果显示,朴素贝叶斯算法构建的影像组学模型对Ⅰ型与Ⅱ型EC 的鉴别诊断效能最好,有助于预测EC 患者的术前组织学类型。以往有研究探索基于ADC 的影像组学参数与EC 的组织学亚型之间的相关性[14]。本研究将基于ADC 的影像组学参数纳入模型中,结果表明ADC 对高级别EC 中存在异质性细胞方面具有预测价值。Fasmer等[15]研究发现,从DCE4 中提取的影像组学参数能够提供预测侵袭性EC 的风险评估,如预测非子宫内膜样肿瘤的组织学分类和肿瘤级别。本研究选取ADC 与DCE4 的影像组学参数构建的影像组学模型效能较好。与本研究相似,有研究发现基于ADC 和DCE4 序列的影像组学参数能够识别EC 中的淋巴血管间隙浸润,且预测EC 侵袭性的组织病理学特征有较高的可重复性[16-17]。
本研究的局限性:①为回顾性研究,样本量有限,需更大样本量的前瞻性研究来支持结果。②手动分割ROI 产生的差异无法避免。因此,可应用ROI绘图的自动化方法来减少差异。③未分析p16、WT-1基因或其他有价值的标志物。今后,须考虑更有价值的免疫组织化学标志物以获得更可靠的结果。④基因组数据未纳入模型,未来研究将结合基因组特征构建更全面的影像基因组学模型。