基于常规MRI影像组学模型预测软组织肉瘤复发

2022-12-20 12:52周慧陈基明吴莉莉邵颖范海云陈亮亮
放射学实践 2022年12期
关键词:肉瘤组学病灶

周慧,陈基明,吴莉莉,邵颖,范海云,陈亮亮

软组织肉瘤(soft tissue sarcoma,STS)是一组高度异质性的恶性肿瘤,其特点为具有局部侵袭性、呈浸润性或破坏性生长。目前,手术切除是治疗软组织肉瘤的主要方式,尽管对于高度恶性的Ⅲ期肿瘤根治性或广泛手术切除能尽量达到R0切除,获得安全的手术切除边界,但仍有15%~40%的STS患者出现肿瘤复发,严重影响预后,患者5年生存率仅为55%~70%[1-2]。STS生物学行为存在多样性,STS患者术后复发受多种因素影响,不仅与切缘状态密切相关,还与患者的年龄、病灶大小、肿瘤位置及其与周围结构关系等因素有关。MRI是STS诊断与鉴别诊断、术前分期和手术治疗方案制订以及术后随访的首选影像检查方法。常规MRI检查最为常用,但采用常规MRI预测STS复发的价值有限[3-4]。影像组学通过自动化数据算法将医学图像转化为深层次特征空间数据,可量化分析病灶内部潜在的病理生理学异质性,是当前的研究热点[5]。目前已有基于机器学习影像组学分析应用于STS的鉴别诊断、术前分级等方面的研究[6-8],但应用于预测STS复发却鲜有报道。笔者应用不同机器学习方法建立基于常规MRI的影像组学模型,旨在探讨其在预测软组织肉瘤复发中的价值。

材料与方法

1.临床资料

回顾性搜集本院2012年1月-2021年6月经手术病理证实STS患者的完整临床及影像资料。纳入标准:①经手术病理证实为软组织肉瘤,病理诊断依据为2020年第五版WHO骨肿瘤及软组织肿瘤分类标准;②术前2周内进行常规MRI扫描;③术后随访时间至少12个月。排除标准:①肿瘤边界显示不清晰或MRI质量不佳,难以准确勾画ROI及后处理;②术后失访。最终纳入92例STS患者,男49例、女43例,年龄5~87,平均(53±19)岁。STS病理类型包括纤维肉瘤(28例)、脂肪肉瘤(15例)、滑膜肉瘤(15例)、未分化肉瘤(11例)、横纹肌肉瘤(7例)、软骨肉瘤(5例)、骨外骨肉瘤(4例)、血管肉瘤(3例)、上皮样肉瘤(3例)和腺泡样软组织肉瘤(1例)。

图1 压脂T2WI图像上肿瘤ROI的勾画。a) 横轴面图像,沿肿瘤边缘勾勒2D-ROI(红色区域); b~c)在横轴面ROI勾勒完成后,经ITK-SNP 3.6.0软件重组形成冠状面和矢状面图像上的2D-ROI(红色区域); d) 所有层面的2D-ROI经软件融合生成病灶的3D-ROI。

术后每3个月进行一次胸部X线平片或CT检查及病灶部位的MRI检查,根据随访结果(其中二次手术23例、电话或门诊随访7例),将STS术后随访期间发生局部复发(26例)或远处转移者(1例肺转移)纳入复发组(27例),未发生局部复发或远处转移者纳入无复发组(65例)。采用计算机完全随机方法将患者按7:3的比例分为训练集65例(复发组19例,无复发组46例)和验证集27例(复发组8例,无复发组19例)。本研究经本院临床试验伦理委员会审批通过。

2.MRI检查方法

使用Siemens Avanto 1.5T磁共振扫描仪,将靠近边缘区的病灶尽可能置于扫描中心。扫描序列及和参数如下。横轴面和冠状面T1WI:TR 460~580 ms,TE 8~11 ms;横轴面、冠状面和矢状面压脂T2WI:TR 3000~5900 ms,TE 49~100 ms,矩阵205×256~384×288,视野18 cm×18 cm~40 cm×40 cm,层厚4.0~6.0 mm,层间距2.0 mm。52例进行了MR增强扫描。

3.临床病理和常规MRI征象的评价

搜集每例患者的临床病理资料,包括性别、年龄、病理分级和临床分期等。病理分级参考法国国家癌症研究中心(FNCLCC)的分级标准,将肿瘤的病理分级分为Ⅰ~Ⅲ级,Ⅰ级为低级别,Ⅱ、Ⅲ级为高级别[9];临床分期参考美国癌症联合会(AJCC)的分期标准,分为Ⅰ~Ⅳ期[10]。由2位分别具有5年和15年工作经验的放射科医师共同评估病灶的常规MRI特征,意见不一致时经讨论达成共识。常规MRI特征:①肿瘤最长径;②生长部位;③位置深浅:以浅筋膜为界,处于浅筋膜以外为浅部,处于浅筋膜以内为深部;④形态,即肿瘤边缘是否呈明显的不规则分叶状改变;⑤边界,包括肿瘤是否具有包膜、与邻近肌肉等组织分界是否清晰;⑥肿瘤周围水肿,定义为肿瘤周围异常信号区,在T1WI上呈斑片状低信号、在压脂T2WI上呈高信号;⑦筋膜、血管和神经侵犯,表现为在增强T1WI或压脂T2WI上可见肿瘤与邻近筋膜、血管和神经分界不清或呈包绕改变;⑧骨和骨膜受累,骨受累表现为肿瘤包绕受累骨或侵及骨髓腔,骨膜受累表现为肿瘤与累及骨之间无薄层脂肪组织。在横轴面压脂T2WI上测量肿瘤最长径;分别在冠状面或矢状面T1WI和压脂T2WI上在病灶内和邻近的正常肌肉组织内勾画ROI,测量病灶和正常肌肉组织的信号强度,所有ROI的形状、大小相同,放置ROI时应尽量避开肿瘤出血、坏死及囊变区。每个部位均测量3次,取其平均值。分别计算T1WI和压脂T2WI上病灶与正常肌肉信号的比值(Rt1和Rfst2)。

4.图像预处理、纹理特征提取、筛选及影像组学模型的建立

由于不同部位病灶的扫描参数存在差异,故在提取纹理特征之前,对图像进行预处理以提高纹理分辨力。首先,使用μ±3δ方法标准化图像的灰阶水平,提高图像对比度[11];然后,采用灰度均衡化,来减少计算时间,提高纹理结果的信噪比[12];最后,应用3D插补技术进行重采样,确保病灶空间特征的一致性[13]。

将所有患者的T1WI和压脂T2WI图像从PACS系统以DICOM格式导入ITK-SNP 3.6.0软件。由上述2位医师采用人工手动方法分别在横轴面T1WI和T2WI图像上(T1WI上病灶ROI的勾画参考压脂T2WI),沿病灶边缘逐层勾画ROI,随后软件自动融合生成病灶的3D-ROI(图1)。然后将3D-ROI导入AK 3.2.0软件进行纹理特征的提取,软件经过自动计算得到基于T1WI和压脂T2WI的影像组学特征各1316个,特征类型包括一阶特征、形态特征、灰度共生矩阵特征、灰度区域大小矩阵特征、灰度游程矩阵特征、邻域灰度差矩阵特征、灰度依赖矩阵特征以及拉普拉斯-高斯滤波、小波变换和局部二值模式变换,其中,小波变换又包含HLL、HHL、HLH、LHH、LLH、LHL、LLL和HHH八种子带,H和L分别代表病灶区域在x、y和z轴方向上的低频分量(low-frequency component)和高频分量(high-frequency component)。采用组内相关系数(ICC)评价2位医师提取特征的一致性,ICC>0.80为一致性较好,保留一致性较好的特征进行后续分析。采用最小冗余最大相关性(minimum redundancy maximum correlation,mRMR)和最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)回归分析对纹理特征进行降维,筛选出最佳特征子集,构建基于T1WI和压脂T2WI和联合序列的3个影像组学模型,采用logistic回归(logistic regression,LR)、随机森林(random forest,RF)及支持向量机(support vector machine,SVM)三种机器学习算法分别建立机器学习模型,再根据各个特征的权重计算影像组学评分(Radscore)。

表1 无复发组和复发组STS患者在训练集和验证集中的临床资料和常规MRI特征

5.统计分析

采用SPSS 24.0、R语言4.0.4和MedCalc 19.0.2软件进行统计分析。计量资料采用Kolmogorov-Smirnov检验进行正态性检验,符合正态分布的计量资料以均数±标准差表示,并采用独立样本t检验进行组间比较;计数资料以频数表示,采用χ2检验或Fisher精确检验进行组间比较。采用ICC评价两位医师提取纹理特征的一致性。绘制校正曲线并使用Hosmer-Lemeshow检验分析预测模型的拟合优度,计算受试者工作特征(ROC)曲线下面积(AUC),通过DeLong检验比较多个模型间AUC的差异。采用决策曲线分析(decision curve analysis,DCA)比较不同模型的临床净收益。以P<0.05为差异具有统计学意义。

图2 LASSO回归对压脂T2WI序列提取的影像组学特征进行降维。a)使用LASSO方法降维后绘制二项式偏差和最优超参数Log(λ);b)纹理特征的LASSO收敛系数图,显示13个非零系数的纹理特征。图3压脂T2WI影像组学模型中各项纹理特征及其权重系数值。 图4训练集和与验证集中复发组与无复发组Radscore值柱状分布图,显示复发组的Radscore值显著低于无复发组。a)训练集;b)验证集。

1.临床资料和常规MRI特征的比较

在训练集和验证集中,无复发组与复发组之间临床病理特征和常规MRI征象的比较见表1。在2个数据集中,病灶位置(深、浅)在两组之间的差异有统计学意义(P<0.05);骨及骨膜受累在训练集中的两组之间的差异有统计学意义(P<0.05),在验证集中的两组之间的差异无统计学意义(P>0.05);筋膜侵犯和神经血管侵犯两个征象在验证集中的两组之间的差异有统计学意义(P<0.05);其它变量在2个数据集中的两组之间的差异均无统计学意义(P>0.05)。

2.影像组学特征的一致性分析

两位医师测量的各项影像组学特征之间的一致性均较好(P均<0.05),ICC的平均值为0.821,95%CI为0.632~0.916。因此,本研究中选取高年资医师提取的组学特征进行后续分析。

3.纹理特征筛选及影像组学模型的建立

AK软件自T1WI和压脂T2WI上各提取了1316个纹理特征,2个序列联合则共有2632个纹理特征,对这3个特征集分别采用mRMR方法去除冗余和不相干特征后各保留30个特征,然后采用LASSO回归进一步降维(图2),最终基于T1WI、压脂T2WI和联合序列各得到9、13和12个最具有预测价值的纹理特征(图3)。采用logistic回归分析方法分别建立影像组学模型,将模型中各个特征与所对应的加权系数进行线性组合得到每个患者的Radscore值(图4)。100次留组交叉验证(100 leave-group-out cross validation,LGOCV)显示2个单独序列及联合序列的组学模型均具有良好的稳定性。

4.临床和影像组学模型的效能评估

将组间差异有统计学意义的临床病理指标和常规MRI征象(包括病灶位置、骨及骨膜受累)纳入多因素logistic回归分析,构建临床模型,结果显示病灶位置为独立危险因素,其优势比(odds ratio,OR)为5.014(P=0.009)。

采用ROC曲线分析临床模型和3个序列影像组学模型的诊断效能,结果见表2和图5。在训练集和验证集中临床模型预测STS复发的AUC分别为0.71和0.74。在3个序列影像组学模型中,压脂T2WI的影像组学模型在训练集和验证集中的诊断效能均较好(AUC均为0.92);但Delong检验结果显示,3个序列影像组学模型之间AUC的差异均无统计学意义(训练集中Z值分别为1.669、1.520和0.159,验证集中Z值分别为1.065、0.193和0.592;P均>0.05)。三个序列的影像组学模型的AUC均大于临床模型,但仅在训练集中压脂T2WI和联合序列影像组学模型的AUC与临床模型之间的差异有统计学意义(Z=3.106,P=0.002;Z=2.545,P=0.011);在验证集中各序列影像组学模型与临床模型间AUC的差异均无统计学意义(Z值分别为0.700、1.535和0.935,P均>0.05)。

5.机器学习模型的建立及效能评估

因在训练集和验证集中压脂T2WI影像组学模型的诊断效能均较好,故将临床病理指标和常规MRI特征与压脂T2WI序列的Radscore相结合,分别采用多因素LR、RF及SVM三种机器学习方法建立机器学习模型。采用ROC曲线分析各模型诊断效能,结果见表2和图5。在LR、RF和SVM三个机器学习模型中, LR模型在训练集和验证集中的预测效能均相对最高(AUC分别为0.93和0.93)。在训练集中,LR模型的AUC与RF模型之间的差异无统计学意义(Z=0.362,P=0.718),与SVM模型的差异有统计学意义(Z=2.444,P=0.015);在验证集中,LR模型与RF、SVM模型的AUC的差异均无统计学意义(Z值分别为0.921和1.263,P均>0.05)。

表2 临床模型、影像组学模型及不同机器学习模型ROC曲线分析结果

图5 不同预测模型的ROC曲线,在训练集和验证集中均以LR模型的AUC最高,临床模型的AUC最低。a)训练集;b)验证集。 图6临床模型、压脂T2WI影像组学模型及LR、RF和SVM模型预测STS复发的决策曲线。All表示所有STS复发患者,None表示所有STS无复发患者。

LR模型的AUC与各序列影像组学模型之间的差异均无统计学意义(在训练集中Z值分别为1.808、0.816和0.401,在验证集中Z值分别为1.062、0.212、0.716,P均>0.05)。Hosmer-Lemeshow检验分析表明LR模型在训练集和验证集中拟合度均较好,差异均无统计学意义(训练集:χ2=6.593,P=0.781;验证集:χ2=4.564,P=0.803)。

DCA显示压脂T2WI影像组学模型、RF及LR模型均获得较好的净收益(图6)。

讨 论

软组织肉瘤具有复发率高的特点,明确软组织肉瘤术后复发的影响因素,指导临床提早干预,对改善预后具有重要意义。本研究中纳入多种影响STS复发的因素,构建了临床模型、影像组学模型及不同机器学习模型,探索能有效预测软组织肉瘤复发的因素。本研究结果显示压脂T2WI、联合序列影像组学模型以及LR、RF模型均具有较高的预测效能(AUC分别为0.92、0.91、0.93和0.91),且临床受益均较好。

STS复发与性别、年龄、部位、位置及边界、肿瘤组织类型、病理分级及临床分期等多种因素有关。本研究纳入多种反映肿瘤异质性的临床病理、常规MRI特征进行研究,结果显示仅肿瘤位置等少数指标有预测价值,由此构建的临床模型预测STS复发的效能较低。影像组学可以发现肿瘤肉眼无法识别的微小差异。我们提取T1WI和压脂T2WI上病灶的纹理特征并进行拉普拉斯-高斯滤波、小波变换和局部二值模式变换,筛选出最佳特征子集并构建影像组学模型,结果显示压脂T2WI和联合序列的影像组学模型的预测效能明显优于临床模型;但是,将临床病理、常规MRI特征与AUC较高的压脂T2WI序列的Radscore相结合构建不同机器学习模型,预测效能均没有明显提高,说明临床病理、常规MRI特征贡献较小。

由于压脂T2WI影像组学模型在训练集和验证集中的诊断效能均较好,本研究中仅讨论压脂T2WI序列。自该序列筛选出的13个最佳纹理特征中,12个为拉普拉斯-高斯滤波、小波变换和局部二值模式变换特征,其中5个是经小波滤波分解获得,且权重较大。原始图像上的纹理特征经过滤波变换后可抑制图像噪声,能获得更真实的影像特征[14-15]。近年来,小波变换被广泛应用于多个领域,并在医学图像处理和信号分析中取得了很好的成效[15-16],小波变换利用对图像的多分辨分解和时间频率的细节分析,通过在高频处时间细分和低频处频率细分,解决时间和频率之间的冲突,从而实现对信号细节的任意聚焦,经小波变换后的纹理特征也更能反映肿瘤的异质性。

由于不同的机器学习算法各自具有不同的优点和不足,不同算法获得的模型表现各异,难以确定何种分类模型更适合预测STS复发。本研究探索性采用了多种机器学习算法构建预测模型,其中LR是最常用的分类方法,模型可解释性非常好;SVM对于小样本、高维度、非线性数据有优势,泛化性能比较好[18];而基于决策树方法的RF是具有监督集成功能的学习算法,能够处理不平衡数据集,在没有增加计算量的情况下能改进预测的准确性,抗过拟合能力强[19-20]。本研究结果显示LR和RF模型均有较好的预测价值,明显优于SVM模型,LR模型无论在训练集还是验证集中均具有很高的预测效能,具有较好的鲁棒性。

本研究的局限性:①为回顾性单中心研究,且STS的发病率低,故样本量相对较少,模型的泛化性和稳定性差,复发组与无复发组两组数据不均衡,需要继续扩大样本量、进行多中心研究,以改进模型的诊断效能;②筋膜、神经血管侵犯、骨和骨膜受累及位置深浅等特征为影像诊断结果,未经病理证实,存在一定的主观性;③本研究仅基于T1WI和压脂T2WI两个序列提取影像组学特征,缺少增强扫描序列,在反映肿瘤内部的特征信息方面可能存在缺失[21]。

综上所述,基于常规MRI的压脂T2WI序列和联合序列的影像组学模型具有较高的预测效能,能获得较好的临床受益,可以无创、简便、有效地预测STS复发;不同机器学习算法构建的预测模型与常规影像组学模型相比,预测效能并无明显提高。

猜你喜欢
肉瘤组学病灶
影像组学在肾上腺肿瘤中的研究进展
东莨菪碱中毒大鼠的代谢组学
Optimal UAV deployment in downlink non-orthogonal multiple access system: a two-user case
PSMA-靶向18F-DCFPyL PET/CT在肾透明细胞癌术后复发或转移病灶诊断中的作用分析
原发性肾上腺平滑肌肉瘤1例
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
滑膜肉瘤的研究进展
术中超声在颅内占位病灶切除中的应用探讨
侧脑室内罕见胶质肉瘤一例
代谢组学在多囊卵巢综合征中的应用