基于MRI影像组学模型预测宫颈淋巴血管间隙浸润的研究

2021-03-16 06:48姜文研崔林鹏刘广兴罗娅红
肿瘤影像学 2021年1期
关键词:组学影像学宫颈癌

姜文研,崔林鹏,金 瑛,刘广兴,马 超,罗娅红

1.辽宁省肿瘤医院(中国医科大学肿瘤医院)肿瘤防治办公室,辽宁 沈阳 110042 ;

2.中国医科大学生物医学工程系,辽宁 沈阳110122 ;

3.辽宁省计划生育科学研究院,辽宁 沈阳 110031;

4.辽宁省肿瘤医院(中国医科大学肿瘤医院)医学影像科,辽宁 沈阳 110042

宫颈癌已成为世界第四大女性恶性肿瘤,在全球因癌症死亡女性中占8%[1],中国每年新发和死亡患者分别可达10万和4万例[2]。宫颈癌淋巴血管间隙浸润(lymph-vascular space invasion,LVSI)是癌细胞侵袭进入淋巴管和血管的一种典型症状,与宫颈癌远端转移密切相关,对于早期宫颈癌治疗策略的选择尤为重要[3-4]。有研究[5]表明,宫颈癌LVSI患者的5年生存率仅约16.5%。当前,临床上对LVSI的评价依赖术中冷冻切片快速病理学检查,相对于临床检查与影像学检查相结合的国际妇产科联盟(International Federation of Gynecology and Obstetrics,FIGO)术前分期而言,具有明显迟滞性,这主要是因为目前尚缺乏针对LVSI的影像学特征性标志,影像科医师无法通过肉眼阅片对患者的LVSI状态进行判断[6]。

磁共振成像(magnetic resonance imaging,MRI)具有极高的软组织分辨力和无骨性伪影等优势,已被广泛应用于宫颈癌的各项临床诊断[7]。其中,T1对比增强(T1 contrastenhanced,T1CE)MRI影像能够显示病变的强化程度及与周围正常宫颈壁的强化对比;T2加权成像(T2-weighted imaging,T2WI)MRI影像则有利于展现病灶形态、位置和浸润范围。正是由于上述两种MRI成像方式能分别反映出疾病的不同表象,因此联合T1CE和T2WI MRI影像对宫颈癌进行联合诊断是当前的一个热门研究方向[8]。基于影像组学的医学人工智能技术通过对临床采集的医学影像提取定量特征并降维筛选后,利用定量化特征建立影像组学计算机模型,可以揭示影像与病理学信息之间的深层次关联性[9-10],有助于辅助临床医师对患者进行诊断和预后预测等工作。当前已有使用计算机辅助方法分析临床MRI影像[11-12],但针对宫颈癌LVSI的辅助诊断预测则鲜见报道。近期的一项最新研究[13]表明,使用单序列MRI影像能够对宫颈癌LVSI状态进行初步预测且准确度达到60%。虽然该报道的预测准确度较低,尚不具有为临床医师提供辅助的应用价值,但提示MRI影像中包含可用于宫颈癌LVSI预测的有效信息。因此,为了进一步探索双序列MRI影像联合对宫颈癌LVSI的预测价值,我们采集了早期宫颈癌患者的双序列MRI数据进行融合分析,以期建立具有一定临床辅助价值的计算机预测模型。

1 资料和方法

1.1 患者情况

在辽宁省肿瘤医院影像归档和通信系统(picture archiving and communication system,PACS)中收集整理2015年11月—2018年8月于辽宁省肿瘤医院就诊的151例女性患者的早期宫颈癌(ⅠA2~ⅡB期)MRI数据。其中经病理学检查证实为LVSI的患者有61例,非LVSI 90例。纳入标准:① 在病理学检查前行盆腔MRI扫描;②经病理学检查确定是否发生LVSI;③ 年龄>18岁;④ 术前FIGO分期为早期宫颈癌(ⅠA2~ⅡB期)。排除标准:① 处于孕期;② 进行过宫颈锥切术或环形电切术治疗;③ 有放化疗史;④患有除宫颈癌以外的其他肿瘤疾病;⑤ 影像学图像模糊或有伪影。本研究通过辽宁省肿瘤医院医学伦理委员会的批准。

1.2 MRI影像的扫描采集

宫颈癌MRI影像的扫描在辽宁省肿瘤医院医学影像科进行。采用德国Siemens公司的Magnetom Verio 3.0 T核磁共振扫描仪,使用腹部8通道相控阵线圈。T2WI MRI扫描参数:重复时间(repetition time,TR)/回波时间(echo time,TE)为550 ms/13 ms;层厚5.0 mm;层间距1 mm;视野400 mm×400 mm;采集矩阵320×320。T1CE MRI扫描参数为:TR/TE为5.08 ms/1.74 ms;以3.0 mL/s的速度静脉推注对比剂钆喷酸葡胺注射液剂量0.1 mmol/kg,然后推注20.0 mL 0.9%NaCl溶液。全部患者采用相同的参数和体位进行扫描,扫描开始前患者需大量饮水以充盈膀胱。扫描得到的MRI影像储存于辽宁省肿瘤医院PACS,由2名有10年以上诊断经验的放射科医师使用公开软件ITK-SNAP(version 3.6,www.itk-snap.org)对影像中的感兴趣区(region of interest,ROI)进行勾画,贴近肿瘤病灶边界并避开宫颈管黏液。当肿瘤边界不清晰时,多个序列互相参照,确定肿瘤边界。如有分歧,由有15年以上经验的放射科医师决定勾画结果。医师在勾画ROI时不知道患者的病理学诊断结果。

1.3 影像学特征提取和筛选

对医师勾画的ROI,使用Python语言开源的Pyradiomics包[14]提取特征,包括18个一阶统计学特征,14个形状特征,75个纹理特征,以及Pyradiomics包提供的8种滤波图像特征。75个纹理特征分别为24个灰度共生矩阵特征(gray level cooccurence matrix,GLCM),16个灰度级游程长度矩阵(gray level run length matrix,GLRLM)特征,16个灰度级区域矩阵(gray level size zone matrix,GLSZM)特征,5个相邻灰度差矩阵(neighboring gray tone difference matrix,NGTDM)特征,14个灰度级相关矩阵(gray level dependence matrix,GLDM)特征。特征筛选分为3步,首先使用单变量曲线下面积(area under curve,AUC)分析,保留AUC大于0.6的特征,然后使用五折交叉验证的最低绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归算法[15]进一步进行特征筛选,最后使用最小冗余最大相关性(max-relevance and min-redundancy,mRMR)算法去除特征间相关性高的冗余特征。五折交叉验证的LASSO 算法使用R语言glmnet包的cv.glmnet函数实现,mRMR算法使用R语言mRMRe包实现。

1.4 构建诺模图模型

使用筛选后的特征构建logistic分类器,获得组学标签公式,再使用R语言的rms包(version 3.5.1)建立和绘制诺模图(也叫列线图)模型。通过绘制校正曲线评价诺模图的预测能力,通过决策曲线分析计算阈值概率范围内净效益,从而对所建立的诺模图模型在临床应用中的价值进行评估。

1.5 模型验证

为了衡量构建的计算机模型对宫颈癌LVSI的预测能力,绘制模型的受试者工作特征(receiver operating characteristic,ROC)曲线,并计算AUC、特异度和灵敏度。ROC曲线的最佳截断值由最大约登指数计算得到[16]。

2 结 果

图1所示为本研究收集的早期宫颈癌患者双序列MRI影像和手工勾画的ROI,图中黄色线条为沿着肿瘤病灶边缘进行勾画的痕迹,在黄色线条内部区域提取影像组学特征。

图1 早期宫颈癌患者MRI影像和勾画的ROI

2.1 MRI影像学特征筛选

先通过单变量AUC分析筛选出AUC大于0.60的影像学特征,再通过LASSO算法进行特征筛选,共获得12个诊断力强的影像学特征(图2),最后使用mRMR算法去除冗余特征,筛选出的6个特征(表1)的特征间相关性最小,预测能力最强。6个特征中有5个属于小波特征,1个属于拉普拉斯-高斯(Laplacian of Gaussian,LoG)特征。筛选出的6个特征用于构建logistic分类器,建立预测模型。组学标签公式MRI评分=-0.515 0+0.424 1×特征1+0.434 9×特征2-0.669 7×特征3-0.522 0×特征4-0.601 6×特征5+0.373 1×特征6。

表1 T1CE和T2WI MRI序列筛选获得的影像组学特征

图2 通过LASSO算法对MRI影像特征进行筛选

表2展示了6个影像学特征的均值、标准差及t检验P值和AUC,6个影像学特征的差异有统计学意义(P均<0.05),AUC均大于0.60,表明对宫颈癌LVSI具有较好的预测能力。

表2 通过特征筛选获得的6个影像组学特征的统计分析 ±s

表2 通过特征筛选获得的6个影像组学特征的统计分析 ±s

影像学特征 数据集 非LVSI LVSI P值 AUC特征1 训练集 4.222±2.363 5.832±3.624 <0.010 0.629测试集 4.817±2.975 6.394±2.921 0.166 0.714特征2 训练集 4.256±1.336 5.748±2.648 <0.010 0.669测试集 4.429±1.323 5.087±1.800 0.254 0.623特征3 训练集 8.733±2.429 7.708±1.414 <0.010 0.638测试集 8.931±2.406 7.549±1.515 0.096 0.695特征4 训练集 -0.033±0.005 -0.036±0.004 0.023 0.654测试集 -0.037±0.010 -0.035±0.004 0.588 0.523特征5 训练集 0.261±0.003 0.260±0.001 <0.010 0.662测试集 0.260±0.004 0.260±0.001 0.597 0.505特征6 训练集 0.576±0.112 0.625±0.108 0.018 0.613测试集 0.605±0.107 0.641±0.106 0.368 0.618

2.2 建立诺模图模型

图3所示为联合双序列影像学特征建立的早期宫颈癌LVSI风险诺模图预测模型。每例患者LVSI风险值的计算方式:MRI评分通过基于T1CE和T2WI序列的影像学特征及系数计算得到,在相应的点垂直于MRI评分轴向分数轴(Points)作一条直线,最终与模型底部风险轴(Risk)相交,获得该患者的LVSI总风险值。图4A和图4B所示为模型的校正曲线,曲线的横纵轴分别为模型计算的LVSI风险值和病理学检查结果(真实标签)。图中虚线为模型的预测结果,与经原点的45°斜线越贴近说明模型预测效果越好。ROC曲线(图4C、D)表明模型在训练集和测试集上获得了良好的AUC值,分别为0.812和0.775。

图3 用于预测早期宫颈癌LVSI的诺模图模型

图4 诺模图模型的校正曲线和ROC曲线

模型的决策曲线绘制如图5所示,曲线的纵轴和横轴分别为模型的净获益率和阈值概率,底部黑色直线为假定患者都没有发生LVSI,蓝色曲线为假定患者都发生LVSI,红色曲线为本研究建立的模型。当阈值概率范围在0.07~0.77时,模型对早期宫颈癌患者有良好获益。

图5 基于诺模图模型的宫颈癌LVSI决策曲线分析

3 讨 论

随着医疗水平提升,早期宫颈癌患者的治疗效果整体较好,但LVSI往往与淋巴结转移风险显著相关,预示着较差的预后[17],因此是临床上制订治疗方案的重要影响因素。已有研究[18]表明,传统的MRI影像分析方法能通过对肿瘤子宫体积比等影像学特征进行分析,从而在一定程度上预测子宫内膜癌LVSI,但忽略了肿瘤内部特征和高维度信息。2019年,Li等[13]首次尝试使用影像组学方法通过单序列MRI对LVSI进行预测,虽然仅使用影像数据建立模型获得的预测AUC仅为0.60,但该研究首次提示MRI影像中含有早期宫颈癌LVSI的影像学标志信息。本研究中,为了进一步探索多序列MRI影像对LVSI的预测价值,我们同时纳入了T1CE和T2WI两个MRI序列数据。T1CE影像能通过微血管密度和灌注信息反映肿瘤微环境与侵袭情况,而T2WI影像则利于提供肿瘤形态信息和间质情况。通过联合这两个MRI序列,能够进一步提高计算机模型对LVSI的预测能力。

为构建预测模型,本研究分别对两个MRI序列的ROI提取特征,然后进行三步特征选择方法筛选出最优特征子集。特征筛选第二步在使用五折交叉验证的LASSO算法,计算其交叉验证损失时,测量方法选择了只用于二分类logistic回归的AUC,而没有用均方误差。图2A第一条虚线处表明AUC最大值,第二条虚线是AUC最大值的一倍标准差的位置。本研究选择在AUC最大值的一倍标准差的情况下,得到特征数量更少的特征子集用于构建分类器。最终筛选出的6个诊断力较强的特征有2个来自于T1CE序列影像学特征,均属于小波特征,有4个来自于T2WI序列影像学特征,其中有3个属于小波特征,另外1个属于LoG特征。我们的研究结果或许可以解释影像科医师无法利用MRI影像对宫颈癌LVSI进行判断的原因,是由于这些诊断力强的影像学特征标志信息均存在于时域之外的高维度空间,人类是难以对其洞察和理解的。T1CE序列的wavelet_HHH_glszm_SizeZoneNonUniformity特征测量整个ROI体积的变异性,较高的值表示异质性更高。T1CE序列的特征wavelet_LLH_firstorder_Kurtosis,峰度表示ROI的像素值分布的峰值高低,描述ROI像素值分布的陡缓程度。峰度越高,像素值的分布越集中在尾部而不是接近均值的峰值处,其方差越大,异质性程度越高。由表2可知,相比于LVSI组,非LVSI组患者的T1CE序列的两个特征的平均值都较低,且差异有统计学意义。可能由于非LVSI组患者的宫颈肿瘤异质性较低,所以,发生LVSI的概率也相应较低。LoG特征中的σ值定义了计算机模型所关注的影像中的纹理粗糙度,由于我们从T2WI序列中获得的LoG特征的σ值较小(1),表明模型更关注于影像中的精细纹理(短距离变化)。

为了建立对临床辅助诊断有价值的预测模型,我们绘制了影像组学诺模图,这是一种医学影像领域近年来广泛使用的直观模型方法。本研究利用双序列MRI影像学特征建立的诺模图模型对LVSI进行预测,测试集AUC值达到0.775,且特异度(0.759)和灵敏度(0.765)均较好,表明模型的漏诊率和误诊率较低。本研究结果明显好于2019年最新的类似研究报道[13],可能的原因是该报道仅使用了T1CE序列,而本研究筛选获得的特征中绝大部分(4个)都是来自于额外纳入的T2WI序列,表明T2WI序列对于宫颈癌LVSI有较高的诊断价值。此外,我们使用的是3.0 T MRI,而前期报道使用的是1.5 T MRI,因此本研究建立的计算机模型能获得更准确的诊断特征。决策曲线分析表明,本研究提出的模型具有较好的临床应用潜力。

本研究存在以下局限性:① 本研究提取和分析了影像组学手工影像学特征,没有引入基于卷积神经网络的深度学习特征,在未来的研究中,拟采用手工特征与深度学习特征相融合建立预测模型;② 本研究未引入DLL4、GINS2等临床分子生物学标志物建立联合预测模型;③ 本研究使用的MRI影像数据均采集自同一家医院,可能存在一定的偏倚,在下一步的研究中,拟联合多家医院进行多中心验证,从而验证所建立计算机预测模型的鲁棒性。

本研究采集在辽宁省肿瘤医院就诊的早期宫颈癌患者的双序列MRI影像,使用影像组学方法进行了特征提取和筛选,并建立了诺模图计算机辅助分析模型。研究结果表明,建立的模型可对LVSI进行有效预测,模型的特异度和灵敏度也较为理想,为临床上针对早期宫颈癌LVSI的影像学预测提供了一种新的技术思路,具有广阔的应用前景。

猜你喜欢
组学影像学宫颈癌
2022 年《中国中西医结合影像学杂志》专题介绍
乳腺炎性肌纤维母细胞瘤影像学表现1例
GM1神经节苷脂贮积症影像学表现及随访研究
影像组学在肾上腺肿瘤中的研究进展
硫利达嗪抗宫颈癌的潜在作用机制
中老年女性的宫颈癌预防
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
预防宫颈癌,筛查怎么做