李陇超 常鸿志 杨艳蓉 折霞 汤敏 雷晓燕 张小玲 张沥
膀胱癌是泌尿系统最常见的恶性肿瘤之一[1]。临床将膀胱癌分为非肌层浸润性膀胱癌(nonmuscle-invasive bladder cancer,NMIBC)和肌层浸润性膀胱癌(Muscle-invasive bladder cancer,MIBC),二者治疗方式完全不同,前者主要采用经尿道肿瘤切除术,后者需行根治性膀胱肿瘤切除术,术前准确分期对膀胱癌患者治疗和预后至关重要[2-5]。目前临床分期主要依赖诊断性经尿道电切术和MRI 检查。诊断性电切术,有创且结果依赖病理标本获取准确性[6,7]。多参数磁共振成像(multiparmetic MRI,mpMRI)已越来越多应用于膀胱癌的术前分期,但其诊断准确性仍需进一步提高[8-12]。
近年来,随着人工智能技术不断发展,基于机器学习的影像组学方法已广泛应用于全身各系统疾病的诊断与评估中[13-17],采用自动化数据特征化算法将医学影像图像转化为具有高分辨率的、可挖掘的特征空间数据,量化病灶形态学特征及内部的异质性,获取主观视觉无法看到的信息,用于疾病诊断与评估等方面。本研究旨在探讨基于机器学习的影像组学模型预测肌层浸润性膀胱癌的诊断价值。
收集本院2017 年9 月~2020 年4 月经病理证实的膀胱癌患者资料。纳入标准:(1)患者术前均接受3.0 T MRI 扫描,序列包括T2WI 和DWI,自动生成ADC 图;(2)所有患者均于MRI 检查后1个月内行手术治疗,病理证实为膀胱癌。排除标准:(1)术前接受过放疗、化疗等治疗;(2)MRI 图像存在伪影,影响评估;(3)病理结果无准确分期;(4)肿瘤直径小于1.0 cm(因肿瘤小于1.0 cm 时几乎全部为非肌层浸润性膀胱癌[18]),无纳入研究的必要,且较小肿瘤在勾画VOI 时因部分容积效应影响较大。最终,共计纳入132 例膀胱癌患者,其中肌层浸润性膀胱癌51 例,非肌层浸润性膀胱癌81 例。
MRI 检查采用Philips 3.0 T MR 扫描设备,16通道腹部相控阵线圈。扫描序列及参数:(1)快速自旋回波(turbo spin echo,TSE)序列,轴位T1WI:TR 498 ms,TE 8 ms,层厚4 mm,视野260×260,矩阵288×229,激励次数1;轴位T2WI:TR 3020 ms,TE 100 ms,层厚4 mm,视野260×260,矩阵372×363,激励次数1;矢状位T2WI:TR 3541 ms,TE 90 ms,层厚4 mm,视野260×260,矩阵348×325,激励 次1。(2)扩散加权成像(diffusion weighted imaging,DWI),轴位:b=0、1000 s/mm2,TR 2000 ms,TE 72 ms,矩阵128×96,视野28 cm×28 cm,层厚4 mm,自动生成ADC图。
所有患者均在MRI 后1 个月内行手术治疗,91 例行经尿道膀胱肿瘤切除术,10 例行部分膀胱切除术,31 例行根治性膀胱全切术。对于首次行经尿道膀胱肿瘤切除术后存在切缘肿瘤组织残余患者,均行二次切除术确保肿瘤组织完整切除并最终确认病变分期。
肿瘤3D 分割:将T2WI 和ADC 图像导入ITKSNAP 软件(3.8 版本)进行病灶分割,对于多灶性肿瘤,选取最高分期病变进行分割,分别由两名有5 年和6 年膀胱癌MRI 诊断经验的医生手动逐层勾画三维体积兴趣区(volume of interest,VOI),选择每个序列的轴位图像,避开坏死区及肿瘤蒂的区域。特征提取:通过分层抽样方法将所有病例以7∶3 的比例分为训练集及验证集。应用AK(GE Healthcare Analysis Kit)软件,对获得的VOI 进行特征提取,自动获得6 大类共402 个影像组学特征,包括直方图参数、形态学参数、纹理特征参数、灰度共生矩阵参数、游程矩阵参数、灰度区域大小矩阵参数。特征筛选;在训练集中,采用单因素方差分析、Mann-Whitney U 检验进行初筛,然后通过相关系数法去冗余,最后采用十倍交叉验证LASSO 算法对特征进行降维选择。机器学习建模;采用Logistic 回归分析算法和R-Tree 对上述筛选的特征参数构建模型。分别构建3 组模型:(1)ADC特征集;(2)T2WI 特征集;(3)ADC+T2WI 特征集。验证:使用训练集数据构建模型,通过混淆矩阵的方法对验证集进行验证,采用ROC 分析评价模型的诊断效能,并计算特异度、敏感度和符合率。以上影像组学流程见图1。
图1 影像组学研究流程图。a)VOI 勾画;b)影像组学特征提取;c)影像组学特征筛选及模型建立评估 图2 a)应用Logistic 回归算法3组模型验证集的ROC 曲线,ADC、T2WI、ADC+T2WI 模型的AUC 分别为0.800、0.878、0.910;b)应用R-Tree 算法3 组模型验证集的ROC曲线,ADC、T2WI、ADC+T2WI 模型的AUC 分别为0.793、0.863、0.913
采用SPSS 22.0 和AK 软件进行统计分析。采用组内相关系数(intraclass correlation coefficient,ICC)进行一致性检验,ICC>0.8 显示一致性好。预测模型的诊断效能评估通过绘制受试者特征(receiver operating characteristic,ROC)曲线并计算曲线下面积(area under curve,AUC)、符合率、敏感度和特异度。P<0.05 为差异有统计学意义。
共计132 例膀胱癌患者,肌层浸润性膀胱癌51 例,非肌层浸润性膀胱癌81 例;单发98 例,多发34 例;MIBC 组年龄(65.4±9.2)岁,男44 例,女7 例;NMIBC 组年龄(64.3±8.9)岁,男68 例,女13例。随机分组中,训练集91 例,35 例MIBC,56 例NMIBC;验证集41 例,16 例MIBC,25 例NMIBC。
两名医师在T2WI 和ADC 图上勾画VOI 一致性检验的ICC(95%CI)值分别为0.905(0.857~0.954)和0.924(0.865~0.967),均显示较好的一致性。最终选择较高年资医生勾画的VOI 进行影像组学分析。ADC 图筛选出4 个影像组学最优特征,T2WI 筛选出13 个影像组学最优特征,ADC 与T2WI 一起筛选出6 个影像组学最优特征。
通过AK 软件自动学习建模后,验证集中应用Logistic 回归分析算法三组模型(ADC、T2WI、ADC+T2WI)的AUC 值分别为0.800、0.878、0.910;特异度分别为0.680、0.880、0.880;敏感度分别为0.750、0.625、0.875;符合率分别为70.7%、78.1%、87.8%。验证集中应用R-Tree 算法三组模型(ADC、T2WI、ADC+T2WI)的AUC 值分别为0.793、0.863、0.913,特异度分别为0.760、0.880、0.800;敏感度分别为0.750、0.688、0.875;符合率分别为75.6%、80.5%、83.0%(表1)。两种机器学习算法均为ADC+T2WI 模型的AUC 最高(图2);两种机器学习算法构建的影像组学模型预测肌层浸润性膀胱癌的诊断效能相当。
表1 两种机器学习算法3 组模型在验证集中的诊断效能
近年来,影像组学方法在膀胱癌患者术前评估中的应用,越来越受关注,已有文献报道影像组学方法可预测膀胱癌肌层侵犯和病理分级[19-23],但是基于多种机器学习算法和不同影像序列的影像组学方法仍需进一步验证研究。
本研究选择了T2WI 和DWI(ADC 图)两组影像图像,结果显示基于两组序列构建的模型均有较好的预测价值,提示简单的检查序列可以构建稳定和有效的模型,有助于未来简化扫描方案,减少临床对DCE 检查序列的依赖。
本研究还发现ADC 联合T2WI 特征集构建的预测模型,诊断效能最佳,两种机器学习方法的AUC 分别为0.910 和0.913,可能跟T2WI 序列能提供组织结构信息,DWI 反映组织功能信息,二者结合可以为膀胱癌肌层浸润预测提供更全面的信息。这两种检查序列均无创且易获取。
本研究另一点优势是应用Logistic 回归分析法、R-Tree 两种机器学习算法,可验证所筛选特征预测价值的稳定性。这两种机器学习算法,对ADC、T2WI、ADC 联合T2WI 三组特征集进行学习建模,结果显示在验证集中Logistic 回归分析法和R-Tree 两种机器学习算法构建的影像组学模型对肌层浸润性膀胱癌均有较好预测价值,诊断效能相当。以上两种学习算法均是临床中常用的机器学习算法,这两种机器学习算法均比较适合小样本和二分类变量的模型构建。上述结果也表明本研究中所筛选的最优特征具有较好的鲁棒性,非常适合在临床推广。
也有研究者[23]发现将影像组学特征和其他成像信息(肿瘤是否存在蒂)相结合更有利于肌层浸润性膀胱癌的术前预测,这确实是值得研究推广的方法,未来可以将更多的临床或影像信息,如肿瘤大小、VI-RADS 分类等结合起来,用于膀胱癌术前评估。
本研究的几个局限性:(1)为单中心回顾性分析,需大样本量的多中心、前瞻性分析进一步验证;(2)本研究中采用手动勾画VOI,两位勾画者一致性较好,但依然不排除主观因素引起偏差;(3)本组患者接受了不同手术方式,手术可能导致肿瘤组织灼烧、碎裂等,对真实病理分期结果产生影响;(4)对膀胱肿瘤与膀胱壁更好的分割仍需进一步探索研究。
综上,基于Logistic 回归分析法、R-Tree 两种机器学习算法的影像组学模型对肌层浸润性膀胱癌均有较好的诊断价值,其中基于ADC+T2WI 特征集构建的预测模型,诊断效能最优。