张一鸿,侯莹,包婕,王成龙,宋阳*,张玉东,杨光
作者单位:1.华东师范大学上海市磁共振重点实验室,上海200062;2.南京医科大学第一附属医院,南京210029;3.苏州大学第一附属医院,苏州215006
前列腺癌是美国男性发病率第一,病死率第二的癌症,其准确诊断是制订最佳治疗计划的保障[1,2]。前列腺癌发生包膜侵犯与根治性前列腺切除术后总生存率下降相关[3]。传统经直肠超声引导的活检往往低估了肿瘤的分期,导致预测不准确[4-6]。研究表明,多参数磁共振成像对包膜侵犯的检测是有效的[7-9]。然而,传统基于磁共振成像的研究,也不能准确地判断侵犯发生,特别是对处于顶部的癌灶,特异度只有30%左右[10,11]。
影像组学[12]是一种通过分析图像ROI,提取定量特征,并对特征进行统计分析的方法,近几年被广泛运用于医学影像研究之中[13,14]。在前列腺癌包膜侵犯方面,主要是针对癌灶内的特征进行分析[15,16]。但包膜侵犯的发生,与癌灶和腺体包膜的位置有关,仅研究一个区域不能反映两者关系。所以本文通过提取可能侵犯区域的组学特征,建立组学模型对前列腺癌是否发生包膜侵犯进行预测。相较于单一组织特征的模型,本文所建立的模型能获得更好的诊断效果。
本研究回顾性分析了2015 年1 月至2019 年6 月在南京医科大学第一附属医院进行磁共振扫描的病例,并通过医院的伦理委员会批准(批准文号:2016-SRFA-093),免除受试者知情同意。数据纳入标准:(1)前列腺癌症患者进行了根治性前列腺切除术;(2)术前4周内进行标准前列腺MRI检查;(3)磁共振检查图像包括T2加权成像、弥散加权成像和对应的ADC图像。排除标准:(1)既往有前列腺癌手术史;(2)进行过前列腺癌辅助治疗(良性前列腺增生或膀胱外梗阻的干预被认为是可接受的)。最后纳入718 例患者,其中未发生侵犯的527 例,发生侵犯的191 例。按照训练集和测试集比例4∶1随机对数据拆分,得到训练集数据574例,测试集144例。
所有数据均使用德国西门子公司的3.0 T 磁共振扫描仪Skyra。扫描参数:T2WI:TE=105 ms,TR=6000 ms,层厚=3.5 mm,扫描矩阵=384×384;DWI:TE=82 ms,TR=6000 ms,层厚=3.5 mm,扫描矩阵=128×128,含有 0、100、250、500、1000、1500、2000 mm²/s等多个b值。ADC由DWI单指数拟合模型计算得到。
两位经验丰富的影像科医师使用3D Slicer,对前列腺腺体和癌灶部分进行手动勾画,得到腺体和癌灶的ROI。由于包膜侵犯是发生在癌灶与腺体包膜接触的区域,本研究基于腺体ROI和癌灶ROI,根据以下规则生成注意力ROI,反映可能发生包膜侵犯的区域:(1)对于在癌灶内部,且在前列腺腺体以外的体素,赋予最大注意力值1.0;(2)对于在癌灶以内,腺体以内的体素,根据体素到腺体包膜的距离r,赋予注意力α/r 的注意力值,其中α 是调节参数,本实验中选取0.5,即图像分辨率;(3)对上述两步生成的区域往外做衰减直到像素值为0。
使用荷兰鹿特丹伊拉斯谟医疗中心研发的Elastix 工具包[17]将ADC 图像配准至T2 图像上,进行重采样操作,使得层内分辨率为0.5 mm×0.5 mm。对生成的注意力图,使用阈值从0.1 至0.5 以0.1 为间隔进行二值化操作,当阈值大于0.5 之后,注意力ROI 的范围太小,不利于特征提取。由于包膜侵犯发生在癌灶与包膜接触的位置,可以重点分析腺体包膜内外差异,受影像组学中微环境(Habitats)[18]启发,本研究将二值化后的注意力ROI划分为前列腺腺体区域(prostate,Pro)、前列腺癌区域(prostate cancer,PCa)和周围组织背景区域(background,BG)(图1)。分别对上述ROI 提取形状特征14 个、T2 图像和ADC图像的灰度特征各18个。
图1 实验流程图Fig.1 The workflow of out study
由于数据正负样本比例约为1∶3,本研究采用合成少数过采集术(synthetic minority oversampling technique,SMOTE)算法平衡样本。使用Z-Score 和Mean标准化的方法进行特征归一化,皮尔森相关系数(Pearson correlation coefficients, PCC)对数据进行降维,特征递归消除(recursive feature elimination,RFE)和KW (Kruskal-Wallis test)的方法对降维后的特征进行进一步选择,除去对结果贡献小的特征。使用支持向量机(support vector machine,SVM)、线性判别分析(linear discriminant analysis,LDA)和线性回归(linear regression,LR)作为分类器。运用5 折交叉验证选取最优模型参数。使用单位标准差(one-standard error,1-SE)方法进行模型选择,模型用独立测试集评估。
以上特征提取和建模操作,使用开源软件FeAture Explorer (FAE) v 0.3.6进行操作[19]。
本文使用ROC曲线和AUC来衡量模型的预测结果,并用Bootstrap 方法计算95%置信区间(confidence interval,CI)。同时还计算了敏感度、特异度、阳性率和阴性率,并使用决策曲线分析(decision curve analysis,DCA)比较模型之间收益差异。
统计学分析使用Python 3.6和Scipy 1.3,年龄和前列腺特异性抗原(prostate specific antigen,PSA)使用曼-惠特尼U检验,病理Gleason 评分(biology Gleason Score,bGS)和病理侵犯统计数量及占比,使用χ2检验,来计算训练集和测试集之间的统计分布。模型预测结果之间的差异使用威尔科克森符号秩检验。P<0.05表示差异具有统计学意义。
718 例患者的训练集和测试集数据的详细临床信息见表1,训练集数据和测试集数据临床信息差异无统计学意义。
表1 训练集和测试集患者临床信息Tab.1 Clinical information of patients in the training and test cohorts
2.2.1 阈值选择
使用不同阈值对注意力ROI进行二值化,用交叉验证的方式进行建模比较,横向对比阈值对训练集结果的影响,发现训练集的AUC表现类似,见图2。根据奥卡姆剃刀原则[20],选取特征数最少对应的模型,即阈值选取0.2。
图2 不同阈值注意力ROⅠ的建模结果。A:不同阈值模型的ROC曲线;B:不同模型AUC的箱型图和建模使用的特征数量,其中箱线图表示模型的AUC统计(左轴),绿色折线表示特征数(右轴) 图3 测试集结果。图A展示了测试集在腺体ROⅠ、癌灶ROⅠ、注意力ROⅠ和注意力ROⅠ子区域四个模型的ROC曲线;图B为这四个模型的DCA曲线Fig. 2 Model results built by attention ROⅠwith different thresholds. A:The ROC curve of different threshold models;B:The box chart of AUC of different models(left axis),and the green plot of the number of selected features(right axis).Fig.3 Model performance on the test cohort.A denotes the ROC curves of the ModelPro,ModelPCa,ModelAtten,ModelRegion on the test cohort.B denotes the DCA curves of the four models.
2.2.2 模型结果
本研究同时使用癌灶ROI、腺体ROI、阈值0.2 的注意力ROI 和注意力ROI 子区域进行建模,结果见表2。
表2 测试集在四个模型上的结果Tab.2 The results of the test cohorts on four models
当使用腺体ROI建模时,使用交叉验证和1-SE的方法进行模型确立,结果发现使用Mean标准化方法、KW 特征选择方法和SVM 分类器时,选出16 个特征,模型在验证集上的效果较好(记为Mean-KW-16-SVM),此时训练集的AUC为0.740 (95%CI:0.690~0.788)、敏感度为0.603,特异度为0.787;测试集AUC 达到0.746 (95%CI:0.651~0.835)、敏感度为0.825,特异度为0.577。当使用癌灶ROI 时,选出的模型为Zscore-KW-12-LR,此时训练集AUC为0.742 (95%CI:0.693~0.790),敏感度为0.702、特异度为0.709;测试集的AUC为0.755 (95%CI:0.670~0.838)、敏感度和特异度分别为0.725和0.692。
使用注意力ROI时,Mean-RFE-2-SVM的模型得到训练集AUC 为0.732 (95%CI:0.689~0.774),敏感度和特异度分别为0.722 和0.664,阳性率和阴性率分别为0.434和0.870;测试集AUC为0.766 (95%CI:0.684~0.846),敏感度可以达到0.900,特异度0.529,阳性率和阴性率分别为0.424和0.932。将注意力ROI中不同组分的特征分开提取并组合建模,模型Mean-RFE-14-SVM 在训练集上的AUC 为0.794(95%CI:0.753~0.835),测试集上AUC 为0.792(95%CI:0.716~0.862)。训练集上敏感度特异度分别为0.695 和0.785,阳性率和阴性率为0.536 和0.878。测试集上敏感度、特异度、阳性率和阴性率分别为0.800、0.721、0.525和0.904。
四个模型在测试集上的ROC 曲线和DCA 曲线展示在图3 中。子区域模型的AUC 最高,在概率阈值取0.2 至0.4 范围内,子区域模型获得的净收益高于其他三个模型。
常规使用腺体ROI进行组学分析时,模型挑出的特征包含了T2 和ADC 的一阶特征,但并没有形状特征。对癌灶ROI进行特征提取建模,主要是形状特征进行了贡献,即通过分析癌灶形状,可以辅助包膜侵犯诊断,特别是2D 最大直径,在建模中权重占据最大。在使用注意力ROI进行建模时,只使用形状特征的体积表面积比和ADC 的灰度最大值建模AUC 就可以达到0.766。注意力图子区域建模,测试集AUC 达到了0.792,背景、腺体、癌灶的特征均有所贡献。具体特征贡献图见图4。
图4 四个模型建模使用的特征及权重,其中A~D分别代表腺体模型、癌灶模型、注意力模型、子区域模型Fig. 4 The weights of features contributed in the model built by prostate gland,prostate cancer,generated attention,and the sub-regions of the attention were shown in figure A to D,respectively.
本研究通过前列腺腺体ROI 和癌灶ROI 生成注意力ROI,并受影像组学微环境的启发,将二值化后的注意力ROI分成背景、腺体和癌灶三个子ROI,分开提取子ROI 的组学特征,经过SMOTE 样本均衡、Mean特征归一化、PCC 降维、RFE 特征选择后,使用SVM 建立模型,在测试集上得到AUC为0.792,说明此方法可以较好地预测前列腺癌患者是否发生包膜侵犯。
相较于单纯使用临床信息,磁共振成像具有可以显示癌灶位置和解剖学信息的优势[21]。除了跟临床特征结合预测外,磁共振影像可以进行特征提取,并建立组学模型对前列腺癌包膜侵犯进行预测。Cuocolo等[22]对三个中心的前列腺癌患者的T2和ADC图像癌灶内部特征进行提取,使用单一中心数据训练,另外两个中心数据进行测试,测试集AUC 分别为0.80 和0.73,模型表现与放射科医生差异无统计学意义。Xu 等[23]在结构像、弥散像和动态增强图像上分析癌灶特征,在115 个数据上建立LASSO (least absolute shrinkage and selection operator)模型,AUC达到0.865,但使用需要注入对比剂的动态对比增强序列,增加了扫描成本。本研究仅使用了T2 和ADC 的序列,横向比较了多种建模方法,最高可以在独立测试集上达到0.792 的AUC,说明了基于磁共振成像的组学模型可以对包膜侵犯进行预测。
前列腺癌包膜侵犯问题,对于ROI的勾画至关重要。Ma 等[15]对200 多例前列腺癌患者的T2 图像的前列腺轮廓及轮廓内约1 mm处进行ROI的勾画,并纳入被怀疑是恶性或者有侵犯趋势的癌灶部分,使得ROI内部能更多地提取包膜的整体细微结构特征,建立的模型在测试集上用LASSO 模型达到0.883 的AUC。Bai 等[16]对284 例的T2 和ADC 图像进行癌灶勾画,将癌灶区域进行扩张并减去其中的直肠、尿道、膀胱得到癌灶周边区域,对其进行特征提取。癌灶区域、周边区域和临床特征分别和组合建模,癌灶周边区域和临床信息的结果最好,测试集上AUC 达到0.718。但这个过程是需要临床医生进行手动勾画感兴趣区域,勾画结果依赖于医生的临床经验。本研究使用的是自动生成注意力图的方式,借鉴了微环境的实现思路,将注意力图划分为更具有组织结构信息的背景、癌灶、腺体等三个区域,分别进行特征提取建模。
相比于其他学者影像组学的工作,本研究使用的特征主要是形状特征和灰阶特征,其原因是考虑到弥散序列的低分辨率和低信噪比,相比于纹理特征,形状和灰阶特征的鲁棒性更好[24,25]。本研究的注意力图模型验证发现,不管是基于整体注意力ROI还是基于其子区域,最终结果表明体积表面积比和ADC图像各组分的灰度值对前列腺癌的包膜侵犯的预测有较大的作用。原因可能是在注意力ROI生成时,选择的是癌灶与腺体边界相近的部分,而腺体边界通常类似于球形,如果癌灶没有突破包膜,那么生成的注意力ROI很可能是月牙状,体积表面积比较低。而各个组分在ADC图像上的整体灰度是有差异的,比如膀胱的亮度最高,其次是腺体,然后是癌灶,背景部分的亮度最低,因此当ADC图像组分越多,灰度差异越大,组分越复杂,越可能发生侵犯。特别是针对子区域模型,特征来源清晰,解释性较强,在临床上具有较好的接受程度。
虽然研究使用自动化的方法生成注意力ROI,但是需要医生手工对前列腺腺体和癌灶进行勾画,勾画过程也是异常烦琐。后续可以使用深度学习对腺体和癌灶进行自动的分割,使得过程自动化。其次,本研究仅仅使用了单一中心的数据,不具有普适性,后续可以在更多不同设备不同中心的数据上进行验证和优化。
综上所述,本研究提出了一种自动生成注意力图的方法,对注意力ROI进行子区域划分并提取特征进行影像组学建模,以辅助诊断磁共振前列腺癌包膜侵犯的诊断问题。本研究所提出的模型使用了解释性较好的特征,有助于辅助临床医生进行诊断,在临床决策中具有一定的参考价值,注意力图的思路也能够为其他相关诊断问题提供研究思路。
作者利益冲突声明:全体作者均声明无利益冲突。