基于多参数磁共振成像影像组学特征的膀胱癌复发预测*

2018-12-01 08:30王焕军石宇强卢虹冰潘维滨徐肖攀
中国医学装备 2018年11期
关键词:组学灰度模态

杜 鹏 王焕军 石宇强 刘 洋 卢虹冰 郭 燕 潘维滨 张 曦 徐肖攀*

膀胱癌(bladder cancer,BC)是泌尿系统最常见的恶性肿瘤,在美国癌症协会最新发布的“Cancer Statistics,2018”中,BC位居男性恶性肿瘤发病率第四位,病死率第八位[1]。高复发率是BC的重要特点之一,数据显示,50%~70%的非肌层浸润性膀胱肿瘤(non-muscle-invasive bladder cancer,NMIBC)患者会于术后18个月中再次发现膀胱肿瘤[2]。对于检测中极易漏检的Tis期病灶只存在黏膜层的NMIBC患者,54%会发展为肌层浸润性膀胱癌(muscle-invasive bladder carcinoma,MIBC)。MIBC患者经根治性膀胱全切术以及盆腔淋巴结清除后,90%的局部病灶会得到有效控制,其术后5年内的复发率降为10%左右[3-5]。因此,术前精准预测BC患者的复发概率,以便医师为患者制定合理有效的治疗方案,具有十分重要的临床意义。

目前,临床普遍采用欧洲癌症研究与治疗组织(European Organization for Research on Treatment of Cancer,EORTC)发布的风险评分表,对BC患者的术后复发风险进行预测。该模型主要采集肿瘤数目、尺寸、组织病理学分期、分级、有无原位癌以及复发次数6个指标,对患者术后1年或5年的复发率和进展率进行评估[6-8]。但是,该预测模型只给出了复发风险的定性分层评估,综合预测性能偏低,受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)仅为0.6,且在预测高风险组或者接种过卡介苗的患者时相较于真实值偏差较大[6-8]。为此,临床迫切需要一种更准确的预测模型,以实现BC患者复发风险的准确预测。

近年来,基于影像组学方法的研究,彰显出影像特征对于膀胱肿瘤特性诊断和预测的巨大潜能[9-14]。然而,影像组学特征能否有效用于肿瘤复发预测,目前还未见到任何文献报道。基于此,本研究拟结合影像组学分析方法,对NMIBC患者的术前影像进行分析,实现BC复发的术前准确预测。

1 材料与方法

1.1 膀胱肿瘤数据获取

选取2016年中山大学第一附属医院收治的28例BC患者的术前T2WI、DWI与ADC影像数据,其中无复发22例,复发6例。通过医师手动勾勒方式,从每位患者的多参数磁共振成像(magnetic resonance imaging,MRI)影像中寻找肿瘤最大的图层,并从中勾勒出肿瘤感兴趣区域(region of interest,ROI)。由于T2WI、弥散加权成像(diffusion- weighted imaging,DWI)与表观弥散系数(apparent diffusion coefficient,ADC)数据的灰度范围差异较大,在进行特征提取前,需对其灰度范围进行离散化,将其离散到统一灰度级。为此,分别从8个、16个、32个、64个及128个灰度尺度对肿瘤影像进行灰度标准化,如图1所示。

1.2 特征提取

有研究者对能够表征肿瘤特性的影像特征进行了总结,这些影像组学特征包括一阶特征、二阶特征和高阶特征等[13-16]。①一阶特征:如直方图特征,能够描述整个ROI与图像灰度的频率分布密切相关的全局特性;②二阶特征:如基于灰度共生矩阵(gray level cooccurrence matrix,GLCM)的特征,能够描述图像灰度局部分布特性;③高阶特征:如基于灰度游程长度矩阵(gray level run Length matrices,GLRLM)的特征,能够很好的描述图像灰度区域性分布特性。

本研究从每种模态的特定灰度级肿瘤ROI中可提取80个特征,其中直方图特征共8个,GLCM特征共39个,GLRLM特征共33个。每个模态有5个灰度级图像,共提取400个特征,三种影像模态共提取1200个特征,见表1。

1.3 基于SVM-RFE的最优特征组合选择

模型的分类效果会受到特征之间的相关性和冗余影响[17-18]。因此,合理的特征选择对提升预测分类的模型具有十分重要的作用。目前,常用的特征选择算法有基于双侧t-test的特征分析与基于支持向量机(SVM)的递归特征消除(support vector machine based recursive feature elimination,SVM-RFE)的最优子集选择。基于双侧t-test的方法是假设特征与特征之间是相互独立的,其特征筛选策略完全忽略了特征之间的相关性,因此特征冗余现象依然存在。基于SVM-RFE方法能将特征子集选择过程与分类器训练过程有机结合起来,充分衡量了特征之间的相关性,能有效削减特征的冗余,提升模型的预测效能和稳健性[13-14]。因此,本研究采用SVM-RFE方法对提取的特征集进行最优特征子集的筛选。

表1 基于T2WI、DWI及ADC模态的特征提取数量(个)

表2 各类特征在不同灰度尺度下3种模态中提取的特征综合预测性能比较

1.4 预测模型构建

基于所得的每个ROI的最优特征集,构建最终的复发预测模型的分类器,并评估其预测效果(如图1所示)。本研究使用SVM方法构建复发预测模型,其基本原理是建立一个超平面将特征集的高维映射加以区分,其中映射集是用于分类的特征集的一个高维映射[12-14]。在使用时,所有特征需归一化到[-1,1]区间,以提高运算效率。本研究采用LIBSVM-3.20软件包,采用径向基函数构建分类超平面,并使用Grid Search方法进行参数寻优。考虑到有限的样本例数,本研究采用三折交叉验证并重复100轮,以充分验证模型的预测性能,得到最终平均预测结果。预测效能评价指标包括敏感性、特异性、准确性和AUC。

2 结果

2.1 模态选取

为了验证不同模态的特征预测效能,分别对不同灰度尺度下从3种模态中提取的所有特征的综合预测性能进行比较分析,其结果见表2,如图2所示。

2.2 SVM-RFE最优特征集选取

图2 不同模态中提取的所有特征对膀胱复发的预测效果图

采用RFE-SVM对本研究提取的1200个特征进行递归剔除,最终得到由25个特征组成的最优特征子集,用于预测模型简化与效能提升,如图3所示。

图3 基于SVM-RFE的最优特征子集选择过程示图

2.3 复发预测模型检测

基于25个特征构成的最优特征子集,构建复发预测模型,并对膀胱肿瘤数据进行复发预测,其结果见表3。

表3 基于最优特征子集的BC复发预测模型综合性能分析(%)

3 讨论

医学影像在BC临床诊断中彰显出强大的潜力,Wang等[9]通过对比BC患者术后的磁共振动态增强成像(dynamic contrast-enhanced magnetic resonance imaging,DCE MRI)与DWI信息,发现DWI序列相比于DCE MRI序列在区分患者术后的BC复发与炎症方面表现更好。Wang等[10]进一步的研究发现:DWI序列在区别BC与腺性膀胱炎方面也表现优异。在比较ADC与标准化表观弥散系数(normalized apparent diffusion coefficient,nADC)在评估BC病理分级的潜力时,发现nADC序列在鉴别BC病理的高低级别上表现更优异[11]。然而目前,临床医师还无法通过NMIBC患者的术前影像对其复发的可能性进行预测。

随着医学影像信息处理技术的发展,从影像中挖掘出大量与特定癌症相关的影像组学特征,为临床医师提供人眼无法直接获取的深层信息,辅助其进行癌症特性诊断,已成为当前的研究热点。Xu等[12]发现,影像特征能够有效区分肿瘤与正常膀胱壁组织,从而实现膀胱肿瘤与非肿瘤组织鉴别。在此基础上,Xu等[13]进一步发现了多个与BC肌层浸润相关的影像特征,初步实现了膀胱浸润性的术前预测。此外,Zhang等[14]还通过对比研究高、低级别膀胱癌的特征差异,找出具有显著性差异的影像特征,实现了膀胱肿瘤分级的术前准确预测。

基于以上分析,本研究主要从以下两个角度进行:①基于多参数MRI影像组学特征构建的膀胱肿瘤复发预测模型,进行术前复发预测;②基于SVM的特征递归选择与分类策略构建复发预测模型,寻找具有全局最优的预测性的特征子集,提升BC复发预测模型的综合性能。

在多参数MRI影像中寻找肿瘤最大的图层,并从中勾勒出肿瘤ROI,并对每个ROI进行多尺度的离散化。其次,对每种模态的特定灰度级肿瘤ROI提取直方图特征、GLCM特征及GLRLM特征,构建复发预测模型的特征集。DWI与ADC中提取的影像组学特征对BC复发预测的准确性均明显高于从T2中提取的特征。将以上从T2WI、DWI和ADC的3种模态中提取的特征相互结合,并验证其预测效果,结果显示:其效果明显逊于单独使用任何一种模态的效果。其原因可能是,样本例数量较少,其阴性样本22例,阳性样本6例,导致特征数远大于样本例数,尤其是阳性样本例数。该现象会造成特征的大量冗余,在分类中产生过饱和等现象,造成严重分类误差。

为了减少特征冗余,降低模型的过拟合程度,从而有效提高模型对BC复发预测的综合性能与泛化能力,本研究在提取的1200个特征的基础上,进一步采用RFE-SVM选择最优特征子集,用于定量描述复发与非复发BC的影像差异,从而明显提高了预测模型的综合性能,灵敏度、特异度、准确率和AUC分别提升到83.33%、100%、96.43%和1.0(见表3、如图3所示)。此外,考虑到复发(6例)与未复发(22例)样本的极度不均衡性,该模型较好地抑制了因样本明显的非均衡性而对少类样本造成的预测偏差,在保持对未复发BC预测良好特异性的同时,可有效增强对复发BC的预测能力。

本研究结果表明,基于T2WI、DWI及其ADC的影像组学特征,能够对BC患者的复发风险进行定量表征,基于多参数MRI影像组学构建的膀胱肿瘤复发预测模型能够有效的进行复发预测,基于多参数MRI的影像组学特征在BC复发预测中具有巨大的潜能。

此外,本研究仍存在一定局限,如原始样本量偏低,有复发样本和无复发的样本例数极不均衡。在后续研究中,将继续收集更多符合条件患者的MRI数据,可着重增加复发样本的收集力度,在一定程度上引入更加均衡的正、负样本,对以上模型进行更全面的分析和验证。

猜你喜欢
组学灰度模态
基于BERT-VGG16的多模态情感分析模型
采用改进导重法的拓扑结构灰度单元过滤技术
影像组学在肾上腺肿瘤中的研究进展
多模态超声监测DBD移植肾的临床应用
东莨菪碱中毒大鼠的代谢组学
跨模态通信理论及关键技术初探
影像组学在核医学影像中的应用进展
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
基于最大加权投影求解的彩色图像灰度化对比度保留算法