罗锦文 朱光斌 关玉宝 周斯琴 何月明
宫颈癌宫旁浸润是国际妇产科联盟(International Federation of Gynecology and Obstetrics,FIGO)分期中重要的评价指标,是影响患者预后的独立危险因素,并且是决定患者治疗方案的主要影响因素。传统FIGO临床分期主要依靠妇科检查,主观性较强,分期的整体准确性低,不同文献报道结论差异较大[1-3],MR无辐射及软组织分辨率高,提高临床分期的准确性,但MR分期准确性与MR设备的性能、技术与影像诊断医师经验有很大关系,存在一定主观性,不同文献结论各异,因此探索一种可靠而又稳定、客观的分期方法具有重要意义。
纹理分析是通过一定的图像处理技术对已获得的医学图像数据提取出纹理特征参数,从而获得纹理的定量或定性描述的处理过程。纹理特征内在变化及定量测量的能够区别不同病变组织的类型及正常及病变组织,为疾病诊疗提供更多的客观的量化的依据[4-6]。近年来,人工神经网络(artificial neural networks,ANN)是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型,具有大规模的并行处理能力、分布性储存能力及自学习能力等优点。径向基函数(radial basis function,RBF)神经网络是具有单隐层的三层前馈神经网络,逼近能力、分类能力和学习速度、推广能力等方面都表现非常优秀,在医学统计与数据挖掘中有着广阔的应用前景。本研究通过对FIGOⅡ期宫颈癌MR图像提取定量的纹理参数特征,并进行RBF分类预测模型的建立,旨在建立用于FIGOⅡ期宫颈癌宫旁浸润诊断与鉴别诊断的RBF预测模型。
1.1 一般资料
收集2016年7月至2019年7月本院收治的经术后病理或临床、MR联合活检证实的共90例FIGOⅡ期宫颈癌患者MR图像及临床资料,年龄段26~74岁,平均(51±9)岁。所有宫颈癌患者病理均为鳞癌。纳入标准:①患者手术前均使用盆腔MR平扫+增强扫描,且MR检查与手术或活检间隔<2周;②患者术前或活检前未行任何放、化疗等治疗;③MR图像各序列清晰,满足影像组特征提取及影像诊断的要求;④术后或活检病理学诊断明确;⑤患者临床资料完整。排除标准:①全身多发肿瘤患者;②腺癌、腺鳞癌等宫颈非鳞癌病例;③患者未行手术或活检;④MR图像显示不清,无法进行影像评价与组学特征提取。
1.2 宫旁浸润判定标准
满足以下条件之一判定无宫旁浸润:①由1名具有主治医师职称以上的妇科医生查体,并由2名具有10年以上盆腔MR肿瘤诊断经验的影像主治医师共同阅片后判定无宫旁浸润;②术后病理明确无宫旁浸润。满足以下条件之一判定有宫旁浸润:①由1名具有主治医师以上职称妇科医师查体,并由2名具有10年以上盆腔MR肿瘤诊断经验的影像主治医师共同阅片后判定有宫旁浸润;②术后病理明确有宫旁浸润。
根据上述判定方法,按照FIGO指南2018年分期标准,纳入本研究的按照宫颈癌FIGO分期的病例数,非宫旁浸润组Ⅱa期为45例,宫旁浸润组Ⅱb期为45例。本研究已经获得本院伦理委员审核通过。所有患者与家属行MR检查前已告知并签署了检查知情同意书。
使用飞利浦Achieva 3.0 T磁共振扫描仪进行扫描。磁共振扫描序列包含扫描序列及参数如下。①矢状面TSE‑T2WI:TR 3500 ms,TE 94 ms,层厚3.5 mm,层间距0 mm,视野250 mm×320 mm。②横轴面TSE‑T1WI:TR 580 ms,TE 12 ms,层厚5 mm,层间距0 mm,视野192 mm×320 mm;③横轴面FS‑T2WI:TR 3 020 ms,TE 89 ms,层厚5 mm,层间距0 mm,视野266 mm×320 mm;④横轴面TSE‑T2WI:TR 2 980 ms,TE 104 ms,层厚5 mm,层间距0 mm,视野192 mm×320 mm;⑤横轴面DWI:TR 581 ms,TE 13 ms,层厚5 mm,层间距0.9 mm,视野192 mm×320 mm。⑥横轴面VIBE‑T1WI,TR 580 ms,TE 12 ms,层厚3.5 mm,层间距1.0 mm,视野260 mm×260 mm。⑦横轴面VIBE‑T1WI增强,TR 580 ms,TE 12 ms,层厚5 mm,层间距0 mm,视野260 mm×260 mm。
3.1 图像选择
在后处理工作站上将选择层厚3.5 mm及层间距0 mm的MR的T2WI矢状位图像以“*.DCM”格式导出,导出图像前保持每一张图的像素为1 118×1 429,标准化图像以减少原始图像对纹理分析各特征参数值的影响,本研究选择在T2WI序列矢状位图像上勾画ROI及提取纹理特征。分别由2名具有10年以上盆腔肿瘤MR诊断经验的副主任医师评价图像,并确定用于分析的层面,意见有分歧时通过协商达成一致。
3.2 病灶ROI特征提取
将MR的T2WI矢状位图像导入ITK‑SNAP 3.08版本(www.itksnap.org)软件,由2名具有10年以上盆腔肿瘤诊断的影像诊断副主任医师分别独立勾画ROI(图1)。ROI勾画原则:①层厚3.5 mm及层间距0 mm的MR的T2WI矢状位图像图像;②距病灶边缘内侧约1~2 mm;③逐层勾画,获得病灶的ROI容积(volume of interest,VOI)。
图1 ROI勾画标注图
将所有原始图像文件及勾画好的ROI文件导入洛兹技术大学提供的免费纹理分析软件MaZda version 4.6软件 (Technical University of Lodz,Institute of Electronics,http://www.eletel.p.lodz.pl/mazda/) 进行图像纹理特征提取[7](流程见图2)。为减少MR图像亮度与对比度的影响,特征提取前对所有MR图像进行灰度标准化处理,控制其灰度值在(μ-3δ,μ+3δ),其中μ和δ分别表示灰度值的平均值和标准差。通过MaZda软件RUN功能键,每个选定VOI可提取出3D直方图、3D灰度共生矩阵(graevel co‑occurrence matrix,GLCM)、3D游程矩阵 (run‑length matrix,GRUN)、3D绝对梯度 (absolute gradient,GRA)、 自 回 归 模 型 (Auto‑regressive model,ARM)及小波分析这六大类共794个纹理特征参数值[7-8]。
图2 图像纹理特征提取流程
3.3 特征选择及降维方法
将上述获得的全部特征采用MaZda软件自带的降维方法,分别是Fisher系数(Fisher coefficient,Fisher)、分类错误概率联合平均相关系数(classification error probability combined average correlation coefficients,POE+ACC) 和交互信息(mutualinformation,MI)的3种方法联合法(FPM法),共选择10个出最具鉴别价值的纹理特征参数。
ⅡA期患者均行手术切除病灶,有明确的病理学诊断报告,病理内容有肿瘤病理类型,分化程度,宫体、宫旁浸润程度,淋巴结情况及淋巴结转移,神经、血管侵犯情况及肿瘤的各种免疫组化信息等等,ⅡB期行活检,有病理诊断报告,ⅡB期确诊病例是临床联合MR评估并活检。
采用SPSS25.0统计分析软件,计量资料符合正态分布的,以表示,符合非正态分布的,用中位数(范围)表示。计量资料组间采用独立样本t检验及非参数U检验分析。比较经降维后对鉴别宫旁浸润组和非宫旁浸润组有价值的3D直方图、3D灰度共生矩阵,3D游程矩阵、绝对梯度、自回归模型各参数特征差异,选取具有统计学差异的参数为自变量,采用随机法70%的数据作为训练集,30%数据作为验证集,反复10次建立RBF的预测模型得到分类正确率,取分类效果最好及正确率最高的模型,并构建ROC曲线分析RBF分类预测模型的诊断效能,计算曲线下面积(area under curve,AUC)。以P<0.05表示差异有统计学意义[9]。
宫旁浸润组及非宫旁浸润组的S010熵、S110对比度、S010角二阶矩、@135°游程长度非均匀性、135°长游程补偿之间比较,差异均具有统计学意义(P<0.05);但宫旁浸润组及非宫旁浸润组的1%灰度百分位3D、45°长游程补偿、Gr均值、Teta1、Teta2比较差异无统计学意义P>0.05,结果见表1。
表1 宫旁浸润组与非宫旁浸润组MR纹理参数比较 n=45,
表1 宫旁浸润组与非宫旁浸润组MR纹理参数比较 n=45,
10个最优MR纹理参数比较,其中S(0,1,0)熵、S(1,1,0)对比度、135°游程长度非均匀性、45°长游程补偿P<0.05。
MR纹理特征1%灰度百分位3D S(0,1,0)熵S(1,1,0)对比度S(0,1,0)角二阶矩135°游程长度非均匀性135°长游程补偿45°长游程补偿Gr均值Teta1 Teta2宫旁浸润组149.74±19.53 7.23±0.22 23.32±14.18 164.76±9.73 145.29±10.08 360.41±10.67 1.14±0.086 96.22±24.95 0.83±0.046-0.63±0.057非宫旁浸润组154.82±25.39 6.96±0.28 13.77±3.48 150.52±11.34 134.20±12.38 345.52±11.76 1.14±0.090 99.87±19.15 0.83±0.056-0.63±0.061 t值-1.063 5.161 4.39 6.397 4.657 6.29-0.306-0.778 0.099-0.002 P值0.29 0 0 0 0 0 0.76 0.439 0.922 0.999
基于MR纹理特征的5个有统计学差异的参数建立的RBF模型10次随机法分类模型诊断,最佳分类预测模型为模型4,其培训的平方和误差为7.416,培训不正确率15.5%,测试平方和误差4.131a,培训不正确率15.6%;培训的整体正确率为84.5%,测试的整体正确率为84.4%。详见表2和表3。
表2 10次随机法RBF模型对宫旁浸润与分宫旁浸润的分类结果
表3 RBF模型4对宫旁浸润与分宫旁浸润的分类预测结果
结果见图3,其隐藏层激活函数为Softmax,输出层激活函数为恒等,模型包括1个输入层,1个隐藏层和1个输出层,输入层神经元个数5个,隐藏层5个,输出层2个。
图3 RBF最佳模型4神经网络图
结果见图4。按照FIGOⅡ是否具有宫旁浸润进行分组,纵坐标为预测概率,以0.5为界,划线,宫旁浸润组与非宫旁浸润组数据重叠少,提示对宫旁浸润与非宫旁浸润识别效果最好。
图4 RBF模型4观察预测图
结果见图5,可见AUC值=0.877。
图5 RBF最佳预测模型4的ROC曲线
RBF神经网络给出了各统计学有差异测纹理指标的相对重要性。5项纹理参数标注化重要性由高到低分别为:135°长游程补偿100.0%,S(1,1,0)对比度83.3%,S(0,1,0)角二阶矩80.9%,135°游程长度非均匀性75.0%,S(0,1,0)熵46.1%。详见表4。
表4 待选指标的相对重要程度
MRI在宫颈癌的诊断、分期、预后评估中都有其独特的优势,2009年至2018年更新的FIGO分期办法,增加影像学和术后病理诊断的证据,新分期中,明确提出影像学可以用于分期,而不再局限于传统的临床分期,MR应用于宫颈癌分期。常规的T2WI平扫序列能很好的显示1b期以上的病灶,所以本研究采用T2WI矢状位平扫进行病灶区域的ROI的勾画,而增强扫描进一步提高了病灶识别率,使用阴道内线圈能显示较小肿瘤。常规MR对宫旁浸润的诊断主要诊断依据是宫颈纤维基质低信号带中断、模糊。但肿瘤存在坏死与水肿时,MR图像会误判宫旁浸润,造成分期过度。随着各种MR功能成像发展,如弥散加权成像、体素内不相干运动弥散加权成像、MR灌注成像,MR波普成像、动态对比增强MR定量等技术的应用,诊断、分期的准确性、灵敏度的进一步提高,但是受限于设备、技术控制等因素制约,完全推广有一定难度;因此宫颈癌宫旁浸润的鉴别诊断仍是宫颈癌影像学研究的难点及重点。以往宫颈癌许多形态学特征、强化特征被认为宫颈癌宫旁浸润的鉴别指标,这些影像学特征仅是宏观评价宫颈癌的特点,但是对某些鉴别特征不明显是否存在宫旁浸润也是缺乏特异性,也具有不确定因素及复杂性,导致了影像及临床医师无法快速准确判断是否存在宫旁浸润。
纹理分析指通过一定的图像处理技术提取出纹理特征参数,从而获得纹理的定量或定性描述的处理过程。医学图像中纹理特征内在变化及定量测量的能够区别不同病变组织的类型及正常及病变组织,为疾病诊疗提供更多的客观的量化的依据[4-6],RBF神经网络是一种使用RBF作为激活函数的人工神经网络。RBF神经网络的输出是输入的径向基函数和神经元参数的线性组合[10]。RBF神经网络具有多种用途,包括包括函数近似法、时间序列预测、分类和系统控制等等,最早由Broomhead和Lower在1988年建立[11],它可以在任意精度下逼近任意的非线性函数,具有易于实现、鲁棒性好,分类快速准确等优点,得到了广泛的应用。本研究采用基于宫颈癌纹理特征联合鉴别宫RBF神经网络模型预测颈癌宫旁浸润分类效果,训练及验证分类准确率达84%以上,RBF神经网络模型预测模型联合纹理分析的其优势在于不依赖影像医师的主观及临床经验,不受专业领域限制,能最大限度提供当前标准图像的各种定量信息[12],有助于提高影像诊断的准确率,更好帮助临床决策。
目前国内外多数研究利用图像的纹理分析技术进行宫颈癌的研究,包括诊断、治疗评估等,Becker等[13]研究肿瘤MRI中的纹理分析可能会产生肿瘤分化和分期的替代标志物,这两者都是宫颈癌治疗计划中的重要因素,MRI纹理特征可预测子宫颈癌的分化和淋巴结分期。Ciolina等[14]研究28例局部晚期宫颈癌患者(FIGOⅠB2~ⅢB)在化疗前接受MRI纹理分析,他们显示出区分组织学肿瘤类型的潜在作用。确定纹理分析和常规MRI参数在预测新辅助化疗的肿瘤反应中的表现,并评估纹理组织异质性与子宫颈癌的组织学类型之间存在关系,得出纹理分析与常规MRI预后因素相比,可预测肿瘤对局部晚期子宫颈癌患者新辅助化疗的反应,应用于子宫颈癌T2加权像的纹理分析超过了常规预后因素在预测肿瘤反应中的作用。
RBF神经网络属于机器学习内的有监督学习,可以发现极为复杂的关系,能创建训练-检验-支持三个分区,网络训练学习更有效,RBF会根据预测变量的值来生成一个或多个因变量(目标变量)的预测模型,可以将模型导出对新的数据进行预测,在医学研究的各个领域都有广泛的应用。Anita等[15]提取早期帕金森病(PD)三维单光子计算机断层扫描(SPECT)图像的纹理特征,包括图像的强度、相关性、熵、偏度和峰度等参数,实现了使用径向基函数核(RBF)的支持向量机(SVM)和极限学习机(ELM)分类器建立,并对其结果进行了比较,发现RBF-ELM在诊断早期PD中可提供98.2%的高精度,该系统具有很大的潜力,可以协助临床医生对PD进行早期诊断,体现了RBF神经网络很好的分类效果;徐静[16]采用RBF神经网络,探讨RBF神经网络在评估慢性肾脏病(CKD)患者的肾小球滤过率(GFR)方面的性能,收集患者的性别、年龄、尿素氮、血肌酐、白蛋白等指标,对原始数据做归一化处理并建立RBF神经网络预测模型,得出结论RBF神经网络尤其能够为CKD1~3期患者、CKD2~5期患者提供更精确的GFR估计值,GFR估计值与99mTc‑DTPA肾动态显像法无明显差异。提示基于普通数据RBF神经网络预测模型与99mTc‑DTPA肾动态显像金标准有良好的匹配度,有助于指导临床决策。
本研究通过MaZda软件提取794个纹理参数,经降维及t检验得到的5项纹理参数按照标注化重要性由高到低分别为:135°长游程补偿100.0%,S(1,1,0)对比度83.3%,S(0,1,0)角二阶矩80.9%,135°游程长度非均匀性75.0%,S(0,1,0) 熵46.1%,;基于MR纹理特征的RBF模型10次随机法分类模型诊断,最佳分类预测模型为模型4,其培训的平方和误差为7.416,培训不正确率15.5%,测试平方和误差4.131,培训不正确率15.6%;培训的整体正确率为84.5%,训练的整体正确率为84.4%。本研究根据MR影像特征及纹理参数特征建立RBF神经网络分类预测模型,使用客观定量的纹理数据,使结果更加可靠。其中使用RBF神经网络最佳预测模型预测宫旁浸润的训练及验证分类准确率达84%以上,AUC值0.877,体现了RBF神经网络方法的良好效果,提示该预测模型对宫颈癌宫旁浸润具有很好的预测效果,目前,在医学统计分析中多采用线性回归,逐步回归、多元回归、logistics回归、Cox回归等进行分析,但是这些常见统计学方法对资料的分布及类型有一定的限制,RBF神经网络对各类变量要求低,能分析变量直接复杂的非线性关系,并能从训练集、验证集中找出规律,有效的表述与解决问题,其分类、分析预测的精确度高、稳定好,值得在医学统计中应用与推广。
本研究不足之处:由于纳入样本量较少,且ROI为人为勾勒,可能引起选择偏倚,后续会进一步扩大样本量及引入半自动勾勒以减少人为误差。
综上所述,利用对宫颈癌MR图像提取的纹理特征,通过特征降维、t检验并进行RBF分类预测模型分类分析,建立预测模型,能对宫颈癌宫旁浸润提供帮助,可在一定程度上避免因影像医师主观因素不同而造成诊断的差异,提高分期诊断的准确性,更好地帮助临床医师决策。