基于乳腺X线图像纹理特征建立机器学习模型在鉴别良恶性乳腺肿块中的价值

2021-04-26 01:43黄栎有高先聪尤传文
放射学实践 2021年4期
关键词:符合率纹理肿块

黄栎有, 高先聪, 尤传文

图1 女,80岁,右乳乳头状癌。a)右侧乳腺CC位X线图像,显示乳腺内椭圆形病灶,大部分边界较清晰;b)手动勾画ROI(红色区域)后的图像。 图2 女,52岁,左乳纤维腺瘤。a)左侧乳腺CC位X线图像,显示乳腺内不规则形病灶,部分边界欠清晰;b)手动勾画ROI(红色区域)后的图像。

乳腺癌作为发病率最高的女性恶性肿瘤,目前已成为我国45岁以下女性死亡率最高的恶性肿瘤之一[1]。尽早发现和诊断可以有效提高乳腺癌患者的生存率[2]。目前,乳腺X线检查在良恶性乳腺肿块的鉴别诊断中已得到广泛的临床应用,但仅凭对形态学特征的主观分析来鉴别肿块良恶性仍存在较大困难。纹理分析能够提取并定量分析图像中的纹理特征参数,提供图像中肉眼无法观察到的潜在信息[3]。而机器学习作为一种人工智能算法,可以利用纹理分析提供的纹理特征参数建立疾病的分类模型。目前基于机器学习的纹理分析的相关研究已越来越多[4-6]。本研究拟探讨基于乳腺X线图像纹理特征所建立的机器学习模型在鉴别乳腺肿块良恶性中的应用价值。

材料与方法

1.研究对象

回顾性搜集2017年1月-2019年12月在本院行乳腺X线检查且经病理证实的243例乳腺肿块患者(263个病灶)的病例资料。所有患者为女性,年龄21~82岁,平均(50.4±15.41)岁。良性肿块患者106例共肿块124个,包括纤维腺瘤77例(95个肿块)、乳腺病29例(29个肿块);恶性肿块患者137例共139个肿块,包括浸润性导管癌122例(124个肿块)、导管内癌7例(7个肿块)、乳头状癌4例(4个肿块)、黏液腺癌4例(4个肿块)。纳入标准:①有明确的病理和临床诊断结果;②肿块内无明显钙化或空洞;③肿块直径0.5~3.0 cm。

2.检查方法

使用HoLogic Inc. Lorad公司Selenia新型数字化乳腺X光机。常规摄取内外侧斜位(mediolateral oblique,MLO)和头尾位(cranial caudal,CC)X光片。选用Auto-Filter曝光模式,25~30 kV,75~95 mAs,图像大小24 cm×29 cm。

3.建立机器学习模型

选择图像:由2位具有5年以上乳腺X线诊断经验的放射科医师采用盲法对每例患者的MLO及CC图像进行比较,选取肿块显示较清晰的图像用于纹理分析。当两位医师的意见不同时,经商议达成一致。将选定的图像以bmp格式保存至电脑。

图像分割及特征提取:采用MaZda软件对图像进行后处理。为降低对比度和亮度对图像灰度值可能带来的影响,在软件中选择μ±3σ选项对每帧图像进行灰度归一化处理。由一位诊断医师在每个肿块灶内进勾画ROI(图1、2)。MaZda软件提供6种纹理分析方法:①灰度直方图;②灰度绝对梯度;③游程矩阵;④灰度共生矩阵;⑤自回归模型;⑥小波变换。每个病灶共提取133个纹理特征,详见表1。

图3 RF模型中纹理特征重要性排序的线条图。

表1 纹理特征列表

机器学习模型的建立及验证:利用R语言(V3.5.1)的caret软件包对数据进行处理和建模。首先,对提取到的纹理特参数进行初步降维,然后利用递归特征删减法进行特征选择,得到最终用于训练模型的纹理特征参数。将处理后的所有数据分为训练集和验证集两组,按照7﹕3的比例进行随机分配。利用训练集数据分别训练获得线性判别分析(linear discriminant analysis,LDA)、Logistic回归(logistic regression,LR)、随机森林(random forest,RF)和支持向量机(support vector machine,SVM)四种模型。其中LDA模型的k值为7时模型的精度最高,RF模型在决策树为500、2叉树变量树为2时模型的精度最高。将训练集获得的4种模型分别在验证集中进行验证。

本研究分别通过符合率、Kappa系数以及ROC曲线下面积(area under the curve,AUC)对模型在训练集和验证集中的诊断效能进行评价,其中训练集采用10折交叉验证后所获得的符合率、Kappa系数和AUC。通过Delong法比较验证集中不同模型之间AUC的差异。以P<0.05为差异有统计学意义。

结 果

1.纹理特征的选择结果

通过对133个纹理参数进行降维处理,筛选得到33个纹理特征。然后通过特征选择,最终将22个纹理特征分别纳入4个模型中进行建模,其中预测精度最高的5个自变量为梯度峰度、高高频小波转换系数S6、偏斜度、长游程补偿和梯度偏斜度。

2.机器学习模型效能的评价

四种机器学习模型在训练集和验证集中的符合率、Kappa系数和AUC值见表2。训练集中以RF模型的诊断效能最好,诊断符合率、Kappa系数和AUC值均高于其它3种模型;SVM模型的诊断效能次之。验证集中以RF模型的符合率、Kappa系数和AUC值最高。

表2 机器学习模型ROC分析结果

通过Delong法比较4种模型间AUC的差异,结果见表3。RF模型与LDA、LR模型的AUC的差异有统计学意义(P<0.05),与SVM模型的AUC的差异无统计学意义(P>0.05)。其余各模型间AUC的差异无统计学意义(P>0.05)。RF模型中各项自变量的重要性排序见图3,其中重要性排名前5的纹理特征为长游程补偿、梯度峰度、偏斜度、高高频小波转换系数S6和峰度。

表3 四个模型间AUC的比较

讨 论

乳腺X线摄影作为乳腺癌首选的检查方法之一,对钙化灶具有很强的分辨力。但对于软组织结节和肿块,其诊断能力有限。目前,已有研究结果显示通过提取乳腺X线图像的纹理特征建立预测模型,可以辅助并提高对乳腺病灶良恶性诊断的准确性[7-8]。但上述研究采用的模型算法并不统一,且未对不同建模算法的准确性进行对比分析。

本研究探讨了乳腺X线图纹理像特征建立机器学习模型在鉴别乳腺肿块良恶性中的价值。研究发现4种预测模型的准确率均超过74%,AUC值均大于0.79,表现出良好的准确率和诊断效能。该结果与既往研究相符。在此基础上本研究通过准确率、Kappa值以及AUC值分别对4种不同模型算法的表现进行比较。其中准确率是指样本中正确分类的样本数的百分比。Kappa值反映了分类精度的一致性。AUC值反应了模型的诊断效能。研究发现RF模型在训练集与验证集中准确率、Kappa值和AUC均高于其它模型。其中RF模型在验证集中的准确率为94.8%,Kappa系数为0.896,AUC值为0.946。其与LDA模型、LR模型间AUC值差异具有统计学意义。RF模型在本研究中表现出高准确性、高度的分类一致性和显著的诊断效能,提示RF模型在鉴别乳腺肿块良恶性中最具潜力。RF模型作为一种用随机方式建立的包含多个决策树的分类器,具有可以处理高纬数据、模型泛化能力强、抗过拟合能力强以及鲁棒性等优点[9]。因此,RF模型可以基于图像纹理特征参数训练出较为稳定的模型。

SVM模型的符合率和Kappa系数仅次于RF模型,验证集中AUC值高于LDA和Logistic回归模型,但差异不具有统计学意义。SVM模型通过寻找对空间划分的最优超平面,对特征空间进行分类。其具有不依赖数据维度、要求样本量小和分类思想简单等特点[10]。本研究中,LDA和Logistic回归模型的表现要逊于RF和SVM模型。LDA模型本质是将初始样本映射到维度更低的样本空间中进行类别输出。LDA模型对非高斯分布的样本及在样本分类信息依赖方差时表现较差,且容易出现过拟合。Logistic回归模型作为被广泛应用的一种广义线性回归模型,存在对连续变量异常值较敏感的问题,其预测结果严重依赖数据质量[4]。但相比属于黑箱算法可解释性差的RF和SVM模型,Logistic回归模型的结果具有较强的可解释性。因此,在疾病诊断中仍具有重要价值。近年来,利用机器学习模型预测疾病类型以及预后的研究越来越多。彭涛等[5]发现RF模型在多参数MRI诊断前列腺癌中表现最好,SVM模型次之;李琳等[11]研究发现RF与SVM模型对原发性肝癌的预后预测中优于Logistic回归模型。本研究结果与之相似。

RF模型支持对参数重要性的排序。结果显示重要性排在前5位的纹理参数分别为长游程补偿、梯度峰度、偏斜度、高高频小波转换系数S6以及峰度。游程矩阵反映了具有特定灰度值的像素在既定方向上出现的频数,长游程补偿值越小表明图像纹理越不均匀。峰度表示的是直方图的锐度。偏斜度为直方图的不对称性的度量方法。高高频小波转换系数反应了图像的细节及清晰度。以上纹理特征均被研究证明在对鉴别肿瘤的良恶性中存在价值[12-13]。

本研究的局限性:①本研究为回顾性单中心研究,且样本量相对较少,研究结果可能存在一定偏倚;②ROI为人工勾画,因此纹理特征的提取结果可能受到人为因素的影响;③本研究仅讨论了4种模型算法,需对更多的模型算法做进一步的对比研究。

综上所述,基于乳腺X线图像纹理特征的机器学习模型在鉴别乳腺肿块的良恶性中具有一定优势,其中RF模型表现出较好的分类性能,SVM模型的表现仅次于RF模型。

猜你喜欢
符合率纹理肿块
颈部肿块256例临床诊治分析
基于BM3D的复杂纹理区域图像去噪
肺纹理增多是病吗?
TEXTURE ON TEXTURE质地上的纹理
口服等渗甘露醇多层螺旋CT小肠造影的临床应用研究
多层螺旋CT与MRI在肝脏肿瘤鉴别诊断中的应用价值
消除凹凸纹理有妙招!
经腹及经阴道超声在诊断盆腔肿块中的应用
乳腺肿块二维及彩色多普勒特征与病理学对照
完形填空精选