吴秀明,王霞丽,吕国荣,魏梦婉,杜永兆,,柳培忠,
1.福建医科大学附属泉州第一医院超声科,福建泉州362000;2.泉州医学高等专科学校省级母婴健康服务应用技术协同创新中心,福建泉州362000;3.华侨大学工学院,福建泉州362000
乳腺癌严重影响着女性健康,根据世界卫生组织的数据,乳腺癌的发病率一直呈上升趋势,而早期诊断和治疗是提高乳腺癌生存率的重要手段[1]。超声是目前最常用的乳腺肿瘤早期检查手段之一,然而正确解读超声图像依赖医师的临床经验,主观性因素的干扰影响其可靠性及可重复性[2-3]。利用计算机辅助技术(Computer Aided Detection,CAD)可有效地区分乳腺肿块的良恶性,但鲜有报道[4-8]。因此,本研究探讨CAD在良恶性检测与特征提取基础上的分类对于乳腺肿瘤的诊断价值。
回顾性分析2017年1月~2018年12月于泉州市第一医院乳腺超声影像检查发现肿瘤的1 016 例患者超声影像资料,有既往乳腺手术史和影像图片质量不佳、临床资料不完整的病例给予剔除,最终获得617例乳腺超声图像,根据BⅠ-RADS评分系统对其实施分级诊断[9],诊断结果为恶性267 例,良性350 例,所有病例均经过超声科医师诊断及术后病理学证实,且超声图片质量合格,临床资料完整。
采用PHⅠLⅠPS iu22、PHⅠLⅠPS iu Elite 等彩超诊断仪,探头频率12 MHz。患者取仰卧位,于乳腺各个象限作纵切面和横切面扫查。在病灶位置重点观察肿块的边缘形态、周围声晕、内部回声、后方衰减等,采集不加彩色血流、不加标注的原始图像供计算机分析。
CAD肿瘤良恶性检测方法流程如图1所示,主要包括图像预处理、特征提取及分类器设计等几个部分。
图1 CAD乳腺肿瘤良恶性检测方法流程图Fig.1 Flowchart of benign and malignant breast tumors detection by computer-aided detection
如图2所示,图像边缘有很多文本及其他干扰信息,有必要为图像选择ROⅠ。但是由于肿瘤的大小、形状及其在图像中的分布位置并不固定,很难自动选取ROⅠ和肿瘤轮廓。因此,为了保证ROⅠ和肿瘤轮廓的准确性,我们采用人工提取的方式,过程如图3所示。
目前对超声图像提取的特征主要包括形态学、统计学、纹理以及分布等特征。本文主要采用图像的形态学特征及纹理特征,是图像物体表面的重要特性,包含了图像中各像素间的空间分布关系。利用HOG[10]计算和统计图像局部区域梯度方向直方图来形成特征,利用LBP[11]描述图像局部纹理特征,利用GLCM[12]提取包括能量、熵、对比度、相关度等纹理特征,结合HOG、LBP及GLCM 的特征提升乳腺肿瘤良恶性检测的效果。
本文对SVM 分类器进行研究[13],具体方法是利用核函数将原始数据映射到高维空间,得到决策超平面。
由两名熟悉超声仪器、具有医学专业主治医师以上职称的医师联合提出诊断。
采用SPSS 19.0 软件进行数据处理,计量数据用均数±标准差表示。计算人工诊断、HOG、LBP、GLCM 单特征以及三特征融合CAD方法鉴别良恶性肿瘤的敏感性、特异性、阴性预测值、阳性预测值、准确率及ROC曲线下面积(AUC)值。组间比较采用χ2检验,AUC值的比较采用McNemar配对检验,P<0.05为差异有统计学意义。
图2 乳腺超声图像样本Fig.2 Samples of breast ultrasound images
图3 图像预处理过程Fig.3 Image preprocessing
利用如图1 所示的CAD 乳腺肿瘤良恶性检测方法,对所有乳腺肿瘤病例进行训练及测试,基于SVM分类算法的各种特征提取方法得到的对比结果如表1所示。
表1 SVM分类算法结果Tab.1 Classification results based on support vector machine
多特征融合方法的各项诊断效能及AUC值均优于单特征LBP、HOG、GLCM(P值均<0.05),见图4。与人工诊断相比,多特征融合的敏感性无显著差异,但特异度显著升高达98.57%(Z值=2.25,P<0.05),同时AUC值为0.985,显著优于人工诊断的0.910(Z值=1.99,P<0.05)。
图4 SVM分类算法结果的ROC曲线比较Fig.4 Comparison of receiver operating characteristic curves of classification results based on support vector machine
上世纪90年代以来,乳腺癌的发病率逐年升高。根据世界卫生组织的数据,乳腺癌每年造成50 多万人死亡,每年有170万新病例被确诊为乳腺癌[14]。超声检查因其无创性、可重复性强、费用低等优点,是目前最常用的乳腺肿瘤早期筛查手段之一[15]。然而,正确解读超声图像需要医生具备较高的技术和临床经验,且诊断结果往往较为主观,容易导致漏诊和误诊[16]。部分无法直接通过影像结果确诊的患者需要进行活检,但活检是一种侵入性检查,并且大部分检查结果是良性的,这将给患者的生理和心理健康带来危害[17]。因此,利用CAD 对乳腺肿瘤进行良恶性分析的方法应运而生。CAD 可以从超声图像中检测出人眼无法获取的信息,如纹理信息、边缘信息等,给医生提供可靠的辅助诊断意见,不仅利于缓解医生的工作负荷,减少因医生经验不足或视觉疲劳等主观原因引起的误诊,也为病人降低了活检率,减轻痛苦。
鉴于此,CAD 技术的研究应用也在国内外受到了广泛关注。对于乳腺超声图像肿瘤良恶性检测的研究方法主要分为两大类:(1)基于手工提取特征的方法:Gomez等[5]通过提取病灶周围最小边界矩形区域计算出灰度共生矩阵,并分别从6个量化水平、4个方向和10 个距离计算出22 个共生统计量,采用Fisher 线性判别分析对纹理特征的判别能力进行评价;汪源源等[5]提出基于形态特征判别超声图像中乳腺肿瘤的良恶性方法,先提取超声图像中乳腺肿瘤的边缘,然后对所得边缘计算相应的3 种形态参数,最后分别采用Fisher线性判据、误差反向传播神经网络和径向基函数神经网络对形态参数进行分类[18];吴英等[7]探讨采用迁移学习方法对乳腺良恶性肿瘤超声图像分类的价值,指出乳腺恶性肿瘤的边缘模糊度、硬度、肿瘤后方与周围区域回声差异、邻域灰度差矩阵粗糙度及水平方向高频分量和垂直方向低频分量的直方图能量均明显高于良性肿瘤。(2)基于深度学习自动提取特征的方法:Shi 等[19]使用深度多项式网络从超声图像中提取纹理特征,再进行良恶性分类;Qi 等[20]将采用卷积神经网络构建的Mt-Net和Sn-Net 两个子网络连接起来,对乳腺肿瘤图像进行深度学习特征提取。这些研究显示多特征融合方法的各项诊断效能及AUC 值均优于单特征LBP、HOG、GLCM(P值均<0.05),表明基于计算机辅助技术的乳腺超声图像诊断可以有效区分肿块的良恶性,在临床诊断上有很大的应用前景。
本文提出一种基于超声图像的HOG、LBP 和GLCM 3 个特征融合的计算机辅助诊断乳腺良恶性肿瘤方法。结果表明,联合多种纹理特征的多特征融合方法比单个纹理特征在诊断乳腺疾病方面的各项效果更好。本研究结果还表明,通过多特征融合方法对超声乳腺肿瘤进行自动分类的诊断效能优于人工诊断分类(P<0.05),有效减少人为诊断所需要耗费的精力和时间,有望为临床鉴别提供辅助诊断依据。由于本文的实验数据来自不同超声设备及不同操作医生,实验结果受其影响。希望在今后的进一步研究中,能够解决超声设备及检查人员等存在的问题。