张丽 闫鑫 李敏
【摘要】 医学影像是临床诊断的重要工具, 对医学影像进行自动分析能够提高医生的工作效率, 减少由主观经验引起的诊断误差。特征提取是影像自动分析体系中的关键环节, 对最后疾病诊断的精度具有重要的影响。然而, 现有的方法忽略了特征的判别性信息。现有特征主要是利用病灶的低级特征, 例如纹理、边缘等信息, 虽然能够对病灶的主要特点进行表示, 但是忽略了病灶之间的判别性, 降低了识别性能。针对该问题, 本文研究了一种基于深度判别性特征(DDC)学习的医学影像方法, 提出了一种新的模型双路字典编码卷积神经网络来学习语义描述码和判别性描述码。引入图像区块(patch)划分层, 生成大量的局部patch图像, 从而为模型的训练提供充足的数据。引入字典编码层和分类层, 加快特征学习速度, 提高识别精度。提出的方法用在乳腺肿瘤识别, 实验结果表明提出的方法在识别效果上优于传统方法。
【关键词】 模式识别;医学影像分析;特征提取;深度学习
DOI:10.14163/j.cnki.11-5547/r.2020.10.088
【Abstract】 Medical image is an important tool for clinical diagnosis. Automatic analysis of medical images can improve the efficiency of doctors and reduce diagnostic errors caused by subjective experience. Feature extraction is a key step in the medical image analysis, and has an important impact on the accuracy of the final disease diagnosis. However, the discriminative information of the feature is ignored. In order to tackle this problem, this paper proposes a medical image analysis based on deep discriminative characteristics (DDC) learning. A novel two-way dictionary code convolutional neural network is proposed to learn discriminative code. The patch extraction layer is introduced to generate a large number of local patch images, thus providing sufficient data for the training of the model. Introducing dictionary code layers and classification layers to speed up feature learning and improve recognition performance. The proposed method is used for breast tumor recognition. Experimental Results show that the proposed method is superior to traditional Methods in recognition effect.
【Key words】 Pattern recognition; Medical image analysis; Feature extraction; Deep learning
乳腺癌是现在致死率较高的恶性癌症之一。纹理特征是乳腺肿瘤分类最为常用、重要的特征[1, 2]。局部二进制模式 (local binary patterns, LBP)是最常用的纹理特征, 已经被用于进行乳腺超声分类[3]。许多基于灰度共生矩阵的纹理特征也是常用的乳腺肿瘤分类特征[4-8]。近年来, 为了获得更有效的纹理特征, 许多研究将焦点放在图像变换上。考虑到小波变换的时间频域的有效性, 先进行小波变换, 然后提取基于纹理和序统计特性的特征, 取得了较好的结果。有研究提出了一种有效的方向局部纹理描述子, 能够融合相位信息和LBP信息[9]。有研究表明[10]在contourlet变换后, 提取其自带的物种纹理特征有助于提升肿瘤分类的精度。考虑到shearlet的方向敏感度以及在各种分辨率上的局部信息, 在shearlet变换后再提取纹理特征也有助于提升肿瘤分类的精度。现有的特征忽略了病灶之间的判别性信息, 如果两个不同种类的病灶的纹理特点比较相似, 则基于纹理的特征很难将两个病灶区分开, 降低了识别性能。针对该问题, 本文提出了一种深度判别性特征(deep discriminative code, DDC)学习的病灶识别方法:提出了新的模型双路字典编码卷积神经网络, 学习语义描述码和判别性描述码。引入patch划分层, 生成大量的局部结构图像, 从而为模型的训练提供充足的数据。引入相似特征提取层和自匹配层, 加快特征学习速度, 提高识别精度。
1 深度判别性特征学习
1. 1 判别性描述码定義 本文提出判别性码, 主要针对具有一定相似性病灶的图像进行判别。假设有肿瘤有N个类别(在乳腺癌分类中, N=2, 即良性和恶性), 每个类别有M幅图像。首先使用主成分分析(PCA)方法对所有图像提取低维特征, 基于获取的低维特征, 利用K-means方法进行聚类, 聚类数目为N, 簇内图像属于同一类。例如, 经过聚类后, 类别A的6幅图像、类别B的3幅图像以及类别C的8幅图像聚到了同一类, 则该簇主要用于区分类别C。因此, 在编码时, 用于A和B的图像编码为0, 病灶C的图像编码为1。依次类推, 可以获取N个编码, 用于判别N个类别。基于聚类原理, 同一簇的图像具有一定的相似性, 本文则利用判别性编码针对不同类别的相似性图像进行判别性分析, 能够进一步提高识别精度。
1. 2 基于雙路字典编码卷积神经网络的编码学习 为了学习获取语义码和判别性码, 本文提出了一种新的双路字典编码卷积神经网络模型, 适用于小数据, 并更充分的利用图像的局部特性, 提高识别精度和速度。本文提出的网络模型主要由patch划分层, 中间特征提取层, 字典编码学习层以及分类层构成。见图1。
1. 2. 1 patch划分层 patch划分层主要用于提取图像的patch以及若干原子, 从而增加样本, 提高训练模型的性能。patch提取器主要是由二值掩码和非0提取器构成。其中, 二值掩码的大小与图像大小相同, 取值只有1和0两种, 值为1的元素范围由人工设定, 将原图像与二值掩码进行相乘, 再输入到非0提取器。该提取器主要是保留非0的元素, 提取出想要的局部patch。本文中提到的原子即字典学习中的原子, 用于表示病灶的局部典型特点。本文使用K-means来学习原子, 通过对同一病灶的patch进行聚类, 获得相应的原子。
1. 2. 2 中间特征提取层 为了通过原子对划分的patch进行分类, 首先构造了一个双路CNN结构分别提取原子和patch的特征。该双路结构中种的两个CNN共享相同的参数。一个CNN输入patch, 另一个输入原子。这种网络结构不增加网络的参数, 可以提供更大的灵活性。中间特征层主要由若干卷积块组成。每个卷积块首先引入卷积层用于学习局部特征、然后进行归一化和ReLU非线性激活函数加快模型的收敛速度, 最后接入最大池化层降低特征的复杂度。
1. 2. 3 字典编码学习层 字典编码学习层用于学习每个patch与原子的相似度, 通过学习一个特征转换空间将两个特征(patch和原子)映射到一个相似性空间, 从而得到patch与原子的相似度, 即可得到字典编码。具体细节如下:在学习获取patch和原子的中间特征后, 将两个特征向量相减得到一个新的特征向量, 然后把它送到字典编码层中, 字典编码层采用一个两层的全连接神经网络加一个softmax层, 两层全连接层用于进行特征转换, softmax层用于将获得的特征进行二值化, 输出为1表示与原子同类, 输出为0表示与原子不同类。同理, 可以得到一个patch与所有原子的编码, 即得到该patch的字典编码。
1. 2. 4 分类层 获得的字典编码本身带有一定的类别信息(与原子的相似度)。本文引入公式1可以从字典编码特征的维度降到1维, 得到每一个局部patch的分类结果L。在公式1中, 表示的是局部中心的数量, C是通过相似性特征层得到的相似性特征, 代表的是相似性特征的第k个元素。设定阈值为0.5, 如果q>0.5, L=1, 否则L=0。
1. 2. 5 图像分类 图像的分类结果通过融合该图像的patch的分类结果获得, 利用公式2:
在公式2中, 是从第n幅图像中提取出的所有局部patch的数量。是第n个病灶图像的第k个局部patch。通过提出的双路字典编码卷积神经网络对每一个语义描述码和判别性描述码进行学习。
2 临床案例
2. 1 数据库 本文在自建乳腺超声数据库上进行算法验证。本数据库中的图像采集自186例志愿者, 共186幅乳腺超声图像;其中良性135例, 恶性51列。见图2。
2. 2 实验方法 本文主要进行三组实验, 验证提出方法的有效性。①比较提出的深度判别性特征和浅层特征[LBP、灰度共生矩阵(GLCM)、小波]的性能。②比较提出的深度判别性特征和深层特征(Alexnet, VGG, Resnet)的性能。③测试提出方法的鲁棒性。利用曲线下面积(AUC)、准确率(ACC)、灵敏度(Sen)及特异性(Spec)作为测试指标。考虑到深度学习模型训练需要大量的数据, 所以在训练时要进行数据增广。
2. 3 深度判别性特征和LBP、GLCM、小波的性能深度判别性特征取得最好的性能, 作为一种深度特征, 有更多的有效信息, 性能要远远优于浅层特征。见表1。
2. 4 深度判别性特征和Alexnet、VGG、Resnet的性能 深层特征比浅层特征的效果更好, 然而该类特征忽略了区分性信息的学习。深度判别性特征重点学习类别之间的区分性, 因此在深层特征中能够取得最好的性能。见表2。
3 小结
本文针对现有医学影像特征提取中的判别性较差问题提出了一种基于深度判别性特征学习方法。提出了判别性描述码;提出新的模型双路字典编码卷积神经网络, 学习判别性描述码。引入patch划分层, 生成大量的局部patch图像, 从而为模型的训练提供充足的数据。引入字典编码层和分类层, 加快特征学习速度, 提高识别精度。提出的方法用在乳腺肿瘤识别, 实验结果表明提出的方法在识别效果上优于传统方法。未来研究工作中间将探索相关模型压缩技术, 降低特征的复杂度, 以期改善肿瘤识别效率。
参考文献
[1] Lee HW, Liu BD, Huang CH, et al. Breast tumor classification of ultrasound images using a reversible round-off nonrecursive 1D discrete periodic wavelet transform. IEEE Transactions on Biomedical Engineering, 2009, 56(3):880-884.
[2] Huang YL, Wang KL, Chen DR. Diagnosis of breast tumors with ultrasonic texture analysis using support vector machines. Neural Computing and Application, 2006, 15(2):164-169.
[3] Matsumoto MMS, Sehgal CM, Udupa JK. Local binary pattern texture-based classi fi cation of solid masses in ultrasound breast images. Proc. SPIE Medical Imaging, 2012:83201.
[4] Alvarenga AV, Pereira WCA, Infantosi AFC, et al. Complexity curve and grey level co-occurrence matrix in the texture evaluation of breast tumor on ultrasound images. Medical Physics, 2007, 34(2):379-387.
[5] Huber S, Danes J, Zuna I, et al. Relevance of sonographic B-mode criteria and computer-aided ultrasonic tissue characterization in differential/diagnosis of solid breast masses. Ultrasound in Medicine and Biology, 2000, 26(8):1243-1252.
[6] Lefebvre F, Meunier M, Thibault F, et al. Computerized ultrasound B-scan characterization of breast nodules. Ultrasound in Medicine and Biology, 2000, 26(9):1421-1428.
[7] Moon WK, Shen YW, Huang CS, et al. Computer-Aided Diagnosis for the Classification of Breast Masses in Automated Whole Breast Ultrasound Images. Ultrasound in Medicine & Biology, 2011, 37(4):539-548.
[8] Kuo WJ, Chang RF, Lee CC, et al. Retrieval technique for the diagnosis of solid breast tumors on sonogram. Ultrasound in Medicine and Biology, 2002, 28(7):903-909.
[9] Cai LY, Wang X, Wang YY, et al. Robust phase-based texture descriptor for classification of breast ultrasound images. BioMedical Engineering Online, 2015, 14(1):26
[10] Zhang Q, Xiao Y, Chen S, et al. Quantification of elastic heterogeneity using contourlet-based texture analysis in shear-wave elastography for breast tumor classification. Ultrasound in Medicine and Biology, 2015, 41(2):588-600.
[收稿日期:2019-12-05]