基于Faster R-CNN的乳腺肿块辅助检测

2019-08-08 06:23徐一舫卓一瑶孙海洋杨冠男
电脑知识与技术 2019年18期
关键词:乳腺肿块卷积神经网络深度学习

徐一舫 卓一瑶 孙海洋 杨冠男

摘要:乳腺钼靶X线图像与多数医学图像相比,肿块边沿模糊、特征区域过小、良性肿块与恶性肿块构成相似。为了解决传统计算机辅助检测乳腺肿块技术效果差的问题,对基于深度学习的乳腺肿块检测模型进行了研究,分析了R-CNN、SPPNet、Fast R-CNN、Faster R-CNN算法的原理。收集并增强了相关数据集。在Ubuntu系统下采用Tensorflow实现了四种算法。对比R-CNN系列算法的检测精度与单张图像检测耗时,验证了Faster R-CNN乳腺肿块算法的检测能力。研究结果表明,Faster R-CNN算法正确率为82.2%且单张图像检测耗时为57ms,具有良好的泛化能力与鲁棒性,适用于医学中有关乳腺肿块的检测任务。

关键词:tensorflow;卷积神经网络;深度学习;乳腺肿块;物体检测

中图分类号: TP18    文献标识码:A

文章编号:1009-3044(2019)18-0217-04

1 背景

乳腺癌在全世界是女性发病率最高的恶性肿瘤之一,严重威胁着全球妇女的生命健康。据资料显示,2012年,全球乳腺癌新发病例167.1万列,发病率为25.1%,并处于逐年上升的趋势[1]。乳腺癌的早期发现和治疗能有效挽救患者的生命。

目前,乳腺钼靶X线摄影(mammography)是诊断乳腺癌最有效的首选方法。然而,医生有可能会受乳腺钼靶X线图像上噪声与对比度的干扰而解读错误,使一些疾病误诊,导致假阴性与假阳性出现。据统计,医学影像的疾病误诊率可达到 10%~30%[2]。因此,为了降低误诊率出现了大量的计算机辅助检测技术(CAD),并有一些投入临床使用。之后,从物体分类到物体检测的过渡,出现R-CNN[4]、SPPNet[5]、Fast R-CNN[6]、Faster R-CNN[7]等方法。相较于传统的CAD,深度学习模型能够提高检测正确率,识别的网络更复杂,通过GPU加速使得学习效率提高,所以,传统的CAD正逐步被深度学习模型所取代[8]。

本研究采用深度学习中常用的Faster R-CNN方法来辅助医生解决良性与恶性乳腺肿块检测的相关问题。训练集和测试集由International Workshop on Digital Mammography提供的DDSM (The Digital Database for Screening Mammography)[9]数据集组成,验证集由部分DDSM数据集与Royal Marsden Hospital提供的MIAS(Mammographic Image Analysis Society MiniMammographic Database)[10]数据集组成。最后通过对数据集的增強与模型的微调达到检测的预期目标。

2 Faster R-CNN的介绍

2.1 R-CNN原理简介

R-CNN(Regions with CNN features)中的CNN的是卷积神经网络(convolution natural network),受Hubel和Wiesel对猫视觉皮层电生理研究启发,Lecun等最早将CNN用于手写数字识别应用上[11]。CNN与普通神经网络的区别在于,CNN中包含由卷积层和池化层构成的特征提取器,可以简化模型复杂度,再通过局部感受与权值共享可以降低模型训练速度。

R-CNN在CNN之上做了改进,可以分为四步:首先通过Selective Search搜寻可能存在物体的区域并提取出候选框,之后用CNN计算每个框的特征并提取出每个框的特征,提取出的特征使用SVM分类器[12]分类,分类后通过非极大值抑制修正输出结果。R-CNN整体框架如图1所示。

2.2 SPPNet与Fast R-CNN原理简介

SPPNet(Spatial Pyramid Pooling Convolutio-nal Network)基于传统CNN结构上,在SVM分类器之前加入了ROI池化层,使得网络输入图像可为任意尺寸,输出尺寸不变[5]。SPPNet只需要运算一次,相较于R-CNN要对每个区域做卷积运算,速度与mAP均超过R-CNN。

2.3 Faster R-CNN原理简介

Faster R-CNN在Fast R-CNN的基础上用RPN(Region Proposal Network)网络代替Selective Search,RPN网络与卷积层共享网络参数,并通过end-to-end生成高质量的候选框。生成的候选框最终送入卷积神经网络与ROI池化层进行分类。Faster R-CNN整体框架如图3所示。

训练时,只需要训练RPN网络与分类网络,通常的做法是在一个batch中,先训练一次RPN网络,再训练一次分类网络。这使得速度与mAP均提高。

3 基于Faster R-CNN的乳腺肿块检测模型

3.1 数据集增强

DDSM数据集一共2620张图像。MIAS数据集一共322张图像,每幅图像都是1024像素x 1024像素,良性中有2张图像的肿块是广泛散布在整个图像里,而不是集中在一个单一的地点,不具有代表性,故去掉。其中关于肿块严重程度包括3个类别:正常(Norm)、良性(Benign)、恶性(Malignant)。本研究只采用良性与恶性肿块图像。

训练集总体数量较少,本研究对样本数据进行增强,加强训练模型的泛化能力。增强常采用的方式:平移、旋转、反转、裁剪、缩放、颜色变换、噪声扰动[13]。此处增强的方式为:先将原图像基于特征区域随机裁剪为768像素X 768像素的图像,再加入高斯白噪声、直方图均衡化。共计10734张图片。每类物体的分布如表1所示。

3.2 数据集的制作

本文将2.1节增强后的数据集打乱后,分为训练集6300张,测试集657张,验证集由未参与训练的20张原图组成,再使用LabelImg对分别训练集、测试集、验证集进行标注,标注界面如图4所示。

3.3 实现环境和模型设置

本文的Faster R-CNN模型在Ubuntu操作系统下,基于Tensorflow深度学习框架与python3.5实现,GPU为GeFore 930M。Faster R-CNN算法选用在ImageNet数据集上训练好的inception v2[14]预训练模型,进过多次调参,最终选用rmsprop优化器,初始learning rate设为0.001,并采用指数下降法更新learning rate,batch size设为10,迭代次数50000次,得到训练好的模型。

3.4 评估指标的定义

肿块良恶性是二分类问题,为了衡量模型表现,本次试验中,计算了机器学习常用的评估指标准确率(Accuracy)。

4 实验

基于Faster R-CNN的乳腺肿块辅助检测结果如图6与图7所示,其中方框内是检测到的肿瘤,准确率显示在方框上。

5 结论

使用深度学习中R-CNN系列算法来进行乳腺肿块的辅助检测,可以检测乳腺中的肿块及肿块严重程度,共3个类别。结果表明,基于Faster R-CNN的乳腺肿块检测模型能较好地完成辅助检测的相关任务,通过对比四种算法说明Faster R-CNN模型在判断良恶性时可以达到82.2%的正确率与单张图像检测耗时57ms的效果。

影响乳腺肿块图像检测的因素主要包括肿块边沿模糊、特征区域过小、良性肿块与恶性肿块构成相似等。本研究能够克服这些影响因素,但对于乳腺中出现多个肿块或者肿块广泛散布与乳腺之中,模型不能完全识别到所有的肿块的情况,接下来有待进行进一步的研究。

参考文献:

[1] 师金, 梁迪, 李道娟, 等. 全球女性乳腺癌流行情况研究[J]. 中国肿瘤, 2017, 26(9): 683-690.

[2] Zheng GY, Liu XB, Han GH. Survey on medical image computer aided detection and diagnosis systems[J]. Ruan Jian Xue Bao/Journal of Software, 2018, 29(5): 1471-1514.

[3] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Proceedings of the International Conference on Neural Information Processing Systems, 2012: 1097-1105.

[4] Ross Girshick, Jeff Donahue, Trevor Darrell, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE Conference On Computer Vision and Pattern Recognition, 2014: 580-587.

[5] Kaiming He, Xiangyu Zhang, Shaoqing Ren, et al. Spatial.Pyramid Pooling in Deep Convolutional Networks for Visual Recognition[C]//IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2015, 37(9): 1904-1916.

[6] Girshick R. Fast R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision, 2015: 1440-1448.

[7] Shaoqing Ren, Kaiming He, Ross Girshick, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[C]//IEEE Transactions on Pattern Analysis & Machine Intelligence, 2016, 39(6): 1137-1149.

[8] 孙利雷, 徐勇. 基于深度学习的乳腺X射线影像分类方法研究[J]. 计算机工程与应用, 2018, 54(21): 13-19.

[9] Bowyer K, Kopans D, Kegelmeyer W P, et al. The Digital Database for Screening Mammography[C]//In proceedings of the Third International Workshop on Digital Mammography, 1996.

[10] Suckling J. The Mammographic Image Analysis Society Digital Mammogram Database Exerpta Medica[C]//International Congress Series, 1994(1069): 375-378.

[11] Lecun Y, Boser B, Denker J S, et al. Backprogation applied to handwritten zip code recongnition[C]//Neural Computaion, 1989, 1(4): 541-551.

[12] Adankon M M, Cheriet M. Support vector machine[J]. Computer Science, 2002, 1(4): 1-28.

[13] Howard, Andrew G. Some Improvements on Deep Convolutional Neural Network Based Image Classification[C]//Computing Research Repository, 2013.

[14] Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, et al. Rethinking the Inception Architecture for Computer Vision[C]//The IEEE Conference on Computer Vision and Pattern Recognition, 2016: 2818-2826.

[15] Jiang B, Luo R, Mao J, et al. Acquisition of Localization Confidence for Accurate Object Detection[C]//European Conferenzce on Computer Vision, 2018: 816-832.

【通聯编辑:谢媛媛】

猜你喜欢
乳腺肿块卷积神经网络深度学习
基于深度卷积神经网络的物体识别算法
乳腺良恶性肿块超声造影典型模式分析及临床价值评价
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
超声弹性成像在乳腺肿块诊断中的应用研究进展
真空辅助微创旋切系统在治疗乳腺肿瘤中的应用