孟以爽+易平+顾问+郭雪君
摘 要: 肺结节的检测是一项非常重要的计算机辅助诊断工作。文章提出了一种多片染色重叠图像处理方法,来增强肺结节与其他健康组织间的差异性,并基于深度学习算法进行肺结节检测实验。实验使用了LIDC-IDRI数据集中的10000张肺部健康组织ROI和12000张肺结节ROI作为训练样本集,使用AlexNet卷积神经网络作为深度学习的算法网络,通过LIDC数据库中176个病人的CT图像测试,得到了95.0%的敏感性和平均5.62的假阳性率结果。实验结果表明,所提出的方法比特征提取方法等传统方法能提高肺结节的检出率。
关键词: 计算机辅助诊断; 深度学习; 肺结节; 卷积神经网络
中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2018)02-05-05
Abstract: The detection of pulmonary nodules is a very important part of computer-aided diagnosis. In this paper, a method of multi-slices coloring and superposition is proposed to increase the difference between pulmonary nodules and other healthy tissues and detect the nodules based on deep learning. The experiment uses 10000 patches of healthy tissues and 12000 patches of pulmonary nodules in LIDC-IDRI dataset as training dataset and AlexNet convolutional neural network as deep learning network. The prediction model after training is tested on 176 patients' CT images and gains the sensitive of 95.0% and an average of 5.62 false positive rates. The experimental results show that the proposed method can improve the detection rate of pulmonary nodules compared with some traditional feature extraction methods.
Key words: computer-aided diagnosis; deep learning; pulmonary nodules; convolutional neural network
0 引言
肺結节很有可能是早期肺癌的一个标志,而肺癌是新发率和致死率最高的癌症之一,因此近几年肺结节已引起广泛的注意[1-3]。传统检测肺结节的方法为通过医师观察肺部的CT切片图像,并识别病人是否有肺结节。然而较微小的肺结节在CT影像上看与血管较为相似,易被遗漏,通常一个病人的完整CT图像有数百张的切片,因此,对计算机辅助检测的研究就显得尤为重要[4]。目前,对肺结节的计算机辅助诊断多使用特征提取分析的方法。近年来,深度学习已经成为了机器学习中一个非常关键的研究领域,并在各个方向的研究中不断取得新的成就[5-7]。本文提出了一种使用多切片染色的预处理方法,并使用深度学习网络训练了大量的CT切片数据,得到了一个预测模型来进行CT切片是否含有肺结节的检测工作。
1 相关工作
深度学习的概念由Hilton于2006年在Science上提出,以区别于人工神经网络算法[8]。卷积神经网络是一种常用于图像识别和图像处理的深度学习算法,诸如人脸识别领域[9],行人检测领域[10]等各个图像相关领域,具有局部感知和权值共享等特点。通过局部感知的方式,神经元可以提取出图像的一些特征,例如方向、角点等,而权值共享这一机制使得卷积神经网络算法可以减少参数的数量。卷积神经网络算法还使用降采样的方法来减少特征的规模。
卷积神经网络的主要组成部分为卷积层、池化层和全连接层。卷积层使用卷积核对图像进行卷积操作,来学习并获得图像的一些特征。池化层常被安排在卷积层之后,负责提取图像的主要特征并进行特征压缩。使用池化层的主要目的是减少数据的规模和计算负荷,并降低算法的复杂度。全连接层则负责将提取到的特征映射到输出样本空间。
2 肺结节的检测
本文的主要研究方法是通过AlexNet深度卷积神经网络算法来对预处理后的数据进行分析。数据预处理共有三个步骤,分别为:肺实质的提取、感兴趣区域的提取和感兴趣区域的叠加操作。
2.1 肺实质的提取
数据预处理的第一步为肺实质的提取。由于我们只对肺部CT图像中的肺实质部分感兴趣,所以我们从原始CT切片图像中提取出肺实质来进行分析,这样就可以有效减少肺部轮廓对实验结果的影响。在肺实质提取的过程中,我们采取了肺部轮廓腐蚀的方法来尽量粘连在肺部轮廓上的候选肺结节与肺部轮廓分割开。
肺实质提取的详细步骤为:①将原始肺部CT切片通过固定阈值二值化,并转换为一个二值图像;②提取出二值图像中的最大连通分量,并将其视为初步提取的肺部轮廓;③通过将较小的黑色连通区域置为白色的方法填补上气管和一些小的空洞;④对肺部轮廓进行腐蚀操作,来将粘连在肺部轮廓上的候选结节与其分割开;⑤填补上一些较小的空洞,并对肺部轮廓使用上一步骤的腐蚀操作中相同的操作算子进行膨胀操作,得到最终的肺部轮廓;⑥通过该轮廓得到肺实质的掩模;⑦通过肺实质掩模从原始的CT切片图像中提取出肺实质。肺实质提取具体步骤的一个例子如图1所示。endprint
2.2 感兴趣区域(ROI)的提取
数据预处理的第二个步骤是ROI的提取。在得到了肺实质之后,我们对肺实质进行分析,并获得候选肺结节的质心位置。我们对肺实质图像以候选肺结节的质心为中心,切割出64×64的小块图像,即为肺实质的ROI。
ROI提取的步骤为:①将肺实质转化为二值图像来进行进一步的分析;②删除一些极小面积的干扰区域;③由于肺结节一般都是近似于球状的,删除一些明显的条状区域(即长宽比过于悬殊的区域);④将图像上仍然遗留的白色连通区域视为候选肺结节,并以候选肺结节的质心为中心,从肺实质中切割出64×64的小块图像,并将其视为感兴趣区域。ROI提取具体步骤的一个例子如图2所示。
2.3 感兴趣区域的叠加
数据预处理的最后一个步骤为ROI小块图像的叠加操作。当我们获得肺实质的ROI区域以后,我们从按切片深度排序的CT切片序列中,找到上一张与下一张切片与其相应的肺实质,并从肺实质中切割出与ROI同一位置的64×64小块图像。将这三张小块图像依次放入RGB通道(红色,绿色,蓝色通道)叠加,最终得到一张64×64的伪彩图。这些64×64的伪彩图将被作为后续深度学习的训练和测试样本集。
感兴趣区域的叠加操作的目的是增强肺结节和其他健康组织之间的差异性。由于肺结节的球状特征,连续三张CT切片上得到的小块图像中的候选肺结节几乎重叠。然而诸如血管之类的健康组织大多呈条状,因此,叠加后的伪彩图上能看到明显的红、绿、蓝色的渐变,显示出健康组织在纵向上呈条状的走向。
对于一些尺寸较小,肉眼识别较为困难的肺结节,通过这一预处理操作能够非常有效地增加肺结节与血管之间的差别。一些典型的肺结节伪彩图和健康组织伪彩图的样本如图3所示。
2.4 深度学习模型
本文使用Caffe(Convolutional Architecture for Fast Feature Embedding)作为深度学习的框架。Caffe由伯克利视觉与学习中心(Berkeley Vision and Learning Center,BVLC)开发,可用于作为卷积神经网络的平台[11]。Caffe有着运行速度快与可扩展等特性。实验使用服务器的操作系统为CentOS 7.3,GPU显卡为NVIDIA GeForce GTX 1080。
數据集的训练工作通过AlexNet完成。AlexNet是一种经典的开源卷积神经网络算法,曾获得2012年ImageNet视觉识别比赛的冠军(ImageNet Large Scale Visual Recognition Challenge,ILSVR)。AlexNet由五个卷积层,三个池化层,三个全连接层和七个激活层组成,有近六千万的自由参数。AlexNet网络的结构如图4。
模型的初始学习率为0.01,以每10000次迭代10的因子衰减。迭代的最大次数为100000次,动量系数为0.9,衰减权值为0.0005。在完成了最大迭代步数的训练以后,我们得到了一个模型,来进行每张伪彩色小块图像中是否含有肺结节的判别工作。
3 实验结果
本文使用LIDC-IDRI(Lung Image Database Consortium)数据库作为训练和测试的肺部CT切片样本集。LIDC-IDRI数据库由美国国家癌症协会(National Cancer Institute,NCI)为了早期癌症的研究而收集与公布[12]。LIDC-IDRI数据库是一个规模较大,被最为广泛使用的肺部CT图像数据库,包含有1007个病人的完整肺部CT切片图像及其标注信息,包括肺结节所在位置、大小与一些其他的特征。
我们使用800个病人的CT图像中提取出的10000张肺结节伪彩小块图像与12000张健康组织伪彩小块图像作为训练数据样本集。通过深度学习的模型对数据的学习和分析,最终训练得到一个预测模型。实验使用不在训练集中的另外176个病人的CT图像作为测试集,对模型进行了测试。测试集中共有321个肺部结节。根据不同肺结节大小得到的实验结果如表1所示,可以发现未被检出的肺结节尺寸均小于10mm。根据不同肺结节位置得到的实验结果如表2所示,实验结果表明不与肺部轮廓粘连的肺结节检出率高于与肺部轮廓粘连的肺结节检出率。
当预测模型分析输入的测试图像后,会输出一个0至1之间的数值,该值表现测试图像中含有肺结节的概率。通过设置一个阈值可以对测试图像进行是否含有肺结节的区分。同一阈值下,敏感性和假阳性的ROC曲线如图5所示。当阈值为0.5时,预测模型的表现较好。
本文算法的实验结果与其他CAD系统的实验结果比较如表3所示。这些CAD系统中,一半使用的是LIDC-IDRI数据库。从实验结果看出,本文提出的方法得到的检出率高于一些其他的CAD 系统,假阳性能够低于一些传统的检测方法。
4 结论
通过本文提出的基于深度学习的多切片染色方法进行肺结节检测实验,我们得到了95.0% 的高敏感性与平均5.62的假阳性。实验结果表明通过本方法可以有效地提高肺结节的检出率。本方法还适用于一些粘连在肺部轮廓上的结节和一些尺寸较小的结节,因此具有较高的普适性。未来,我们将继续在假阳性的降低和肺结节的分类(例如GGO结节与非GGO结节的区分)上开展研究。
参考文献(References):
[1] Nie S D, Li-Hong L I, Chen Z X. A CI feature-based pulmonary nodule segmentation using three-domain mean shift clustering[C]// International Conference on Wavelet Analysis and Pattern Recognition. IEEE,2008:223-227endprint