基于深度学习的肺部肿瘤图像识别方法

2020-11-03 13:25高雷鸣肖满生向华政
计算机测量与控制 2020年10期
关键词:肺部卷积神经网络

高雷鸣,肖满生,向华政

(湖南工业大学 计算机学院,湖南 株洲 412000)

0 引言

肺癌是现如今人类生命的危害之一,如果能在早期发现并医治能大大提升肺癌病人的生存率。电子断面检测(CT)被用作肺癌诊断的筛查工具,有助于肺癌早期的诊断,但是分析海量肺部CT图像信息需要医生付出大量努力,而且早期肺部肿瘤特征不明显,医生在分析影像局部微小特征时会产生迟疑,无法对病人病情做出精确判断。同时医生的个人阅历作用于整个的诊断流程,缺少系统化的规范,不同的医生对于同一幅肺部CT图像可能会产生分歧,所以这种诊断模式必定存在主观成分的干扰,快速准确地判断肺部是否有肿瘤和肿瘤良性还是恶性,能够减少前期繁琐的检查,防止不需要的手术,减轻患者心理和身体的痛苦,还能够提升病人的存活率。因此,实现肺部肿瘤图像的自动检测是一项非常具有研究价值和难度的工作。

当前,主要在两方面实现对肺部肿瘤图像分类。第一是基于基础学习策略的方法,采用小波分析(WT)、非参数局部纹理特征描述子等特征提取方法和核方法、多决策树、加权稀疏编码算法等分类方法。如F.Han[1]等人对伽柏纹理、边缘特征和非参数局部纹理特征描述子进行提取来训练稀疏稳健分类器进行肺部肿瘤图像的分类。采用基于基础学习策略的学习方法,无法自动进行特征提取且过程复杂,对专业领域的条件需求过高,而且由于算法局限性,对细微特征的提取方面也存在一定的难度,严重限制了对肺部肿瘤图像分类。第二是利用卷积神经网络CNN进行识别。深度学习是基础学习更深领域的研究,其中,CNN模型在人工智能如生物身份识别[2]、人机交互识别[3-4]、医学影像分析[5]等领域都获得了突出的成就,该网络可以直接对原始图像进行处理,自动学习相应的有效特征,避免了传统分类方法的繁琐性和限制性。

现如今,卷积神经网络已普遍运用在医学图像分类。文献[6]利用噪声数据训练编码器获取肺部肿瘤图像的特征,训练泛化性能强的编码器,对肿瘤图像做出良性和恶性判断,比浅层特征提取方法取得了更高的鲁棒特征;文献[7]采用多标准特征提取方法训练网络,解决了单标准特征提取的单一性和局限性,获得了更高的分类性能;文献[8]提出一种处理海量数据的模型,对网络内部进行升级,在网络中加入隐层,使模型能够提取更具张力的特性,在面对海量图像数据时比现有方法具备更高的性能。然而,由于医学CT图像的样本注释受限于匮乏的医学专家,获取海量注释样本难以实现,从而导致缺少肺部训练数据集,卷积神经网络依然存在无法提取更有目的性的深层特征和拟合难题。

面对上述难题,本文将样本扩充、迁移学习应用于卷积神经网络模型,并在网络中引入批量归一化层,输出层通过三层全连接层和softmax回归进行分类,解决特征提取的繁琐性和网络微数据过拟合性,从而提高肺部肿瘤图像的分类精度。

1 算法描述

1.1 卷积神经网络

卷积神经网络是由神经认知机模型[9]进化而来的。现如今,卷积神经网络已发展成为一个庞大的多层神经网络,对图像全局特征地提取学习与分类是经过逐层来完成的。

卷积层是局部性的低层特征提取层,如图1所示通过卷积核从左到右、从上到下的顺序依次作用于原始矩阵,并将矩阵对应位置的元素相乘后想加,经过多次卷积操作得到输入矩阵的特征图(feature map)。卷积核矩阵的数值通过不断训练达到拟合。卷积计算[10]如下式:

(1)

图1 卷积操作

池化层是对卷积层特征进行整合分析。池化层作用于相邻的卷积层之间,用来减少样本和数值的量,以达到简化特征的维度、加速网络训练效率和避免过拟合现象的目的。池化计算公式

(2)

式中,p()表示降维函数,β表示权重参数。

全连接层是特征加权层,对特征矩阵进行向量相乘,综合池化后的所有特征,整合出具有区分性和目的性的特征信息,结合softmax回归达到对图像分类的目的。

1.2 Softmax分类器

本文使用softmax回归模型对肺部肿瘤图像进行分类。回归模型用假设函数lθ计算测试样本n属于不同种类的几率值p(m=j|n),假设函数为:

(3)

(4)

Softmax的代价函数为:

(5)

式中,λ(λ>0)为正则化系数。I{m(i)=j}为特征函数。使用梯度法来得到式(5)最小值。

1.3 迁移学习

本文是对肺部肿瘤图像微样本进行实验,在缺少海量实验数据的情况下,如果使用卷积网络训练可能导致过拟合局面或者训练出来的网络缺乏泛化能力。因此本文把迁移学习[11-12]的思想应用于卷积神经网络,使用海量ImageNet样本对CNN网络进行预运算,获得有效的参数值,然后运用在肺部肿瘤数据集上进行调整学习。如式(6)和(7)所示,其中Sp是预训练样本区间,St是目标样本区间。

Sp={(a1,b1),…,(am,bm)}

(6)

(7)

迁移学习可行性是因为CNN 通过多层结构完成提取特征的任务,从预训练样本区间提取到对目标样本训练有帮助的参数值,避免参数的频繁变化,这样网络在训练时就更加迅速,有效解决过度拟合局面,提高图像分类性能。

1.4 批量归一化(BN)

卷积神经网络的运算是一个极其繁琐的过程,数据在训练过程会发生转换,下层输入参数会随着上层网络参数的改变进行变化,这种频繁的改变会导致神经网络出现收敛速率过慢,或者梯度消失等无法训练的情况。因此本文在网络中引入批量归一化层来解决上述问题。具体算法如下:

算法1:批处理

输入:a:β=(a1,…,am)

输出:规范后的网络响应{bi=BNγ,β(ai)}

5.Return学习的参数γ和β。

2 网络模型设计

2.1 基于深度学习的特征提取模型

本文模型如图2所示,在每个卷积层和神经元激活函数之间引入批量归一化层,对输入数据首先进行预归一化处理,代替原网络中的局部归一化操作,并采用ReLU作为激活函数,通过三层全连接层和Softmax分类器实现肺部肿瘤图像的分类。

图2 网络结构图

在整个网络训练之前,首先利用ImageNet数据集进行预训练,代替了零基础训练网络的传统方法,本文网络训练的权重、偏置的默认值使用预运算好的参数,损失函数变化速率设置为0.01,将经过5000次迭代后预运算好的网络迁移到肺部图像上进行某种程度的调整学习。

2.1.1 改进后的网络模型

卷积层1+池化层1。使用大小为11×11×96,间距为4的过滤器滤波操作,输出55×55×96的特征map,然后采用下采样尺度为3×3,间距为2的下采样算法进行降维操作,输出27×27×96的特征map。

卷积层2+池化层2。使用大小为5×5×256,间距为1的过滤器滤波操作,输出27×27×256的特征map,然后采用下采样尺度为3×3,间距为2的下采样算法进行降维操作,输出13×13×256的特征map。

卷积层3+卷积层4。使用大小为3×3×384,间距为1的过滤器滤波操作,输出13×13×384的特征map,这两层卷积层后不接池化层。

卷积层5+池化层3。使用大小为3×3×256,间距为1的过滤器滤波操作,输出13×13×256的特征map,然后采用下采样尺度为3×3,间距为2的下采样算法进行降维操作,输出6×6×256的特征map。

2.1.2 最大池化操作

池化操作不仅具有减少特征维度、参数量的作用,还能够保持特征不变性。有两种池化操作:均值池化(mean-pooling)、最大值池化(max-pooling),本文采用的是max-pooling,对领域特征点取最大值,来减弱卷积层权重值的差错对均值的影响,对在保持低参数计算量的情况下,到达保留更多纹理信息的目的。

2.2 肺部图像的自动分类

对肺部图像的分类任务是通过全连接层和分类器完成的,如图3所示,全连接层的开始为第五层卷积层的聚合特征,通过3层的全连接作用获得到1000维的Softmax输出,本文在全连接层中加入Dropout使某些神经元停止工作,使网络学习更具表达性的特征,以减少过拟合局面,达到正则化效果。同时使用ReLU避免梯度消失局面。

图3 分类器模型图

3 实验结果分析

3.1 实验环境

本文采用Caffe平台。模型是在Intel i7-9000K CPU,NVIDIA GeForce RTX 2070上进行学习完成的。前期数据的处理用Matlab完成。

3.2 数据集

3.2.1 数据来源

本文实验使用肺结节数据集LIDC,LIDC整合了医学界专家的对肺结节病例的诊断信息。每个病例都包含50~250张肺部CT图像和一个注释文件,专家标注的诊断信息权威且详细。严格按照专业医师注明选取肺部CT样本4000例,健康CT样本占20%,良恶性肿瘤样本占80%。

3.2.2 数据处理

在卷积神经网路中需要保证特征输出图大小是一致的,需要将肺部图像进行归一化预处理操作,压缩为227×227,将样本进行排序并按照一定的数量将肺部CT图像划分为训练样本和测试样本。其中训练样本占70%例,测试样本占30%例。

3.2.3 样本扩充

为了解决数据量不足对网络运算导致的过拟合局面,本文对LIDC样本集作出以下处理:将肺部肿瘤图像水平、垂直翻转、转动135°/270°、缩放比例、加入高斯噪声、裁剪、移位等操作,将已有的训练样本集转化为新的样本集,以达到快速扩充样本集的目的,减少高频特征对网络的影响,提升网络模型的学习能力。

3.3 评价标准

本文使用准确率ACC、敏感性SNR、特异度SPR、AUC面积和训练时间来判定该分类系统的性能。

真阳性率TPR为准确筛选良恶性数据的百分比,真阴性率TNR为准确筛选健康数据的百分比,假阳性率FPR为错误筛选良恶性数据的百分比,假阴性率FNR为错误筛选健康数据的百分比。则SPR、SNR、ACC的公式如下:

(8)

(9)

(10)

3.4 实验结果分析

首先实验选择在同一数据集不同训练模型上进行比较,将本文所提方法与LeNet-5[13],ResNet[14],AlexNet[15],VGGNet[16],GooLeNet[17]5种模型进行对照,表1展现了卷积神经网络在6种方法上的训练时间和测试准确率,通过实验可以看出,本文所设计网络和方法获取了更有效和表达性的肺部图像特征,比其他5种模型实现了更好的分类准确度。在训练时间方面,本文所提方法的训练时间明显低于其他5种方法,网络具有更好的分类性能。

表1 模型训练时间与准确率

本文用相同的肺部图像数据集对AlexNet模型和改进的网络模型进行训练,验证批量归一化层的使用对模型稳定性和模型训练速率的作用。通过图3可以得出改进模型的准确率的上升速率和训练损失值下降速率都比AlexNet模型的快很多,而且网络训练过程快速平稳。说明批量归一化层不仅可以避免梯度消失,维持网络平稳性,加速网络训练速率和学习能力。

本文采用以下方法进行网络运算来观察迁移学习对模型性能的作用:

1)利用肺部样本对改进的模型使用零基础的运算方法;

2)利用ImageNet样本对改进的模型实行初始运算,用已经训练好的参数作为模型训练的输入值。

如表2所示,利用迁移学习的方法模型各方面的性能都更优,在面对小规模数据集训练时用较短时间提取到了更有效的信息,有益于网络在肺部图像小样本判断中达到准确的识别分类。

表2 网络不同运算方法性能比较

本文对AlexNet模型和改进的模型分别采用原始样本和样本扩充的方法进行运算来观察样本扩充方式对网络性能的作用。如表3所示,采用样本扩充的运算方法,网络获得了更好的学习能力,说明了样本扩充很好地减少了数据不平衡过少难题,验证了样本扩充的功能性。

4 结束语

本文基于肺部肿瘤图像分类对深度卷积神经网络模型

表3 网络不同运算方法性能比较

图3 本文方法和AlexNet的测试准确率和损失值

优化改进,在利用迁移学习和样本扩充基础上,并在网络每层数据输入前预先归一化处理,防止传统特征提取和分类的限制性,减少了高频特征对网络模型的影响,而且有效减少了网络在数据缺乏时导致的过拟合局面,使卷积神经网络运用非常有限的医学样本,提升了肺部肿瘤模型的分类准确率和效率,且网络健壮性得到了提升,为医生判断提供良好的协助作用。在今后的研究中,对网络内部构造和网络学习能力往深层次扩展,进一步提升模型的分类精准度,并运用于大规模医学图像的分类。

猜你喜欢
肺部卷积神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
星形诺卡菌肺部感染1例并文献复习
基于神经网络的船舶电力系统故障诊断方法
盐酸氨溴索在慢阻肺合并肺部感染的临床应用
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
探讨高分辨率CT在肺部小结节诊断中的应用价值