基于改进的AlexNet的乳腺肿瘤智能诊断方法

2020-08-31 06:31武明虎马旭茹
湖北工业大学学报 2020年4期
关键词:乳腺准确率卷积

武明虎,马旭茹,刘 敏

(湖北工业大学电子与电气工程学院,湖北 武汉 430068)

2015年中国抗癌杂志指出:乳腺癌是威胁女性健康的头号杀手[1]。病理诊断是判断乳腺病变程度的可靠手段,但仅仅依赖病理医生的人工阅片,无法实现快速、高效的诊断[2]。利用数字图像处理技术可将苏木精和伊红染色的病理组织切片制作成数字图像,这使得利用计算机进行辅助诊断成为可能。

计算机辅助诊断的宗旨是利用计算机的定量分析、客观判断为病理专家提供可靠的参考。目前,计算机辅助诊断可分为两个阶段:基于特征工程和传统机器学习算法的乳腺病理图像分类阶段和基于卷积网络的全自动分类阶段。

基于特征工程和传统机器学习算法的乳腺病理图像分类阶段,采用人工提取特征的方法,基于这些特征训练支持向量机、随机森林等分类器。该方法中,分类器的性能依赖于前期的特征提取,然而人工提取特征对专业知识要求较高、过程繁琐,且深层特征提取困难。Kowal等人[3]利用四种聚类算法提取特征来训练分类器,结果表明特征提取算法的选择、特征的选取等因素都会对后期的分类造成影响。George等人[4]运用全自动细胞核分割的方法提取特征并训练分类器,结果表明前期对细胞核的分割效果严重影响后期诊断的准确性。Spanhol等人[5]采用局部二值模式等方法提取特征并训练多种分类器,最终实验精确度为80%~85%,仍然没有摆脱繁琐的人工提取特征操作,且分类准确率不高。

相比于传统的分类方法,基于卷积网络的全自动分类方法摆脱了人工设计特征的繁琐过程,利用反向传播算法不断优化网络模型,克服了传统分类方法的缺点。Aresta等人[6]在2018年的乳腺癌病理图片识别挑战赛中使用卷积神经网络以优秀的成绩完成分类任务,但在对高分辨率图片的处理上仍存在局限性。Baris等人[7]采用级联全连接神经网络,网络分类准确率有所提高,但同时增加了网络的复杂度和计算成本。对于高分辨率的医学图像,一般的卷积神经网络在提取深层特征方面仍具有局限性。相比于一般神经网络模型,AlexNet模型对高分辨率图像的细化特征具有较高的敏感性。2016年Spanhol等人[8]提取多种尺度的图像块来扩充原始数据集并训练缩减结构后的AlexNet网络,达到了88.6%的识别准确率。2017年Spanhol等人[9]另辟蹊径,分别对来自AlexNet的三个全连接层的特征进行融合,并使用SoftMax函数根据融合特征进行分类,网络性能相对于其2016年的研究而言并没有明显的改善。2018年郑群花等人[10]使用AlexNet网络对乳腺病理图像进行细分类,采用迁移学习与数据增强的方法解决过拟合问题,付出了较大的时间代价。Deniz等人[11]使用迁移学习的方法初始化AlexNet网络,并融合VGG16与AlexNet提取的深度特征对AlexNet进一步微调,识别准确率相比于传统方法具有显著的提升。然而,以上基于AlexNet网络的分类方法都忽略了网络中间层会使数据产生一定的偏移进而导致原始数据分布发生改变的问题。

由于医学图像标注成本高、获取困难,采用数据增强方法扩充数据集以保证网络能够进行充分学习。采用以AlexNet架构为基础框架的卷积网络模型对良性和恶性乳腺病理图像进行分类。针对AlexNet网络的中间层会使数据产生一定的偏移而导致原始数据分布发生改变的问题,引入批量归一化算法,减小模型中间层的偏移量,加速网络收敛,提高分类准确率。考虑到全连接层引入的大量参数会大大增加网络过拟合的可能性,采用Dropout方法在训练过程中随机丢失一些神经元,提高模型对真实数据的拟合能力,使诊断结果具有更高的参考价值。

1 方法

采用卷积神经网络完成乳腺病理图像的自动分类任务。模型总体框架如图1所示,可分为训练阶段和测试阶段,神经网络在经过扩充的训练集上进行训练,最终在测试集上对网络的识别性能进行评估。

图1 利用优化的AlexNet的乳腺病理图像分类流程图

1.1 数据增强

提高模型泛化性的最好办法是使用大规模数据进行训练。然而,医学病理图像制作过程繁琐,标注成本高,获取困难。在深度学习中通常采用数据增强[12]的方法来解决数据不足的问题。

采用几何变换的方法进行数据增强,利用Kears自带的数据增强函数对BreaKHis数据库中的图片进行平移、缩放、旋转、水平翻转、垂直翻转等操作,扩充每个批次的数据量以减轻数据量不足带来的影响。图2展示了数据增强的结果。

图2 几何变换结果

1.2 AlexNet网络结构

AlexNet是一个被广泛应用于图像分类的卷积神经网络模型,AlexNet网络结构如图3所示。网络总共包含8层结构,其中5个卷积层(标记为Conv)、3个全连接层(标记为FC)。使用线性整流函数(ReLU)作为激活函数增加网络的非线性性。整个网络包含三个池化层(标记为MaxPool),分别位于第一个、第二个和第五个卷积层之后,池化层的输出数据尺寸为其输入的一半。第三个卷积层和第四个卷积层保持输入输出尺寸相同。最后一个卷积层输出的特征值经过扁平化处理后进入全连接层,其中前两个全连接层各有4096个神经元。利用SoftMax函数处理最后一个全连接层生成特征向量,并用概率向量表示类别的最终预测结果。

图3 AlexNet模型结构

1.3 批量归一化

深度网络的训练是一个复杂的过程,只要网络的前几层发生微小的改变,那么这种微小的偏移就会被后几层累积放大下去。神经网络学习的本质也就是学习数据分布[13],一旦网络某一层的输入数据的分布发生改变,那么这一层网络就需要去适应学习这个新的数据分布。如果训练过程中,训练数据的分布一直在发生变化,将会影响网络的训练速度。文献[13]中提出的批量归一化算法(Batch Normalize简称BN)能够减小ReLU函数导致的数据偏移,解决训练过程中原始数据分布发生改变的问题,从而加速网络收敛,改善网络性能。BN算法通过计算一个小批量中的均值与方差来实现特征归一化。BN算法的详细过程见表1。

βi=E[x(i)]

由于卷积层提取的特征值有正有负,负值特征会被ReLU函数丢弃,导致经过ReLU激活函数的特征值产生一定的偏移量,这种偏移会随着网络层的加深而被不断放大,最终会影响网络做出正确的判断。因此,选择将BN层设置在卷积层和激活函数之间,利用BN算法对输入激活函数的特征进行归一化处理,减小引起偏移的量,从而加速网络收敛,提高网络的泛化能力。

1.4 优化后的AlexNet网络

本实验在图3所示AlexNet网络基础架构中做了一些改善。图4所示为引入BN后的卷积层结构单元,通过第一个和第二个卷积滤波器后得到的特征向量,经过BN算法进行归一化处理后再进入激活单元。用图4中的结构单元替换AlexNet网络的原始卷积层结构单元。根据具体的数据集特点设置合适的批次大小(batch_size),将会有助于提高识别准确度,在本实验中设置batch_size为32。

图4 引入BN后的卷积层结构单元

1.5 网络参数设置

对于AlexNet网络,输入图片尺寸不宜过大,在实验中将460×700像素的乳腺病理图像重新缩放到224×224。在训练过程中卷积层使用正态分布进行初始化,对后三个卷积层进行L2正则约束,并对输入特征产生0.0001的惩罚。选择随机梯度下降作为网络的优化器,学习率(learning rate)设置为0.01。考虑到AlexNet网络的全连接层会引入大量的参数,大大增加了过拟合的风险。因此,在网络的前两个全连接层后使用Dropout。在网络的训练过程中,Dropout可使网络以一定的概率随机“删除”一些神经元。由于每次进行权值更新时,节点都是以一定概率随机出现,因此不能保证每2个隐含节点每次都同时出现,这样权值的更新不再依赖于有固定关系隐含节点的共同作用,阻止了某些特征仅在其它特定特征下才有效果的情况。在该实验中设置60%的丢失率,可以使网络达到很好的结果。

2 实验结果及分析

2.1 数据集

BreaKHis数据集[5]收集了来自82名患者的乳腺病理图像。首先获取组织样本,利用苏木精和伊红染色法制作组织切片,最后在电子显微镜的帮助下生成数字图像。每个病例的最终诊断结果都是由经验丰富的病理学家提供,并通过免疫组织化学分析等补充检查确认。使用不同的放大因子(40×、100×、200×、400×)制作7909个临床代表性显微图像,其中良性样本2480个,恶性样本5429个。图像采用三通道RGB无压缩的便携式图形格式进行保存,尺寸为460×700像素,没有经过归一化和颜色标准化处理。数据集的图像分布见表2。

表2 BreaKHis数据集中不同放大系数的图像分布

在实验过程中,将BreaKHis数据集分成两个部分:70%作为训练集对网络进行训练,30%作为测试集来验证网络性能的优异。

2.2 评价指标

采用识别准确率对网络的性能进行评估。用Nr表示正确分类的图片数量,Na表示数据集中病理图片的总数,那么基于图像水平的识别率(Image_level_Rate)可以由下式表示:

2.3 实验结果及分析

实验的硬件配置为Lenovo ThinkStation,Intel i7 CPU。在python语言的编译环境下,使用Keras框架完成实验仿真。

为了验证基于几何变换的数据增强方法扩充高分辨率医学图像的有效性,分别采用放大倍数为40×的原始数据集和扩充后的数据集训练改进后的AlexNet网络,并采用分类准确率对网络性能进行评估。

图5展示了训练过程中AlexNet网络在未使用和使用数据增强技术两种情况下的识别准确率变化曲线。网络在测试集上的评估结果如表3所示。未使用数据增强技术的原始数据集样本少,网络在40个epoch之前一直处于不断学习的状态,拟合效果较差,测试集上的准确率只有75.7%。而图5(b)中展示的训练过程,由于使用了数据增强扩充数据集使得网络能够在大规模数据集进行上训练,在10个epoch之后就开始收敛,对原始数据的拟合效果较好,测试集上的准确率达到88.8%。实验结果表明了数据增强后的数据集可保证网络进行快速、充分的学习,从而提高模型对高分辨率医学病理图像的分类准确性,使最终的辅助诊断结果更可靠。

(a)未使用数据增强

(b)使用数据增强图5 准确率曲线

表3 使用数据增强前后模型的识别准确率 %

为了评估改进后的AlexNet网络对良性乳腺肿瘤和恶性乳腺肿瘤识别性能,选择文献[5]、文献[9]的实验结果作为对照组,它们都使用了BreakHis数据集。文献[5]中使用了多种特征提取器搭配不同的分类器,其中使用无参数阈值邻接统计(Parameter-Free Threshold Adjacency Statistic,PFTAS)算法提取特征,采用二次线性分析(Quadratic Linear Analysis,QDA)作为分类器的方案得到的分类效果最佳。文献[9]中选用AlexNet网络作为基本网络框架,为了保证实验的严谨性,选取文献[9]中来自第二个全连接层的深度特征(原文中为f7)为输入特征的实验组作为参照(此结构与本方案的AlexNet网络的基本结构相同,具有一定的对比性)。

实验结果见表4,引入批量归一化的AlexNet网络识别准确率与文献[5]的传统方法、文献[9]的AlexNet网络相比分别提高了5.96%、6.09%,验证了笔者提出的改进方法的有效性。实验结果表明,批量归一化能够有效减小ReLU函数产生的偏移量,解决了AlexNet网络中间层数据分布发生改变的问题,增强了模型的泛化能力。

3 结论

对于样本较少的高分辨率医学数据集,采用数据增强方法扩充数据集,从根本上解决了病理图像标记样本少而带来的过拟合问题。采用了以AlexNet为架构的卷积网络模型对良性、恶性肿瘤进行全自动的分类。为了解决AlexNet网络中间层改变数据分布的问题,引入了批量归一化算法,减小模型中间层的偏移量,使模型能够快速、高效地处理高分辨率乳腺病理图像。实验结果表明,改进后的AlexNet的分类准确率较原有方法提高了6%,具有较好的鲁棒性和泛化性。本实验在最终的分类类别方面有待进一步细化,在将来的工作中可考虑结合更优秀的数据增强方法对乳腺病理图像进行细分类。

猜你喜欢
乳腺准确率卷积
基于高频超声引导的乳腺包块导丝定位在乳腺病变中的诊断价值
乳腺结节状病变的MRI诊断
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
卷积神经网络的分析与设计
从滤波器理解卷积
体检查出乳腺增生或结节,该怎么办