基于改进的卷积神经网络的病理图片区域分类器

2019-11-01 09:10叶钧翔
数字技术与应用 2019年7期
关键词:卷积神经网络

叶钧翔

摘要:本文对已有的高性能卷积神经网络框架进行修改,简化网络的同时保留原网络的结构特点以及优秀性能,利用IDC数据集训练得到高性能的病理图片区域分类器,可用于实现病理图像区域的自动分割。

关键词:卷积神经网络;病理图片;区域分类

中图分类号:TP183 文献标识码:A 文章编号:1007-9416(2019)07-0056-02

1 概述

1.1 应用背景

高通量自适应性采样法(HASHI)是一种有效的利用卷积神经网络的病理图片区域分割算法。该算法通过在整张标注阳性区域的病理图片上进行常规采样,获取得到标注的区域图片,将这些图片作为卷积神经网络的训练集,得到一个病理图片区域分类器。在进行病理图片区域分割时,该算法使用拟蒙特卡洛法以及梯度插补法对未标注的病理图片进行采样,并使用训练得到的分类器对采样得到的区域图片进行分类,得到病理图片的概率热图,从而实现病理图片的自动区域分割。以卷积神经网络为模型的分类器作为高通量自适应采样法的主要部分,极大地影响了整个系统的性能。所以,得到一个高性能、适应应用场景的卷积神经网络模型是提高整体算法性能的关键。

1.2 卷积神经网络

随着如VGGNet、GoogLeNet、ResNet等卷积神经网络模型的提出,以及其预训练模型和迁移学习的广泛运用,这些能较好地解决大多数应用场景中的问题,但由于这些大型模型的输入分辨率过大以及提取特征针对性不强的限制,无法在病理图片区域分类这一数据集精度高、分辨率小的应用场景中直接使用。

针对上文所述的问题,本文通过对已有的前沿的卷积神经网络框架进行修改、简化,保留原模型的特征以及性能优势,相对中使用的模型,有更高的复杂度以及更好的性能。

2 卷积神经网络构架

在尝试了若干卷积神经网络特征结构后(如Inception,ResNet),本文选择了Res2Net作为模型的基本框架结构,并将该模式应用于深度较浅的轻量级模型当中。本文模型的基本结构如图1所示。

2.1 关于Res2Net

Res2Net是在颈状结构以及残差块结构基础之上改进得到的一种网络结构,它将颈状结构中单一的卷积层替换为一组卷积层,这些卷积层以分层的类残差结构相连接,这样的结构在不增加模型计算复杂度的同时可以丰富网络提取的语义信息,提高输出特征图可呈现的多尺度性。具体来讲,在Res2Net结构当中,输入的特征图被分为了若干组,每一组卷积层从一组输入的特征图中提取特征,上一级卷积层输出的特征图会被下一级作为输入的一部分。这个过程会重复多次,直到所有的输入特征图都被处理完。最后,所有输出的特征图拼接在一起,再通过一个卷积核尺寸为1×1的卷积层实现多尺度信息的融合。

2.2 模型设计

在医学图像区域分类的应用场景下,样本图片的分辨率低,且所呈现的低级特征较多,高级特征较少。针对该特点,本文在设计卷积神经网络时提高了第一个卷积层中卷积核的初始数量,并在之后使用Res2Net结构拓展了网络的宽度,且在网络深度受到输入图片分辨率限制的条件下保证输出特征图感受域的大小。由于使用Res2Net结构,模型在有一定结构复杂度的同时有着较小的计算复杂度。为了降低模型的计算复杂度,在卷积神经网络的设计当中总会加入一定数量的下采样层来缩减特征图的尺寸,去除其中冗余的信息。由于该应用场景数据集中的样本图片所包含的信息精度较高,使用常用的池化层可能会丢失大量的有用信息,本文使用了步长为2的卷积层代替了池化层。通过实验表明,该设计能有效地提高模型的性能。与传统的设计方法相同,该模型在最后一个卷积层后使用了全连接层利用输出的特征图进行分类。在激活函数的选择上,除了输出层使用的Softmax函数,其它结构均使用LeakyReLU函数,相比于传统的ReLU函數,LeakyReLU函数给所有的负值赋予了一个非零斜率,可以解决ReLU函数进入负区间后神经元停止学习的情况。

3 实验及结果分析

3.1 数据集

(1)数据集描述。本文使用的原数据集包含了162张已经标注IDC区域的浸润性导管癌病理图片,放大倍数为40x。通过以50×50像素为单位对病理图片中的感兴趣区域进行不重叠采样切割,得到共计277,524张图片切块,其中198,738张标注为IDC阴性,78,786张标注为IDC阳性。数据集中的样本示例图2所示。

之后对处理过的数据集进行分层采样,以6:4的比例将处理过的数据集分为训练集和测试集,并保证两者中阴性样本与阳性样本的比例相同,利于模型的训练以及之后的性能检验。在训练过程中,图片将被预处理缩减为32×32的尺寸。

(2)数据增强。数据增强是缓解由于数据集样本不足而导致模型欠拟合的一种有效方法,通过对数据集样本加入噪声,还可以提高模型的鲁棒性和泛化性。本文在训练模型的过程中以batch为单位,对训练集中的图片在限定范围内进行小幅的随机平移、随机翻转、随机旋转和随机放大,并以与原图片相同的背景色作为变换后缺失部分的填充色,以达到高强度的实时数据增强,并且保持图片中关键信息的完整性,直到达到指定的epoch。

3.2 训练策略

(1)优化算法:本文模型使用Adam作为优化算法。Adam是一种可以替代传统随机梯度下降过程的一阶优化算法,它能基于训练数据迭代地更新神经网络权重,相对于常用的SGD算法,Adam有着计算高效、内存占用少、快速调参等优势。(2)类别平衡:由于病理图片的数据特性,数据集中阴性样本的数量会以不同程度地大于阳性样本,所以训练得到的分类器会出现阴性样本预测正确率高,阳性样本预测正确率低的情况,导致分类器的综合性能不能达到应用场景的需求。本文通过改变代价函数中阳性样本的权值来缓解该问题,经过多次实验比较,当阳性样本的权值为1.5时模型的综合性能较优。

3.3 实验结果

本文将本文使用的模型与不使用Res2Net的颈状模型以及传统浅层网络模型通过同样的训练策略进行训练,将训练的过程以及结果进行对比。实验结果表明使用Res2Net结构的模型较颈状模型以及传统浅层网络模型在训练过程中能更好地拟合数据集的分布情况。对比传统的浅层网络,本文模型有着明显的性能优势,在经过25个epochs之后优势扩大至近2.15%。在训练结束后,本文通过模型在测试集上的混淆矩阵对各个模型的性能进行评估,评估标准使用了正确率(Accuracy)、查全率(Recall)、准确率(Precision)、F1得分(F1-Score)。图3所示中的结果表明使用了Res2Net结构的本文模型在四项标准上都呈现可观的优势。

4 结语

本文使用Res2Net结构设计了一个适用于病理图片区域分类应用场景的卷积神经网络,利用公开的IDC数据集对该网络模型进行了训练,得到一个高性能的病理图片区域分类器,通过实验验证,该分类器相对使用颈状模型以及传统浅层网络模型的分类器在各个评判标准上有着全面的优势,证明了Res2Net结构在浅层网络应用的有效性。该模型可以直接在HASHI算法或其它使用区域分类来实现病理图片区域分割的算法当中,作为高性能的区域分类器提高算法的整体性能。在未来的发展与应用当中,本文的模型或其设计方法可以被应用于病理图片区域识别或其它医疗智能诊断领域。同样,在各个不同的应用场景中,可以合适地使用如Res2Net等优秀网络结构来提高卷积神经网络的性能。

猜你喜欢
卷积神经网络
卷积神经网络语言模型研究
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法